本文指导如何在 FastAPI 中实现令牌桶速率限制,涵盖算法原理、代码实现、中间件集成和测试方法。核心亮点是通过 IP 级别控制请求频率,并添加标准速率限制响应头,适用于 API 管理和系统稳定性保障。
专题:fastapi
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 8 篇文章。
本文指导如何构建一个生产级RAG应用,涵盖FAISS向量存储、检索门控、结构化输出、API回退及评估机制,帮助开发者打造稳定、安全且可维护的AI系统。
本文指导如何在FastAPI中使用OpenTelemetry实现LLM的端到端可观测性,涵盖追踪、时间跨度设计、语义属性及成本分析,为开发者提供清晰的架构和实践方法。
Oxyde 是一个融合 Pydantic 与 Rust 的异步 ORM 工具,通过统一模型定义减少代码冗余,采用 Django 风格查询 API,强调类型安全和显式操作。支持多种数据库,集成 FastAPI,适合现代 Web 应用和 AI 服务开发。
本文介绍一个六周的AI合同审查系统项目,采用多代理协作、RAG技术与LangGraph流程编排,旨在实现自动化合规检查与风险评估。系统基于FastAPI和Postgres构建,具备实际企业应用价值,适合开发者和研究人员参考。
本文介绍了开源的轻量级向量检索调试工具 agent-memory-inspector,专为 RAG 系统设计,可在 FastAPI 项目中通过中间件实时记录检索日志、可视化相似度并自动标记异常。提供代码示例和使用场景,邀请开发者在实际项目中试用并反馈功能改进。
Toolforge MCP是一个开源项目,旨在简化AI模型工具的开发与部署。它通过自动化扫描代码库(如`/kits`文件夹),解析带有特定装饰器的函数及其文档字符串,智能提取输入/输出参数和类型信息,从而自动生成工具配置。这些工具随后可通过FastAPI框架提供服务。该项目有效解决了传统模型工具配置复杂、文档滞后等问题,为开发者提供了一套高效、便捷的工具构…
本文介绍了一个基于RSS的轻量级内容发现工具的开发,通过用户点赞机制实现内容推荐,使用FastAPI、SQLAlchemy和SQLite等技术,强调非商业性质与社区驱动。项目旨在简化RSS浏览体验,提供类似TikTok的推荐方式,但不涉及广告或数据收集。