RAG 检索异常调试利器:轻量化向量检索调试工具 agent-memory-inspector
Reddit r/LocalLLaMA2026/02/22 18:26机翻/自动摘要/自动分类
5 阅读
内容评分
技术含量
6/10
营销水分
5/10
摘要
本文介绍了开源的轻量级向量检索调试工具 agent-memory-inspector,专为 RAG 系统设计,可在 FastAPI 项目中通过中间件实时记录检索日志、可视化相似度并自动标记异常。提供代码示例和使用场景,邀请开发者在实际项目中试用并反馈功能改进。
正文
大家好,
我近期开源了一款专注于向量检索的轻量级调试工具 agent‑memory‑inspector,旨在帮助研发 (Retrieval‑Augmented Generation)系统的同学快速定位检索环节的异常。该工具可无缝集成到基于 FastAPI 的服务中,并支持主流向量数据库(如 Milvus、Pinecone、Qdrant 等)。
主要功能
- 实时查询日志:捕获每一次向量检索的输入、输出、相似度分数以及对应的文档 ID。
- 可视化相似度分布:通过内置的 Plotly 图表展示检索结果的相似度曲线,帮助判断阈值是否合适。
- 异常检测:自动标记相似度异常低(< threshold)或返回空结果的请求,并提供上下文回溯。
- FastAPI 中间件:只需在项目中加入一行
app.add_middleware(MemoryInspectorMiddleware)即可开启全链路监控。
使用示例
from fastapi import FastAPI
from agent_memory_inspector import MemoryInspectorMiddleware
app = FastAPI()
app.add_middleware(MemoryInspectorMiddleware, db_url="postgresql://...", top_k=5)
@app.post("/query")
async def query(prompt: str):
# 这里调用向量检索并返回结果
...
期待的合作方式
- 问题复现:如果你的 系统出现检索不准、返回空或相似度异常等情况,直接把请求日志交给本工具即可快速定位。
- 功能反馈:欢迎在 GitHub 提交 Issue,或通过邮件提供使用场景,我会持续迭代完善。
项目地址: https://pypi.org/project/-memory-inspector/
期待与各位在实际项目中碰撞出更多调试思路!