首页/详情

RAG 检索异常调试利器:轻量化向量检索调试工具 agent-memory-inspector

Reddit r/LocalLLaMA2026/02/22 18:26机翻/自动摘要/自动分类
5 阅读

内容评分

技术含量
6/10
营销水分
5/10

摘要

本文介绍了开源的轻量级向量检索调试工具 agent-memory-inspector,专为 RAG 系统设计,可在 FastAPI 项目中通过中间件实时记录检索日志、可视化相似度并自动标记异常。提供代码示例和使用场景,邀请开发者在实际项目中试用并反馈功能改进。

正文

大家好,

我近期开源了一款专注于向量检索的轻量级调试工具 agent‑memory‑inspector,旨在帮助研发 (Retrieval‑Augmented Generation)系统的同学快速定位检索环节的异常。该工具可无缝集成到基于 FastAPI 的服务中,并支持主流向量数据库(如 Milvus、Pinecone、Qdrant 等)。

主要功能

  • 实时查询日志:捕获每一次向量检索的输入、输出、相似度分数以及对应的文档 ID。
  • 可视化相似度分布:通过内置的 Plotly 图表展示检索结果的相似度曲线,帮助判断阈值是否合适。
  • 异常检测:自动标记相似度异常低(< threshold)或返回空结果的请求,并提供上下文回溯。
  • FastAPI 中间件:只需在项目中加入一行 app.add_middleware(MemoryInspectorMiddleware) 即可开启全链路监控。

使用示例

from fastapi import FastAPI
from agent_memory_inspector import MemoryInspectorMiddleware

app = FastAPI()
app.add_middleware(MemoryInspectorMiddleware, db_url="postgresql://...", top_k=5)

@app.post("/query")
async def query(prompt: str):
    # 这里调用向量检索并返回结果
    ...

期待的合作方式

  • 问题复现:如果你的 系统出现检索不准、返回空或相似度异常等情况,直接把请求日志交给本工具即可快速定位。
  • 功能反馈:欢迎在 GitHub 提交 Issue,或通过邮件提供使用场景,我会持续迭代完善。

项目地址: https://pypi.org/project/-memory-inspector/

期待与各位在实际项目中碰撞出更多调试思路!

标签