本地多模态 LLM 实现 PDF 视觉检索与逆向图像搜索原文社区Reddit r/LocalLLaMA2026/02/20 22:373530本文介绍了一款基于本地多模态 LLM 的开源工具,可对数百万张猫咪 PDF 图片进行自然语言和逆向图像检索。通过将 PDF 页面转为图像向量并存入向量数据库,实现“orange cat beach”之类的文本查询以及上传图片的相似搜索。项目已在 GitHub 开源,提供完整的部署指南。本地大模型视觉检索PDF 搜索多模态模型开源项目