专题：pdf-search

本地多模态 LLM 实现 PDF 视觉检索与逆向图像搜索

社区Reddit r/LocalLLaMA2026/02/20 22:373530

本文介绍了一款基于本地多模态 LLM 的开源工具，可对数百万张猫咪 PDF 图片进行自然语言和逆向图像检索。通过将 PDF 页面转为图像向量并存入向量数据库，实现“orange cat beach”之类的文本查询以及上传图片的相似搜索。项目已在 GitHub 开源，提供完整的部署指南。