开源项目:为本地 LLM 注入视觉能力,集成 Google Lens 与 OpenCV
Hacker News2026/02/11 13:40机翻/自动摘要/自动分类
4 阅读
摘要
该开源项目(noapi-google-search-mcp)为本地大型语言模型(LLM)赋予了强大的视觉识别能力。通过集成 Google Lens 和 OpenCV,项目能够让纯文本模型识别图像中的物体,并进行准确的描述。此外,它还整合了 Google 的多项搜索服务,如搜索、新闻、地图等,提供了一个无需 API 密钥的综合性工具集。该项目极大地扩展了本地 LLM 的应用场景,使其能够处理更复杂的视觉信息任务。
正文
该项目构建了一个 MCP 服务器,为任何本地大型语言模型()提供了实时的 Google 搜索和视觉能力,且无需 API 密钥。
最新功能 google_lens_detect 利用 OpenCV 检测图像中的物体,对每个物体进行裁剪,并将其发送给 Google Lens 进行识别。即使是像 GPT-OSS-120B 这样纯文本模型,也能从桌面照片中准确识别出 NVIDIA DGX Spark 和 SanDisk USB 驱动器。
此外,该项目还集成了 Google 搜索、新闻、购物、学术、地图、财经、天气、航班、酒店、翻译、图片、趋势等共计 17 种工具。
安装命令:
pip install noapi-google-search-mcp && playwright install chromium
GitHub 仓库:https://github.com/VincentKaufmann/noapi-google-search-mcp PyPI 包:https://pypi.org/project/noapi-google-search-mcp/