开源项目：为本地 LLM 注入视觉能力，集成 Google Lens 与 OpenCV

Hacker News2026/02/11 13:40机翻/自动摘要/自动分类

摘要

该开源项目（noapi-google-search-mcp）为本地大型语言模型（LLM）赋予了强大的视觉识别能力。通过集成 Google Lens 和 OpenCV，项目能够让纯文本模型识别图像中的物体，并进行准确的描述。此外，它还整合了 Google 的多项搜索服务，如搜索、新闻、地图等，提供了一个无需 API 密钥的综合性工具集。该项目极大地扩展了本地 LLM 的应用场景，使其能够处理更复杂的视觉信息任务。

正文

该项目构建了一个 MCP 服务器，为任何本地大型语言模型（）提供了实时的 Google 搜索和视觉能力，且无需 API 密钥。

最新功能 google_lens_detect 利用 OpenCV 检测图像中的物体，对每个物体进行裁剪，并将其发送给 Google Lens 进行识别。即使是像 GPT-OSS-120B 这样纯文本模型，也能从桌面照片中准确识别出 NVIDIA DGX Spark 和 SanDisk USB 驱动器。

此外，该项目还集成了 Google 搜索、新闻、购物、学术、地图、财经、天气、航班、酒店、翻译、图片、趋势等共计 17 种工具。

安装命令：

pip install noapi-google-search-mcp && playwright install chromium

GitHub 仓库：https://github.com/VincentKaufmann/noapi-google-search-mcp PyPI 包：https://pypi.org/project/noapi-google-search-mcp/

开源项目：为本地 LLM 注入视觉能力，集成 Google Lens 与 OpenCV

摘要

正文

标签