开源项目 WinRemote MCP:赋能 AI 代理完全控制 Windows 桌面
Reddit r/LocalLLaMA2026/02/11 17:37机翻/自动摘要/自动分类
4 阅读
摘要
WinRemote MCP 是一个新发布的开源项目,旨在解决 AI 代理在控制 Windows 桌面时功能受限的问题。它提供了一个 MCP 服务器,让 AI 代理能够通过超过 40 种工具远程完全控制 Windows 机器,包括屏幕截图与 UI 识别、鼠标键盘操作、文件系统管理、注册表读写、服务与进程管理等。该项目填补了现有 MCP 生态在 Windows 平台上的空白,为企业级 AI 应用落地提供了强大的支持。
正文
为了解决现有 MCP(Multi- Conversation Protocol)生态系统在 Windows 支持上的不足,开发者创建了一个名为 WinRemote MCP 的开源项目。该项目是一个 MCP 服务器,允许 AI 代理远程完全控制 Windows 机器。
核心功能包括:
- 屏幕交互: 截图、UI 元素检测、OCR 识别、鼠标键盘控制(点击、输入、滚动、快捷键)。
- 文件系统操作: 读取、写入、搜索文件,以及上传/下载。
- 系统管理: Windows 注册表读写、服务管理(启动/停止/列表)、计划任务管理、进程管理。
- 网络诊断: Ping、端口检查、连接信息。
- 其他: 屏幕录制(GIF 格式),总计超过 40 种工具。
工作原理:
用户可以通过 pip 安装 winremote-mcp,然后运行一个简单的命令即可启动服务器。任何支持 MCP 协议的 AI 代理(如 Claude Desktop, Cursor, OpenAI agents 等)即可获得对 Windows 机器的完全访问权限。项目同时支持 stdio 和 HTTP 传输。
安装命令:
pip install winremote-mcp
运行命令示例:
winremote-mcp --transport http --port 8090
开发动机:
许多现有的 MCP 工具主要针对 Mac/Linux 环境。然而,Windows 仍然是企业桌面环境的主流。WinRemote MCP 旨在填补这一空白,提供对 Windows 特有功能(如注册表、服务、计划任务、COM 自动化)的深度支持,而不仅仅是通用的文件操作。
该项目采用 MIT 许可证开源,并欢迎社区反馈。