谷歌 Gemini 3.1 Pro 重磅发布:推理能力翻倍,性能登顶,成本腰斩
机器之心2026/02/20 08:53机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
8/10
营销水分
7/10
摘要
谷歌发布了其最新的大型语言模型 Gemini 3.1 Pro,标志着 AI 在科学、研究和工程领域的重大进展。该模型在核心推理能力上实现了翻倍提升,并在 ARC-AGI-2、GPQA、LiveCodeBench Pro 等多项关键基准测试中取得领先成绩,性能超越了现有顶级模型,同时运行成本显著降低。Gemini 3.1 Pro 能够处理复杂问题、生成代码动画、整合复杂系统并实现交互式设计,已陆续部署至开发者、企业及消费者产品中。
正文
<p>谷歌在上周发布了 Gemini 3 Deep Think 的重大更新后,紧接着正式推出了支撑这些突破的升级版核心智能:Gemini 3.1 Pro。这一新模型在科学、研究和工程领域的复杂挑战应对上,展现了显著的进步。</p><p>参与 Gemini 3 Deep Think 研究的姚顺宇表示:“后续还会有更好的模型源源不断地涌现”,预示着 AI 模型的快速迭代。</p><p>谷歌表示,Gemini 3.1 Pro 在核心推理能力上实现了进一步跃升,为复杂问题的求解提供了更强大、更智能的能力基准。在 ARC-AGI-2 基准测试中,3.1 Pro 的成绩达到了 77.1%,其推理性能是 3 Pro 的两倍以上。</p><p>此外,内部基准测试显示,3.1 Pro 在多个专业领域表现出色:</p><ul><li>科学知识:GPQA 钻石级测试得分 94.3%。</li><li>编码:LiveCodeBench Pro Elo 得分 2887,SWE-Bench Verified 得分 80.6%。</li><li>多模态理解:MMMLU 测试得分 92.6%。</li></ul><p>这些进步不仅是渐进式的,更代表了模型在处理“思考” token 和长期任务方式上的改进,为构建自主智能体提供了更可靠的基础。第三方公司 Artificial Analysis 的评估显示,Gemini 3.1 Pro 已跃居榜首,成为当前功能最强大、性能最佳的 AI 模型,且运行成本不到 Claude Opus 的一半。</p><p>Gemini 3.1 Pro 的强大功能使其能够可视化复杂主题、整理零散数据并将创意项目化为现实。谷歌通过一个经典的“鹈鹕骑自行车”SVG 动画展示了其能力跃升。</p><p>目前,谷歌正将 3.1 Pro 部署到面向消费者和开发者的各类产品中:</p><ul><li>开发者:通过 Google AI Studio 的 Gemini API、Gemini CLI、Google Antigravity 和 Android Studio 提供预览。</li><li>企业:上线 Vertex AI 和 Gemini Enterprise。</li><li>消费者:通过 Gemini 应用程序(APP)和 NotebookLM 推出。</li></ul><p>企业合作伙伴已开始整合 3.1 Pro 预览版,并对其可靠性和效率提升表示肯定。Databricks CTO Hanlin Tang 指出,3.1 Pro 在 OfficeQA 基准测试中取得了“同类最佳结果”。Cartwheel 联合创始人 Andrew Carr 则强调了模型在 3D 变换理解上的显著提升。</p><p>3.1 Pro 的定价策略稍显复杂,根据输入/输出 token 数量、上下文缓存以及联网搜索(Grounding)等因素进行收费。</p><h3>3.1 Pro,好用吗?</h3><p>谷歌强调,3.1 Pro 的设计初衷是为了解决那些“简单答案”无法应对的复杂问题。它将先进的推理能力转化为实用的工具,帮助用户攻克棘手挑战。其应用场景包括:</p><ol><li><strong>基于代码的动画:</strong>直接根据文字提示生成网站可用的、自带动效的 SVG 图片,具有高清晰度和小文件体积的优势。</li><li><strong>复杂系统整合:</strong>能够连接复杂的 API 接口,如搭建实时航空仪表盘,直观呈现国际空间站运行轨道。</li><li><strong>交互式设计:</strong>编写复杂的 3D 模拟代码,并打造沉浸式互动体验,如通过手势控制鸟群飞行并实时生成配乐。</li><li><strong>创意编程:</strong>深入理解文学作品的氛围和精神内核,将其转化为具有现代风格的网站设计,例如为《呼啸山庄》构建个人作品集网站。</li></ol><p>谷歌表示,Gemini 3.1 Pro 是一个预览版,未来将在自主工作流等领域寻求进一步突破,并计划全面开放使用。目前,3.1 Pro 已逐步面向 Google AI Pro 和 Ultra 套餐用户开放更高使用额度,并登陆 NotebookLM。开发者和企业用户可通过 Gemini API、AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI 和 Android Studio 平台抢先体验预览版。</p>