谷歌DeepMind发布Gemini 3 Deep Think V2，展现科学推理新高度

AINews2026/02/12 13:44机翻/自动摘要/自动分类

内容评分

技术含量

8/10

营销水分

7/10

摘要

谷歌DeepMind推出Gemini 3 Deep Think V2，展现卓越的科学推理能力。该模型在ARC-AGI-2、HLE和Codeforces等测试中表现优异，尤其在数学、物理和工程领域有实际应用价值。其发布更侧重于实用计算而非演示，为研究人员和开发者提供了新的工具和参考。

正文

谷歌DeepMind近日向Google AI Ultra订阅用户推出了升级版的Gemini 3 Deep Think V2推理模式，并为部分用户开放Vertex AI/Gemini API的早期访问权限。该版本在多个关键基准测试中表现突出：在ARC-AGI-2测试中得分84.6%，在无需任何辅助工具的情况下完成Humanity’s Last Exam (HLE)测试的得分达到48.4%，在Codeforces平台上的Elo分数达到3455分，接近人类顶尖选手水平。Gemini 3 Deep Think V2特别强化了在科学和工程领域的应用能力，例如数学论文中的错误检测、物理系统建模、半导体材料优化，以及从草图到CAD/STL格式的3D打印流程转换。ARC基准测试的创建者François Chollet表示，这一模式对提升AI在测试中的适应性和智能水平具有重要意义，并预测人类与AI的差距将在2030年左右缩小。此次发布的版本更注重实际计算需求，而非实验室演示，并提供了ARC任务的详细成本信息。

谷歌DeepMind发布Gemini 3 Deep Think V2，展现科学推理新高度

内容评分

摘要

正文

标签