谷歌DeepMind发布Gemini 3 Deep Think V2,展现科学推理新高度
AINews2026/02/12 13:44机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
8/10
营销水分
7/10
摘要
谷歌DeepMind推出Gemini 3 Deep Think V2,展现卓越的科学推理能力。该模型在ARC-AGI-2、HLE和Codeforces等测试中表现优异,尤其在数学、物理和工程领域有实际应用价值。其发布更侧重于实用计算而非演示,为研究人员和开发者提供了新的工具和参考。
正文
谷歌DeepMind近日向Google AI Ultra订阅用户推出了升级版的Gemini 3 Deep Think V2推理模式,并为部分用户开放Vertex AI/Gemini API的早期访问权限。该版本在多个关键基准测试中表现突出:在ARC-AGI-2测试中得分84.6%,在无需任何辅助工具的情况下完成Humanity’s Last Exam (HLE)测试的得分达到48.4%,在Codeforces平台上的Elo分数达到3455分,接近人类顶尖选手水平。Gemini 3 Deep Think V2特别强化了在科学和工程领域的应用能力,例如数学论文中的错误检测、物理系统建模、半导体材料优化,以及从草图到CAD/STL格式的3D打印流程转换。ARC基准测试的创建者François Chollet表示,这一模式对提升AI在测试中的适应性和智能水平具有重要意义,并预测人类与AI的差距将在2030年左右缩小。此次发布的版本更注重实际计算需求,而非实验室演示,并提供了ARC任务的详细成本信息。