谷歌发布Gemini 3.1 Pro:推理与编码能力提升显著
AINews2026/02/19 13:44机翻/自动摘要/自动分类
5 阅读
内容评分
技术含量
8/10
营销水分
7/10
摘要
谷歌发布Gemini 3.1 Pro,显著提升推理与编码能力,通过ARC-AGI 2和SWE-Bench测试验证。独立机构认可其性能与成本效益,尽管存在部分质疑,但整体获得业界高度评价。
正文
谷歌近日发布了Gemini 3.1 Pro的开发者预览版本,该版本整合了多个工具,包括Gemini应用、NotebookLM、Gemini API/AI Studio和Vertex AI。在ARC-AGI 2基准测试中,Gemini 3.1 Pro的推理性能提升了77.1%,在编码能力测试(如SWE-Bench)中也表现出色,达到80.6%的提升。独立评估机构Artificial Analysis和Arena均认可其卓越的性能和成本效益。尽管部分社区成员对测试目标的合理性提出质疑,或对发布的稳定性表示担忧,但多数人仍对其在实际应用中的改进充满期待。Gemini 3.1 Pro的核心智能技术同样被应用于Gemini 3 Deep Think,该产品已准备投入实际使用。多位行业领袖,包括Sundar Pichai、Demis Hassabis和Jeff Dean,均对这一进展表示高度认可。