Qwen3.5-Max预览版登顶LMArena中国榜首,阿里千问首次超越GPT-5.4与Claude 4.5
量子位2026/03/20 10:11机翻/自动摘要/自动分类
5 阅读
内容评分
技术含量
5/10
营销水分
8/10
摘要
阿里千问发布Qwen3.5-Max预览版,在权威盲测平台LMArena中击败所有国际与国产模型,登顶中国最强AI模型。其在数学与文本能力子榜均居中国第一,总榜全球第六,首次实现对GPT-5.4和Claude 4.6的超越。该模型延续‘小参数大性能’策略,8款开源模型全系SOTA,标志着中国大模型正式进入全球第一梯队。
正文
2026年3月20日,LMArena盲测榜单更新,阿里巴巴通义千问团队发布的Qwen3.5-Max-Preview预览版以1464分登顶中国模型榜首,击败GPT-5.4、Claude Sonnet-4.6、Grok 4.1等国际顶尖模型,以及豆包2.0、GLM-5、Kimi 2.5等全部国产竞品。在总榜中位列全球第六,数学能力子榜排名全球第五、中国第一,专家文本能力子榜位列全球第十、中国第一。该模型是Qwen3.5系列的旗舰版本,延续了千问系列‘小参数大性能’的路线,其基础版Qwen3.5-Plus参数量3970亿、激活170亿,已在开源社区引发广泛关注。目前Qwen3.5系列共开源8个尺寸模型,全部达成同尺寸SOTA。LMArena由LMSYS组织,采用盲测投票机制,被公认为全球最公正的性能评估平台。此次表现标志着中国首次在顶级闭源模型面前实现全面超越,中美格局进入‘五五开’时代:前五名中,阿里成为唯一中国公司,与OpenAI、Anthropic、Google、xAI并列;字节、智谱、月之暗面、百度、亚马逊紧随其后进入前十。