专题：open-source-model

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 4 篇文章。

Qwen3.5-Max预览版登顶LMArena中国榜首，阿里千问首次超越GPT-5.4与Claude 4.5

媒体量子位2026/03/20 10:118550

• Qwen3.5-Max预览版在LMArena总榜排名全球第六

• 击败GPT-5.4、Claude 4.6等所有海外顶级模型

阿里千问发布Qwen3.5-Max预览版，在权威盲测平台LMArena中击败所有国际与国产模型，登顶中国最强AI模型。其在数学与文本能力子榜均居中国第一，总榜全球第六，首次实现对GPT-5.4和Claude 4.6的超越。该模型延续‘小参数大性能’策略，8款开源模型全系SOTA，标志着中国大模型正式进入全球第一梯队。

Qwen3.5 LMArena盲测榜模型对比阿里云AI 开源模型

阿里千问3.5系列模型登顶Hugging Face开源榜，编程效率惊人

原文

媒体量子位2026/02/26 16:237620

阿里千问3.5系列模型在Hugging Face全球开源大模型榜单中包揽前四，成为社区焦点。新模型性能超越GPT-5 mini，具备强大的原生多模态和Agent能力，部分可部署于消费级显卡。其中Qwen3.5-35B-A3B仅用10分钟便完成人类中级程序员5小时编程任务，展现惊人效率。该系列模型已获全球知名平台适配，累计开源400余款，下载量超10亿，衍生…

通义千问开源模型 LLM模型 Hugging Face AI代理

GLM-5重磅发布：开源模型实现24小时自主编程，700次工具调用、800次上下文切换，性能比肩Claude Opus 4.5

原文

媒体量子位2026/02/14 16:147860

智谱AI正式发布GLM-5开源模型，标志着开源AI进入长任务时代。该模型展现出惊人的自主编程能力，能连续运行代码超24小时，完成700次工具调用和800次上下文切换，从零手搓GBA模拟器。其在权威榜单Artificial Analysis和Vending Bench 2中表现出色，编程能力与Claude Opus 4.5比肩，并在经营能力上取得开源第一。G…

GLM-5 工具调用上下文切换连续运行能力大语言模型

Nanbeige4.1-3B：3B开源小模型，兼具强大推理、偏好对齐与Agent能力，支持256K长上下文

原文

社区Reddit r/LocalLLaMA2026/02/11 15:3830

Nanbeige LLM Lab 发布了开源3B模型Nanbeige4.1-3B，旨在验证小型通用模型在推理、偏好对齐和Agent行为方面的潜力。该模型在LiveCodeBench-Pro、IMO-Answer-Bench等复杂推理任务上表现出色，并通过单次前向传播实现连贯推理。在偏好对齐方面，Nanbeige4.1-3B在Arena-Hard-v2和Mu…

Nanbeige4.1-3B 开源模型推理自主智能体长上下文处理