专题:open-source-model

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

媒体量子位2026/03/20 10:118550
Qwen3.5-Max预览版在LMArena总榜排名全球第六
击败GPT-5.4、Claude 4.6等所有海外顶级模型

阿里千问发布Qwen3.5-Max预览版,在权威盲测平台LMArena中击败所有国际与国产模型,登顶中国最强AI模型。其在数学与文本能力子榜均居中国第一,总榜全球第六,首次实现对GPT-5.4和Claude 4.6的超越。该模型延续‘小参数大性能’策略,8款开源模型全系SOTA,标志着中国大模型正式进入全球第一梯队。

媒体量子位2026/02/26 16:237620

阿里千问3.5系列模型在Hugging Face全球开源大模型榜单中包揽前四,成为社区焦点。新模型性能超越GPT-5 mini,具备强大的原生多模态和Agent能力,部分可部署于消费级显卡。其中Qwen3.5-35B-A3B仅用10分钟便完成人类中级程序员5小时编程任务,展现惊人效率。该系列模型已获全球知名平台适配,累计开源400余款,下载量超10亿,衍生…

媒体量子位2026/02/14 16:147860

智谱AI正式发布GLM-5开源模型,标志着开源AI进入长任务时代。该模型展现出惊人的自主编程能力,能连续运行代码超24小时,完成700次工具调用和800次上下文切换,从零手搓GBA模拟器。其在权威榜单Artificial Analysis和Vending Bench 2中表现出色,编程能力与Claude Opus 4.5比肩,并在经营能力上取得开源第一。G…

社区Reddit r/LocalLLaMA2026/02/11 15:3830

Nanbeige LLM Lab 发布了开源3B模型Nanbeige4.1-3B,旨在验证小型通用模型在推理、偏好对齐和Agent行为方面的潜力。该模型在LiveCodeBench-Pro、IMO-Answer-Bench等复杂推理任务上表现出色,并通过单次前向传播实现连贯推理。在偏好对齐方面,Nanbeige4.1-3B在Arena-Hard-v2和Mu…