专题:model-comparison

按该标签聚合的大模型资讯列表(自动分类与标签提取)。7 篇文章。

媒体InfoQ 中文2026/04/03 22:405810
谷歌开源Gemma大模型系列
支持手机端离线Agent运行

谷歌开源Gemma系列大模型,主打手机端离线Agent支持与内存优化技术。通过动态内存分配和量化压缩,实现轻量化部署。对比Qwen等竞品,突出其在参数规模、推理效率及资源占用方面的优势,为移动端AI应用提供新方案。

媒体量子位2026/03/20 10:118550
Qwen3.5-Max预览版在LMArena总榜排名全球第六
击败GPT-5.4、Claude 4.6等所有海外顶级模型

阿里千问发布Qwen3.5-Max预览版,在权威盲测平台LMArena中击败所有国际与国产模型,登顶中国最强AI模型。其在数学与文本能力子榜均居中国第一,总榜全球第六,首次实现对GPT-5.4和Claude 4.6的超越。该模型延续‘小参数大性能’策略,8款开源模型全系SOTA,标志着中国大模型正式进入全球第一梯队。

社区Reddit r/LocalLLaMA2026/02/15 11:284830

本文对 Apple Silicon M3 Ultra 平台上的大型语言模型(LLM)进行了性能实测。在 llama.cpp 环境下,使用 10000 token 的深度上下文生成任务作为评测标准,GPT-OSS:120B 以其出色的速度和通用性脱颖而出,成为当前中等硬件配置下的首选。Nemotron Nano 因其参数规模与速度的良好平衡展现出潜力。GLM…

媒体AWS Machine Learning Blog2026/02/07 00:2940

Amazon SageMaker AI推出基于Amazon Nova的LLM评判器,支持动态评分标准生成,可精准评估生成式AI模型输出。该评判器通过自动生成评估规则,提升模型迭代和数据质量控制的效率,具备可解释性、灵活性和高准确性三大核心亮点,适用于多种AI应用场景。