NVIDIA发布Nemotron 3 Super:1200亿参数模型与代理系统创新
AINews2026/03/11 13:44机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
9/10
营销水分
7/10
摘要
NVIDIA发布Nemotron 3 Super,参数量达1200亿,采用混合架构,推理速度提升2.2倍,支持代理式工作负载。该模型在AA Intelligence Index中表现优异,同时推动了代理系统的应用与优化,涵盖多个AI产品和平台。
正文
NVIDIA近日推出了其最新的开放模型Nemotron 3 Super,该模型拥有1200亿参数,活跃参数量约为120亿,采用混合式Mamba-与SSM Latent 架构,支持100万的上下文窗口。在FP4精度下,其推理速度比GPT-OSS-120B快了2.2倍,并且在吞吐量方面有显著提升。Nemotron 3 Super还支持代理式工作负载,并以高透明度公开了权重、数据和基础设施的详细信息。在AA Intelligence Index评估中,该模型获得了36分,优于GPT-OSS-120B,但略逊于Qwen3.5-122B-A10B。NVIDIA强调其技术方向正从模型本身转向运行环境的优化与编排。在社区和基础设施方面,多个项目如vLLM、llama.cpp、Ollama、Together、Baseten、W&B Inference、LangChain和Unsloth GGUFs等迅速支持了该模型。Nemotron 3 Super的关键技术创新包括原生多标记预测(MTP)机制和显著提升的键值缓存(KV-cache)效率。在产品层面,NVIDIA推动了代理系统的应用,如Perplexity的Personal Computer和Computer for Enterprise,以及Replit 4和Base44 Superagents等,这些产品旨在实现更高效、可读性强、可分叉的代理系统,并具备实时控制能力。