NVIDIA发布Nemotron 3 Super：1200亿参数模型与代理系统创新

AINews2026/03/11 13:44机翻/自动摘要/自动分类

内容评分

技术含量

9/10

营销水分

7/10

摘要

NVIDIA发布Nemotron 3 Super，参数量达1200亿，采用混合架构，推理速度提升2.2倍，支持代理式工作负载。该模型在AA Intelligence Index中表现优异，同时推动了代理系统的应用与优化，涵盖多个AI产品和平台。

正文

NVIDIA近日推出了其最新的开放模型Nemotron 3 Super，该模型拥有1200亿参数，活跃参数量约为120亿，采用混合式Mamba-与SSM Latent 架构，支持100万的上下文窗口。在FP4精度下，其推理速度比GPT-OSS-120B快了2.2倍，并且在吞吐量方面有显著提升。Nemotron 3 Super还支持代理式工作负载，并以高透明度公开了权重、数据和基础设施的详细信息。在AA Intelligence Index评估中，该模型获得了36分，优于GPT-OSS-120B，但略逊于Qwen3.5-122B-A10B。NVIDIA强调其技术方向正从模型本身转向运行环境的优化与编排。在社区和基础设施方面，多个项目如vLLM、llama.cpp、Ollama、Together、Baseten、W&B Inference、LangChain和Unsloth GGUFs等迅速支持了该模型。Nemotron 3 Super的关键技术创新包括原生多标记预测（MTP）机制和显著提升的键值缓存（KV-cache）效率。在产品层面，NVIDIA推动了代理系统的应用，如Perplexity的Personal Computer和Computer for Enterprise，以及Replit 4和Base44 Superagents等，这些产品旨在实现更高效、可读性强、可分叉的代理系统，并具备实时控制能力。

NVIDIA发布Nemotron 3 Super：1200亿参数模型与代理系统创新

内容评分

摘要

正文

标签