专题:nemotron

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

官方AWS Machine Learning Blog2026/03/17 04:517830
AWS部署百万级NVIDIA GPU
EC2支持新型Blackwell GPU

AWS与NVIDIA在2026年GTC大会上深化AI合作,部署百万级GPU、支持新型EC2实例、优化分布式LLM推理及提升Apache Spark性能。此举旨在帮助企业构建稳定、可扩展且合规的AI生产系统,为开发者和研究人员提供更强大的工具。

媒体AINews2026/03/11 13:447930
Nemotron 3 Super参数量达1200亿
推理速度比GPT-OSS-120B快2.2倍

NVIDIA发布Nemotron 3 Super,参数量达1200亿,采用混合架构,推理速度提升2.2倍,支持代理式工作负载。该模型在AA Intelligence Index中表现优异,同时推动了代理系统的应用与优化,涵盖多个AI产品和平台。

媒体AWS Machine Learning Blog2026/02/12 03:3830

NVIDIA Nemotron 3 Nano 30B 是一款开源的30亿活跃参数混合专家(MoE)语言模型,现已在 Amazon SageMaker JumpStart 上线,支持一键部署。该模型采用 Transformer-Mamba 架构,在编码、数学与科学推理等任务中表现优异,上下文窗口达百万令牌,兼具高精度与高效率。其完全开放的权重与部署方案,便于…