专题：sagemaker

Nova Forge SDK是亚马逊推出的用于简化企业级LLM定制的开发工具包，整合了SFT、RFT、DPO、LoRA等多种微调方法，统一管理从数据准备到模型部署的全流程。它通过智能默认配置和底层服务抽象，降低技术门槛，支持在SageMaker Training Jobs上高效运行，帮助企业快速构建专有AI模型，避免灾难性遗忘与配置复杂性。

LLM定制监督微调直接偏好优化 LoRA微调 Amazon SageMaker

Bark.com与AWS合作构建高效视频生成解决方案

原文

媒体AWS Machine Learning Blog2026/03/18 23:246940

• AI驱动视频生成流程

• 多阶段架构确保一致性

Bark.com与AWS合作构建视频生成解决方案，通过AI技术将内容生产时间从数周缩短至数小时，实现语义和视觉一致性，支持多客户细分的个性化广告生成。

视频生成 AI内容创作生成式AI Amazon Bedrock Amazon SageMaker

AWS AI League：实践驱动的AI技能提升与微调实战

原文

媒体AWS Machine Learning Blog2026/03/17 23:517950

• 游戏化AI培训提升参与度

• 微调LLM实现领域定制

AWS AI League通过游戏化、实践导向的学习模式，帮助组织提升AI技能，特别是LLM微调技术。结合SageMaker等工具，Atos在保险核保领域成功应用，展示了微调模型在准确性和成本效益上的优势。

大型语言模型微调 AI教育模型定制化 AWS人工智能联赛模型微调

在SageMaker上构建兼容Strands代理的自定义LLM模型解析器

原文

官方AWS Machine Learning Blog2026/03/06 00:155850

本文探讨了如何在SageMaker上部署自定义LLM，并通过实现自定义解析器解决与Strands代理的响应格式不兼容问题。核心亮点包括使用`awslabs/ml-container-creator`简化部署、自定义解析器的实现以及`stream()`方法的关键作用。

Amazon SageMaker Strands代理 LLM部署自定义解析器 Bedrock API格式

vLLM助力高效服务多个微调模型：Multi-LoRA技术详解

原文

官方AWS Machine Learning Blog2026/02/26 04:566850

本文提出Multi-LoRA技术，通过在模型层插入适配器实现多模型共享GPU资源，显著提升效率。适用于MoE模型如GPT-OSS、Qwen3-MoE等，已在vLLM 0.15.0中实现，并在Amazon SageMaker AI和Bedrock上部署。性能提升包括OTPS提高19%和TTFT缩短8%。

VLLM 多LoRA Mixture‑of‑Experts 架构 Amazon SageMaker Amazon Bedrock

在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型

原文

媒体AWS Machine Learning Blog2026/02/24 23:466830

本文介绍如何在 Amazon SageMaker 上使用 Ray 和 veRL 训练 CodeFu-7B，一个专为竞争性编程设计的 70 亿参数模型。通过强化学习和分布式训练，该模型在算法推理和代码生成方面表现出色。文章提供了完整的实现流程和资源链接，适合开发者和研究人员参考。

Ray veRL 强化学习库 Amazon SageMaker CodeFu-7B 模型强化学习

Amazon SageMaker AI 2025：可观测性、模型定制与托管深度升级

原文

媒体AWS Machine Learning Blog2026/02/21 04:265670

2025年，Amazon SageMaker AI在模型训练、调优和托管方面取得了显著进展。本文重点介绍了其在可观测性、模型定制和托管功能上的深度升级。通过引入细粒度指标，用户可精准诊断性能瓶颈和资源浪费，并利用CloudWatch实现主动监控与自动响应。无服务器模型定制简化了调优流程，支持RLVR/RLAIF等高级技术，并兼容主流模型。此外，双向流、IP…

Amazon SageMaker AI/LLM 全栈可观测性无服务器架构模型部署

NVIDIA Nemotron 3 Nano 30B 登陆 SageMaker JumpStart：开源MoE大模型，30亿参数高效推理新标杆

原文

媒体AWS Machine Learning Blog2026/02/12 03:3830

NVIDIA Nemotron 3 Nano 30B 是一款开源的30亿活跃参数混合专家（MoE）语言模型，现已在 Amazon SageMaker JumpStart 上线，支持一键部署。该模型采用 Transformer-Mamba 架构，在编码、数学与科学推理等任务中表现优异，上下文窗口达百万令牌，兼具高精度与高效率。其完全开放的权重与部署方案，便于…

Mixture‑of‑Experts 架构 Nemotron模型 Amazon SageMaker 开源权重长上下文处理