专题：gpu-reservation

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

AWS SageMaker AI训练计划：为推理端点预留GPU资源

官方AWS Machine Learning Blog2026/03/25 04:276820

• 预留GPU资源用于推理端点

• 支持时间窗口和实例类型选择

AWS SageMaker AI训练计划允许用户为推理端点预留固定GPU资源，确保在关键评估期或突发场景下有稳定的计算能力。文章介绍了具体操作流程、实例配置方法及管理策略，适用于需要可预测资源的AI模型部署。

媒体AWS Machine Learning Blog2026/02/21 04:266740

2025 年 Amazon SageMaker AI 推出灵活训练计划用于推理端点，并通过多 AZ 高可用、LoRA 并行扩展和 EAGLE‑3 自适应解码四项技术显著提升推理成本性能。新功能实现 GPU 预留、容错提升和吞吐增长，帮助用户在生产环境中更高效、低成本地部署大模型。