媒体AWS Machine Learning Blog2026/03/13 05:206840
• 新增CloudWatch指标用于监控AI推理延迟
• 提供实时配额使用估算,避免流量限制
AWS在Amazon Bedrock中新增了两个CloudWatch指标,用于实时监控推理延迟和配额使用。`TimeToFirstToken`反映生成第一个令牌的时间,`EstimatedTPMQuotaUsage`提供更准确的配额消耗估算。这些指标无需配置,自动收集,适用于多种API,有助于性能优化和容量管理。