专题:serverless-deployment

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

官方Microsoft Azure Blog2026/03/11 15:008920
Fireworks AI集成Microsoft Foundry
支持多模型推理与部署选项

Microsoft Foundry 集成 Fireworks AI,为企业提供统一的开放模型推理平台。该方案支持多款主流模型,包含无服务器部署和 PTU 计费模式,日处理能力达 13 万亿 tokens,每秒处理 18 万请求。核心亮点在于打通模型全生命周期管理,通过 BYOW 功能实现自定义权重部署,解决传统方案中工具碎片化导致的扩展难题,助力开发者高效…