首页/详情

Microsoft Foundry 集成 Fireworks AI:开放模型高性能推理新方案

Microsoft Azure Blog2026/03/11 15:00机翻/自动摘要/自动分类
2 阅读

内容评分

技术含量
9/10
营销水分
8/10

摘要

Microsoft Foundry 集成 Fireworks AI,为企业提供统一的开放模型推理平台。该方案支持多款主流模型,包含无服务器部署和 PTU 计费模式,日处理能力达 13 万亿 tokens,每秒处理 18 万请求。核心亮点在于打通模型全生命周期管理,通过 BYOW 功能实现自定义权重部署,解决传统方案中工具碎片化导致的扩展难题,助力开发者高效构建企业级 AI 应用。

正文

随着各行业对开放模型的采纳率提升,企业亟需在性能、成本、定制化及安全性等方面获得更精细的控制。传统方案因工具碎片化导致创新效率低下,而 Microsoft Foundry 通过统一平台整合模型评估、部署、治理等全流程功能,解决这一痛点。今日,Fireworks AI 作为高性能开放模型推理引擎在 Foundry 平台公开预览,其核心价值在于将先进模型能力与企业级运营需求结合。该平台支持 DeepSeek V3.2、OpenAI gpt-oss-120b、Kimi K2.5 和 MiniMax M2.5(新增)等模型,提供无服务器部署与 PTU 计费模式。关键性能指标包括:日处理 13 万亿 tokens、每秒 18 万请求、大型模型生成超 1,000 tokens/模型。通过 '自带权重'(BYOW)功能,开发者可直接上传自定义模型权重,无需重构服务架构。Microsoft Foundry 的标准化工作流与 Fireworks AI 的高吞吐量引擎形成互补,助力企业实现从实验到生产的无缝迁移。

标签