Microsoft Foundry 集成 Fireworks AI：开放模型高性能推理新方案

Microsoft Azure Blog2026/03/11 15:00机翻/自动摘要/自动分类

内容评分

技术含量

9/10

营销水分

8/10

摘要

Microsoft Foundry 集成 Fireworks AI，为企业提供统一的开放模型推理平台。该方案支持多款主流模型，包含无服务器部署和 PTU 计费模式，日处理能力达 13 万亿 tokens，每秒处理 18 万请求。核心亮点在于打通模型全生命周期管理，通过 BYOW 功能实现自定义权重部署，解决传统方案中工具碎片化导致的扩展难题，助力开发者高效构建企业级 AI 应用。

正文

随着各行业对开放模型的采纳率提升，企业亟需在性能、成本、定制化及安全性等方面获得更精细的控制。传统方案因工具碎片化导致创新效率低下，而 Microsoft Foundry 通过统一平台整合模型评估、部署、治理等全流程功能，解决这一痛点。今日，Fireworks AI 作为高性能开放模型推理引擎在 Foundry 平台公开预览，其核心价值在于将先进模型能力与企业级运营需求结合。该平台支持 DeepSeek V3.2、OpenAI gpt-oss-120b、Kimi K2.5 和 MiniMax M2.5（新增）等模型，提供无服务器部署与 PTU 计费模式。关键性能指标包括：日处理 13 万亿 tokens、每秒 18 万请求、大型模型生成超 1,000 tokens/模型。通过 '自带权重'（BYOW）功能，开发者可直接上传自定义模型权重，无需重构服务架构。Microsoft Foundry 的标准化工作流与 Fireworks AI 的高吞吐量引擎形成互补，助力企业实现从实验到生产的无缝迁移。

Microsoft Foundry 集成 Fireworks AI：开放模型高性能推理新方案

内容评分

摘要

正文

标签