小米发布MiMo V2系列大模型，涵盖文本、多模态与语音合成

上周，两个未公开的匿名模型‘Hunter Alpha’和‘Healer Alpha’在知名API聚合平台OpenRouter上悄然出现，尽管未进行宣传，但调用量迅速增长。业界普遍猜测其为DeepSeek的测试版本，但小米官方确认这两款模型实为MiMo的早期测试版本。随后，小米正式发布了三款MiMo V2系列模型：MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS。MiMo-V2-Pro作为旗舰文本基座模型，专为高强度任务设计，擅长推理、规划和工具调用；MiMo-V2-Omni是全模态模型，融合文本、视觉和音频感知能力，实现从理解到执行的完整流程；MiMo-V2-TTS则专注于语音合成，赋予AI自然、富有情感的表达能力。MiMo-V2-Pro的API价格仅为同类产品的五分之一，参数量大幅增加但推理效率未下降，得益于混合注意力架构（Hybrid Attention）和轻量级MTP（Multi Prediction）技术。该系列模型在多项评估中表现优异，MiMo-V2-Pro在全球权威排行榜中位列第八，国内排名第二。小米还提供为期一周的免费接口支持，以推动其在开发者生态中的应用。小米表示，此次发布标志着AI从‘能对话’向‘能完成任务’的重要进化，并体现了其在AI领域的深度布局和前瞻性战略，旨在推动‘人车家全生态’的深度融合。

小米发布MiMo V2系列大模型，涵盖文本、多模态与语音合成

内容评分

摘要

正文

标签