小米发布MiMo V2系列大模型,涵盖文本、多模态与语音合成
爱范儿2026/03/19 16:12机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
8/10
营销水分
7/10
摘要
小米发布MiMo V2系列模型,涵盖文本、多模态与语音合成。MiMo-V2-Pro性能优异,价格仅为同类产品五分之一,采用混合注意力架构和MTP技术。MiMo-V2-Omni具备全模态处理能力,MiMo-V2-TTS实现AI语音化。该系列标志着AI从对话向任务执行的进化,助力‘人车家全生态’整合。
正文
上周,两个未公开的匿名模型‘Hunter Alpha’和‘Healer Alpha’在知名API聚合平台OpenRouter上悄然出现,尽管未进行宣传,但调用量迅速增长。业界普遍猜测其为DeepSeek的测试版本,但小米官方确认这两款模型实为MiMo的早期测试版本。随后,小米正式发布了三款MiMo V2系列模型:MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS。MiMo-V2-Pro作为旗舰文本基座模型,专为高强度任务设计,擅长推理、规划和工具调用;MiMo-V2-Omni是全模态模型,融合文本、视觉和音频感知能力,实现从理解到执行的完整流程;MiMo-V2-TTS则专注于语音合成,赋予AI自然、富有情感的表达能力。MiMo-V2-Pro的API价格仅为同类产品的五分之一,参数量大幅增加但推理效率未下降,得益于混合注意力架构(Hybrid Attention)和轻量级MTP(Multi Prediction)技术。该系列模型在多项评估中表现优异,MiMo-V2-Pro在全球权威排行榜中位列第八,国内排名第二。小米还提供为期一周的免费接口支持,以推动其在开发者生态中的应用。小米表示,此次发布标志着AI从‘能对话’向‘能完成任务’的重要进化,并体现了其在AI领域的深度布局和前瞻性战略,旨在推动‘人车家全生态’的深度融合。