媒体量子位2026/03/31 16:227940
• 全模态理解与生成能力
• 实时视频编程与对话
Qwen3.5-Omni是阿里推出的全模态AI模型,具备215项SOTA成绩,支持音视频理解、实时编程和语义打断等创新功能。其Thinker-Talker架构和Hybrid-Attention MoE技术提升了处理效率和交互自然度,适用于视频会议、论文解读和网页设计等场景。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 4 篇文章。
Qwen3.5-Omni是阿里推出的全模态AI模型,具备215项SOTA成绩,支持音视频理解、实时编程和语义打断等创新功能。其Thinker-Talker架构和Hybrid-Attention MoE技术提升了处理效率和交互自然度,适用于视频会议、论文解读和网页设计等场景。
最新SOTA嵌入模型专为代理工作流设计,公开预览。通过优化信息表示,提升AI系统处理复杂任务的效率与准确性,适用于多步骤任务的语义理解和执行。
美团发布 LongCat-Flash-Thinking-2601,该模型在 Agentic Search、Agentic Tool Use 和 TIR 等关键指标上达到开源模型 SOTA 水平,具备强大的工具调用与智能体协作能力,适用于复杂任务处理与 AI 研究。
美团发布开源视频生成模型 LongCat-Video-Avatar,实现 SOTA 拟真效果。该模型支持文本和图像输入,生成高质量视频,适用于多种应用场景。开源特性鼓励技术共享与创新。