阿里巴巴发布Qwen 3.5系列模型：多模态与轻量化部署

AINews2026/03/02 13:44机翻/自动摘要/自动分类

内容评分

技术含量

8/10

营销水分

6/10

摘要

阿里巴巴发布Qwen 3.5系列模型，涵盖0.8B至9B参数规模，支持多模态处理和扩展强化学习。模型采用Gated DeltaNet混合注意力机制，适用于边缘设备和轻量级应用。已在Ollama和LM Studio中集成，并在iPhone 17 Pro上实现6位精度运行。Codex 5.3在编码代理测试中表现良好，但系统稳定性仍是挑战。

正文

阿里巴巴近日发布了Qwen 3.5系列模型，涵盖0.8B至9B参数规模，专为边缘计算和轻量级应用场景设计。该系列模型具备原生多模态处理能力，并引入了可扩展的强化学习机制。其支持长达262K个标记的上下文窗口，可扩展至100万个标记。模型采用了创新的Gated DeltaNet混合注意力机制，结合线性注意力层与全注意力层，以提升效率和性能。Qwen 3.5已在Ollama和LM Studio等工具中成功集成，并在iPhone 17 Pro上实现了6位精度的高效运行演示。值得注意的是，较小规模的模型默认关闭推理功能。在编码代理领域，Codex 5.3在WeirdML基准测试中达到79.3%的准确率，但模型的可用性和稳定性仍面临挑战。研究指出，确保代理系统的可靠性和可观测性是跨职能难题，需明确的评估标准和方法论。此外，使用AGENTS.md和SKILL.md等文档规范可有效减少编码流程中的运行时间和标记消耗。

阿里巴巴发布Qwen 3.5系列模型：多模态与轻量化部署

内容评分

摘要

正文

标签