阿里巴巴发布Qwen 3.5系列模型:多模态与轻量化部署
AINews2026/03/02 13:44机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
8/10
营销水分
6/10
摘要
阿里巴巴发布Qwen 3.5系列模型,涵盖0.8B至9B参数规模,支持多模态处理和扩展强化学习。模型采用Gated DeltaNet混合注意力机制,适用于边缘设备和轻量级应用。已在Ollama和LM Studio中集成,并在iPhone 17 Pro上实现6位精度运行。Codex 5.3在编码代理测试中表现良好,但系统稳定性仍是挑战。
正文
阿里巴巴近日发布了Qwen 3.5系列模型,涵盖0.8B至9B参数规模,专为边缘计算和轻量级应用场景设计。该系列模型具备原生多模态处理能力,并引入了可扩展的强化学习机制。其支持长达262K个标记的上下文窗口,可扩展至100万个标记。模型采用了创新的Gated DeltaNet混合注意力机制,结合线性注意力层与全注意力层,以提升效率和性能。Qwen 3.5已在Ollama和LM Studio等工具中成功集成,并在iPhone 17 Pro上实现了6位精度的高效运行演示。值得注意的是,较小规模的模型默认关闭推理功能。在编码代理领域,Codex 5.3在WeirdML基准测试中达到79.3%的准确率,但模型的可用性和稳定性仍面临挑战。研究指出,确保代理系统的可靠性和可观测性是跨职能难题,需明确的评估标准和方法论。此外,使用AGENTS.md和SKILL.md等文档规范可有效减少编码流程中的运行时间和标记消耗。