媒体AINews2026/03/02 13:446830
• Qwen 3.5支持多模态与轻量化部署
• 采用Gated DeltaNet混合注意力机制
阿里巴巴发布Qwen 3.5系列模型,涵盖0.8B至9B参数规模,支持多模态处理和扩展强化学习。模型采用Gated DeltaNet混合注意力机制,适用于边缘设备和轻量级应用。已在Ollama和LM Studio中集成,并在iPhone 17 Pro上实现6位精度运行。Codex 5.3在编码代理测试中表现良好,但系统稳定性仍是挑战。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 1 篇文章。