媒体爱范儿2026/03/05 19:477830
Qwen 3.5 Small模型以9B参数实现高性能推理,可在本地设备运行,挑战了'模型越大越聪明'的行业共识。其发布与林俊旸离职事件引发对AI行业技术路线与商业利益冲突的讨论,凸显小模型在效率与灵活性上的优势,以及对云厂商的潜在冲击。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 2 篇文章。
Qwen 3.5 Small模型以9B参数实现高性能推理,可在本地设备运行,挑战了'模型越大越聪明'的行业共识。其发布与林俊旸离职事件引发对AI行业技术路线与商业利益冲突的讨论,凸显小模型在效率与灵活性上的优势,以及对云厂商的潜在冲击。
AdaReasoner提出一种创新的训练范式,使7B小模型在多模态推理任务中实现性能飞跃,甚至在特定拼图推理任务上超越GPT-5。其核心在于将“何时、何种、如何使用工具”作为一种通用推理能力进行学习,而非简单调用。通过Tool Cold Start(TC)引入错误修正与回溯机制,Tool-GRPO(TG)优化多轮工具编排,以及Adaptive Learni…