Moonshot注意力残差、Codex功能扩展与LangChain开源工具进展
AINews2026/03/16 13:44机翻/自动摘要/自动分类
3 阅读
内容评分
技术含量
8/10
营销水分
7/10
摘要
Moonshot提出注意力残差机制,提升计算效率并降低延迟;Codex用户增长显著,新增子代理功能并优化知识转移;LangChain开源Deep Agents框架,支持复杂编码代理流程。三者均涉及AI模型架构、训练效率及开发工具的创新。
正文
Moonshot近期发布了一篇关于注意力残差(Attention Residuals)的论文,提出了一种基于输入的注意力机制,该机制在处理前一层数据时展现出1.25倍的计算优势,并且推理延迟开销低于2%。该技术已在Kimi Linear模型(总参数量480亿,活跃参数30亿)上进行了验证,引发了关于其创新性与现有技术(如DeepCrossAttention及谷歌早期相关工作)的讨论。
OpenAI的Codex持续发展,每周活跃用户超过200万,同比增长近4倍。GPT-5.4的日处理量达到5万亿,年运行成本高达10亿美元。Codex新增了子代理功能,支持多代理协同的编码流程。其基础设施日趋成熟,配套工具包括Context Hub和chub(用于代理间反馈循环),以及AssemblyAI提供的技能支持系统。此外,从GitHub仓库自动提取技能信息的功能提升了知识转移效率40%。
LangChain发布了LangGraph CLI工具,并开源了Deep Agents框架,实现了包括规划、文件系统操作、shell访问和子代理在内的高级编码代理工作流程。