首页/详情

智谱 GLM-5:AI Agent 工程的深度技术实践

机器之心2026/02/23 20:18机翻/自动摘要/自动分类
1 阅读

内容评分

技术含量
9/10
营销水分
7/10

摘要

智谱 GLM-5 是面向 Agentic Engineering 的新一代大模型,具备 200K 上下文长度和高效 Agent 工具调用能力。其核心技术包括 DSA 注意力机制、异步强化学习框架 Slime 和分层上下文管理策略,显著提升了训练与推理效率。GLM-5 在多个开源基准测试中表现优异,且适配国产 GPU,是 AI Agent 领域的重要技术突破。

正文

智谱 AI 在马年港股首个交易日市值暴涨近 43% 的同时,发布了新一代旗舰基座模型 GLM-5 的完整技术报告,展示了其在 AI 领域的技术实力。GLM-5 面向 Agentic Engineering,具备更强的代码能力、200K 和更高效的 工具调用能力,尤其擅长处理复杂系统工程与长程 任务。其核心创新包括 DSA(DeepSeek Sparse Attention)注意力机制、异步强化学习框架 Slime 以及 强化学习算法。通过 DSA,GLM-5 在不牺牲理解能力的前提下,将长序列计算量压缩 1.5-2 倍,参数规模扩展至 744B,训练 总量提升至 28.5T。Slime 框架通过异步推理与训练分离,显著提升 GPU 利用率。此外,GLM-5 还引入了 TITO Gateway、分层上下文管理(HCM)等创新,解决了 RL 训练中的数据污染、审美、遗忘等问题。GLM-5 全栈适配国产 GPU,如华为昇腾、摩尔线程等,进一步拓宽算力生态。其在多个基准测试中表现优异,甚至在部分任务上超越 Claude Opus 4.5。

标签