智谱 GLM-5：AI Agent 工程的深度技术实践

机器之心2026/02/23 20:18机翻/自动摘要/自动分类

内容评分

技术含量

9/10

营销水分

7/10

摘要

智谱 GLM-5 是面向 Agentic Engineering 的新一代大模型，具备 200K 上下文长度和高效 Agent 工具调用能力。其核心技术包括 DSA 注意力机制、异步强化学习框架 Slime 和分层上下文管理策略，显著提升了训练与推理效率。GLM-5 在多个开源基准测试中表现优异，且适配国产 GPU，是 AI Agent 领域的重要技术突破。

正文

智谱 AI 在马年港股首个交易日市值暴涨近 43% 的同时，发布了新一代旗舰基座模型 GLM-5 的完整技术报告，展示了其在 AI 领域的技术实力。GLM-5 面向 Agentic Engineering，具备更强的代码能力、200K 和更高效的工具调用能力，尤其擅长处理复杂系统工程与长程任务。其核心创新包括 DSA（DeepSeek Sparse Attention）注意力机制、异步强化学习框架 Slime 以及强化学习算法。通过 DSA，GLM-5 在不牺牲理解能力的前提下，将长序列计算量压缩 1.5-2 倍，参数规模扩展至 744B，训练总量提升至 28.5T。Slime 框架通过异步推理与训练分离，显著提升 GPU 利用率。此外，GLM-5 还引入了 TITO Gateway、分层上下文管理（HCM）等创新，解决了 RL 训练中的数据污染、审美、遗忘等问题。GLM-5 全栈适配国产 GPU，如华为昇腾、摩尔线程等，进一步拓宽算力生态。其在多个基准测试中表现优异，甚至在部分任务上超越 Claude Opus 4.5。

智谱 GLM-5：AI Agent 工程的深度技术实践

内容评分

摘要

正文

标签