首页/详情

MAGE:多尺度自回归生成解决离线强化学习全局规划难题

量子位2026/04/06 13:35机翻/自动摘要/自动分类
2 阅读

内容评分

技术含量
9/10
营销水分
6/10

摘要

MAGE是一种多尺度自回归生成算法,旨在解决离线强化学习中全局规划不足的问题。通过先建模宏观结构再细化微观细节,MAGE在多个复杂任务中表现出色,推理效率高,具备实际部署潜力。

正文

面对复杂连续任务的长程规划,现有生成式离线强化学习方法常陷入局部合理但全局偏航的困境。为解决这一问题,厦门大学和香港科技大学联合提出MAGE算法,采用自顶向下的多尺度生成策略,先建模轨迹的宏观结构,再逐步细化微观细节。MAGE包含多尺度轨迹自编码器和条件引导自回归生成机制,通过严格以目标回报和初始状态为条件,确保的每一步都朝向最终目标。在多个基准测试中,MAGE表现出色,尤其在Adroit、Franka Kitchen和AntMaze等任务中显著优于现有方法。其推理速度达到27毫秒/步,满足实时控制需求。该算法通过将连续轨迹转化为离散,结合轻量级适配器和条件引导损失函数,实现了轨迹起点与真实环境的精确对齐。

标签