专题:imitation-learning

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

官方Microsoft Research Blog2026/02/06 01:006840
PIDMs通过预测未来状态提升模仿学习
减少对大量示范数据的依赖

本文提出预测逆动力学模型(PIDMs)以改进模仿学习,通过预测未来状态和推断行动,提升数据效率和意图建模能力。实验表明PIDMs在多数任务中优于传统行为克隆方法,尤其适用于数据稀缺或复杂环境。