预测逆动力学模型:提升模仿学习的数据效率与意图建模原文官方Microsoft Research Blog2026/02/06 01:006840• PIDMs通过预测未来状态提升模仿学习• 减少对大量示范数据的依赖本文提出预测逆动力学模型(PIDMs)以改进模仿学习,通过预测未来状态和推断行动,提升数据效率和意图建模能力。实验表明PIDMs在多数任务中优于传统行为克隆方法,尤其适用于数据稀缺或复杂环境。数据效率状态预测模仿学习AI研究动作选择