首页/详情

Yann LeCun团队推出单GPU运行的世界模型LeWM

量子位2026/03/24 15:00机翻/自动摘要/自动分类
5 阅读

内容评分

技术含量
9/10
营销水分
7/10

摘要

Yann LeCun团队推出单GPU运行的世界模型LeWM,基于JEPA架构,实现快速规划和物理理解。模型参数仅1500万,训练速度比传统方法快48倍,适用于机器人控制任务,具备异常检测能力,已开源。

正文

Yann LeCun团队最新推出的世界模型LeWorldModel(简称LeWM)基于JEPA架构,实现了单GPU训练和快速规划。该模型通过编码器将图像压缩为特征,预测器根据当前特征和动作预测下一帧,结合高斯正则化防止模型坍塌。LeWM在四个机器人控制任务中表现优异,尤其在推箱子和导航任务中,成功率高达96%。其核心创新在于仅使用两个损失函数:预测损失和SIGReg正则损失,极大简化了训练流程。此外,LeWM具备物理理解能力,能识别违反物理规律的异常场景,如物体瞬移。项目已开源,包含训练代码和论文链接。

标签