专题:world-models

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

媒体Latent Space2026/04/03 01:555800
因果结构替代规模扩展
游戏引擎建模物理因果

Moonlake AI提出基于因果结构的多模态世界模型,通过整合符号逻辑与神经网络,实现环境交互模拟。该模型突破传统视频生成范式,强调物理规律理解与高效推理能力,为机器人控制、医疗等场景提供新思路,但评估方法仍具挑战。

媒体Latent Space2026/03/11 14:468740
AMI获10.3亿美元种子轮投资
聚焦世界模型与抽象表示学习

Yann LeCun创立的AMI实验室获得10.3亿美元种子轮投资,估值达35亿美元,专注于构建理解物理世界的AI模型。其核心技术基于JEPA架构,强调抽象表示和现实建模,而非仅依赖语言预测。AMI的成立被视为对当前LLM路径的挑战,具有重要的行业和欧洲战略意义。

媒体机器之心2026/02/21 21:376830

BridgeV2W 提出“具身掩码”技术,将机器人动作的坐标空间映射到视频生成模型的像素空间,解决了动作-像素对齐、视角鲁棒性和跨具身通用性三大难题。该模型能让机器人在行动前“预演”未来,并能利用海量无标注人类视频进行训练,显著提升了具身世界模型的规模化和泛化能力,为通用具身智能提供了新路径。

媒体Import AI2025/10/27 20:316820

本期《AI进口》聚焦AI在机器人研发、实验室协作和API安全三个方向的突破。Ctrl-World通过可控世界模型提升机器人性能,LabOS实现AI与人类的实验协作,AI审计代理有效检测恶意微调。苹果推出Pico-Banana-400k数据集用于图像编辑训练,展示了AI在图像生成领域的进展。文章提供了具体技术细节和实验结果,具有较高的参考价值。

媒体Import AI2025/08/25 20:306820

本文涵盖AI在象牙走私分析、世界模型Mirage 2、LLM抽象推理能力、电路设计AI AnalogSeeker及谷歌Gemma 3等领域的应用与研究。重点在于AI如何辅助人类、提升效率、模拟复杂认知,并推动技术落地。核心亮点包括特征标记识别、世界模型浏览器体验、LLM与人类思维相似性及轻量级模型的发布。