本文介绍了 LeWorldModel (LeWM),这是一种针对机器人控制任务的创新型世界模型。与以往依赖复杂损失函数或预训练组件的方法不同,该模型实现了端到端的像素级学习,仅通过预测未来状态和维持数据多样性两个核心目标进行训练。这种简化设计使得模型不仅极其稳定且易于优化,而且在处理 2D 和 3D 复杂环境时表现出色。实验证明,LeWM 在保证竞争力的同时,其规划速度比主流模型快出近 48 倍。此外,该模型展现了对物理规律的深刻理解,能够有效识别并预警违反物理常识的异常情况。

LeWorldModel:高效端到端像素级潜在世界模型
17分钟 ·
11·
0