11 月 10 日,斯坦福教授、ImageNet 奠基人李飞飞在个人 Substack 发布长文《From Words to Worlds》
她指出,大模型最强的能力在语言,但 AI 真正的下一跳不在语言里,而在世界里,她称之为空间智能(Spatial Intelligence)
今天的大模型像是学霸在考试,却不是生活中的高手。
在她的带领下,World Labs 已经发布了首个世界模型原型产品 Marble。这是世界上第一个可以生成真正 3D 世界的生成模型。
李飞飞和她的团队在 2024 年创立 World Labs,用不到一年时间,就发布了世界上第一个基于空间智能的产品原型 Marble(网站:www.worldlabs.ai)
在她看来,世界模型最先爆发的领域不是重工业,而是讲故事的人:
- 影视导演、动画工作者、虚拟拍摄团队
- 游戏设计师、VR开发者、叙事类AI应用开发者
- 普通创作者、学生、甚至孩子
AI 进入机器人,一直是行业共识,但为什么迟迟没有爆发?
李飞飞的答案是:没有空间智能,机器人就看不懂世界。
传统机器人训练一个动作,需要大量真实场景的数据、手工编写的代码和规则。现在有了世界模型,机器人可以在 AI 生成的仿真世界中自主学习。
谁会最早用上空间智能?
- 想建一个世界观的创作者
- 想让机器真正动起来的开发者
- 想用 AI 做模拟、教学、辅助理解的研究者与一线工作者

