EP03 Generalist、π 和 Sunday：通用具身落地的技术趋势与挑战

1｜📒The Alphaist 播客栏目介绍

《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。我们关注技术与创业的第一性原理，聚焦那些正在改变世界的早期创始人、工程师与产品探索者。

每期节目，我们会围绕一个具体的科技创业方向展开深度对话。在这里，我们不追热点、不讲空洞概念，而是用最真实的一线经验去回答创业者最关心的问题：什么值得做？为什么是现在？我们应该怎样做？

The Alphaist 相信：时代真正的机会，往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。

我们希望用这档节目，陪伴新一代的 Alpha 创业者们，记录与见证那些改变世界的勇敢开始。

📢 我们建了一个 The Alphaist 行业交流群，希望聚集同频的一线工程师、研究者与创业者，在这里分享行业进展、一手消息，以及任何还没琢磨透的问题。为保持良好的社群氛围，入群需经过审核，点击链接填写申请问卷：alphaist.feishu.cn

2｜🤖本期播客介绍

2024年11月，三家硅谷公司几乎同时投下重磅炸弹：Generalist AI 宣称找到了机器人领域的 Scaling Law，Physical Intelligence 发布了能从错误中学习的 π0.6，Sunday Robotics 用一只200美元的手套重新定义数据采集。

这不是巧合，而是一个信号——具身智能可能正在逼近它的"ChatGPT时刻"。

但真相远比Demo复杂：27万小时数据够不够？机器人真的会涌现吗？为什么"端到端"让工程师又爱又恨？当硅谷还在Research Lab模式里探索时，中国公司已在问"三年内能做什么产品"——谁会笑到最后？

本期嘉宾：

冯思远：Toyota Research Institute 研究员，Diffusion Policy 联合作者
俞冠廷 (Peter Yu)：XYZ Robotics CTO
张强 (Jony)：国地共建具身智能机器人创新中心首席研究员

我们将深入讨论：

Scaling 的信仰：Generalist 声称找到 Scaling Law，但怎样定义Scaling Law？
从模仿到经验：Physical Intelligence 为什么让机器人"从错误中学习"？
数据革命：Sunday 的三指手套能否打破数据采集瓶颈？
Evaluation 困境：没有公认的 Benchmark，我们怎么知道在爬“正确”的山？
形态之争：为什么三家最前沿的公司都选择了"非人形"？
中美路径：Research Lab vs 产品导向，哪种模式更适合探索期？

3｜🕙时间轴

研究范式转变

05:12 范式转向：Diffusion Policy让监督学习"又可以了"，完美接上LLM趋势
07:53 工程务实：Right tool for the right job，VLA每次evaluate都很expensive
08:28 端到端代价：模块化可以写Spec做Unit Test，VLA只能说"大概能跑"
10:34 意外的跨界：π0.6出来后，来讨论的反而是自动驾驶的人——他们每天能用的数据不到1%

Generalist：Scaling的信仰

12:04 Bet against Scaling Law，基本上不是一个好主意
12:58 Evaluation困境：没人知道task长什么样，没人能复现任何实验
15:18 数据质量的隐忧：两只手夹爪做daily life，但工业场景用吸盘吸箱子——这很难transfer
17:07 Harmonic Reasoning：可能是observation和action同步predict，不是新想法，但工程实现很难

Physical Intelligence：从错误中学习

21:21 路径转变：采了很多数据后发现光靠现有的数采方式纯怼pretraining还是不够的，开始转向Post-Training
22:32 Language Model的启发：数据飞轮到瓶颈后，RL是更好利用数据的方式
26:12 经验学习：不只学对的，从错误中也能学——看别人失败的视频也能学开车
26:47 RECAP的聪明：把问题切得很好，每部分都stable，接起来就好用

Sunday：数据采集革命

27:48 200美元手套：Skill Capture Glove让普通人在家就能采集数据
28:50 两指到三指：三指是复杂度和通用性的最佳平衡点
31:03 Long Horizon的真相：线性"长程任务"只是model prediction，分支场景才有挑战
33:02 范式跃迁实证：Dishwasher demo从"10人1年"变成"1人1周"

中美格局与Evaluation

34:17 路径分野：国内注重落地和system，硅谷像OpenAI一样"不落地"做Research
36:37 机器人特殊性：causal system无法做offline benchmark，线上evaluation成本太大
37:51 国家标准的尝试：中国已有具身智能相关团标和国标，但"通用"这个东西太难定义
39:23 评测悖论：用uncertain的世界模型去评测uncertain的policy，是否合理？

具身形态与落地

42:19 迭代速度优先：形态次要，关键是"怎么加快迭代速度"
43:22 硬件是天花板：想法验证阶段把天花板定太低是不利的
45:02 Superhuman才有价值：搬更重、看更精、天上飞、水下游——要有differentiation
49:19 殊途同归：工业派心里都有走向家庭的梦想，南坡北坡都在攀登同一座山
50:56 PC类比：最早的PC也没定义用户任务，卖给Developer让他们自己想

未来预测

57:18 乐观派：三年内会出现具身的ChatGPT时刻
58:02 谨慎派：周期性过程，最近两年轻算法偏工程
59:18 建设派：真正产生value要10年，一半以上问题跟硬件有关

4 ｜🅰️ 关于我们

Alphaist：一家生于2025的美元新基金，和它的十年赌局

如果你喜欢The Alphaist的播客内容，希望参与我们整个探索和创作过程，欢迎加入我们：加入我们｜品牌内容负责人/实习生招聘中

微信公众号：Alphaist Partners