EP03 Generalist、π 和 Sunday:通用具身落地的技术趋势与挑战The Alphaist

EP03 Generalist、π 和 Sunday:通用具身落地的技术趋势与挑战

62分钟 ·
播放数455
·
评论数2

1|📒The Alphaist 播客栏目介绍

《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。

每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做?

The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。

我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。

2|🤖本期播客介绍

2024年11月,三家硅谷公司几乎同时投下重磅炸弹:Generalist AI 宣称找到了机器人领域的 Scaling Law,Physical Intelligence 发布了能从错误中学习的 π0.6,Sunday Robotics 用一只200美元的手套重新定义数据采集。

这不是巧合,而是一个信号——具身智能可能正在逼近它的"ChatGPT时刻"。

但真相远比Demo复杂:27万小时数据够不够?机器人真的会涌现吗?为什么"端到端"让工程师又爱又恨?当硅谷还在Research Lab模式里探索时,中国公司已在问"三年内能做什么产品"——谁会笑到最后?

本期嘉宾:

  • 冯思远:Toyota Research Institute 研究员,Diffusion Policy 联合作者
  • 俞冠廷 (Peter Yu):XYZ Robotics CTO
  • 张强 (Jony):国地共建具身智能机器人创新中心首席研究员

我们将深入讨论:

  • Scaling 的信仰:Generalist 声称找到 Scaling Law,但怎样定义Scaling Law?
  • 从模仿到经验:Physical Intelligence 为什么让机器人"从错误中学习"?
  • 数据革命:Sunday 的三指手套能否打破数据采集瓶颈?
  • Evaluation 困境:没有公认的 Benchmark,我们怎么知道在爬“正确”的山?
  • 形态之争:为什么三家最前沿的公司都选择了"非人形"?
  • 中美路径:Research Lab vs 产品导向,哪种模式更适合探索期?

3|🕙时间轴

研究范式转变

  • 05:12 范式转向:Diffusion Policy让监督学习"又可以了",完美接上LLM趋势
  • 07:53 工程务实:Right tool for the right job,VLA每次evaluate都很expensive
  • 08:28 端到端代价:模块化可以写Spec做Unit Test,VLA只能说"大概能跑"
  • 10:34 意外的跨界:π0.6出来后,来讨论的反而是自动驾驶的人——他们每天能用的数据不到1%

Generalist:Scaling的信仰

  • 12:04 Bet against Scaling Law,基本上不是一个好主意
  • 12:58 Evaluation困境:没人知道task长什么样,没人能复现任何实验
  • 15:18 数据质量的隐忧:两只手夹爪做daily life,但工业场景用吸盘吸箱子——这很难transfer
  • 17:07 Harmonic Reasoning:可能是observation和action同步predict,不是新想法,但工程实现很难

Physical Intelligence:从错误中学习

  • 21:21 路径转变:采了很多数据后发现光靠现有的数采方式纯怼pretraining还是不够的,开始转向Post-Training
  • 22:32 Language Model的启发:数据飞轮到瓶颈后,RL是更好利用数据的方式
  • 26:12 经验学习:不只学对的,从错误中也能学——看别人失败的视频也能学开车
  • 26:47 RECAP的聪明:把问题切得很好,每部分都stable,接起来就好用

Sunday:数据采集革命

  • 27:48 200美元手套:Skill Capture Glove让普通人在家就能采集数据
  • 28:50 两指到三指:三指是复杂度和通用性的最佳平衡点
  • 31:03 Long Horizon的真相:线性"长程任务"只是model prediction,分支场景才有挑战
  • 33:02 范式跃迁实证:Dishwasher demo从"10人1年"变成"1人1周"

中美格局与Evaluation

  • 34:17 路径分野:国内注重落地和system,硅谷像OpenAI一样"不落地"做Research
  • 36:37 机器人特殊性:causal system无法做offline benchmark,线上evaluation成本太大
  • 37:51 国家标准的尝试:中国已有具身智能相关团标和国标,但"通用"这个东西太难定义
  • 39:23 评测悖论:用uncertain的世界模型去评测uncertain的policy,是否合理?

具身形态与落地

  • 42:19 迭代速度优先:形态次要,关键是"怎么加快迭代速度"
  • 43:22 硬件是天花板:想法验证阶段把天花板定太低是不利的
  • 45:02 Superhuman才有价值:搬更重、看更精、天上飞、水下游——要有differentiation
  • 49:19 殊途同归:工业派心里都有走向家庭的梦想,南坡北坡都在攀登同一座山
  • 50:56 PC类比:最早的PC也没定义用户任务,卖给Developer让他们自己想

未来预测

  • 57:18 乐观派:三年内会出现具身的ChatGPT时刻
  • 58:02 谨慎派:周期性过程,最近两年轻算法偏工程
  • 59:18 建设派:真正产生value要10年,一半以上问题跟硬件有关

4 |🅰️ 关于我们

Alphaist:一家生于2025的美元新基金,和它的十年赌局

如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中

微信公众号:Alphaist Partners

展开Show Notes
晴总
晴总
2026.1.08