1|📒The Alphaist 播客栏目介绍
《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。
每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做?
The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。
我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。
2|🤖本期播客介绍
2024年11月,三家硅谷公司几乎同时投下重磅炸弹:Generalist AI 宣称找到了机器人领域的 Scaling Law,Physical Intelligence 发布了能从错误中学习的 π0.6,Sunday Robotics 用一只200美元的手套重新定义数据采集。
这不是巧合,而是一个信号——具身智能可能正在逼近它的"ChatGPT时刻"。
但真相远比Demo复杂:27万小时数据够不够?机器人真的会涌现吗?为什么"端到端"让工程师又爱又恨?当硅谷还在Research Lab模式里探索时,中国公司已在问"三年内能做什么产品"——谁会笑到最后?
本期嘉宾:
- 冯思远:Toyota Research Institute 研究员,Diffusion Policy 联合作者
- 俞冠廷 (Peter Yu):XYZ Robotics CTO
- 张强 (Jony):国地共建具身智能机器人创新中心首席研究员
我们将深入讨论:
- Scaling 的信仰:Generalist 声称找到 Scaling Law,但怎样定义Scaling Law?
- 从模仿到经验:Physical Intelligence 为什么让机器人"从错误中学习"?
- 数据革命:Sunday 的三指手套能否打破数据采集瓶颈?
- Evaluation 困境:没有公认的 Benchmark,我们怎么知道在爬“正确”的山?
- 形态之争:为什么三家最前沿的公司都选择了"非人形"?
- 中美路径:Research Lab vs 产品导向,哪种模式更适合探索期?
3|🕙时间轴
研究范式转变
- 05:12 范式转向:Diffusion Policy让监督学习"又可以了",完美接上LLM趋势
- 07:53 工程务实:Right tool for the right job,VLA每次evaluate都很expensive
- 08:28 端到端代价:模块化可以写Spec做Unit Test,VLA只能说"大概能跑"
- 10:34 意外的跨界:π0.6出来后,来讨论的反而是自动驾驶的人——他们每天能用的数据不到1%
Generalist:Scaling的信仰
- 12:04 Bet against Scaling Law,基本上不是一个好主意
- 12:58 Evaluation困境:没人知道task长什么样,没人能复现任何实验
- 15:18 数据质量的隐忧:两只手夹爪做daily life,但工业场景用吸盘吸箱子——这很难transfer
- 17:07 Harmonic Reasoning:可能是observation和action同步predict,不是新想法,但工程实现很难
Physical Intelligence:从错误中学习
- 21:21 路径转变:采了很多数据后发现光靠现有的数采方式纯怼pretraining还是不够的,开始转向Post-Training
- 22:32 Language Model的启发:数据飞轮到瓶颈后,RL是更好利用数据的方式
- 26:12 经验学习:不只学对的,从错误中也能学——看别人失败的视频也能学开车
- 26:47 RECAP的聪明:把问题切得很好,每部分都stable,接起来就好用
Sunday:数据采集革命
- 27:48 200美元手套:Skill Capture Glove让普通人在家就能采集数据
- 28:50 两指到三指:三指是复杂度和通用性的最佳平衡点
- 31:03 Long Horizon的真相:线性"长程任务"只是model prediction,分支场景才有挑战
- 33:02 范式跃迁实证:Dishwasher demo从"10人1年"变成"1人1周"
中美格局与Evaluation
- 34:17 路径分野:国内注重落地和system,硅谷像OpenAI一样"不落地"做Research
- 36:37 机器人特殊性:causal system无法做offline benchmark,线上evaluation成本太大
- 37:51 国家标准的尝试:中国已有具身智能相关团标和国标,但"通用"这个东西太难定义
- 39:23 评测悖论:用uncertain的世界模型去评测uncertain的policy,是否合理?
具身形态与落地
- 42:19 迭代速度优先:形态次要,关键是"怎么加快迭代速度"
- 43:22 硬件是天花板:想法验证阶段把天花板定太低是不利的
- 45:02 Superhuman才有价值:搬更重、看更精、天上飞、水下游——要有differentiation
- 49:19 殊途同归:工业派心里都有走向家庭的梦想,南坡北坡都在攀登同一座山
- 50:56 PC类比:最早的PC也没定义用户任务,卖给Developer让他们自己想
未来预测
4 |🅰️ 关于我们
Alphaist:一家生于2025的美元新基金,和它的十年赌局
如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中
微信公众号:Alphaist Partners

