E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法硅谷101

E217|机器人开可乐发扑克有多难?聊聊灵巧手的硬件与算法

71分钟 ·
播放数23851
·
评论数38

2026年,人形机器人将迎来规模化量产的元年。最清晰的信号来自特斯拉,“金色擎天柱”Optimus Gen 3预计在2026年第一季度亮相,并计划在年底前建成产能高达100万台的生产线。马斯克曾多次表示,特斯拉未来约80%的价值来自这里,而非汽车。而“擎天柱”的攻关关键,正在于它的“手与前臂”。
本期是我们机器人特辑之灵巧手,我们邀请了灵巧手模型算法方面和硬件方面的两位专家,一起聊聊灵巧手不同技术路线的特点,以及它在数据和算法上面临的挑战。
嘉宾们认为,对灵巧手头部公司来说,短期内针对单项任务打造成功一个的Demo并不难,真正的突破在于通用性与可扩展性。当算法能让机器人在短时间内学会开可乐、开门、拧螺丝等多样化的灵巧操作,才意味着灵巧手到达了类似ChatGPT的泛化突破阶段。

【主播】
泓君,硅谷101创始人,播客主理人

【嘉宾】
齐浩之,亚马逊&前Meta机器人研究科学家,芝加哥大学助理教授
陶一伟,TetherIA 创始人兼CEO,前Tesla Optimus高级机器人机械工程师

【本期口播由腾讯广告算法大赛赞助播出】
我们播客7月份做过腾讯广告算法大赛的招募,这场比赛在11月27日刚收尾,吸引了全球8400名技术人才、2800多支队伍参加。在这次比赛中,年轻人在用各种新方法解决多模态痛点:比如冠军团队用行为条件化建模,让算法更能“感觉”用户需求;有人去验证scaling law在生成式广告推荐模型里是否适用;也有人在数据安全前提下把性能继续往上推。可以说这个比赛是把全球顶尖技术人才聚集到一起,也反过来在推动广告算法的进步与系统性能,在AI时代,这类比赛可以让自己的能力被看见、也是让企业找到顶尖人才的最佳场景。

【你将听到】
Demo背后的虚与实
02:37 评估灵巧手能力的关键:精细运动、泛化能力与可靠性
05:58 “开可乐”Demo背后:演示效果与实际能力的差距
08:23 硬件厂商追求单项突破,算法团队更重泛化能力
15:32 灵巧手面临的瓶颈和独有的技术挑战是什么?

三大技术路线
19:26 连杆驱动:常见6自由度,也有高自由度方案(ILDA)
21:26 直驱方案:关节与电机一一对应,灵活度高(Sharpa)
24:59 绳驱方案:双向拉绳(Shadow Hand、ORCA)与单向拉绳(Tesla)
29:57 仿真研究为何更偏爱直驱方案?
33:13 天价灵巧手:不为盈利,只为筛选顶尖客户
36:21 Evan亲述:在特斯拉研发Optimus灵巧手的经历
40:33 从解剖学到外科观摩:马斯克坚持的仿生路线启发了“电机前臂迁移”
42:52 绳驱vs直驱:装配难度与量产前景对比

算法、数据、触觉
44:32 揭秘Meta机器人项目
48:25 受GPT与特斯拉FSD启发,机器人研究重心已转变
50:08 灵巧手数据采集为何难上加难?
52:01 机器人顶尖团队盘点:学术派与产品派
53:33 触觉如何提升灵巧手的操作能力?
58:11 灵巧手数据金字塔:遥操、仿真、视频
01:01:27 Genie3视频模型能用于训练机器人吗?
01:03:17 在伯克利做机器人研究是种什么体验?
01:07:09 灵巧手的“GPT时刻”还有多远?

【延伸阅读】
《机器人的“最后一公里”:深聊灵巧手的“不可能三角”与六大技术门派》
本期播客中提到的公司:
1X
ILDA
Shadow Hand
ORCA Hand
Sharpa
Figure AI
Tesla Optimus
Physical Intelligence(PI)
Sunday Robotics
Generalist
Covariant
TetherIA
源升智能

【监制】
泓君
【后期】
AMEI
【运营】
朱婕
【BGM】
The Light from Within - Howard Harper-Barnes
Floating in Space - Eva Hummingbird
All Parts Equal - Airae
The Secret Spring - Helmut Schenker

【在这里找到我们】
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:podcast@sv101.net

Special Guests: 陶一伟 and 齐浩之.

展开Show Notes
今天这两个嘉宾听下来就舒服多了,不夹杂太多英语,灵巧手每种方案的对比讲的也很清楚。上期两个嘉宾就很符合大家对VC的刻板印象,业务说得很含糊,夹杂太多英语,语调中带着居高临下。实际上VC也有像大学教授这种懂技术又真诚的人
提篮桥夜未眠:人家目标客群就不是你这种人,为什么要讨好你,你谁?
斯台普斯溜冰王:可笑,又来了你行你上这套词儿。你low不low啊
3条回复
节目做的很好👍👍👍👍
霜雪明
霜雪明
2025.12.25
54:44 给猫狗穿上袜子/鞋子后,它们走路也会变得笨拙很多。触觉能很大程度上帮助生物进行末端修正
霜雪明
霜雪明
2025.12.25
41:32 手外科算是骨科医院里最精细的科室(其他科室则是在和病人“搏斗”)
罗伯特ME
罗伯特ME
2025.12.22
齐教授应该是真买了或者真用过sharpa。
ljk_xjyt
ljk_xjyt
2025.12.15
1:03:16 这里关于“如果视频模型能预测物理世界,那么语言模型就没有幻觉”的推论有点奇怪: 大量的语言模型幻觉其实不涉及物理。比如编照不存在的论文。错误的历史事实 不存在的软件 API等。即使视频模型能够预测物理世界 也不能完全解决语言模型等幻觉问题
PLMAY
PLMAY
2025.12.14
50:48 嘉宾很专业,说话有点ai感哈哈哈哈(对不起
Viv-SH
Viv-SH
2025.12.12
一直在想目前灵巧手剥蛋壳这件事情能达成了么?
神经娃哇:没有
Whitney:yes
3条回复
包包bb
包包bb
2025.12.11
现在广告怎么那么多
夜带刀:这么好的节目没有广告赞助才奇怪吧
野鸡一只:奖金200万的广告诶,希望多来点
4条回复
野鸡一只
野鸡一只
2025.12.11
这期节目感觉更适合视频播客,嘉宾在讲解技术细节时候如果能配合视频感觉会更加直观。
nina_SZ
nina_SZ
2026.1.27
请问开可乐瓶的demo视频链接有吗
一个外行人听完了,很喜欢这两位嘉宾,解释得很清楚,情绪很平和,让我对灵巧手这个行业有了更多了解。而且播客没有视频干扰,更focused,很喜欢!
HD841113z
HD841113z
2026.1.05
我作为年轻人还可以等 但老人时间不多了
山下郭
山下郭
2025.12.29
上周末我看宇树科技教机器人踢腿反被机器人踢裆的视频,感慨机器人不好教啊
陈醋_odGp
陈醋_odGp
2025.12.20
我就说嘛 你们这个节目太适合播客了 短视频就不太行,主要是太长,不太适合短视频
ly-ouch
ly-ouch
2025.12.16
11:29 广告中出
阿互
阿互
2025.12.14
分享的挺好
陶一伟 毕业就去了Tesla这么核心的组, 学习的什么专业啊
Evan陶一伟Tethe:谢谢您的认可,我学的是机械工程机器人方向,cmu硕士毕业以后也是在几个不同的地方工作过。后来特斯拉开始做人型机器人后因为很感兴趣就有幸加入
闪闪皮卡丘:居然是嘉宾亲自回复! 果断关注!
3条回复
YouKnowSty
YouKnowSty
2025.12.12
还得是泓君,听起来最舒服
HD414309x
HD414309x
2025.12.13
大涨知识,嘉宾好评!