65: 信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 | AI 大爆炸

65: 信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 | AI 大爆炸

63分钟 ·
播放数4506
·
评论数25

本期《晚点聊》邀请了在去年底就已造出人形机器人的公司,逐际动力的联合创始人谌骅。

(*节目中涉及的术语可见 Shownotes 末尾的附录解释。)

图:逐际动力人形机器人 CL-1

谌骅于 2012 年获浙江大学控制科学与工程学院自动化专业学士学位及竺可桢学院荣誉学位,在 2018 年获美国俄亥俄州立大学电气与计算机工程博士学位,后在本校进行博士后研究,2019 年 6 月回国。

2022 年,谌骅与他的博士生导师、知名机器人学者张巍一起创办了逐际动力。

今年刚刚过去的三个月,我们已看到了这个领域的诸多新进展: Figure AI 获 OpenAI、微软、英伟达、贝佐斯 6.75 亿美元投资,接入 OpenAI 大模型;英伟达在 GTC 大会上发布机器人基础平台 GR00T,黄仁勋还与科幻动画片主角“机器人瓦力”的实物版同台;特斯拉 Optimus 新释放 demo;做机器人大脑的 PI 获得 OpenAI、红杉等的投资。

与真实物理世界的交互是语言之外的重要学习与智能进化方式,有“身体”的智能也能大大拓展了 AI 的任务范畴。


图:逐际动力四轮足机器人 W1(左),逐际动力点式双足机器人 P1(右)

本期节目,从 GTC 等近期行业热点切入,谌骅分享了他博士以来亲历的技术进展和创业历程、目前人形机器人技术栈的瓶颈;我们也对比了中美人形机器人创业的诸多差异。

他认为,GPT 大大加速了机器人大脑的发展,“小脑部分”也就是勾连大脑决策到最后身体执行的部分仍有很多突破空间,这也是最让人兴奋之处。

内容摘要:
· GTC 与近期进展:看好机器人,但黄仁勋与 Transformer 八子对话又没聊机器人
01:20 小脑能力已经赶不上大脑,更关注小脑
05:12 FigureAI 和 Aloha 背后的新技术:Diffusion Policy,扩散模型用于生成机器人动作
06:44 Diffusion Policy 和 Diffusion 模型之间的关系
09:04 重要提升在于泛化性:机器人可以像人那样洗盘子了,不需要盘子摆放精确
09:47 为何 GTC 黄仁勋与 Transformer 八子论坛完全没聊到机器人?

· 求学与创业:当软件与硬件 meet,机会信号出现
12:56 2016-2017 年读博期间,波士顿动力 demo 表现好,与他们的科学家交流,发现方法很相似
14:29 波士顿动力展现的是「足式运动能力」,它和「操作能力」是两条线
15:00 足式运动能力在控制上为什么难?——一个「欠驱动」系统
18:08 足式运动能力,抽象一下就是谌骅博士研究的课题:混杂系统的最优控制
20:08 MIT 开源硬件方案是对行业的重要推动
21:26 MIT 使用了原本用于其它领域的行星减速器,也从理论上做了解释
24:10 大公司 VS 小公司,一个没有完全 ready 的方向,更看中探索的灵活性
26:30 逐际做了 3 个产品,为什么做这么多?

· 市场观察:人形机器人为什么在中国先火?AGI 信仰充值带来了什么?
27:43 去年中国为什么多了这么多人形机器人?——马斯克效应
29:50 走得像人能体现技术能力,但这也许没那么重要
31:43 逐际的四轮足机器人和点式双足机器人:用在哪儿?干什么?
34:29 点式双足机器人的更强运动和平衡能力——来自这两年强化学习在机器人控制中的运用。
35:00 这和 Transformer 没有直接关系,但整个领域的信仰充值让大家意识到用数据驱动方法做控制是可行的。
36:43 为什么中国做人形机器人的公司看起来比美国公司“更不聚焦”?
40:53 为什么大模型是美国先火,人形机器人是中国先火?
42:45 波士顿动力居然有 30 多岁了!它仍在用液压驱动,几乎不可能产品化
45:19 一个现象:起步太早的科技公司,可能因在老技术栈上积累太深,采纳新技术更慢
47:10 这一次,这件事不会再发生了吗?为什么?
48:54 更确定的事:人形机器人方向;发展不及预期的事:硬件
52:26 机器人的数据也是和硬件耦合的:比如触觉该如何表达?这受限于传感器
54:56 机器人端侧算力,英伟达 Jetston 又先人一步
57:23 人形机器人是交叉学科,兼具软硬能力的人可能会成为主导
59:25 对机器人“叛变”人类谨慎乐观

相关链接:

B站-逐际动力首次公开人形机器人CL-1动态测试(2023.12)
www.bilibili.com

基于强化学习,逐际动力双足机器人P1野外徒步
www.bilibili.com

逐际动力发布首款四轮足机器人
www.bilibili.com

晚点聊 ep 40-通用机器人,AI 的下一个浪潮?
www.xiaoyuzhoufm.com

Diffusion Policy 论文
diffusion-policy.cs.columbia.edu

附录:节目中出现的技术、公司等名词
逐际动力:一家通用机器人研发和制造商,产品包括人形机器人、四轮足机器人及相关软硬件和AI解决方案。
·FigureAI:2022 年成立的美国人形机器人公司,近期获得 OpenAI、微软、英伟达、亚马逊创始人贝佐斯共计 6.75 亿美元的融资。
·PI(Physical Intelligence):今年新成立的机器人大脑创业公司,获红杉、OpenAI 投资。
·Mobile Aloha:斯坦福大学服务机器人项目,展示过开窗、浇花、收拾垃圾等能力。
·波士顿动力 Atlas:波士顿动力的一款人形机器人。
·Diffusion Policy:一种基于扩散模型的机器人动作生成策略。
·自由度:系统、模型或物理实体在运动或变化过程中可以变化或被独立控制的参数数量;在机器人领域常说的“某个关节有几个自由度”,就是指关节在运动时可被独立控制的方向和角度的数量,它决定了机器人的动作范围和灵活性。
·欠驱动系统:系统的控制输入数量少于系统自由度的数量,导致系统不能完全控制所有自由度的状态。
·混杂系统:包含连续和离散动态的系统,它们在同一系统内同时存在并相互作用,增加了系统的复杂性。
·连续状态:系统的状态可以在一定范围内无限取值,变化是连续不断的,没有跳跃或间隔。
·离散状态:系统的状态只能取特定的、分离的值,变化是阶段性的,不连续。

登场人物:
谌骅,逐际动力联合创始人
程曼祺,晚点 LatePost 科技报道编辑(微信:momochoqo;即刻:程曼祺_火柴Q)

剪辑:甜食

展开Show Notes
E_L
E_L
2024.4.05
很棒的内容!希望能继续采访更多科技细分前沿方向的创业公司。强化学习用于机器人可以看看covariant,主创团队是中国背景的年轻人以及pieter abbeel(深度强化学习开创者之一),他们ceo最近接了不少pr也有上英文播客。
E_L:另外,关于人形机器人是硬、软主导,以后有机会可以深入从具体市场/产品/产业的视角探讨,而不只是从业人员知识背景。现在有learning背景强的团队从大模型作为机器人大脑切入(pi、covariant),但是它们目标的市场形态是怎么样的、是否合理? 从机器人的用途出发,在不同用途上的机器人市场会产生什么样的软/硬件竞争格局
曼祺_MatchQ
:
我去看看新进展
3条回复
paperadio
paperadio
2024.4.02
很好的节目,干货👍(非娱乐向😂)
曼祺_MatchQ
:
正在想这类话题怎么平衡干货和更好的代入感和听感?欢迎多些建议。(这期我觉得有些话题展开挺有意思,不在原初的提纲里
曼祺_MatchQ
:
😄 感谢分享这么多。有启发,下次可以试起来
3条回复
阿互
阿互
2024.4.02
外行人眼红中(˵¯͒〰¯͒˵)
是张林~
是张林~
2024.4.05
主持人太会问了!!很喜欢这期
喜欢这期节目,有广度有深度
媛子_
媛子_
2024.4.03
18:28 中译中。聊得很有意思
Mark_Kram
Mark_Kram
2024.4.04
这么说Boston dynamica真是有点过,现在主流的双足都还是model based的方法,和BD走的路一样。
momo_inorg
momo_inorg
2024.4.02
图片挂了
曼祺_MatchQ
:
嗯嗯 正在重新传。也可以看链接里的机器人视频,更动态。
真的很干货 我超喜欢
Greeks
Greeks
2024.4.02
听了
桃奈小安
桃奈小安
2024.4.02
打卡
c3cc
c3cc
2024.4.19
从2024.4.19回来,波士顿动力宣布停止开发液压动力机器人,发布了全新电动Atlas机器人
Evann
Evann
2024.4.13
32:58 这里是否应该说更像「插电混动式电动车」而不是「增程式电动车」。前者是会根据情况切换油动或电动来节约资源,而后者是用发动机给电池充电,场景不大一样~
音之切
音之切
2024.4.12
内容非常好,正在这个领域的学生听完以后收获很多
霜雪明
霜雪明
2024.4.05
22:08 MIT提高了“力透明度”这里,是不是指步进电机的某种改进应用方案?
霍霍星球
霍霍星球
2024.4.03
我们投资的电机项目今年量产了,请嘉宾采购😁
09:25 机器人还是要从单一场景到想办法解决更加通用泛用的场景 模式识别的发展雀食带来了一波发展 奈何动作方面也看起来是没跟上(逃
独步91
独步91
2024.4.02
希望被机器人替代的我小板凳坐好了!