148: 访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡晚点聊 LateTalk

148: 访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡

85分钟 ·
播放数9666
·
评论数33

「华为前自动驾驶首席科学家投身具身创业。」

本期嘉宾是它石智航创始人陈亦伦,他曾担任大疆创新机器视觉总工程师和华为自动驾驶部门首席科学家。

2021 年,智能辅助驾驶的爆发前夕,陈亦伦在华为带团队开始采集大量真实的驾驶数据,用深度学习替代过去自动驾驶的规则方法,3 万行代码做了过去 200 万行代码的事,这是业界第一批探索端到端智能驾驶的尝试。

陈亦伦说,那一刻,他觉得自己找到了自动驾驶的钥匙,而他还想用这把钥匙去探索一个年少时种下的更大梦想:通用智能机器人,也就是具身智能。

在回到母校清华,于 AIR(智能产业研究院)担任智能机器人方向首席专家 2 年后,2025 年初,陈亦伦和百度原资深副总裁、百度智能驾驶事业群负责人李震宇一起创立它石智航,在最初 2 轮融资中,筹集了超过 2.4 亿美元。创下中国具身智能领域的首轮融资记录。

这期节目,陈亦伦讲述了他从自动驾驶到具身智能的多年技术探索和研发实践,他看到的具身智能的 3 道曙光和 3 道关卡,以及怎么先越过其中的第一道:数据。

本期嘉宾:陈亦伦,它石智航创始人兼 CEO
本期主播:程曼祺,晚点 LatePost 科技报道负责人

时间线:
-从华为、清华到创立它石,看到具身的三道曙光
02:35 用神经网络做自驾规控(PnC),3 万行替代 200 万行代码
11:13 三道曙光:强化学习提升运控(locomotion)能力;LLM 处理任务规划;端到端解决极端案例
17:13 端到端、VLA、世界模型,联系与区别
20:40 三道关卡:数据、算法、后训练
24:43 具身还在第一道关卡,数据;最后能经受大量数据的算法结构会很简单;GPT 最伟大的是定义了训练任务是预测下一个 token,而非架构本身
30:16 定义具身模型的训练任务:建立空间概念、跟世界交互

-数据解法:真实数据而非仿真和视频数据,手套采集而非遥操
40:54 具身需要真实数据,不看好仿真和视频数据
49:42 真实数据只有两个源头,世界与人;真实意味着场景真实、动作真实;为可穿戴设备是唯一解
55:08 手套+第一视角摄像头采集数据的具体实现
59:11 具身充满了硬件场景、本体、数据算法间的交替组合和协同优化,中国有供应链和场景优势
01:05:08 没有选择 VLA,具身会有自己的模型,而不是简单在 LLM 上发展

具身已经到了 Scaling 的临界点
01:13:23 看数据增长趋势,具身已经到了 Scaling 的临界点
01:18:04 它石的落地场景之一是处理柔性材料的线束装配
01:21:15 能自己定义目标的具身公司就是靠谱的;成为别人,不是好的选择

01:22:38 连点成线:往期分享

往期具身智能访谈:
晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人

晚点聊 96 期:和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望

晚点聊 86 期:We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道

晚点聊 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展

剪辑制作:甜食

小红书@曼祺_火柴Q即刻@曼祺_火柴Q

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

展开Show Notes
陈亦伦在大疆做过机器视觉总工程师,在华为做过自动驾驶首席科学家,后来又在清华 AIR 做过两年研究,非常善于把复杂的技术讲得很简单。

具身领域有诸多分歧:怎么获取数据?获取何种数据?具身模型的形态?……陈亦伦对自己的逻辑和它石在行业探索中的位置、角度的描述都非常清楚。这对我是一次体验很好的技术访谈。我期待看看,26 年,真机 vs 仿真;基于 LLM 来做 VLA vs 更独立的具身模型等不同 bet 的演进。

(btw,当天我和陈博聊天的会议室是我 25 年 1 月我采访闫俊杰时的同一个会议室。MiniMax 上市前刚搬家了,而它石用了他们之前的办公室😄
王琪Kimi:按照这个风水又是一个几百亿的上上市公司
曼祺_MatchQ
:
https://mp.weixin.qq.com/s/BE8TL74jOmlpiUMdEEkcww(文字版链接)
姥姥王
姥姥王
2026.1.16
具身智能行业的旗舰创业团队!
Wiasper
Wiasper
2026.1.16
深入浅出 竟然听懂了…大佬确实不一样
HD712317z
HD712317z
2026.1.16
这篇采访的含金量会随着时间提高
很高质量的采访!个人感觉采集人的数据一个很大的问题是需要retarget到机器手上,这一步受限于人手与机器手尺寸形状自由度的限制,还是没有很好的解决方案。
Bugoff
Bugoff
2026.1.17
我关注和学习具身智能2年多了(技术和商业都有不少研究)我目前在国内某新能源汽车大厂做出海,积累了很多对外经验,我2025年年底刚从国外出差就开始在看具身智能相关工作机会,听完它石创始人的访谈,我觉得这会是一家未来值得关注的公司,甚至值得加入,期待未来一起把我们国内优秀具身智能产品的渠道和产品体系在海外搭建起来 我决定下周就去投投简历和他们聊聊!
罗伯特ME
罗伯特ME
2026.1.16
太强了
青蓝
青蓝
2026.1.21
非常有深度的访谈
MoMee
MoMee
2026.1.20
很有收获
长跑男
长跑男
2026.1.19
大佬的思维逻辑一致性太强了
Aiming_mC0e
Aiming_mC0e
2026.1.31
很棒!
挺有意思的,很多判断和Google那边的不一致。
HD559400z
HD559400z
2026.1.19
有没有人做听觉,视觉混合的辅助驾驶?
嘉宾讲了非常多manipulation和自动驾驶的类比,可否也再展开讲下区别
曼祺_MatchQ
:
好的角度,现场可以多追问这个方面(记下来📝
way2AGI
way2AGI
7天前
没有学者的严谨,很对武断的决绝但是存在争议的观点说不来丝毫不带犹豫的😴
way2AGI:竟然听着像余大嘴的风格
feizaiQ
feizaiQ
2026.2.14
46:50 但是没有仿真怎么做RL呢?
曼祺_MatchQ
:
RL 也可以用真机self play 的数据,不过我不太清楚这样的数据量和成本。
有些采访在晚点公众号能看到,有些不能。好奇这是基于什么考虑的🤪
曼祺_MatchQ
:
还没写完
jx_0xff
jx_0xff
2026.1.16
1:01:12 帮助大家了解业内认为的技术路线,和怎么解决数据采集,窥探一下技术前缘,还挺有趣呀[呲牙]了解下业内认为的技术路线,和怎么解决数据采集,窥探一下技术前缘,还挺有趣呀[呲牙]
Mengya花
Mengya花
2026.1.16
听完觉得国内的技术团队已经是世界第一梯队了