人形≠通用≠落地:人形机器人的真问题| S9E15

人形≠通用≠落地:人形机器人的真问题| S9E15

62分钟 ·
播放数16570
·
评论数28

它们会跳舞、跑马拉松、在工厂打螺丝……人形机器人正在从科幻走向现实。马斯克说 Optimus 是 Tesla 的未来,国内创业者与资本也纷纷跟进,具身智能进入技术竞速新阶段。
据统计,2025 年仅前两个月,中国人工智能领域的投资交易额就已经逼近 2024 年全年的总额,达到数百亿规模,全球范围内,谷歌、微软等科技巨头也在加速布局具身智能赛道。
但——人形真的有必要吗?VLA 模型真的能「端到端」控制机器动作?我们距离真正的落地应用还有多远?
本期《科技早知道》邀请峰瑞资本执行董事 刘鹏琦 与人大高瓴人工智能学院副教授 胡迪,与丁教和雅娴一起,聊聊这场尚未形成共识的技术狂奔。一起深入具身智能的关键分歧、成本难题与哲学困境。

关于 MiniMax Speech-02 模型
MiniMax 推出的全新升级的语⾳模型 Speech-02,在两项权威榜单:Artificial Analysis Speech Arena 和 Hugging Face TTS Arena 中,双榜位列全球第一。
Speech-02 具有⾜够泛化的模型能⼒,为用户提供超拟⼈、个性化、多达 32 语种的语⾳服务。
MiniMax Speech 也刚刚发布了技术报告,如果你对技术细节感兴趣,欢迎点击链接查看,想用 MiniMax Speech 来打造属于自己的声音,欢迎点击链接尝试:国内海外
Untitled

本期人物
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
刘鹏琦,峰瑞资本 执行董事
胡迪,中国人民大学高瓴人工智能学院 副教授
Yaxian, 「科技早知道」节目监制

主要话题
03:07 人形机器人热潮从哪来?Optimus、马拉松赛事与特斯拉的野心
08:36 机器人一定要人形么?人形 vs 实用性的争议
14:23 通用机器人=终极目标?从泛化能力聊起
24:30 触觉感知、力反馈、可靠性,机器人上肢发展的现实瓶颈
36:08 大模型的路线之争:端到端(VLA )模型 vs 模块化控制路径
47:03 训练数据从哪来?仿真 vs 真机 vs 互联网模仿学习
51:47 人形机器人落地的不可能三角:成功率、通用性与成本如何取舍?
59:12 家庭机器人、可控核聚变、量子芯片,哪个会先实现?

幕后制作
监制:Yaxian
后期:Jack
运营:George
设计:饭团

延伸阅读
VLA模型
VLA 是视觉 - 语言 - 动作(Vision - Language - Action)大模型的简称,是一种先进的多模态机器学习模型。它能让机器人接收环境信息和语言指令,经理解、推理与决策后,转化为动作指令来控制机器人运动,以实现与物理世界的交互。

内容研究志愿者招募
Hi 你好呀,这里是「科技早知道」内容研究志愿者招募。如果你是前沿科技行业的从业者(包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等),欢迎加入我们分享你在行业内的一手观察和见解。
你将有机会参与到节目的制作当中,你的知识和见解也可能成为未来节目的一部分!
志愿者招募入口

加入声动活泼
声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位,详情点击招聘入口

商务合作
声动活泼商务合作咨询
Untitled

关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡声东击西吃喝玩乐了不起反潮流俱乐部泡腾 VC商业WHY酱跳进兔子洞不止金钱
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:ting@sheng.fm
声小音
欢迎扫码添加声小音,在节目之外和我们保持联系。

Special Guests: 刘鹏琦 and 胡迪.

展开Show Notes
置顶
MiniMax 推出的全新升级的语⾳模型 Speech-02,通过⾜够泛化的模型能⼒,为用户提供超拟⼈、个性化、多样性的语⾳服务。如果你对该模型感兴趣,可以在 shownotes 中查看详情~
NX21240
NX21240
2025.5.15
还是找业界的嘉宾听起来接地气,学校里的教授改不了泛泛而谈的毛病,说的内容提供的新信息含量还不如问大模型。
Jolin_乔琳
Jolin_乔琳
2025.5.16
这个开头也太像了吧!minimax 这次的语音模型确实有点厉害!
01:17 开头完全没有违和感!绝了!
开头好牛
nene请说
nene请说
2025.5.20
00:43 我靠 开头居然是minimax模仿yaxian的声纹!!完全听不出
jhwei
jhwei
2025.5.16
两位嘉宾有一点“两极”的意思,追求完美解决方案的研究人员,和追求落地回报的投资人员,能听出来两位在自己的领域都是有很深的积累的。
个人观点,有时候的技术落地时刻,并没有达到完美解决问题的时刻。回头看自动驾驶“端到端”火起来的时候,其实很多人是不信的,但是很快大家就都开始转向端到端。有时候学术界和工业界是需要相互扶持的。
wong1908
wong1908
2025.5.28
44:59 作为一个投资人想说,“人人都需要车”是个谬误,“不是人人都需要机器人”也是个谬误,甚至可以说,“人人都需要出行”在未来也会是谬误。
不如说是汽车已经充分实现了全社会的心智认知,而机器人还没有——至少这个评论区中一半以上的评论,都反映出大家还没有在“机器人是什么”这个根本问题上形成共识。
这个问题需要15-20年后给出答案。
是迦棋呀
是迦棋呀
2025.5.19
这个开头竟然是生成的人声!牛呀,还挺像的!
RoyZ
RoyZ
2025.5.20
33:15 先造出一个机器猿,人就不要干预了,然后把数万年的自我学习浓缩在极短时间内
山北多:问题就在于现在造的机器人连狗都不如,再多的数据和知识喂能有什么用。
无聊的猪
无聊的猪
2025.5.17
29:29 压敏电阻是电压敏感型啊
Bright869
Bright869
2025.5.16
不太认同说机器人不是必需品。T型车被造出来之前也没人觉得车是必需品,受到马车厂商推动,不少地方甚至禁止汽车。
请的嘉宾质量真的太一般了😓
鱼刺fd
鱼刺fd
2025.5.22
没必要人形,特定场景的优化的智能机器人才是最优解吧。比如双足可没有轮式跑得快啊?还耗能
RoyZ
RoyZ
2025.5.20
36:43 哈,我毕业设计也是做的机器人手臂设计
奥本山默
奥本山默
2025.5.19
说的非常好,很认同
Feng_zUT7
Feng_zUT7
2025.5.18
12:46 所谓的读书读傻了
Shawnwoh
Shawnwoh
2025.5.16
人人都需要很多个机器人 但真的不是人人都需要车 ,且 车也是机器人的一种
从数据的角度来说,元宇宙/AR/XR是否是具身智能的前序行业?前者可以积累大量的人类运动数据。
Soong_2zha
Soong_2zha
2025.5.16
机器人跑马拉松的后面都连着线,被遥控的哈,跟度娘的萝卜快跑一个水准哈,人家马斯克开发机器人是为了火星开发哈,想想以人类最快的速度飞到火星要将近10个月,当然还要等2年在近火星轨道位置发射火箭。国内人形机器人抄特斯拉,抄了个毛线🧶