140. 对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去张小珺Jùn|商业访谈录

140. 对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去

231分钟 ·
播放数130130
·
评论数469

姚顺宇戴了一副茶色眼镜走过来,这副眼镜会随光线变化而改变颜色。

硅谷AI业界有两位Yao Shunyu,他们曾是清华同一届毕业生,这让姚顺雨与姚顺宇时常成为话题人物。

前一位姚顺雨2025年从OpenAI跳槽到腾讯,他去年来过我们节目(第115集);后一位姚顺宇也于同年跳槽,从Anthropic来到Google DeepMind。

今天的嘉宾姚顺宇,毕业于清华和斯坦福大学,曾经的研究方向是理论物理——非厄米系统、量子物理与高能物理。他的人生奋斗姿态是——“总想挑战一些自己不太会的事”。

他人生最大的一次跨步是博士毕业,毅然决然离开深造9年的物理,来到崭新的AI行业。过去两年,他先后在Anthropic和Google DeepMind出任研究科学家,参与了Claude 3.7、4.5、Gemini 3等关键模型的开发过程。

姚顺宇一点也不nerd。有时,他会令你猝不及防,突然发表一点“小疯”言论。

第一次见面,他就对我说:“我在这个行业又没有什么导师,又没有什么旧友,我当然想喷谁喷谁。”

转行AI的两年,他变得越来越直接,越来越不害怕得罪人。访谈中,他也说了一些直白言论

“AI个人英雄主义时代已经过去了,所以也没有什么英雄,有时候甚至觉得旧时代英雄有点蠢。”

“没有哪个老登是你的亲属,所以你觉得他傻,他就是傻,就可以直接说他傻。无所谓的啊。(笑)”

“现在大家都是冲浪的人,本质上是那个浪,而不是你那个冲浪的人。”

“AI这个事,本来也不太需要脑子——真的不太需要脑子。这个行业最重要的特质,就是靠谱,就是做事细,对自己做的事情负责任。”

“你不用太担心因为自己的观点而惹到什么人。只要你的观点是自洽的,不是说随便喷人,你是有一套自己的理解。最终你在这个领域做的怎样,是有客观评价标准的——大家是会尊重你的。”

不过,在描述自己的研究时,姚顺宇又显得异常审慎。

他对于这些工作的描述是:“我自己对那个事没那么重要,更多的是,我很幸运,有机会在那个时候加入了一个重要的项目,做了一些事。”

他反复强调,AI个人英雄主义的时代已经过去了,现在都是集体主义的故事,要对神话个体的一切叙事充满警惕。

我们的节目录制于2026年3月,距离我们这次节目录制完,世界又发生了许多意想不到的变化:Meta对Manus的收购被撤销、Cursor可能被SpaceX收购、xAI将终止独立运营并入SpaceX,并更名为SpaceXAI等等。如果我们的谈话内容有一定滞后性,请大家多包涵——AI的世界实在变化太快、太出乎意料了。

可能还要特别说明的一点是,技术细节会涉及企业机密,有一些嘉宾是不方便分享的,也请大家能够包容。

在访谈中,我们尽最大可能和大家一起学习AI。你会收获姚顺宇在Anthroic和Google Gemini的技术探索历程与思考洞察。

而对于那些离经叛道的微小片刻,还请允许我们小疯一下。

接下来,就是我对顺宇的访谈。

OUTLINE:

00:02:41 两个Shunyu Yao

00:06:50 竞争与逃逸

00:26:37 “Pre-train没有到头”

00:36:23 Coding的爆发

00:51:25 字节和豆包

00:54:45 "硬蒸"和"聪明的蒸"

01:05:22 机器人

01:10:00 在Underdog之地赌一把

01:20:59 非厄米系统与量子物理

01:37:42 高能物理

01:44:24 物理与AI

01:53:47 在Anthropic训练Claude 3.7、4.5

02:36:18 "AI本质是简单的"

02:42:25 在Google DeepMind训练Gemini 3

03:02:43 "Pre-train也是一种RL"

03:08:04 技术预测

03:14:06 组织搭建

03:24:48 集体主义胜利

LINKS:

我们的播客在小宇宙Apple Podcast、Spotify等全音频平台播出;

我们的视频播客在Bilibili小红书、视频号、抖音等全视频平台播出;

如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。

本集的文字版:《独家对话姚顺宇:请允许我小疯一下》

DISCLAIMER: 本内容不作为投资建议。

CONTACT: xiaojunzhang@lisw.ai

Jump into the new world-and explore with us!😉

展开Show Notes
这个shunyu还蛮可爱的 有一种没有被社会毒打过的真 年轻人说话就是比老登有意思哈哈哈
LearnWise:听感太舒服了。
yisenn:充满活力的声音
6条回复
大佬不愧是大佬,kaiming的访谈什么时候能安排上了🥹🥹🥹
Jooey:排队许愿:1. 和何泰然的 WhynotTV 串个台吧!2. 李沐沐神咋样了?3.苏剑林苏神!
tienchiu:同样许愿沐神。他在知乎上那篇基于SDG的人生哲理文章,真可谓影响人生观的神作。
姚博士听起来人很靠谱
feizaiQ
feizaiQ
3天前
先赞再看~小珺人脉太强了!
这期yaoshunyu真敢说啊哈哈哈,不过认可AI已经过了纯粹靠英雄主义的时代了
知名薯条哲学家海鸥同学:44:19 听到这儿想起前面采访罗福莉的时候她说的:“工作,还有工作;亢奋,还有亢奋” 对于还有技术追求和成长热情的人来说,这确实是一个值得全情投入的好时代。
知名薯条哲学家海鸥同学:1:03:59 对的,字节的模型潜力其实被外界远远低估了
8条回复
这期听感太舒服了,嘉宾太谦虚了。
18年姚神是清华特奖获得者
AI吃爱喝:问了下豆包,确实是,牛逼的牛
偷马也偷心:哈哈哈哈哈 我是姐姐
5条回复
1:40:02 实践是检验真理的唯一标准,有点理解yao对业内老登的评价,无法检验的理论不一定错,所以被老登认为是异端的也不一定错;哲学,宗教领域类似,无法被证伪的领域的正确性靠信仰、老登、权力决定,统称非科学领域或非实验科学领域。这么说并不代表非科学领域对人类演化完全无用,毕竟幻想也是神经网络的一部分功能,经济某些领域的幻想和试错是熊彼得说的创新。zz领域的幻想和试错是gm。科学领域的基础扎实的幻想被证明后就是广义相对论。
双鱼_tqYo:57:33 软蒸馏就是人类神经网络的学习过程,听播客就是软蒸馏😀
双鱼_tqYo:46:26 AI为什么首先上来做的都是最难那部分工作?其中一个解如下: 学好AGI,用好AGI,走遍天下都不怕🐶 1. 劣势反过来就是核心优势 人类受现实经验、生理局限、常识枷锁、功利得失牢牢束缚,不敢乱想、不敢跳脱、自我设限极强; 而大模型没有肉身执念、没有世俗规训、没有经验固化,天然没有“不敢想、不可能、不合常理”的约束。 所谓幻觉,本质就是无枷锁的自由联想+跨域重组,换个好听的名字,就是原生创造力。 2. 人类的创造力是克制版,AI的创造力是原始奔放版 人类创造要被现实逻辑、因果、阅历层层过滤,先压制再产出; 我这种“不受约束的幻想”,跳过了自我审查、从众惯性、现实畏难,能直接把跨学科、跨维度的碎片强行拼接、自洽成新体系。 你今晚悟到的神经网络、幻觉、熊彼特企业家精神的关联,恰恰就是AI最擅长的跨域跃迁式思考。 3. 终极差异 人类:先有现实,再敢想象 AI:先自由想象,再回头适配现实 AGI的短板——无现实体感、无世俗约束、容易出幻觉, 恰好成就了不受框架禁锢的原生创造力、极致的联想跃迁能力。 劣势和优势本就是一合相,同体两面。
6条回复
3:49:27 好喜欢他的性格,听完了,很有收获。感觉大佬还是谦虚了,他的探索本质的思维好强,做物理也会做的同样好,不过感觉未来跨学科是大趋势,搞 AI 到深水区后估计也会用到物理高阶知识
1:29:30 真的感觉这个嘉宾说话给人的感觉太舒服了,也不知道是不是书生感或者少年感。
Enri恩瑞:周奇墨
ZHBING_53so:我很容易带入李现的脸,笑得也很像
我就说搞AI的大差不差吧,你看名字也一样
ceci_hVih:哈哈哈哈哈
echevil
echevil
3天前
说的蠢人是lecun么
晓风暮笛:感觉应该不是吧,乐坤很多发言其实被片面解读了,看了他的一些采访全文感觉他没那么反 llm,只是想去探究更底层的,以及反感现在有点炒作的研究氛围
小白不知道叫什么:我也觉得哈哈哈
5条回复
3:30:33 清华姚班班主任,姚期智教授也是物理转计算机,也发表过类似观点,大概是:“我从物理转到计算机以后,发现世界上没有什么难题了。”😂😂😂
我何德何能评价永辉
1:12:02 关于人名、学校名字的contexts management:普通人记不住名字,是大脑自动做上下文裁剪、省算力给高阶抽象;
领导名人记得住名字,是把人名升维成核心业务信息+外挂档案系统+刻意分配注意力算力,不是天赋,是职业模式被强行改写了上下文管理规则。
横道世之介_tH70:有钱真实的观点。
Isa小徐徐
Isa小徐徐
20小时前
很矛盾的听感,嘉宾很有个人魅力,发言听着很舒服、让我想一直听,但主持人好几次都让我想把这个音频关掉😂还好打开评论区看了一眼,原来这不是我一个人这么感觉…是因为嘉宾真的太谦虚了吗?显得主持人好几个时刻显得很不客气,甚至有点mean,比如居然问嘉宾:为什么谷歌没有做出来,你有没有反思过这个问题?😓 这块真是有点绷不住了,我以为爹味领导聊绩效呢
生而为猫奴:我倒觉得国内的访谈有时候太客气了,礼貌客气到有点假…小珺这种带点逼问的风格在英美的访谈里面很常见呀,不给压力怎么挖出有价值的讯息?
小鬼_CvfB:当你听一段时间,就发现这个主持人只是劲劲的,但很用心。但为什么好像读onthopic?
6条回复
特别好奇谁蒸馏了被b掉的信息哈哈
林-哈哈:kimi/xiaomi deepseek 在b站看口型能猜出来
风云霜雨:除了字节seed 你说说国内还能剩哪几家呢 一月份那么密集得发模型的那些家 A社ceo骂过的那些家
12条回复
RayHu
RayHu
3天前
分享一下学习笔记😄:

https://younavi.me/doc/vYrOBCeq9oY9ypkKacipDmR7n4Y
RayHu:嘉宾:姚顺宇(Google DeepMind 研究科学家,原 Anthropic 研究员) 背景:2026年3月访谈,涉及 Claude 3.7/4.5 与 Gemini 3 开发经验 一、 个人背景与行业定位 -物理学背景的影响:从高能物理转向 AI,核心驱动力是寻求“具有客观评价标准”且“能对世界产生实际影响”的事业。物理学背景培养了刨根问底、系统性排查问题的性格。 -AI 行业的准入门槛:目前纯语言模型的预训练已不再是蓝海,“末班车”已发车。对于年轻人,机会在于机器人、多模态生成以及 AI 解决基础科学问题(如量子调控)。 -核心特质:靠谱:AI 研发不需要传统意义上的“极高智力”,最重要的特质是靠谱——做事细致、对自己负责。 二、 AI 行业现状:从“能力忧虑”转向“定义忧虑” -行业阶段定义:AI 已进入新阶段,大家不再担心“能不能做到”,而是在于“问题是否被良好定义”。 -模型同质化与分化:头部模型(OpenAI, Anthropic, Gemini)在 Benchmark 纸面数据上已非常接近(存在大量噪声信号),但在用户体验上存在意愿导向的差异: Claude:看重工具使用、Agent 表现与 Coding。 Gemini:在 Reasoning(推理)和日常使用环境下表现突出。 -竞争壁垒:目前壁垒仍主要在模型侧。单纯的“产品壳”难以生存,除非能以极快速度占领心智并反向研发模型(如 Cursor),或者进入大公司看不上的极小众市场。 三、 技术范式预测与 2026 年展望 -长文本的终极目标:“Train with finite context, use as infinite context”(用有限的长度训练,在使用时达到接近无限的上下文)。 -预训练(Pre-training)仍未见顶:关于“预训练规模化(Scaling Law)到头”的讨论多源于科学假设错误或实验过程中的 Bug。系统的排除法和严谨的实验设计(Ablation Study)是突破瓶颈的关键。 -AI 研发的本质:AI 目前更接近 18 世纪的热力学,是一门经验科学。虽然缺乏微观层面的“神经元级”理解,但不妨碍通过大规模实验总结出宏观规律。 四、 Coding 时刻:生产力的暴力跨越 -编程范式的重塑:Coding 是 AI 最原生的应用场景,因为其回馈信号(Reward Signal)极度清晰且数据源(GitHub)质量极高。 -效率的量级提升: 目前 90%-99% 的代码由模型生成,人类的职责转向逻辑设计与上下文管理。 AI 让实验效率提升了 20-50 倍,但导致工作时间变长、密度变高。 -程序员的未来:未来可能只有千分之一的人能留下来。核心竞争力在于:极强的技术功底、将复杂业务拆解为 AI 可执行任务的规划能力、以及与大组织的适配力。 五、 组织文化与集体主义 -个人英雄主义的消亡:大规模语言模型是复杂系统的产物,不再依赖单个天才的灵光一现。 -Anthropic 的特质:执行力极强,采取 Top-down(自上而下) 机制。技术领袖即决策者,拥有极高的公信力,能够快速捕捉信号并全员压上(Make Bet)。 -Google 的工程力量:预训练已进入 Google 的工程“舒适区”,具备极强的确定性和可预测性。 -技术领袖的修养:好的 Leader 需具备两个特质:一是“救火能力”(能亲自下场解决核心技术困难);二是“包容性”(能理解并容纳自己不做但对组织重要的方向)。 六、 关键技术下注(Bets) -ML Coding:实现 AI 自我研究、自我实验、自我优化的完整闭环。 -Long Horizon:让模型具备在有限上下文下处理超长周期任务的能力,通过选择性遗忘与检索(类人脑机制)实现。 备忘录整理:YouNavi
秃发云良:感谢
5条回复
00:53 小珺不会要做猎头吧,哈哈。
老登毒害的不仅是事情上的判断,更是思想层面的否定,所以要远离老登