英雄主义时代的终结:深度对话 DeepMind 研究员姚顺雨,揭秘硅谷大模型竞赛的底层真相M7AI

英雄主义时代的终结:深度对话 DeepMind 研究员姚顺雨,揭秘硅谷大模型竞赛的底层真相

28分钟 ·
播放数6
·
评论数0

在硅谷的 AI 圈子里,“姚顺雨”(Yao Shunyu)是一个自带流量的名字,甚至带有某种“双生”的传奇色彩:一位是曾任职于 OpenAI、后归国担任腾讯首席科学家的姚顺雨;另一位则是本文的主角,先后效力于 Anthropic 和 Google DeepMind 的姚顺雨。

这位 DeepMind 研究员的转行经历极具戏剧性:他曾是在清华和斯坦福研究非厄米系统(Non-Hermitian systems)、拓扑理论及黑洞量子信息的顶级物理学家。然而,在入职伯克利博士后仅仅两周后,他便毅然辞职投身 AI 浪潮。从追求“不可验证”的高能物理理论,到追求“绝对客观验证”的 AI 工程,姚顺雨的跨越折射出大模型竞赛的底层范式转移:在这个时代,个人的英雄主义已经让位于集体主义的执行力,而决定成败的往往不是“脑子”,而是“信心”。

1. AI 开发“不需要脑子”,需要的是极致的执行(C)

作为一名技术布道师,我见过无数天才试图用精妙的算法改变世界,但姚顺雨给出的观察却冷酷而清醒:在当今的 AI 框架下,Idea 是极其廉价的,甚至“AI 研发并不太需要脑子”。

“AI 这个事本来也不太需要脑子……这个行业最重要的特质就是 C(Execution),就是做事,然后对自己做的事负责任。”

在大模型时代,所谓的“脑子”往往体现为一种系统性的实验排除法。姚顺雨认为,真正的核心壁垒是 C(Execution)——即将宏大构想拆解为微小、可执行步骤并对其结果绝对负责的能力。当实验结果偏离预期时,平庸的研发者会陷入哲思,而优秀的工程师会通过设计严密的消融实验(Ablation Studies),像物理学家寻找实验误差一样排除 Bug。

这背后隐含着一种“冲浪者与浪”的哲学:AI 的进展如同一股不可阻挡的巨浪,个人只是浪尖上的冲浪者。你可以选择冲得更好、姿态更美,但你无法阻止浪潮本身。在这个背景下,集体的执行效率远比个人的灵光一现更具杀伤力。

2. Scaling Law 的天花板:是物理撞墙,还是“信心”丢失?

业界关于 Scaling Law(规模定律)是否见顶的争论,在姚顺雨看来,更多是一个心理学问题而非纯粹的科学问题。他将人们认为规律到头的情况归纳为三类:

  1. 适用范围到头: 认为 Scaling Law 在物理机制上无法继续延伸。

  2. 数据撞墙: 认为高质量互联网数据已被耗尽。

  3. 代码有 Bug: 模型表现停滞并非规律失效,而是实验设计或实现中存在未察觉的错误。

姚顺雨的核心洞察在于:大多数顶尖研究者认为规律到头,真相往往是第三种——有 Bug。 在物理学研究中,如果理论与数值对不上,研究者会死磕每一个参数;在 AI 研发中亦然。

解决问题的关键在于“信心”。当你坚信 Scaling Law 依然有效时,你会系统性地排查每一个可能的 Bug;一旦你丧失信心,就会顺理成章地宣布“撞墙”。Scaling Law 不仅是经验公式,更是支撑研发投入的信仰。

3. Anthropic 的成功密码:技术一号位的绝对决策权与“战友情”

作为曾在 Anthropic 核心团队(Horizon Team)参与大尺度强化学习研究的成员,姚顺雨揭示了这家公司能与 Google 这种巨头抗衡的关键:一种高效的“Top-down”(自上而下)决策模式。

这种模式的成功并非偶然,而是源于核心团队极高的“共信力”。Anthropic 的创始团队(如 Jared Kaplan, Jack Rae 等)是真正一起“下过战壕”的战友,他们共同撰写了奠定现代大模型基础的 Scaling Law 和 GPT-3 等关键论文。

  • Anthropic 模式(Startup): 核心决策者即是技术领袖,拥有深厚的技术底座。这让他们敢于在不确定性中“Make Bet”(下注),并动员全公司力量执行。

  • Google 模式(Big Tech): 倾向于“Bottom-up”(自下而上)。在预训练这种确定性极高的工程化项目中,Google 的人才储备和系统性管理展现出无敌的碾压势头;但在瞬息万变的新领域,官僚逻辑往往会稀释决策的果断性。

4. Coding:AI 唯一真正原生的成功场景

姚顺雨认为,尽管 AI 无处不在,但除了编程(Coding),目前尚无第二个真正意义上的 AI 原生成功场景。其背后的逻辑在于 Coding 是一个闭环系统(Closed-loop)

  1. 反馈信号清晰: 代码能否跑通、输出是否正确,拥有客观且即时的奖励机制(Reward Signal),这为强化学习提供了天然的温床。

  2. 高质量数据基石: GitHub 积累了数十年的结构化数据,且由于代码逻辑的严密性,其数据质量天然优于杂乱的网页文本。

  3. 审美标准一致: 全球顶尖程序员对“好代码”(简洁、高效、解耦)有着高度共识,这降低了 AI 模仿人类顶尖思维的难度。

这也解释了一个有趣的悖论:AI 在人类认为最难的理性领域(数学、代码)进展最快,而在缺乏标准的“产品设计”或“情感共鸣”领域进展缓慢。

5. 程序员的未来:从“码农”到“系统架构师”

对于 AI 是否取代程序员,姚顺雨持有一种“理性的悲观”。他认为取代不会瞬间发生,而是一个价值重新分配的过程:未来可能只有 1/1000 的顶尖程序员能存活,他们拿走 100 倍的工资,并指挥 AI 完成过去所有人的工作。

在这一进程中,传统程序员必须向“AI 协作型架构师”转型:

同时,他也清醒地指出,仅靠“卖 Token”(API)是一门差生意,容易陷入价格战。唯有像 Google 这样拥有完整生态链的巨头,或能通过极致产品体验(如 Cursor、Cloud Artifacts)建立壁垒的公司,才能在浪潮中生存。

6. 技术演进的下一幕:ML Coding 与“选择性遗忘”

展望未来 6-12 个月,姚顺雨预测了两大核心趋势:

  • AI 研制 AI(ML Coding):

  • 长文本的哲学(Long Horizon): 姚顺雨提出了 “有限 Context 训练,无限 Context 使用” 的构想。真正的个人助手不应是无限增加内存,而是学会像人类一样 “选择性遗忘”。你不需要记得昨天晚上吃了什么,只需在特定场景下精准检索相关信息。这种模拟人类认知机制的“上下文管理”,是通往真正 Agent 的关键。

7. 中美差距:资源劣势逼出的“聪明蒸馏”策略

在谈及中美模型 GAP 时,姚顺雨提出了一个独特的视角:中国算力资源的短缺,反而逼出了更先进的“多智能体(Multi-agent)”雏形。

  • 硬蒸馏: 强行模仿别家模型的输出,这在商业和技术上都是平庸且不道德的。

  • 聪明蒸馏: 将别家强模型作为“评价者”或“辅助者”,融入自家的训练循环。在这种模式下,中国实验室实际上在探索如何让不同分布、不同特性的模型协同工作。

此外,中国模型(如字节跳动的豆包)在用户体验优化、语音生成的自然度与响应速度上已经达到世界顶级水平。这种对用户需求的敏锐捕捉,是在算力劣势下实现差异化突围的明智选择。

结论:在这个不确定的时代,人类该写什么样的教案?

姚顺雨从物理学转向 AI,本质上是从一个“理论自洽”的世界转向一个“实验验证”的世界。他的洞察告诉我们:在这个英雄主义退场的背景下,任何试图阻挡 AI 进展的行为都会削弱自身的议价权。

当 AI 已经学会了我们交给它的所有理性知识,甚至开始自主进化时,人类的角色正在发生本质的变化。我们不再是唯一的“写作者”,而更像是“教案的设计者”(Curriculum Designer)。

当理性、逻辑与工程执行力都被 AI 掌握时,人类作为“老师”,下一篇教案应该写什么?是审美、是价值观、还是对未知世界最原始的探索欲?这是一个留给所有人的、关乎未来的深邃命题。在这个不确定的时代,唯有极致的执行与持续的学习,不可被阻挡。