英雄主义时代的终结：深度对话 DeepMind 研究员姚顺雨，揭秘硅谷大模型竞赛的底层真相

在硅谷的 AI 圈子里，“姚顺雨”（Yao Shunyu）是一个自带流量的名字，甚至带有某种“双生”的传奇色彩：一位是曾任职于 OpenAI、后归国担任腾讯首席科学家的姚顺雨；另一位则是本文的主角，先后效力于 Anthropic 和 Google DeepMind 的姚顺雨。

这位 DeepMind 研究员的转行经历极具戏剧性：他曾是在清华和斯坦福研究非厄米系统（Non-Hermitian systems）、拓扑理论及黑洞量子信息的顶级物理学家。然而，在入职伯克利博士后仅仅两周后，他便毅然辞职投身 AI 浪潮。从追求“不可验证”的高能物理理论，到追求“绝对客观验证”的 AI 工程，姚顺雨的跨越折射出大模型竞赛的底层范式转移：在这个时代，个人的英雄主义已经让位于集体主义的执行力，而决定成败的往往不是“脑子”，而是“信心”。

1. AI 开发“不需要脑子”，需要的是极致的执行（C）

作为一名技术布道师，我见过无数天才试图用精妙的算法改变世界，但姚顺雨给出的观察却冷酷而清醒：在当今的 AI 框架下，Idea 是极其廉价的，甚至“AI 研发并不太需要脑子”。

“AI 这个事本来也不太需要脑子……这个行业最重要的特质就是 C（Execution），就是做事，然后对自己做的事负责任。”

在大模型时代，所谓的“脑子”往往体现为一种系统性的实验排除法。姚顺雨认为，真正的核心壁垒是 C（Execution）——即将宏大构想拆解为微小、可执行步骤并对其结果绝对负责的能力。当实验结果偏离预期时，平庸的研发者会陷入哲思，而优秀的工程师会通过设计严密的消融实验（Ablation Studies），像物理学家寻找实验误差一样排除 Bug。

这背后隐含着一种“冲浪者与浪”的哲学：AI 的进展如同一股不可阻挡的巨浪，个人只是浪尖上的冲浪者。你可以选择冲得更好、姿态更美，但你无法阻止浪潮本身。在这个背景下，集体的执行效率远比个人的灵光一现更具杀伤力。

2. Scaling Law 的天花板：是物理撞墙，还是“信心”丢失？

业界关于 Scaling Law（规模定律）是否见顶的争论，在姚顺雨看来，更多是一个心理学问题而非纯粹的科学问题。他将人们认为规律到头的情况归纳为三类：

适用范围到头： 认为 Scaling Law 在物理机制上无法继续延伸。
数据撞墙： 认为高质量互联网数据已被耗尽。
代码有 Bug： 模型表现停滞并非规律失效，而是实验设计或实现中存在未察觉的错误。

姚顺雨的核心洞察在于：大多数顶尖研究者认为规律到头，真相往往是第三种——有 Bug。 在物理学研究中，如果理论与数值对不上，研究者会死磕每一个参数；在 AI 研发中亦然。

解决问题的关键在于“信心”。当你坚信 Scaling Law 依然有效时，你会系统性地排查每一个可能的 Bug；一旦你丧失信心，就会顺理成章地宣布“撞墙”。Scaling Law 不仅是经验公式，更是支撑研发投入的信仰。

3. Anthropic 的成功密码：技术一号位的绝对决策权与“战友情”

作为曾在 Anthropic 核心团队（Horizon Team）参与大尺度强化学习研究的成员，姚顺雨揭示了这家公司能与 Google 这种巨头抗衡的关键：一种高效的“Top-down”（自上而下）决策模式。

这种模式的成功并非偶然，而是源于核心团队极高的“共信力”。Anthropic 的创始团队（如 Jared Kaplan, Jack Rae 等）是真正一起“下过战壕”的战友，他们共同撰写了奠定现代大模型基础的 Scaling Law 和 GPT-3 等关键论文。

Anthropic 模式（Startup）： 核心决策者即是技术领袖，拥有深厚的技术底座。这让他们敢于在不确定性中“Make Bet”（下注），并动员全公司力量执行。
Google 模式（Big Tech）： 倾向于“Bottom-up”（自下而上）。在预训练这种确定性极高的工程化项目中，Google 的人才储备和系统性管理展现出无敌的碾压势头；但在瞬息万变的新领域，官僚逻辑往往会稀释决策的果断性。

4. Coding：AI 唯一真正原生的成功场景

姚顺雨认为，尽管 AI 无处不在，但除了编程（Coding），目前尚无第二个真正意义上的 AI 原生成功场景。其背后的逻辑在于 Coding 是一个闭环系统（Closed-loop）：

反馈信号清晰： 代码能否跑通、输出是否正确，拥有客观且即时的奖励机制（Reward Signal），这为强化学习提供了天然的温床。
高质量数据基石： GitHub 积累了数十年的结构化数据，且由于代码逻辑的严密性，其数据质量天然优于杂乱的网页文本。
审美标准一致： 全球顶尖程序员对“好代码”（简洁、高效、解耦）有着高度共识，这降低了 AI 模仿人类顶尖思维的难度。

这也解释了一个有趣的悖论：AI 在人类认为最难的理性领域（数学、代码）进展最快，而在缺乏标准的“产品设计”或“情感共鸣”领域进展缓慢。

5. 程序员的未来：从“码农”到“系统架构师”

对于 AI 是否取代程序员，姚顺雨持有一种“理性的悲观”。他认为取代不会瞬间发生，而是一个价值重新分配的过程：未来可能只有 1/1000 的顶尖程序员能存活，他们拿走 100 倍的工资，并指挥 AI 完成过去所有人的工作。

在这一进程中，传统程序员必须向“AI 协作型架构师”转型：

同时，他也清醒地指出，仅靠“卖 Token”（API）是一门差生意，容易陷入价格战。唯有像 Google 这样拥有完整生态链的巨头，或能通过极致产品体验（如 Cursor、Cloud Artifacts）建立壁垒的公司，才能在浪潮中生存。

6. 技术演进的下一幕：ML Coding 与“选择性遗忘”

展望未来 6-12 个月，姚顺雨预测了两大核心趋势：

AI 研制 AI（ML Coding）：
长文本的哲学（Long Horizon）： 姚顺雨提出了 “有限 Context 训练，无限 Context 使用” 的构想。真正的个人助手不应是无限增加内存，而是学会像人类一样 “选择性遗忘”。你不需要记得昨天晚上吃了什么，只需在特定场景下精准检索相关信息。这种模拟人类认知机制的“上下文管理”，是通往真正 Agent 的关键。

7. 中美差距：资源劣势逼出的“聪明蒸馏”策略

在谈及中美模型 GAP 时，姚顺雨提出了一个独特的视角：中国算力资源的短缺，反而逼出了更先进的“多智能体（Multi-agent）”雏形。

硬蒸馏： 强行模仿别家模型的输出，这在商业和技术上都是平庸且不道德的。
聪明蒸馏： 将别家强模型作为“评价者”或“辅助者”，融入自家的训练循环。在这种模式下，中国实验室实际上在探索如何让不同分布、不同特性的模型协同工作。

此外，中国模型（如字节跳动的豆包）在用户体验优化、语音生成的自然度与响应速度上已经达到世界顶级水平。这种对用户需求的敏锐捕捉，是在算力劣势下实现差异化突围的明智选择。

结论：在这个不确定的时代，人类该写什么样的教案？

姚顺雨从物理学转向 AI，本质上是从一个“理论自洽”的世界转向一个“实验验证”的世界。他的洞察告诉我们：在这个英雄主义退场的背景下，任何试图阻挡 AI 进展的行为都会削弱自身的议价权。

当 AI 已经学会了我们交给它的所有理性知识，甚至开始自主进化时，人类的角色正在发生本质的变化。我们不再是唯一的“写作者”，而更像是“教案的设计者”（Curriculum Designer）。

当理性、逻辑与工程执行力都被 AI 掌握时，人类作为“老师”，下一篇教案应该写什么？是审美、是价值观、还是对未知世界最原始的探索欲？这是一个留给所有人的、关乎未来的深邃命题。在这个不确定的时代，唯有极致的执行与持续的学习，不可被阻挡。