姚顺宇：AI Scaling Law（规模定律）的持续有效性

当外界纷纷讨论“规模定律撞墙”、大厂创新乏力时，Google DeepMind 研究员姚顺宇却给出了截然相反的判断：预训练的 Scaling Law 远未见顶，所谓“撞墙”大多是工程 Bug 或科学假设错误。他曾供职于 Anthropic，如今在谷歌，亲历三大 AI 巨头的内部打法。

本期内容源自《张小珺播客》对姚顺宇的深度访谈。你将了解到，为何他认为 AI 研发已从“个人英雄主义”进入“集体系统化”时代；代码生成为何能率先爆发（反馈清晰 + GitHub 数据）；以及 Anthropic、Google、OpenAI 在决策机制和文化上的本质差异。他也直率地评价了中美 AI 竞争：中国公司在 C 端产品和“蒸馏”技巧上是先行者，而美国公司更专注于提升智能上限。最后，他预测未来 6-12 个月内，AI 将实现“自我研究”的闭环。这是一份来自一线实战派的技术洞察。

姚顺宇认为，AI 已进入拼执行、拼数据工程、拼系统化建设的平稳增长期。真正的突破可能来自对下一代交互形态的探索，以及 AI 对科研过程本身的全面自动化。

参考：

🧠 AI 研发范式转移——从“个人英雄”到“系统化工程”

个人英雄主义时代已过：现在的成功更多依赖集体的执行力和系统的严谨性。
研发像18世纪的热力学：理论与实验紧密结合，通过大规模数值实验验证想法。
“涌现”的真相：所谓智能涌现，其实是发现了如何通过大规模训练同步提升所有能力的方法。
Scaling Law未见顶：很多“撞墙”言论，实际上是工程上的bug或科学假设错误，而非规模本身的天花板。

🏢 三大模型公司内部对比——Anthropic、Google、OpenAI

Anthropic：执行力极强，决策层本身就是核心技术负责人，能实现高效的自上而下决策。
Google：技术储备深厚（TPU、人才），擅长将确定的技术路径转化为严谨的工程项目，文化偏向自下而上，研究自由度大。
OpenAI：曾引领范式，但组织上面临决策机制的挑战；其后训练团队与产品结合非常紧密。

💻 核心技术洞察——代码、强化学习与长文本

代码为何率先爆发：反馈信号极度清晰（测试通过/失败），且拥有GitHub这一高质量天然数据集。
强化学习的作用：后训练的核心，通过在清晰反馈环境中大规模练习，显著提升模型能力（如Claude 3.7）。
长文本哲学：用有限的训练长度实现无限的使用长度，通过选择性遗忘和检索机制让模型具备更长的工作跨度。

🌍 行业现状与中美竞争

模型同质化：三大公司纸面跑分接近饱和，未来差异在用户体验和特定场景（Agent、Coding）优化。
AI自我演进：预计6-12个月内，AI将能完整实现“提出假设→写代码跑实验→分析结果”的自我研究闭环。
对话式交互“愚蠢”：目前的Chatbot形态非常原始，未来需要全新产品形态。
中美对比：
- 中国：人才储备出色，C端产品商业模式和生态构建极强（抖音、豆包），在“蒸馏”技巧上是先行者。
- 美国：更专注于提升智能上限和效率工具，C端产品力相对较弱。

🎓 个人成长与职业态度

物理学背景的价值：培养了系统性思考和追根究底的性格，追求“可客观评价的标准”。
推崇“靠谱”：做事并负责、清晰定义问题，对含糊其辞的观点持批判态度。