当外界纷纷讨论“规模定律撞墙”、大厂创新乏力时,Google DeepMind 研究员姚顺宇却给出了截然相反的判断:预训练的 Scaling Law 远未见顶,所谓“撞墙”大多是工程 Bug 或科学假设错误。他曾供职于 Anthropic,如今在谷歌,亲历三大 AI 巨头的内部打法。
本期内容源自《张小珺播客》对姚顺宇的深度访谈。你将了解到,为何他认为 AI 研发已从“个人英雄主义”进入“集体系统化”时代;代码生成为何能率先爆发(反馈清晰 + GitHub 数据);以及 Anthropic、Google、OpenAI 在决策机制和文化上的本质差异。他也直率地评价了中美 AI 竞争:中国公司在 C 端产品和“蒸馏”技巧上是先行者,而美国公司更专注于提升智能上限。最后,他预测未来 6-12 个月内,AI 将实现“自我研究”的闭环。这是一份来自一线实战派的技术洞察。
姚顺宇认为,AI 已进入拼执行、拼数据工程、拼系统化建设的平稳增长期。真正的突破可能来自对下一代交互形态的探索,以及 AI 对科研过程本身的全面自动化。
参考:
🧠 AI 研发范式转移——从“个人英雄”到“系统化工程”
个人英雄主义时代已过:现在的成功更多依赖集体的执行力和系统的严谨性。
研发像18世纪的热力学:理论与实验紧密结合,通过大规模数值实验验证想法。
“涌现”的真相:所谓智能涌现,其实是发现了如何通过大规模训练同步提升所有能力的方法。
Scaling Law未见顶:很多“撞墙”言论,实际上是工程上的bug或科学假设错误,而非规模本身的天花板。
🏢 三大模型公司内部对比——Anthropic、Google、OpenAI
Anthropic:执行力极强,决策层本身就是核心技术负责人,能实现高效的自上而下决策。
Google:技术储备深厚(TPU、人才),擅长将确定的技术路径转化为严谨的工程项目,文化偏向自下而上,研究自由度大。
OpenAI:曾引领范式,但组织上面临决策机制的挑战;其后训练团队与产品结合非常紧密。
💻 核心技术洞察——代码、强化学习与长文本
代码为何率先爆发:反馈信号极度清晰(测试通过/失败),且拥有GitHub这一高质量天然数据集。
强化学习的作用:后训练的核心,通过在清晰反馈环境中大规模练习,显著提升模型能力(如Claude 3.7)。
长文本哲学:用有限的训练长度实现无限的使用长度,通过选择性遗忘和检索机制让模型具备更长的工作跨度。
🌍 行业现状与中美竞争
模型同质化:三大公司纸面跑分接近饱和,未来差异在用户体验和特定场景(Agent、Coding)优化。
AI自我演进:预计6-12个月内,AI将能完整实现“提出假设→写代码跑实验→分析结果”的自我研究闭环。
对话式交互“愚蠢”:目前的Chatbot形态非常原始,未来需要全新产品形态。
中美对比:
中国:人才储备出色,C端产品商业模式和生态构建极强(抖音、豆包),在“蒸馏”技巧上是先行者。
美国:更专注于提升智能上限和效率工具,C端产品力相对较弱。
🎓 个人成长与职业态度
物理学背景的价值:培养了系统性思考和追根究底的性格,追求“可客观评价的标准”。
推崇“靠谱”:做事并负责、清晰定义问题,对含糊其辞的观点持批判态度。

