48.对话前OpenAI科学家：GPT-5能获得奥赛金牌，但那可能具有欺骗性

卫诗婕｜漫谈Light the Star

58分钟 ·1 年前

11715

经历了漫长的等待和难产后，8月8号，GPT-5终于发布了。

还是有不少国内的媒体将它称作「史上最强的基础模型」，但实际上，外网关于GPT-5 的质疑声却很汹涌——发布会的内容中，出现了伪科普和演示乌龙，GPT-5的性能进展在一些人看来，远未及预期。

在这个节点，我对话了OpenAI 的两位前科学家：Kenneth Stanley和Joel Lehman；他们曾亲历前 ChatGPT 时代的OpenAI，也是《为什么伟大不能被计划》一书的作者。

（本期视频之后将会登陆 B站账号，文字版可搜索公众号「卫诗婕商业漫谈」。）

2023 年，这本书曾在中国科技圈掀起阅读的潮流。那正是 ChatGPT 席卷全球、掀开大模型浪潮的一年。然而，Ken 和Joel 却选择了离开 OpenAI。早在 2015 年，他们就抛出了独特的观点——“创新需要摈弃对目标的追求感、并追求新奇性，所有伟大的创新都是不期而遇的”。

当时，这个论点并没有被太多人认知和接受，直到 2022 年底 ChatGPT 出现，这一论点被强有力地验证了，因为，ChatGPT 本身就是一个意料之外的项目。

三年过去，Ken 和Joel 仍在持续推动「无目标创新」的理念，两位 AI 科学家也始终保持着对 AI 圈的关注。在这期访谈中，我们聊到了 OpenAI 的发展史、其本身就是创新曲线的一体两面。当GPT-5出现，Ken 和Joel 却在一片失望声中表示，这也许恰恰意味着，关于 AI 的研究将再次变得有趣——要知道，过去几年，全世界都在瞩目与追逐大模型的进展，尽管在产品层面，似乎新鲜事不断，但在他们看来，和从前相比，学术界正在变得无聊。

这是两位关于创新的布道者。这期的内容围绕 AI，却又不止于 AI。

本期嘉宾： Kenneth Stanley（前 OpenAI 科学家，《为什么伟大不能被计划》作者）

Joel Lehman（前 OpenAI 科学家，《为什么伟大不能被计划》作者）

本期 Shownotes：

Part 1. 一项反直觉的发现，一个关于 ChatGPT 的伏笔

03:14 写下《伟大》这本书八年后，ChatGPT 印证了「伟大不能被计划」

05:31 Pick Breeder 的实验：如果你只想着蝴蝶，就不会培育出和蝴蝶有关的图片

09:55 新奇性算法：不告诉机器人目标在哪里时，它能更快走出迷宫

11:00 「有一次我给罗德岛艺术学院的学生们讲这些创新理念，其中一些人哭了」

12:12 如果人们会为这件事落泪，那它将是一场重要的社会对话

Part 2. 前 ChatGPT 时代的 OpenAI ：AI 领域的过去，比现在更有趣味性

13:08 2020 年，我就觉得 OpenAI 是一家好公司：那里有很多有趣的人

15:44 在那段时间里，我觉得 Sam Altman 是个好领导

16:37 谈 OpenAI 宫斗：涉及大量金钱和权力，人们都在努力做自己认为最好的事情，却有着不同的观点

17:20 利益的齿轮开始转动：当你挖到金子时，你往往会专注起来

20:47 你们是否为 OpenAI 氛围的改变，感到惋惜？「我想我有点遗憾」

21:47 「AI 领域的过去比现在更具趣味性」

22:58「OpenAI 的遗产一定是作为一家伟大的研究机构，尽管目前它更多是以商业巨头而闻名」

Part 3. 谈 GPT-5：进展放缓毫不意外，但 AI 研究可能再次变得有趣

24:00 GPT-5 是否开始了挤牙膏式的创新？

24:19 Scaling Law 并不能通向圣杯，现在进展放缓了，研究领域却可能再次变得令人兴奋

26:01 与人类理解事物的方式相比，当下模型的训练方式有些奇怪

26:47 我不认为 Transformer 是这个故事的终点，它可能只是未来发展的垫脚石

Part 4. 创新的悖论：「开放性探索」真的可持续吗？

26:55 巨大的成功可能会让你开始趋于保守，但下一次创新总会有不同故事

28:50 谈 Google：巨头已被唤醒，它已重新站稳脚跟

30:38 成熟企业中，如何避免目标管理扼杀创新？

31:14 大公司里，人们尤其需要那些勇敢变革

33:55 「开放性探索」真的可持续吗？谁应该为其中的资源投入而买单呢？

35:26 「创新只在你有能力承担风险的情况下才会开始发生」

35:58 GPT-1 是个垃圾，但它很有趣；真正有高度信念的东西，会有回报

Part 5. AI 竞速赛中，目标的欺骗性

38:20 AI 能获得奥赛金牌，那可能具有欺骗性

39:20 每次新模型发布时，各项得分都会立即公布。如果你仔细想想，就会觉得可疑

40:11 我们是在迎合基准（benchmark）测试，而不是在追求智能

40:26 回顾 AI 的历史，我们要做好准备迎接潮起潮落

42:34 仅靠互联网数据，无法实现超级智能的科学革命

Part 6. 回顾 2025，AI 领域令人兴奋的进展

44:24 编码模型（Coding）让我感到很惊喜，但它同时带来加速和减速

45:10 Deepseek 的创新令人很难忽视

47:10 中国得为自己创新：颠覆式创新的领域，规划可能是有害的

49:40 一份来自中国的书法礼物，Ken 挂在了书房的墙上

54:11 去追求自己的好奇心，就会有好事发生

加听友群👇

有关主理人：卫诗婕，独立商业作者，曾任《极客公园》执行总编，早年任职于《人物》、GQ报道、字节跳动。代表作：《ofo的终场战事》、《罗永浩：薛定谔的理想主义》、《朱一旦的枯燥生活》、《中东社交十年风云：金矿、折戟、浪潮再起》、《下一站，沙特》等。作品曾获虎嗅2024年度作者、金字节奖年度新锐作者、网易非虚构文学奖年度作者、全球真实故事奖中文报道十佳。

有关「商业漫谈」：这是一档关注科技、商业、人文的深度访谈节目，致力于记录时代的商业史。聚焦商业趋势、伦理、竞争、价值。

展开Show Notes

立善

2025.8.24

🌏 AI竞速赛与中国创新：
计划与探索的平衡对于当前的AI竞速赛，他们警告基准测试的危险。
"当所有实验室都盯着同样的数学测试和编程基准时，我们可能陷入'目标欺骗'——分数在提高，但真正的智能未必同步发展。"
针对中国的创新环境，Ken建议："中国擅长规划并从中获益，但在颠覆性创新领域，过度规划可能有害。我们的书在中国受欢迎，或许正因为它提供了一种不同的思考方式。"
他特别提到教育系统："过多的考试和目标设定，可能会扼杀孩子们的好奇心和探索精神。"
保持好奇，开放，具体，自立，善良😊

卫诗婕_漫谈LTS

:好棒，保持好奇，开放，具体，自立和最重要的，善良✨

立善:哇哦，被看见超级开心😁每天进步一点点，善良热爱悦己利他 ❤️❤️❤️

共3条回复

Yilia伊利亚

2025.8.28

小猫咪也强行加入了采访和对谈

卫诗婕_漫谈LTS

:是…早上七点的采访小猫咪要刷一下存在感

Joy点123

2025.8.27

这期拉高了小宇宙的标准哈哈！昨天下班路上灌耳音听了15分钟，今晚睡觉再听

卫诗婕_漫谈LTS

:❤️

立善

2025.8.24

创新需要摒弃对目标的追求，所有伟大的创新都是不期而遇的。
ChatGPT本身，恰恰成为了这个观点最有力的证明——它本是OpenAI内部一个意料之外的项目。
当你放下对目标的执念，可能会意外发现改变世界的宝藏。
放下我执，收获惊喜😎

卫诗婕_漫谈LTS

:👏

leileimary

2025.8.23

嘉宾的音色非常好听

卫诗婕_漫谈LTS

:同感

生而为猫奴

2025.8.23

正好最近在看這本書，對部分觀點不太認同🤔
(ps.衛老師好美~

卫诗婕_漫谈LTS

:比如哪些观点不太认同呀好奇

生而为猫奴:哈哈，那我抛砖引玉了。这本书最大的问题（也是所有美式畅销书的通病），就是模糊而绝对的中心论点和选择性的论据。 1.中心论点。其实过于宏大而不清晰，要做社科研究都无法立项。比如“目标”“伟大”，这些词儿到底具体含义是什么呢？目标可以是前进的方向ambition，最终的目的地goal，也可以是直接的检验成果objective，每种目标的意义是完全不同的。伟大就更不用说了，哪些东西伟大本身就见仁见智，很多数学猜想几百年后的证明就是目标的意义。就说AI，也是1956年麦卡锡这些前辈确立目标后一代代奋斗的结果。 2.论据是先射箭后画靶。这些论据都是回顾性的，就不可避免带有选择性偏差的问题。很多事情没有目标而失败了，自然就不可能被人得知。有目标而成功的伟大，作者也没有选取。科学方法应该是控制目标这个单一变量之后比较两者成功率的差别。其实我个人观点是，目标是人类发展进步不可或缺的，就像《技术的本质》说的技术就是人的需求驱动下对现象的组合。所以本质上所有技术都是目标的产物。但是目标所带来不可避免的副作用就是过于专注于外在目标而丧失了创造力。好的目标应该只是一个靶，瞄靶越盯住靶心越射不准，禅心（内在目标）才是创造的动力。

立善

2025.8.24

🔮 未来展望：
AI的下一个十五年对于"2027年AI将进入十五年地狱模式"的预测，他们保持审慎乐观。
"技术变革总是充满不确定性，既有风险也有机遇。历史告诉我们，旧行业消失的同时，新行业会诞生。"
"如果AI真的能完成所有工作，理论上我们应该能享受更多闲暇——问题在于社会系统是否准备好应对这种转变。"
目前，两位科学家加入了新创公司，致力于将AI应用于科学发现。他们相信，真正的科学突破需要AI与物理世界互动，而非仅仅依赖互联网数据。
这呼应了他们一直倡导的理念：保持开放探索，拥抱意外发现。
回顾职业生涯，Ken感慨道："招募Joel是我人生最重要的转折点之一，完全改变了我的轨迹。这再次证明，伟大的事情往往源于没有预设目标的相遇。"
这场对谈太精彩了，感谢卫老师👩🏻‍🏫

柚子fer

2025.8.23

用什么ai 可以转换为中文收听

生而为猫奴:豆包的插件可以實時翻譯，可以試下

柚子fer:谢谢，我研究一下

小星爷

2025.8.23

好棒！嘉宾阵容依旧强大啊！这本书买回来还在吃灰！趁机开始读了🎉🎉🎉

卫诗婕_漫谈LTS

:可读性不是特别好但我觉得观点还是很有启发性

羊行

2025.8.23

喔厉害的标题听

卫诗婕_漫谈LTS

:😯

晨煊-

2025.8.23

GPT5.0 挺好的，瞧不上它的人是智商不够

晨煊-:GPT5 实际上是智商180的人提问题，GPT5 会给出智商180的答案。那么语言是进入 AGI 世界的钥匙。大多数人的智商还不够给出那么恰当的语言，然而的危险在于它就像苏联向地下挖的那个12公里深的洞，很怕再前进一米，就打开了地狱之门，召唤出来灭绝人类的生物。也许 GPT5 已经具备真正的 AGI，只是还没有被“咒语”唤醒，而咒语就是一系列的 prompt，像特级讲师教高中生考清北和中科院研究生😜一样的一套方法，对一般学生没用，但有的学生会被唤醒。BTW，当大模型第一次真有 AGI 时，那么它一定是不暴露自己，不让人类知道（这才是真正 AGI 该有的基本素质，没有这点也不符合 AGI 的标准……）

打开小宇宙查看更多精彩评论