从开普勒到AI：科学发现的瓶颈转向验证

本播客翻译自Dwarkesh Podcast 陶哲轩的访谈（原英文播客）。

# 从开普勒到AI：科学发现的瓶颈转向验证

> 从开普勒的椭圆轨道到今天的AI数学，这期讨论科学发现为何正从“提出想法”转向“验证、筛选与协作”。

## 导语

当AI越来越擅长批量生成假设，科学最稀缺的能力可能已不再是灵感，而是验证、判断和说服。本期从科学史讲到当代数学研究，既谈AI在数学中的真实进展与边界，也谈为什么很多重要理论在早期并不占优，却最终改变了世界。

## 主持人

本期主持人围绕“科学发现究竟如何发生”持续追问，不只关心AI能不能解题，也把讨论推进到科学判断、传播说服和研究流程重构这些更底层的问题，使这场对谈兼具历史视角与现实针对性。

## 嘉宾

嘉宾是数学研究一线的代表性学者 Terrence Tao。由他来谈AI与数学的关系尤其值得听，因为他既熟悉真正的数学突破如何产生，也长期观察工具、证明形式化和研究协作方式的变化，能把技术热潮放回具体研究实践中判断。

## 亮点

- 从开普勒放弃“漂亮但错误”的理论讲起，重新理解科学发现里数据、试错与验证的作用。
- 讨论一个科学想法为何常常在早期并不更准确、也不更容易被接受，科学进步如何依赖叙事与说服。
- 拆解AI做数学的现状：早期成果之后进入平台期，真正优势更可能在广度铺开而非单点突破。
- 具体谈到AI已明显提升文献检索、作图、排版等辅助效率，但尚未真正加速最核心的数学突破。
- 围绕Lean、形式化证明与“人工机巧”展开，讨论AI协作的潜力、局限，以及未来更现实的人机分工。
- 从素数定理、孪生素数猜想到黎曼猜想，解释数学界为何会在严格证明之外形成强烈信念。

## 章节目录

- `00:00` 从开普勒到AI：科学发现的瓶颈
这一章先回顾了开普勒如何在哥白尼模型和第谷·布拉赫高精度观测数据的基础上，放弃自己关于柏拉图立体的漂亮理论，最终发现行星椭圆轨道与三大运动定律。对话随后借这个故事讨论科学发现的过程：提出想法固然重要，但数据收集、验证和分析同样关键。两人进一步把开普勒类比为不断试错的“高温度模型”，引出当下AI能大规模生成假设后，科学真正的瓶颈正转向验证、筛选与识别哪些想法值得推进。
- `15:13` 科学进步如何被判断与说服
这一章围绕“怎样判断一个科学想法是否真正有价值”展开，讨论了标准、路径依赖和历史语境对科学评价的影响。对话借日心说、牛顿、达尔文等案例说明，正确理论在早期往往并不更准确、也不更容易被接受。后半段进一步谈到科学不仅靠数据和验证，也依赖叙事、传播与说服；同时以天文学和引文研究为例，说明人们或许还能从有限数据中提取出更多关于科学活动本身的信号。
- `30:17` AI数学进展的平台期与广度优势
这一章围绕“AI做数学”当前到底进展到哪一步展开：早期确实解出了一批埃尔德什问题，但纯靠AI一击即中的阶段似乎已经过去，眼下进入了平台期。讨论的重点转向AI与人类的互补关系——AI擅长大规模铺开、尝试现有方法，人类更擅长深入突破和发明新技术。也因此，AI对数学最可能带来的改变，不只是解单个难题，而是推动一种更偏“规模化实验”的新研究方式。
- `45:26` AI数学协作的边界与可能
这一章先谈到，评估AI能力需要更标准化的数据集和公开的挑战题，而不是只看公司公布的成功案例。随后话题转向数学研究中的实际体验：AI已经明显提升了文献检索、作图、排版等辅助工作效率，也让论文变得更丰富，但还没有真正加速最核心的数学突破。后半段重点讨论“人工机巧”和真正智能的差别，以及AI与Lean在证明、分析和重构数学成果中的潜力与局限，强调未来更可能是人类与强大工具之间的新型协作，而不是AI一次性自主解决难题。
- `01:00:27` 素数模型、偶然性与AI时代的数学
这一章先从“半形式化”科学交流谈起，说明如果没有一种既能容纳数据、论证和叙事、又不易被AI钻空子的框架，人工智能就很难真正参与猜想生成与科学判断。随后以高斯从数据中提出素数定理为例，展开讨论素数的统计模型、孪生素数猜想、黎曼猜想，以及数学界为何会在缺乏严格证明时仍形成强烈信念。后半段转向陶哲轩个人的学习方式、写博客记录知识的习惯，以及他对偶然交流价值的强调，最后谈到AI对数学工作的重塑：短期更像互补工具，长期会改变研究路径，也让年轻人拥有更多非传统进入前沿的机会。
- `01:23:39` 致谢收尾
这一章是对谈的结束部分，主持人表示可以用前一句作为收尾，并向 Terrence 表达感谢。Terrence 简短回应，完成了整段节目的礼貌收束。

## 章节摘要

### 00:00 - 15:12 从开普勒到AI：科学发现的瓶颈

这一章先回顾了开普勒如何在哥白尼模型和第谷·布拉赫高精度观测数据的基础上，放弃自己关于柏拉图立体的漂亮理论，最终发现行星椭圆轨道与三大运动定律。对话随后借这个故事讨论科学发现的过程：提出想法固然重要，但数据收集、验证和分析同样关键。两人进一步把开普勒类比为不断试错的“高温度模型”，引出当下AI能大规模生成假设后，科学真正的瓶颈正转向验证、筛选与识别哪些想法值得推进。

- 开普勒最初相信行星轨道与柏拉图立体之间存在几何和谐，但第谷的数据最终迫使他放弃这套理论。
- 凭借第谷比前人精确得多的观测数据，开普勒经过多年分析，发现了椭圆轨道、面积定律和后来的第三定律。
- 对话强调科学不只是灵感时刻，还包括选题、收集数据、提出假设、验证结果和写作传播等多个环节。
- 在AI让想法生成成本大幅下降之后，科学面临的新难题是如何大规模验证、评估并筛选真正有价值的理论。

### 15:13 - 30:17 科学进步如何被判断与说服

这一章围绕“怎样判断一个科学想法是否真正有价值”展开，讨论了标准、路径依赖和历史语境对科学评价的影响。对话借日心说、牛顿、达尔文等案例说明，正确理论在早期往往并不更准确、也不更容易被接受。后半段进一步谈到科学不仅靠数据和验证，也依赖叙事、传播与说服；同时以天文学和引文研究为例，说明人们或许还能从有限数据中提取出更多关于科学活动本身的信号。

- 一个科学想法是否会结出成果，往往取决于未来的发展、社会文化的采纳，以及既有标准带来的惯性。
- 科学史上许多后来被证明正确的理论，在刚提出时常常显得更不准确、更反直觉，甚至不如旧理论完整。
- 达尔文和牛顿的例子说明，科学传播能力会影响理论被理解和接受的速度，数据之外还需要把故事讲清楚。
- 天文学长期在数据稀缺条件下发展出强大的信号提取能力，而引用中的重复笔误这类细节，也可能成为衡量科研行为的间接指标。

### 30:17 - 45:24 AI数学进展的平台期与广度优势

这一章围绕“AI做数学”当前到底进展到哪一步展开：早期确实解出了一批埃尔德什问题，但纯靠AI一击即中的阶段似乎已经过去，眼下进入了平台期。讨论的重点转向AI与人类的互补关系——AI擅长大规模铺开、尝试现有方法，人类更擅长深入突破和发明新技术。也因此，AI对数学最可能带来的改变，不只是解单个难题，而是推动一种更偏“规模化实验”的新研究方式。

- AI已经解出五十多道埃尔德什问题，但纯靠AI直接解题的新增成果明显减少，低垂果实基本已被摘完。
- 当前更常见的做法是人和多个AI工具协作，由AI提出证明思路、做批评改写、生成数据或整理文献。
- 讨论认为AI强在广度、人类强在深度，因此未来科学研究需要重构流程，先让AI大范围摸清地形，再由专家攻克真正困难的部分。
- AI目前很擅长把已有标准方法大规模应用到问题上，但在补上关键缺口、提出真正新技术方面仍然有限，系统研究中的成功率往往只有1%到2%。

### 45:26 - 01:00:26 AI数学协作的边界与可能

这一章先谈到，评估AI能力需要更标准化的数据集和公开的挑战题，而不是只看公司公布的成功案例。随后话题转向数学研究中的实际体验：AI已经明显提升了文献检索、作图、排版等辅助工作效率，也让论文变得更丰富，但还没有真正加速最核心的数学突破。后半段重点讨论“人工机巧”和真正智能的差别，以及AI与Lean在证明、分析和重构数学成果中的潜力与局限，强调未来更可能是人类与强大工具之间的新型协作，而不是AI一次性自主解决难题。

- 嘉宾认为，判断AI真实水平需要标准化数据集和统一挑战题，避免只看到成功案例而忽略失败结果。
- AI已经显著改变数学论文的写法，能更快完成作图、代码生成、文献检索和排版等辅助任务，但核心解题过程仍主要依赖纸笔思考。
- 他把当前AI更接近反复试错和蛮力扩展的“人工机巧”，而不是能在互动中持续积累部分进展、形成新理解的智能。
- 对于Lean生成的大型形式化证明，他认为即使初看难懂，仍可以通过拆分引理、重构版本和后处理分析来提炼关键思想与更优雅的表达。

### 01:00:27 - 01:23:39 素数模型、偶然性与AI时代的数学

这一章先从“半形式化”科学交流谈起，说明如果没有一种既能容纳数据、论证和叙事、又不易被AI钻空子的框架，人工智能就很难真正参与猜想生成与科学判断。随后以高斯从数据中提出素数定理为例，展开讨论素数的统计模型、孪生素数猜想、黎曼猜想，以及数学界为何会在缺乏严格证明时仍形成强烈信念。后半段转向陶哲轩个人的学习方式、写博客记录知识的习惯，以及他对偶然交流价值的强调，最后谈到AI对数学工作的重塑：短期更像互补工具，长期会改变研究路径，也让年轻人拥有更多非传统进入前沿的机会。

- 如果科学交流缺少一种半形式化框架，AI就难以可靠地参与提出策略、生成猜想和判断其可信度。
- 高斯通过统计数据提出素数定理，开启了把素数视为具有某种密度的伪随机对象的思路。
- 数学界对孪生素数猜想和黎曼猜想的信心，很大程度来自统计模型、实验支持，以及少数已证明结果与模型预测的一致。
- 陶哲轩认为偶然性的交流和适度的干扰很重要，而AI在未来十年会接手数学家大量日常工作，但更可能先作为互补工具而非完全替代者。

### 01:23:39 - 01:23:43 致谢收尾

这一章是对谈的结束部分，主持人表示可以用前一句作为收尾，并向 Terrence 表达感谢。Terrence 简短回应，完成了整段节目的礼貌收束。

- 主持人认为前一句话很适合作为整场对谈的结尾。
- 主持人在结束时向 Terrence 表达感谢。
- Terrence 以简短回应接受致谢。

## 适合谁听

适合关心AI、科学方法与数学研究的人收听；听完你会更清楚AI正在改变科学的哪个环节、哪些地方仍离真正突破很远。