📝 本期播客简介
本期我们克隆了:知名播客《Dwarkesh Podcast》在 Jul 1, 2026 的一期深度对谈 Grant Sanderson (@3Blue1Brown) – AI and the future of math
Grant Sanderson 是广受欢迎的数学科普频道 3Blue1Brown 的创始人,他正在制作一个记录人工智能在数学领域进展的新项目。这期节目主要探讨了人工智能在数学前沿的突破速度,以及这些进展对我们理解创造力、科学发现和未来工作意味着什么。
节目从 AI 在国际数学奥林匹克竞赛(IMO)上的表现切入,深入讨论了 AI 解决千禧年大奖难题的可能性,以及这背后更深层的问题:当 AI 能证明定理时,人类的角色是什么?Grant 通过伽罗瓦和群论的历史案例,精彩地阐述了数学中“提出好问题”和“创造新定义”的价值,这些往往比证明定理本身更重要,却难以被量化为基准测试。
对话还延伸到 AI 在写作、编程、学习等领域的局限性,以及数学家在 AI 时代可能转向“策展人”角色的未来图景。如果你对 AI 的能力边界、科学发现的本质、以及未来人类与 AI 的协作方式感兴趣,这期节目会提供极具深度的思考。
👨⚕️ 本期嘉宾
Grant Sanderson,全球知名数学科普频道 3Blue1Brown 的创始人。他以精美的可视化动画和清晰的讲解风格,将复杂的数学概念变得直观易懂,影响了无数数学学习者和爱好者。他正在制作一个记录 AI 在数学领域进展的新项目,深度关注人工智能如何改变数学研究的方式。
⏱️ 时间戳
开场与AI在数学上的突破
嘉宾介绍与AI在数学领域的进展速度
三年前的预言:IMO金牌不等于AGI
为什么IMO题目其实是可以训练的
AI进展的“尖峰”特性:数学正好在尖峰上
AI在几何题上秒杀,组合题上挣扎
千禧年难题与AI的能力边界
解决千禧年难题是否意味着能胜任白领工作?
跨领域知识连接的可能性
蒙哥马利与戴森的故事:偶然的跨领域连接
费马大定理的解法:需要构建理论的大山
如果AI能构建理论大山,智能水平就太高了
下一个基准:提出猜想与创造定义
移动球门:IMO金牌没有带来变革性影响
下一个基准:提出有趣的问题和新的概念化方式
好的数学家证明定理,伟大的数学家提出猜想
如何量化“提出好猜想”?这很难做成基准
数学家们对AI的语气在过去一年发生了变化
伽罗瓦、群论与可验证奖励的困境
提出新思考方式的价值:爱因斯坦与广义相对论
伽罗瓦与群论:验证循环长达100年
为什么伽罗瓦理论是完美的例子
五次方程求根公式的历史背景
拉格朗日:找到正确的提问方式
伽罗瓦的悲剧人生:在监狱里写下革命性想法
当时的学术界拒绝了伽罗瓦的论文
伽罗瓦去世后,想法花了40年才被认可
历史可能走向另一种可能:伽罗瓦被遗忘
群论的应用:盖尔曼预言夸克的存在
压缩即智能:如何衡量“优雅”
不以解决问题为标准,如何衡量进步?
“压缩即智能”:表达越简洁越智能
黎曼猜想解法的第三种可能:纯粹靠硬算
用柯尔莫哥洛夫复杂度量化“优雅”
人类一直在做这件事,AI迟早也会做到
AI会否让数学变得不可理解?
担心AI证明黎曼猜想但人类不理解
单位距离猜想反例:AI的推理是可理解的
解黎曼猜想的三种方式:连接、理论构建、蛮力
ABC猜想尝试性证明:异类的数学大山
David Bessis:《定理经济的衰落》
知道解是对的,会帮助人类理解
证明与解释的区别
Timothy Chow:“未解决的阐述性问题”
证明和解释之间有区别
概念化与想法本身真的有区别吗?
提出新颖洞见的人往往也是优秀的阐释者
AI可能也会擅长解释和提炼
数学家的未来:策展人角色
Grant会一直做现在做的事直到死
数学家最终会变得更像美术馆策展人
Grant的角色可能转向策展方向
人类音乐家永远有一席之地,数学也一样
AI作为超级连接器
AI刚跨过连接想法的门槛,下一步是什么?
广义相对论就是把黎曼几何和狭义相对论连接起来
朗兰兹纲领:一种研究精神
AI成为超级连接器的可能性
为什么自回归模型难以建立跨领域连接?
从数据角度思考:设计环境激励连接能力
并行化与数字心智的优势
AI的关键优势:并行化和可扩展性
数字心智天生具备的优势
设计Agent之间的“偶然对话”
故意给不同Agent不同的上下文
IMO钓鱼题:需要跳出上下文才能解
系统性刷新思维:数字心智的优势
熵坍缩与系统性增加熵
人们对AI的担忧:熵坍缩
AI的关键优势:系统性尝试否定和证明
爱因斯坦的偏见:在prompt层面增加熵
科学不存在唯一正确的启发式方法
可反复尝试性比形式化更重要
为什么AI在计算机使用方面进展慢?
可反复尝试性是关键,不只是可验证性
Lean对于AI目前的进步水平没那么重要
可反复尝试性比形式化更重要
Lean的未充分探索的好处:无限探索
数学独有的特性:按下启动键,十年后回来看
自然语言验证与过程监督
Karpathy的AutoResearch想法
人类数学研究就是一个不断扩展的图书馆
穷举搜索所有可能的代数系统
DeepSeek数学模型:自然语言验证的可行性
数学比其他领域更可能信任自然语言验证器
Lean的另一个意义:消除错误率
写作为什么比数学和编程更难
写作进展慢的原因:不擅长评判
写作不像代码和数学那样模块化
为什么代码能从“能用”进步到“干净”,写作不行?
写作的关键在于洞察力
不可预测性是写作的核心
心智理论与AI的局限性
AI在构建人的心智模型方面特别差
教LLM写间隔重复提示卡的实验
写一张好卡片需要投射人的心智状态
肉毒杆菌实验:理解表情需要模仿
模型没有面部肌肉,像外星人在尝试共情
如何用LLM学习
用LLM学习的建议
“跟谁学”比“学什么”更重要
LLM的解释像维基百科,缺乏刻意构建的动机
把LLM当超级加强版Google用
最有收获的学习经历:先有人搭好枝干
LLM不擅长重新框定你的问题
给学生的建议
对想成为数学家的学生的建议
搞清楚钱从哪来、你创造什么价值
数学家的社会角色变化不大
教学是后AGI时代最稳定的工作之一
在疯狂的世界里,数学是AI走得最远的领域
数学加速的实际应用
AI做出来的数学到底有没有用?
数学进展不均衡:代数数论vs偏微分方程
波音的例子:数学洞见省了几十亿美元
数学巨大突破不太可能立刻转化为经济突破
数学已经变得完全没用了吗?
🌟 精彩内容
💡 “好的数学家证明定理,伟大的数学家提出猜想,最伟大的数学家创造定义”
Grant引用了这句名言来阐述数学创造力的层次。在AI时代,提出好问题和创造新概念的能力可能比证明定理更重要,但这些恰恰是最难被量化为基准测试的能力。
“好的数学家证明定理,伟大的数学家提出猜想,而最伟大的数学家创造定义。”
💡 伽罗瓦理论:验证循环长达100年
Grant通过伽罗瓦和群论的历史,精彩地说明了数学中最有价值的洞见往往需要极长时间才能被认可。伽罗瓦在监狱里写下的革命性想法,当时被学术界拒绝,花了40年才被理解,而群论在物理学中的应用更是等到20世纪才出现。这对AI的“可验证奖励”训练范式提出了深刻挑战。
“你确实有这整整100年的时间,一个想法流经许多不同人的头脑,最后才沉淀成数学界公认的好东西。”
💡 数学独有的特性:按下启动键,十年后回来看
Grant指出,有了Lean这样的形式化工具,AI可以在数学领域实现完全自动化的无限探索,不需要人类检查,只管砸算力。这是其他领域都不具备的特性。
“这是数学独有的、其他领域都没有的特性。你可以按下启动键,然后只管往里砸算力,十年后再回来看,问它‘你有什么成果?’”
💡 数字心智的优势:系统性刷新思维
Grant和Dwarkesh讨论了AI可以通过给不同Agent不同的上下文和偏见,系统性地增加“熵”,避免陷入单一思维模式。这与人类需要“跳出上下文”才能解决某些问题的特性形成对比。
“有时候,你在其他领域做人类研究时,也会想要同样的东西,有时候就是需要能够说,刷新你的思维,用一个完全不同的方式来切入。”
💡 写作的关键在于不可预测的洞察力
Grant深入分析了为什么AI在写作上表现不佳。写作不只是对已有想法的蒸馏,关键在于在正确的节点做出不可预测的举动,那才是更有洞察力的地方。这与自回归模型的生成方式存在根本矛盾。
“要写出好东西,就必须包含某种不可预测的元素……在哪个正确的节点做出一个不可预测的举动,那才是更有洞察力的地方。”
💡 教学是后AGI时代最稳定的工作之一
Grant认为,即使AI成为完美的讲解者,教学仍然是最稳定的职业之一,因为它太依赖人与人的关系。老师所做的是一种非常社会化的、教练式的、导师式的事情。
“即使LLM是很好的讲解者,老师所做的是一种非常社会化的、教练式的、导师式的事情,这可能是未来50年里最稳定的职业之一。”
💡 数学家最终会变得更像美术馆策展人
面对AI能产生海量数学成果的未来,Grant提出数学家的角色可能转向“策展人”——在近乎无限的想法空间中导航,判断哪些想法值得投入和展示。这种策展能力依赖于人与人之间的信任关系。
“你仍然需要有人帮你在这个近乎无限的空间里导航,告诉你哪些想法值得投入……我们永远会更喜欢一个和我们有关系的人,因为我们被激发兴趣的方式是一种社会现象。”
```
🌐 播客信息补充
本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的
使用 AI 进行翻译,因此可能会有一些地方不通顺;
如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
