#276. Łukasz Kaiser: Transformer的诞生、推理模型与AI的未来

#276. Łukasz Kaiser: Transformer的诞生、推理模型与AI的未来

131分钟 ·
播放数1515
·
评论数3

📝 本期播客简介

本期我们克隆了与人工智能领域顶尖专家 Łukasz Kaiser 的深度对话。Łukasz 是一位波兰数学家和计算机科学家,也是那篇开启生成式A I时代的里程碑论文《Attention is All You Need》(Transformer模型)的八位作者之一。他曾任Google Brain主任研究科学家,自2021年起在OpenAI担任研究员,负责过G P T 4长上下文项目,并领导团队催生了最新版ChatGPT中使用的O1推理模型。 在这期节目中,Łukasz将带我们回顾Transformer的诞生,揭示其如何从一个“普通”研究想法演变为A I基石。更重要的是,他将深入探讨A I发展的“新范式”——推理模型。与传统大语言模型预测下一个词不同,推理模型能进行内部思考、调用外部工具,从而实现更高效的学习、更少的幻觉,并有望加速科学发展。Łukasz驳斥了“A I冬天”的说法,预言未来一两年A I将迎来“令人害怕”的迅猛进步,并分享了OpenAI构建有益通用人工智能的愿景。他还讨论了A I在自动化工作、多模态训练、以及如何应对社会挑战等方面的深刻见解。这不仅是一次技术前沿的探索,更是对A I如何重塑我们世界的一次深思。

翻译克隆自:El Cerebro detrás de OpenAI y Google 🤖 | 🎙️ Łukasz Kaiser, Lead Researcher en OpenAI - Podcast IA 🟣

👨‍⚕️ 本期嘉宾

Łukasz Kaiser,波兰数学家和计算机科学家,Transformer模型论文《Attention is All You Need》的八位作者之一。曾任Google Brain主任研究科学家,自2021年起在OpenAI担任研究员,负责过GPT-4长上下文项目,并领导团队催生了最新版ChatGPT中使用的O1推理模型。

⏱️ 时间戳

00:00 开场 & 播客简介

AI新范式:推理模型的崛起

02:14 Transformer开启生成式AI时代:Łukasz作为作者之一的感受

02:53 推理模型:AI发展的新范式,处于极其陡峭的上升阶段

03:14 推理模型与AGI:数据需求更少,有望加速科学发展

03:43 AI发展的瓶颈:GPU和能源

04:04 AI冬天论:Łukasz驳斥,预言未来一两年AI将迅猛进步

05:22 智能的定义:超越目标,纯粹的好奇心

07:11 OpenAI的愿景:构建有益通用人工智能,推动科学进步

08:22 AI的强大力量:机遇与挑战并存,政府应密切关注

09:02 AI发展速度:数字化世界桥梁可快速搭建,但需持续观察

10:09 OpenAI的使命:构建有益AGI,赋能人类,推动科学

AI对工作与社会的影响

11:02 AGI的定义与发展:AI与人类智能的根本差异,自动化任务的未来

13:01 AI自动化工作:从任务取代到工作辅助,快速普及的电脑任务自动化

15:58 AI在编程领域的进展:模型成为程序员的得力助手,代码生成与审查能力惊人

19:03 AI进步的瓶颈:算力限制与模型迭代周期

20:48 研究与发布:技术发现到产品落地的漫长周期

22:17 模型再训练:GPT-4到GPT-4o的演进,兼顾性能与成本

23:13 模型优化策略:做大模型与模型蒸馏

24:03 OpenAI的转变:从研究实验室到服务近十亿用户的公司

25:08 算力争夺战:Sam Altman的努力与GPU的极限

26:43 AI发展趋势:旧范式接近极限,新范式(推理)陡峭上升

27:58 推理模型:从预测下一个词到内部思考与工具调用

30:49 AI进步的动力:突破性研究与经济驱动

33:20 Transformer的诞生:从普通研究想法到AI基石

38:39 Transformer的应用:从翻译到语言模型,数据效率的提升

39:15 推理模型的起源:ChatGPT问世前两年的研究积累

42:51 老式大语言模型与推理模型的区别:预测下一个词 vs 内部思考与工具调用

44:05 推理模型的工具调用:网页搜索、Python代码执行与MCP协议

45:34 思维链:推理模型接近AGI的体现

46:09 推理模型的训练:强化学习与先验知识的重要性

47:02 推理模型的优势:从错误中学习,更长时间的思考与验证

48:55 推理的本质:模仿输出,通过思考达到结果

50:43 推理模型:学习数据量更少,泛化能力更强,重大范式转变

AI的未来与挑战

51:57 推理模型的潜力:从编程到科学加速,尚未找到真正的“引爆点”

55:30 AI的创造力:加速科学发现与执行,而非凭空创造

58:02 AI在日常工作中的应用:代码辅助、实验运行与合成数据生成

01:03:05 模型速度与效率:蒸馏技术与算力瓶颈

01:05:46 AI进步的动力:持续的工程改进与新研究突破

01:09:31 AI的进步空间:模型仍不完美,巨大改进潜力

01:10:30 推理模型的未来:并行化与从任意数据中学习

01:13:44 Pulse功能:AI的“思考”与更完善的答案

01:14:40 多模态训练:视频、音频等数据对AI理解世界的重要性

01:17:35 机器人与AI:物理世界理解的突破与层级结构

01:21:49 世界模型:语言模型理解抽象世界,多模态填补物理世界空白

01:22:17 AGI的定义:Demis Hassabis的观点与推理模型的潜力

01:23:54 物理世界理解:视频训练与机器人技术的发展

01:27:17 AI幻觉:产生机制与推理模型的解决方案

01:31:48 幻觉的解决:数据调整、强化学习与推理过程

01:33:22 模型的不对齐:思维链与最终答案的差异

01:35:59 思维链的展示:美学与安全考量

01:39:19 AI研究者的自豪与压力:谷歌与OpenAI的文化变迁

01:41:13 AI竞争:共同目标与信息流动

01:43:12 进步的代价:昂贵的算力投入与实验失败

01:44:40 其他实验室:Anthropic、Grok与Meta的AI发展

01:45:31 AI垃圾内容与武器:研究者的担忧与政府的责任

01:48:55 OpenAI的订阅模式:避免用户参与度优化,实现有益AI

01:50:05 商业模式的挑战:广告与佣金的平衡

01:52:01 产品推荐:确保模型公平性,不受商业协议影响

01:53:13 市场压力:OpenAI的坚持与挑战

01:54:20 OpenAI硬件设备:Jony Ive的参与与未来愿景

01:55:30 订阅模式的坚持:不为用户参与度优化

01:58:06 AI的未来愿景:解决平凡问题,加速科学进步

02:00:01 AI与教育:导师潜力与作弊风险

02:00:49 乐观与怀疑:对技术进步的看法与社会责任

02:02:50 AI的社会责任:如何正确使用技术,避免负面影响

02:04:05 AI的进步与社会适应:持续改进与生活扰动

02:07:45 结束语:对Łukasz Kaiser的感谢与对AI未来的期望

🌐 播客信息补充

本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的

使用 AI 进行翻译,因此可能会有一些地方不通顺;

如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

展开Show Notes
lewes
lewes
2025.10.29
干货
Dyson戴森
Dyson戴森
2025.10.27
有点儿听不明白
希瑞:同感 倒不是讲的内容本身有多难 而是AI翻译还是稀碎的 听得太费劲了😂