📝 本期播客简介
本期我们克隆了:硅谷知名 AI 技术播客《The TWIML AI Podcast》AI Trends 2026: OpenClaw Agents, Reasoning LLMs, and More with Sebastian Raschka - #762
当预训练技术趋于成熟,大模型的下一个增长点在哪里?本期嘉宾 Sebastian Raschka 是一位顶尖的独立 LLM 研究员,也是畅销书《从头开始构建大语言模型》的作者。他认为我们正处于一场“推理革命”之中。
在这期节目中,Sebastian 将深度拆解 DeepSeek R1 和 OpenAI o1 背后的技术逻辑,解释为什么“后期训练”和“可验证奖励”成为了压榨模型性能的关键。他还会分享自己如何利用 AI 进行“氛围编程”,在不精通 Swift 的情况下开发出原生的 macOS 应用。无论你是关注底层架构的开发者,还是希望利用 AI 提升效率的普通用户,这期关于 2026 年 AI 趋势的深度对谈都不容错过。
👨⚕️ 本期嘉宾
Sebastian Raschka,独立 LLM 研究员、知名 AI 教育家。他曾任 Lightning AI 研究主管,并著有《Python Machine Learning》和《Build a Large Language Model from Scratch》等多部经典著作。他致力于将复杂的 AI 理论转化为可落地的代码实践。
⏱️ 时间戳
00:00 开场 & 嘉宾介绍
LLM 的范式转移
01:50 推理革命:从“记忆提取”到“逻辑思考”的跨越
03:54 工具包装器(Tool Wrapper)的兴起:大模型不再是孤岛
07:37 渐进式改进:模型健壮性与“生活质量”的提升
“氛围编程”与个人工作流
11:05 开发者的新姿势:利用 LLM 构建自定义 macOS 效率工具
13:54 确定性工具 vs 随机性模型:如何找到最佳平衡点
15:33 氛围编程(Vibe Coding):技术门槛的瓦解与底层原理的价值
17:45 社交媒体上的“一次性搞定”:是奇迹还是幸存者偏差?
深度拆解推理技术
19:24 2026 三大核心主题:推理、推理侧扩展与智能体化
22:03 可验证奖励(Verifiable Rewards):为什么数学和代码走在最前面
24:13 过程奖励模型(PRM):如何教 AI 检查自己的思考步骤
27:27 推理侧扩展:用推理阶段的算力换取更高的准确率
30:59 自我改进(Self-Refinement):让模型在循环中进化
智能体与未来架构
33:35 智能体(Agents):从单次对话到闭环任务处理的演进
35:54 多智能体系统:是噱头还是未来的生产力基石?
38:45 架构演进:MoE、MLA 与稀疏注意力的实战落地
43:00 持续学习的迷思:长上下文是否取代了模型更新的需求?
46:23 文本扩散模型:Transformer 之外的另一种可能
教育与新书预告
47:31 从头构建推理模型:Sebastian 的新书计划与实验心得
50:15 学习路径建议:如何系统掌握 LLM 的完整生命周期
🌟 精彩内容
💡 推理革命:后期训练成为新战场
Sebastian 指出,预训练已经非常成熟,现在的“低垂果实”在于后期训练。通过推理侧扩展(Inference Scaling),我们可以在模型生成答案时投入更多算力,让模型拥有更多“思考时间”,从而解决复杂的逻辑问题。
🛠️ 氛围编程(Vibe Coding)的实践
嘉宾分享了自己如何通过 LLM 在短时间内开发出处理播客章节、arXiv 论文链接的 macOS 应用。他强调,LLM 的最大收益不在于直接完成任务,而在于帮助用户开发出“运行逻辑确定”的工具。
🚀 可验证奖励与 DeepSeek 的突破
讨论了 DeepSeek R1 如何利用数学和代码的确定性规则提供奖励信号。这种范式消除了人工标注的模糊性,使得模型可以通过强化学习进行大规模的自我进化。
💻 架构的微调与创新
虽然 Transformer 依然稳坐江山,但 DeepSeek 引入的 MLA(多头潜变量注意力)和稀疏注意力机制,证明了通过计算换内存、降低 KV 缓存成本在超大规模模型中的可行性。
❤️ 持续学习与个人化
Sebastian 认为,真正的自动化持续学习仍是梦想。目前,长上下文窗口和 RAG(检索增强生成)在很大程度上缓解了对实时更新模型的需求,但在处理具有广泛影响的新信息时,模型更新依然不可或缺。
🌐 播客信息补充
翻译克隆自:The TWIML AI Podcast:AI Trends 2026: OpenClaw Agents, Reasoning LLMs, and More with Sebastian Raschka
本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的
使用 AI 进行翻译,因此可能会有一些地方不通顺;
如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
