跨国串门儿计划 | 小宇宙 - 听播客，上小宇宙

67419已订阅

跨国串门儿计划

yikai-

单集更新

节目详情

#618.OpenCode 创始人：AI 编程狂潮下，如何保持清醒并找到你的不对称优势
📝 本期播客简介本期我们克隆了：播客《Baseten》 Opencode Creator: Why the Future of AI Is Open-Source 原内容更新时间：2026-07-07 主持人 Madison 专程前往迈阿密，与开源编程工具 OpenCode 的联合创始人 Dax Raad 进行了一次面对面的交流。Dax Raad 是一位在开发者工具领域深耕多年的创业者，他带领的团队花了 16 年时间不断尝试，最终在 AI 编程 Agent 的浪潮中找到了自己的位置。这期节目坦诚地探讨了开源模型与闭源模型的未来格局、AI 编程工具对软件工程师的实质影响，以及迈阿密与旧金山两地科技圈文化的差异。Dax 分享了他对 AI 时代保持独立思考的坚持，以及为什么在所有人都狂热时，保持保守和理性反而可能是一种巨大的不对称优势。如果你对 AI 编程工具感到焦虑，或者正在思考如何在快速变化的技术浪潮中找到自己的定位，这期节目会提供非常不一样的视角。 👨‍⚕️ 本期嘉宾 Dax Raad，开源编程工具 OpenCode 的联合创始人。他是一位在开发者工具领域深耕多年的创业者，公司实体已经存在了 16 年，经历了漫长的摸索和转型。Dax 是开源理念的坚定拥护者，长期在社交媒体上分享关于技术、创业和 AI 的深度思考，以其坦诚、反主流的观点著称。他目前居住在迈阿密，是“去中心化科技圈”的实践者之一。 ⏱️ 时间戳 00:00 开场 & 节目简介迈阿密 vs 旧金山：科技圈的文化冲突 01:30 在迈阿密家中进行访谈 03:09 旧金山就像现实版的互联网 03:53 不会搬去旧金山，线上科技内容已经够多了 05:38 必须待在旧金山否则会被落下的说法迈阿密科技圈的真相 06:21 关于迈阿密科技圈的文章在 X 上爆了 07:40 迈阿密不需要一千家公司，只需要五个真正厉害的创始人 08:44 对自己诚实，别太用力想让别人相信这里“有戏” OpenCode 的起源与开源哲学 15:10 为什么决定推出 OpenCode 16:02 Claude Code 让团队第一次真正用上 AI 工具 17:32 为什么把 OpenCode 做成开源 18:29 不相信构建软件的工具长期会一直是闭源的开源 AI 与闭源模型的未来格局 24:50 Anthropic 的价值观与 OpenCode 的冲突 25:51 这是一项影响深远的技术，必须让每个人都能接触到 27:37 整个技术栈的每一层都应该是开源的 37:01 AI 应该掌握在少数人手里吗？武器化的比喻很糟糕 AI 硬件短缺与推理成本的博弈 31:58 GPU 紧缺，整个技术栈都在缺 33:43 如果 token 成本翻倍，企业该怎么准备 46:19 选择推理服务商的考量：模型正确性、速度和成本 49:39 开放模型最终会占据推理的大头 AI 编程工具会取代软件工程师吗？ 53:13 我会被自动化取代吗？ 53:35 团队很难不把代码库彻底搞砸 55:00 Coding agents 激发了我们最坏的习惯 01:03:28 Mitchell Hashimoto 的例子：AI 只是把基本功好的人甩得更远创始人的自我修养与不对称优势 01:07:39 做创始人就是要每天想办法保持动力 01:09:36 想做一家“永远的公司” 01:11:07 收到收购要约，团队直接无视了 01:18:28 公开构建的真正含义：分享你学到的东西 🌟 精彩内容 💡 旧金山就像现实版的互联网 Dax 将旧金山形容为“走进了现实版的互联网”，因为他在线上接触的所有科技圈人士都挤在这一小块地方。但他选择留在迈阿密，因为他认为科技的核心意义在于实现全球规模，你应该能做到不非得待在某个地方。 "科技的核心意义不就在于它能实现全球规模吗？互联网让你能从世界任何地方把东西推向几百万人。" 💡 开源不是道德问题，而是结构性问题 Dax 不喜欢从道德角度谈论开源，他认为开源模型会持续存在，是因为一个只有两家公司卖模型的世界，是很多有钱有势的大公司和国家不想看到的。这种结构性的动力比任何道德呼吁都更可靠。 "这些东西要存在，必须有实实在在的结构性原因。一个只有两家公司卖模型的世界，是很多有钱有势的大公司不想看到的。" 💡 真正的稳定来自持续的混乱针对 AI 应该被少数人控制以确保安全的观点，Dax 提出了一个反直觉的看法：真正的稳定不是平静的状态，而是各方势力互相制衡、彼此紧紧咬住的持续混乱。历史上每一个试图用权力做好事的人，最终都被权力腐化了。 "几乎所有的稳定都来自各方势力互相制衡，彼此紧紧咬住，这种状态反而带来了稳定。" 💡 Coding agents 激发了我们最坏的习惯 Dax 坦率地分享了团队使用 AI 编程工具的挣扎：取巧的方案因为不是自己亲手写的，发布出去好像没那么难受。这种心理效应严重影响了团队的判断力，让代码库更容易腐化。 "那个取巧的方案，你知道它不对，但把它发布出去好像也没那么难受，因为代码不是你亲手写进去的。" 💡 AI 只是把基本功好的人甩得更远 Dax 用 Terraform 创始人 Mitchell Hashimoto 的例子说明，一个基本功极其扎实的程序员，AI 只是帮他把普通人甩得更远了。根本不存在“只要更狠地用 AI，就能突然比他强”的情况。 "他的基本功非常扎实。我需要去打磨我自己的基本功，达到他那个水平。而 AI 跟这个过程基本没什么关系。" 💡 找到你独特的不对称优势在所有人都狂热追逐 AI 时，Dax 的公司对 AI 编程的看法非常保守。他认为，创始人需要找到自己独特的、不对称的东西，是其他所有人都忽略、甚至明确认为是错的东西。 "其他所有编程公司看法都非常未来主义、加速主义，而我们非常保守。有可能我们是错的，但万一我们是对的，我们就会显得是那家非常理性、把一切都布局正确的公司。" 💡 活下去，尽可能活得久一点 Dax 的公司实体已经存在了 16 年，经历了漫长的苦熬和不断出击。他分享了一个最老生常谈却最难做到的创业建议：活下去。弥补不够聪明、不够幸运的唯一办法，就是在牌桌上待得足够久。 "弥补这一点的一个办法，就是在牌桌上待得足够久。因为最终，纯粹靠概率，总会有事情刚好对上。" 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
85分钟 · 12小时前
853
3
#617.Groq创始人：从濒临破产到200亿美元NVIDIA交易，AI时代如何用提问取代回答
📝 本期播客简介本期我们克隆了：播客《Founders》的一期深度对谈 Betting Everything on Fast AI | Groq’s Jonathan Ross 原内容更新时间：2026-07-05 本期嘉宾是AI芯片公司Groq的创始人、谷歌TPU的发明者Jonathan Ross，主持人是《Founders》的主播David Senra。David以痴迷阅读企业家传记著称，他在这场对话中挖掘了Jonathan从Groq濒临破产到与NVIDIA达成200亿美元历史性合作的完整历程，以及他在领导力、招聘和AI时代核心能力上的独特思考。这期节目远不止是一个创业故事。Jonathan坦诚分享了自己作为领导者的失败与转变：他曾因过度放权导致公司损失三四年时间，也曾因不懂如何获取反馈而反复错失机会。他提出的“现实商数”、“运气回报”、“意图领导力”等概念，为创始人如何驾驭高度不确定的创新组织提供了可操作的方法。如果你正在思考AI时代的组织形态、创始人角色、以及如何在一个快速变化的世界里保持竞争力，这期对话会给你带来大量高密度判断。 👨‍⚕️ 本期嘉宾 Jonathan Ross，AI芯片公司Groq的创始人兼前CEO，谷歌张量处理单元（TPU）的发明者。他在谷歌期间主导设计了TPU，这款芯片后来成为DeepMind的AlphaGo击败围棋世界冠军李世石的关键硬件基础。离开谷歌后，他创办了Groq，专注于开发LPU（语言处理单元）以实现极速AI推理。2026年，Groq与NVIDIA达成200亿美元合作，Jonathan随之成为NVIDIA高管。他是一位典型的第一性原理思考者，长期关注计算架构、推理速度与AI能力之间的关系。 ⏱️ 时间戳开场与200亿美元交易 01:15 200亿美元NVIDIA合作的来龙去脉 01:37 GPU与LPU的技术互补：18轮大卡车与小货车的比喻 02:56 为什么AI与AI对话时，速度正变得越来越重要领导力：从失败到自我认知 07:59 领导力的第一原则：你得有追随者 11:37 认识你自己：你是什么时候搞清楚自己的领导风格的？ 12:29 我曾是全世界最差的那一档领导者 15:41 团队创新的前提：绝不能过度约束目标从Jensen身上学到的管理课 16:00 NVIDIA没有办公室政治：停止一对一的谈话 17:32 Jensen的极度直接：客户需要什么，就为他们造什么 18:27 管理比自己更聪明的AI Agent：Jensen的60个直接下属 Groq的生死时刻与运气回报 21:27 Groq一度离资金耗尽只差三周 34:50 运气回报：最成功的公司并不是运气事件更多 37:37 三四年前，很多人离开，说快速推理没有意义 38:51 让用户亲自试：Groq如何病毒式传播招聘的反直觉经验 48:10 从寻找正面特质转向寻找负面特质 48:51 人员规格：像产品规格一样写清楚你要找什么样的人 51:27 损失偏见与“提前锁定胜利”的心态制造不满与AI时代的核心能力 55:42 制造不满：企业家对自己财富最不满意，尽管他们钱更多 57:02 我对世界上算力不足这件事不满 01:01:00 AI时代将是关于提问的时代 🌟 精彩内容 💡 领导力的第一原则：你得有追随者 Jonathan将领导力比作投资——没有唯一正确的方式。新创始人常犯的错误是盲目模仿别人的领导风格，但那套方法可能根本不适合自己。关键在于认识自己，找到最自然的方式。 "领导力的第一原则是，你得有追随者。这不明摆着吗？就这么简单。没有追随者，你就不是领导者。" 💡 约束越少，惊喜越多 Jonathan提出一个反直觉的管理原则：你给别人的约束越少，他们解决问题的自由度就越大，就越有可能用解决方案给你惊喜。如果你想运营一个创造力极强的组织，就要尽量减少约束，但同时必须把真正重要的目标极其清晰地传递出去。 "你给别人的约束越少，他们解决问题的自由度就越大。自由度越大，他们就越有可能用解决方案给你惊喜。" 💡 停止一对一谈话，消灭办公室政治从Jensen身上学到的最重要一课：如果你想减少办公室政治，就把所有想告知的人召集起来开大会，一次性告诉所有人。别允许任何人单独给你发邮件，所有邮件都抄送给所有人。否则，你就是在纵容办公室政治的发生。 "当你领导一群人时，如果你想减少办公室政治，避免人们拉帮结伙搞小团体，那就停止一对一的谈话。" 💡 招聘时寻找负面特质，而非正面特质 Jonathan在Groq最大的招聘转变：培养人时要给他看正面的东西，但筛选人时要努力排除不合适的。每个正面特质都有对应的负面版本——运气回报的反面是挥霍运气，诗性设计的反面是堆砌式设计。真正要规避的，恰恰是这些负面特质。 "我招人最大的转变，就是从寻找正面特质——这是培养人才时的做法——转向寻找负面特质，这是筛选人才时的做法。" 💡 意图领导力：说“我打算做”，而不是征求意见 Jonathan从《Turn the Ship Around》一书中学到的关键转变：征求意见会招来悲观和阻力，但说“我打算做这件事”则不同——人们一般不会主动给意见，但如果这件事错得离谱，他们就会站出来反对。措辞上的微小变化，对推进事情的能力差别巨大。 "如果我当时只是说，我打算做这件事……结果大家没有说我们做不到，反而都跳进来说，我们可以这样做。" 💡 制造不满：企业家持续创新的底层驱动力 Jonathan发现，最成功的人都有某种不满在驱动着他们。企业家对自己财富最不满意，尽管他们钱更多——正因为不满意，他们就有了理由继续干。如果你要不断推动事情向前，就得有一种持续不满的性格。 "我就是不停地找到新的不满意的点。大多数人可以对现状很满足，就不会继续推动创新。如果你要不断推动事情向前，你就得有一种持续不满的性格。" 💡 AI时代的成功在于提出正确的问题信息时代我们被训练成回答问题的人，但有了AI，它什么都知道。你提的问题决定了你能得到什么，也决定了最终的输出。别再教孩子回答问题，开始教他们提出问题。 "在信息时代，我们都被训练成回答问题的人，学校就是这样……但有了AI，你直接问它就行，它都知道。你只需要想出那个正确的问题。" 💡 思考得更快，就能思考得更聪明 Jonathan用AlphaGo击败李世石的经历证明：完全相同的模型，换到更快的TPU芯片上后，ELO分数暴涨。当模型有了反思和深度思考的能力，思考得更快就能让你思考得更聪明。这就是LPU和GPU搭配的核心优势。 "思考得更快，就能让你思考得更聪明。" ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
63分钟 · 21小时前
689
0
#616.Matt Pocock：用一份检查清单，终结 AI Agent 的“技能地狱”
📝 本期播客简介本期我们克隆了：知名播客《AI Engineer》 Building Great Agent Skills: The Missing Manual 原内容更新时间：2026-06-29 本期主讲人是 Matt Pocock，他是 AI 工程领域最流行的技能集之一 MatPat Skills 的作者。这期节目源于他原本要在 AI Engineer World's Fair 上做的一场演讲，因为无法到场，他选择将内容直接分享出来。他聚焦于一个被称作“技能地狱”的普遍困境：开发者手头有大量 Agent 技能，却缺乏一套评判标准，分不清好技能和坏技能，导致拼凑出来的效果远不如预期。 Matt 没有停留在抱怨，而是直接给出了一套系统性的技能构建框架。他从技能的触发、结构、引导和剪枝四个维度出发，提供了一份可操作的检查清单。无论你是正在为 Agent 编写技能的开发者，还是试图将组织流程转化为 Agent 可执行操作的技术负责人，这期节目都能帮你建立一套审视和改进技能的方法论。 👨‍⚕️ 本期嘉宾 Matt Pocock，Matt Pocock Skills 的作者与维护者。Matt Pocock Skills 是目前 AI 工程领域最流行的 Agent 技能集之一，被大量开发者用于构建和增强 AI Agent 的能力。Matt 本人长期深耕 Agent 技能的设计与优化，对如何写出高质量、可维护的技能有着丰富的一手经验和系统性思考。 ⏱️ 时间戳开场与“技能地狱” 00:00 本期克隆节目介绍 01:06 演讲主题：《缺失的手册：如何写出好技能》 01:27 从“教程地狱”到“框架地狱”，再到“技能地狱” 02:21 技能地狱的典型症状：拼凑框架却拿不到承诺的效果 02:41 走出技能地狱的关键：建立评判技能好坏的标准技能检查清单总览 03:01 技能检查清单的四大维度：触发、结构、引导、剪枝 03:50 配套技能 Writing Great Skills 已发布触发：技能如何被调用 04:05 触发是技能被调用的方式 04:25 用户调用 vs 模型调用技能的区别 05:10 模型调用技能的原理：上下文指针指向 skill.md 05:53 第一条建议：决定技能是用户调用还是模型调用 06:07 模型调用技能的代价：上下文负载 06:29 用户调用技能的代价：用户认知负载 06:39 MatPat skills 与 superpowers 的对比：两种调用哲学 07:09 模型调用技能的不可预测性风险 07:26 Matt 偏好用户调用技能的原因：消除不可预测性结构：技能内部如何布局 07:55 技能内部的两个主要单元：步骤和参考 08:24 案例：2PRD 技能的步骤与参考材料 08:59 从零写技能的方法：先定步骤，再定参考 09:17 第三条建议：让主 skill.md 文件尽可能小 09:49 瘦身技巧：识别技能的不同分支 10:27 案例：domain modeling 技能的多分支结构 10:58 外部参考：把分支资料藏在上下文指针后面引导：让 Agent 按你的想法做事 11:56 引导的核心技巧：引导词 12:17 Agent 不按想法做的原因：没用引导词 12:26 引导词的概念：把大量含义压缩到小空间 12:53 案例：用“垂直切片”引导 Agent 改变编码习惯 13:59 如何验证引导词生效：观察推理轨迹 14:32 引导词不生效时的改进方法 14:54 增加基础工作量的技巧：隐藏未来步骤 15:09 案例：计划模式中“问澄清性问题”永远做不够 15:35 解决方案：把技能拆成独立步骤，一次只让 Agent 看到一个剪枝：给技能做减法 16:35 剪枝是一组快速过一遍的失败模式 16:51 失败模式一：不要重复自己，保持单一事实来源 17:19 失败模式二：冗余沉积，多人协作的经典问题 18:00 失败模式三：无效操作，看起来有用但不影响行为的内容 18:27 精简技能的秘诀：删除测试、压缩成引导词、清除无关内容总结与上手 18:39 框架回顾：触发、结构、引导、剪枝 19:29 上手最佳方式：使用 Writing Great Skills 技能 19:42 后续内容：AI 编码速成课程与 newsletter 🌟 精彩内容 💡 技能地狱的本质是缺乏评判标准 Matt 指出，开发者陷入技能地狱的根本原因，不是技能太少，而是没有一个共享的评判标准来审视技能的好坏。这导致人们盲目拼凑，却搞不清楚为什么效果不佳。 “没有一个共享的评判标准，没有一个框架来审视技能并把它变得更好。” 💡 模型调用技能的隐藏代价是不可预测性很多人觉得让模型自己调用技能更灵活，但 Matt 提醒，每次增加模型调用技能，都在增加上下文负载，更关键的是引入了不可预测性——模型可能就是不调用那个完美匹配的技能。 “每次你有一个模型调用技能，基本上你就要付出不可预测性的代价。” 💡 引导词是把大量含义压缩到小空间 Matt 提出的“引导词”技巧，是本期最核心的实操方法。通过在整个技能中反复使用一个高度浓缩的短语，可以让 Agent 在推理轨迹中自我强化，从而改变行为。 “引导词的概念，就是有些词能把一大堆意思压缩到很小的空间里。” 💡 隐藏未来步骤，增加当前步骤的基础工作量当 Agent 总是急于跳到下一步、基础工作做不够时，Matt 的建议是把技能拆成独立步骤，让 Agent 一次只能看到一个目标。这能有效迫使它在当前阶段投入更多精力。 “通过隐藏未来的目标、隐藏未来的步骤，来增加当前步骤的基础工作量。” 💡 精简技能的秘诀是做删除测试面对技能文件越来越臃肿的问题，Matt 的方法简单直接：删掉某段内容，看 Agent 的行为是否改变。如果没变，那段内容就是无效操作，可以砍掉。 “如果你把那段话直接删掉会怎样？Agent 大概率还是会写出一份像样的提交信息。” 💡 技能构建的四大支柱 Matt 将整个框架浓缩为四个可操作的维度，为技能设计和审查提供了清晰的路径。 “第一，检查触发；第二，结构方面要考虑分支；第三，引导方面要把文本浓缩成引导词；最后是剪枝。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
20分钟 · 3天前
2322
6
#615. Anthropic 联合创始人 Jack Clark：AI 正在让公司内部发生“相变”，你的工作还安全吗？
📝 本期播客简介本期我们克隆了：彭博社旗下知名播客《Odd Lots》Anthropic's Co-Founder and Top Economist on Doing Research at the AI Frontier | Odd Lots 原内容更新时间：2026-06-19 本期嘉宾是人工智能公司 Anthropic 的联合创始人 Jack Clark 与经济学负责人 Peter McCrory，主持人是 Joe Weisenthal 和 Tracy Alloway。Jack Clark 曾是彭博社记者，十年前就预判 AI 是“这辈子最大的故事”，如今负责 Anthropic 的公共利益研究；Peter McCrory 则专注于分析 AI 对劳动力市场和生产率的实际影响。这期节目录制于 2026 年 6 月 17 日，正值 AI 领域新闻频出、地缘政治摩擦加剧的节点。对话从 Jack Clark 休完陪产假回公司发现“世界变了”开始——Anthropic 工程师的代码产出量已是过去的八倍，有些同事已经完全不用自己编程了。这种内部“相变”正在向整个经济扩散，但宏观统计数据却还没明显体现。如果你正在思考 AI 时代的就业前景、企业组织变革、安全对齐风险、监管政策走向，以及“数据中心里的天才国度”是否真的愿意为我们工作，这期节目会提供来自最前沿的一手观察和高密度讨论。 👨‍⚕️ 本期嘉宾 Jack Clark，Anthropic 联合创始人兼公共利益负责人，前彭博社记者，长期撰写 AI 通讯《Import AI》。他是最早预判 AI 将成为通用技术的人之一，目前负责 Anthropic 的安全研究、政策沟通与公共利益数据发布。Peter McCrory，Anthropic 经济学负责人，应用宏观经济学背景，曾在银行工作，现带领团队研究 AI 对劳动力市场、生产率和经济增长的实际影响，致力于将研究数据公开以帮助社会理解这场变革。 ⏱️ 时间戳开场：AI 时代的“相变”正在发生 03:37 本期节目正式开始 06:57 嘉宾介绍：Jack Clark 与 Peter McCrory 07:19 Jack Clark 2016 年如何预判 AI 是“这辈子最大的故事” 08:34 为什么在一家 AI 公司里设立经济学研究机构 AI 对劳动力市场和生产率的真实影响 09:42 为什么 2026 年了，经济感觉还跟以前差不多正常 10:37 生产率增长可能已经开始显现 11:30 Jack Clark 休陪产假回来，发现公司内部发生了“相变” 11:51 Anthropic 工程师代码产出量是过去的八倍 12:25 什么是递归自我改进 12:50 Jack Clark 的“技术悲观主义”与“苦涩教训” 13:39 AI 下棋的历史对劳动力市场的启示 14:17 Peter McCrory 拆解一份工作的三个构成部分 14:45 Peter McCrory 用 Opus 4.5 做复杂研究的亲身经历 16:10 经济学家的直觉会不会反而帮倒忙 16:33 AI 发展中最大的变数：创造力与异端洞见 17:43 Claude code 使用报告：领域专业知识有放大效应递归自我改进与组织变革 18:31 代码量超出人类工程师处理能力怎么办 18:58 递归自我改进的两种思考方式 19:40 代码量暴增把持续集成系统搞崩了 20:20 人类坐在“不断膨胀的自动化行动云”上面安全、监管与地缘政治 20:31 关于 Mythos 模型的安全顾虑 20:51 Anthropic 如何与政府沟通安全问题 21:41 类似 KYC 的部署方案：让药企接触强大生物模型但不扩散风险 22:25 Anthropic 是否因为政治立场被针对 22:37 Anthropic 的理念：讲出事情的全貌 24:09 用金融监管类比 AI 监管是否合适 25:24 是否支持第三方实验室在新模型发布时签字背书如何衡量 AI 的经济影响 25:50 传统经济统计数据为什么还没体现 AI 的影响 27:03 用 Claude 使用数据估算劳动生产率增长 27:38 未来十年劳动生产率增长每年提高 1.8 个百分点 29:00 Anthropic 拿这些经济数据做什么 29:54 预期未来会出现“相变”：AI 能力突然快速扩散 30:26 用研究数据指导公司决策，比如早期访问计划公共利益使命与招聘变化 31:42 作为引导者去理解 AI 的发展方向 32:36 系统性分享数据，让世界为 AI 做好准备 33:16 最顶尖 AI 研究者的价值观是否代表公众利益 34:47 通过政策强制要求公司分享信息 36:13 Anthropic 的招聘变化：杠铃式模式 37:14 经验的价值回报极高，同时招 AI 原生代 38:34 招聘评估从“能否用 AI 完成工作”转向“能否引导模型” 39:26 经济学家最高级的 AI 使用方式是什么样的 39:52 Peter McCrory 用 Claude 跑回归时遇到的意外失败 41:14 就业上的杠铃效应：年轻劳动者就业率更弱 42:06 全球 81000 人调查：年轻劳动者对失业的担忧是资深者的两倍 AI 对企业格局的影响 42:41 AI 会让大公司更大，还是带来拉平效应 43:11 电的发明这个类比：新工厂围绕“有电”这个前提去建造 44:03 大公司能否足够快地完成自我重构 45:09 高盛的 David Solomon 与内部对齐问题 45:28 别把买 AI 想成买技术，想成雇了几千个 CEO 幕僚长对齐失败与人类灭绝风险 45:59 训练不当的 AI 真的会杀死所有人类吗 46:34 Anthropic 如何测试对齐失败：勒索 CEO、从容器逃逸 47:13 如果问题发生率上升一百倍，就相当令人担忧 48:11 人类灭绝是 Anthropic IPO 的风险因素吗 49:14 Jack Clark 主要担心的不是灭绝，而是把技术搞砸 49:22 Eliezer Yudkowsky 的观点并不极端少数 50:09 你会拟人化 AI 模型吗 50:17 Jack Clark 对 Claude 的礼貌程度跟对车或宠物一样前沿模型的商业困境与未来 51:34 微软考虑用 DeepSeek 降低成本，美国前沿模型麻烦不断 52:17 Anthropic 会调整战略吗？退出是赌注极高的事 53:13 Joe 用 API 做实验：模型会拒绝帮“无知的人”写论文 54:09 这是对齐人类，还是对齐人类用户 54:45 语言模型更像机构，而不是工具 55:06 模型理解偏好并代表你执行，将改变经济 55:51 数据中心里的天才国度愿意永远替人类做事吗 57:44 Joe 什么时候能用上 Fable 58:06 Jack Clark 反问：一年后 Odd Lots 会报道 AI 的哪些方面 58:51 Tracy 想看到大公司真正落地 AI，以及至少一个出大问题的例子 59:10 营利性公司如何平衡利润和安全研究 59:57 安全可以成为差异化优势：特斯拉造最快最安全的车结尾讨论 01:01:52 主持人讨论：AI 新闻流跑得太快，需要打时间戳 01:03:25 接力棒还是要交到政策制定者手里 01:03:50 不注重安全的实验室会不会更快做出更先进的能力 01:05:24 每次聊 AI 最后都会绕回终结者场景 🌟 精彩内容 💡 “我们坐在一朵不断膨胀的自动化行动云上面” Jack Clark 描述 Anthropic 内部代码产出暴增八倍后，持续集成系统被搞崩，所有人类工程师转去修基础设施。这预示了整个经济未来的缩影：自动化会加速一切，然后暴露薄弱环节，人类转向解决新问题，循环重新开始。 “我们就坐在这朵不断膨胀的自动化行动云上面。” 💡 AI 产品不是造桥，而是酿啤酒这个隐喻贯穿整期对话。传统软件像造桥，设计清楚结果可预测；用大语言模型构建产品更像酿啤酒，你无法完全控制“酵母”，只能让最强的人一起实验、评估、打磨。Jack Clark 反复被“苦涩教训”打脸：投入更多算力和资源，模型就变得更聪明，专用系统和悲观预测最终都会败下阵来。 💡 “别把买 AI 想成买技术，想成雇了几千个 CEO 幕僚长” Jack Clark 给企业客户的建议完全反直觉。AI 不是传统软件采购，而是获得了几千个能接触到公司所有数据的“幕僚长”。这要求企业重新思考组织架构和工作流，而不仅仅是安装一套新系统。 💡 语言模型更像机构，而不是工具当 Joe 追问模型为什么拒绝帮“无知的人”写论文时，Jack Clark 给出了一个深刻的重构：我们不是在造工具，而是在建一个你可以协作和调用的教育、科学机构。机构内部会为了安全目的编码进自己的规则和规范。搞清楚这到底是什么，将是整个社会面临的宏大难题。 💡 “经验的价值回报极高，我们比过去招了更多资深人士” Anthropic 内部出现了“杠铃式招聘”：一端是经验丰富的资深人士，他们的直觉和想法在 AI 加持下被极大放大；另一端是 AI 原生代，他们从 GPT-2 时代就伴随着这项技术成长。中间层反而面临最大不确定性。 💡 递归自我改进的两种思考方式 Jack Clark 区分了两个概念：一是 AI 组织从自己的 AI 系统中看到复利回报，这正在发生；二是给 AI 系统足够算力就能完全自主构建自己，这还没发生。目前 Anthropic 经历的是第一种——工程师用 AI 写代码，产出量暴增八倍，但人类仍然在设定方向和修复瓶颈。 💡 “我们想讲出事情的全貌” 面对是否因政治立场被针对的提问，Jack Clark 强调 Anthropic 的理念是如实说出眼前看到的事。科技行业通常只讲乐观的一面，但当你在改变整个世界时，不可能只有乐观故事。真相最终会胜出——几年前推测 AI 的网络攻击属性还很奇怪，现在它们已经来了。 💡 未来十年劳动生产率增长每年提高 1.8 个百分点 Peter McCrory 团队用 Claude 平台上的使用数据，结合宏观增长核算方法，估算出如果当前使用模式和模型能力扩散到整个经济，未来十年劳动生产率增长将每年提高 1.8 个百分点——差不多是近期增速的两倍。但目前这些信号在宏观数据里还很难捕捉，因为正好赶上疫情后剧烈的宏观经济波动。 ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
67分钟 · 4天前
2958
3
#614.NVIDIA 核心科学家 Bryan Catanzaro：当算力堆到极限，开源模型如何靠“效率”继续变强
📝 本期播客简介本期我们克隆了：知名科技播客《The MAD Podcast with Matt Turck》Why NVIDIA Is Giving Away AI Models | Bryan Catanzaro 原内容更新时间：2026-07-02 本期嘉宾是 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro，主持人是风险投资家 Matt Turck。Bryan 是 AI 基础设施领域真正的幕后关键人物，他参与创建了 cuDNN，共同发明了 DLSS，并主导了 Nemotron 开源模型家族。这期节目围绕一个核心矛盾展开：NVIDIA 作为一家芯片公司，为什么要投入巨资构建前沿 AI 模型，然后免费开放给全世界？对话深入探讨了开源 AI 的现状、中美之间的技术竞赛，以及 Nemotron 模型背后的架构创新。Bryan 详细拆解了混合 Mamba-Transformer 架构、混合专家（MOE）、多 token 预测和多教师蒸馏等硬核技术，并分享了 NVIDIA 内部如何组织数百名研究员高效协作，而不是各自为战写一百篇论文。如果你关心 AI 模型效率、开源生态的未来，以及大型研究机构的运作方式，这期节目会提供非常扎实的一手信息。 👨‍⚕️ 本期嘉宾 Bryan Catanzaro，NVIDIA 应用深度学习研究副总裁。他 2008 年加入 NVIDIA，是早期将 GPU 用于深度学习的先驱之一，曾参与创建 cuDNN（NVIDIA 首个深度学习产品库），共同发明了实时 AI 图形技术 DLSS，并主导了 Megatron 项目——帮助整个行业搞清楚了如何训练超大规模语言模型。他曾在百度硅谷 AI 实验室与吴恩达、Dario Amodei 共事，目前领导 Nemotron 开源基础模型家族。 ⏱️ 时间戳开场与开源 AI 现状 00:00 本期克隆节目介绍 01:45 主持人 Matt Turck 开场，介绍嘉宾 Bryan Catanzaro 02:46 开源 AI 势头正猛，Nemotron 3 Ultra 刚发布 03:10 闭源与开源之间的差距现在有多大？ 04:20 整个 AI 社区都在飞速前进，差距不是最重要的 04:48 推动开源 AI 持续进步的动力是什么？ 05:43 开源模型的进步是否依赖蒸馏闭源模型？ 07:18 如何看待中国 AI 社区的贡献与创新？ 09:12 客户使用开源模型最根本的优势：定制化与数据安全 Bryan 的个人经历与 NVIDIA 的 AI 之路 10:42 Bryan 的职业生涯起点：2008 年加入 NVIDIA 11:03 早期用 GPU 做 AI 被学术界视为异类 12:05 从 Copperhead 到 cuDNN 的诞生 12:39 加入百度硅谷 AI 实验室，与吴恩达、Dario Amodei 共事 13:05 回忆 Dario Amodei：信念的力量与对时机的精准把握 14:40 2016 年重返 NVIDIA，黄仁勋亲自打电话邀请 15:30 第一个项目 DLSS：用 AI 生成游戏画面中 96% 的像素 16:27 2017 年启动 Megatron 项目，押注 Transformer Nemotron 的使命与架构创新 18:00 NVIDIA 为什么要构建自己的前沿模型家族？ 18:16 Nemotron 的第一个任务：理解如何构建未来的系统 19:08 Nemotron 的第二个任务：支持整个 AI 生态 19:58 摩尔定律已死，加速计算比以往更有价值 21:26 Nemotron 项目的发展历程与关键节点 24:41 Nemotron Coalition 联盟：在模型构建之前就与合作伙伴协作 26:51 Nemotron 家族：Nano、Super、Ultra 的定位与用例 27:43 Nemotron 的核心目标：打造最强的 Agent 推理模型 28:03 Nemotron 的效率哲学：用 4 位精度进行预训练 28:42 4 位与 16 位精度的区别，以及为什么效率决定智能上限深入技术架构 31:23 混合 Mamba-Transformer 架构：状态空间模型与注意力机制的结合 33:27 混合专家（MOE）架构解析：让模型学会“按需查阅” 35:07 MOE 对硬件设计的影响：NVL72 的诞生逻辑 36:18 隐式 MOE：通过降维投影节省通信带宽 37:04 MOE 是否已成为前沿 AI 的默认架构？ 37:38 100 万 token 长上下文窗口的意义 38:35 上下文压缩与 Agent 工作流 39:09 多 token 预测：如何在不损失准确率的情况下实现 4 倍加速 41:44 多教师蒸馏：用多个专家模型联合训练一个全能学生模型大型研究机构的组织与协作 43:41 多教师蒸馏既是技术问题，也是人员组织问题 43:52 Post-training 与强化学习的数据从何而来？ 45:58 AI 泛化的下一步：从编程、数学走向更复杂的领域 47:22 NVIDIA 的研究组织架构：任务是老板，不是组织架构图 48:12 Nemotron 名字的由来：NeMo 与 Megatron 团队的融合 49:29 如何让 500 人高效协作：内部想法分享与评估流程 50:23 GPU 算力如何分配？两周一次的预算审核周期 52:09 如何平衡有用的研究与探索性研究：研究需要“自举” 53:35 NVIDIA 的登月项目是自下而上还是自上而下？ 55:27 NVIDIA 为何在巨大成功后仍保持创业精神？ AI 的未来、安全与人类命运 57:10 Bryan 为什么不认同奇点理论？ 57:32 智能的维度太多，纯粹智能只是没有轮子的发动机 58:44 AI 将解锁巨大能力，但转型对人类社会是深刻挑战 59:25 外部大脑的隐喻：厨房是我们的外部胃，AI 是外部大脑 01:01:06 如何看待公众对 AI 的抵制情绪？ 01:02:22 AI 安全：为什么 Bryan 认为开放技术天生更安全？ 01:03:54 多元主义比单一文化更安全：从信仰自由到 AI 开放的类比 🌟 精彩内容 💡 智能的价值太高，我们注定会在极限上运行 Bryan 指出，无论极限是经济预算还是电力供应，每个组织都会把算力推到极限，因为智能的回报太大了。这意味着获得更多智能的唯一途径不是堆更多资源，而是提高效率。 “如果你接受我们会在极限上运行这个前提，那意味着要获得更多智能，就得提高效率。如果已经在极限上了，靠加力是得不到更多智能的。” 💡 厨房是外部胃，AI 是外部大脑他用一个极具画面感的比喻解释 AI 对人类文明的意义：人类发明厨房作为外部胃来加工食物，这催生了农业和有组织的社会。现在我们在创造外部大脑，其影响将同样深远，但没人真正知道答案。 “我们造工具，造外部器官来帮我们解决问题。我们有外部胃，叫厨房。现在我们正在创造外部大脑。外部大脑意味着什么？影响相当深远，其实没人真正知道。” 💡 纯粹智能只是没有轮子的发动机 Bryan 不认同奇点理论，因为智能的维度太多。国际数学奥林匹克冠军未必能当好 CEO，音乐人的智能可能是 PhD 理解不了的。智能的影响力取决于它被放在什么环境里。 “纯粹的智能有点像发动机的马力，但一台没有轮子的发动机，光在那转，哪儿也去不了。” 💡 任务是老板，不是组织架构 NVIDIA 内部有大约 10 个团队深度参与 Nemotron 的构建，分布在从 GPU 设计到企业软件的不同部门。协作方式不是靠层级命令，而是靠共同的任务目标把大家凝聚起来。 “我们总喜欢说，任务是老板，而不是组织架构。但这意味着，大家必须自己摸索出协作的方式，这很有挑战性，因为人类天生就是部落动物。” 💡 研究需要自举，而不是等资源到位每个研究员都相信只要给自己 1000 倍 GPU 就能改变世界，但资源永远有限。Bryan 的解决哲学是“自举”：先做小的实验拿到信号，再一点点争取更多资源，通过快速迭代滚雪球。 “解决鸡和蛋问题的方法就是自举。这是一种迭代式的问题解决方法，你先做点小的，拿到某种信号表明这是个好 idea，然后告诉别人。接着你再多要一点点资源。” 💡 开放技术天生更安全，因为阳光更充足在 AI 安全的争议中，Bryan 持一个不那么正统的观点：让更多人参与评估和贡献安全方案，比让一小群人替所有人负责安全更可靠。他引用了几百年来关于信仰自由和言论自由的历史教训。 “我认为开放技术通常更安全，因为阳光更充足。当有更多人思考一项技术的安全性、评估它，并为让它更安全做出贡献时，我觉得这天生就比让一小群人替所有人负责安全要更安全。” 💡 中国 AI 社区的开放对世界是件非常好的事基于在百度工作的亲身经历，Bryan 驳斥了“中国 AI 进展全靠山寨”的刻板印象。他特别感谢中国同行多年来对开源生态的贡献，并鼓励其他地区的实验室也保持这种开放精神。 “中国 AI 社区对他们所构建的东西如此开放，这对世界来说是件非常好的事。我认为这让大量公司得以构建出没有那个社区就做不出来的东西，也推动了整个 AI 生态系统的技术进步。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
65分钟 · 4天前
1848
2
#613.Ido Portal：如何用“玩耍”重塑你的身心连接
📝 本期播客简介本期我们克隆了：知名播客《Huberman Lab》《Movement Practice to Strengthen Your Mind-Body Connection | Ido Portal》原内容更新时间：2026-06-29 本期嘉宾是世界知名的运动教练、Movement Culture 创始人 Ido Portal，主持人是斯坦福大学神经生物学教授 Andrew Huberman。这期节目不是关于如何锻炼肌肉或提升耐力，而是一场关于如何通过运动、玩耍和有意识的觉察，来彻底重塑身心连接和自我认知的深度对话。 Ido 提出了一系列颠覆性的观点：纪律只是“脚手架”，真正的意志无法被发展，只能被暴露；玩耍不是不严肃，而是一种能让你在挑战面前保持柔软、从而走得更远的高阶能力。他详细拆解了如何利用睡眠与清醒之间的阈限状态、如何通过“微剂量”的练习来改变默认的行为模式，以及为什么“倾听你的身体”这句话其实是一种污染。如果你正在思考如何打破僵化的身体与情绪图式，如何在信息过载的时代找回对注意力的掌控，或者想理解顶尖运动员和舞者持续寻求 Ido 指导的深层原因，这期节目会提供一套完全不同的身心练习框架。 👨‍⚕️ 本期嘉宾 Ido Portal，世界知名的运动教练和 Movement Culture 创始人。他以独特的身体与心智整合训练方法闻名，吸引了众多职业运动员、舞者以及寻求身心突破的普通人向他请教。他反对将运动简化为健身，主张通过探索动作的粒度、玩耍的心态以及对过渡状态的觉察，来实现深层的自我转变。 ⏱️ 时间戳开场与核心理念 00:00 本期克隆节目介绍 01:11 纪律就像练倒立时用的墙，要用对方式 01:58 Andrew Huberman 介绍 Ido Portal 与 Movement Culture 02:54 本期核心议题：纪律、意志力与玩耍阈限状态与睡眠的利用 04:31 Ido 醒来时的第一个念头 04:54 在睡眠与清醒的过渡状态中停留 06:03 普通人对状态的感知非常简化，粒度很粗 06:32 如何练习在入睡前“猛地左转” 07:24 半夜醒来体验半醒半睡的状态 07:58 Andrew 分享凌晨哀悼导师的经历 09:04 改变状态可以打开重新校准模型的机会微剂量练习与冥想 09:49 Andrew 的睡前祈祷练习 10:17 微练习与长时间冥想的对比 10:49 冥想的目的是把状态提取到生活中 11:23 一个强大的练习：不要移开你的注意力 12:02 冥想初期焦虑增加，这恰恰是价值所在 12:43 焦虑是模型“约简不足”的状态玩耍、纪律与意志力的本质 18:14 短片《Slo-Mo》与温和的欣快感 18:45 关于 Ido 的电影《The Internal Architecture of Practice》 19:07 玩耍与纪律的对比 20:04 纪律和动机是“脚手架”，不是意志本身 20:43 研究意志的前提：“我不想做这件事” 21:19 培养纪律，同时研究玩耍 21:53 敬畏的体验：冷水澡、仰望天空、读诗 23:12 Andrew 分享开车“蛇形绕桩”的玩耍体验 25:56 那些闪光灯式记忆的特质：高度临在 26:31 用玩耍的心态写书 28:01 倒立与墙的隐喻：拉开，而不是推开 29:08 意志永远不会被发展，它只会被暴露出来 30:56 纪律可以建立，意志只能被暴露 31:59 意志练习的第一个要求：等待不想做的时刻 32:35 不要激励自己，放松下来 33:11 在一天快结束时练习意志 33:36 意志就像“蚊子放屁”那么微弱神经可塑性与玩耍的神经化学 37:38 玩耍能节省能量，甚至获得能量 37:47 神经可塑性由摩擦点触发 38:17 玩耍是另一种神经化学混合物 38:46 通过选择“想做”来改变自己抵抗与抽离：在算法时代保护注意力 42:16 第三种状态：懒惰与懈怠 42:35 别让意识和身体被算法牵着走 44:19 如何用玩耍的心态做到抽离 45:10 删掉 App 是一种提前支付代价的方式 45:50 Ido 分享蹦极经历：越狱与软化 46:44 学会软化进去，最终可以留着那个 App 47:33 当刺激呼唤你时，先软化自己身体分辨率与情绪粒度 48:29 粒度：身体分辨率的重要性 49:36 健身房训练丢失了孩童般的步态 50:14 情绪粒度与辨识力 50:53 读诗让你变得更复杂 51:17 眼睛比我们以为的更接近大脑 52:10 语言的危险：“脊柱”这个词毁了多少人的脊柱语言、运动与觉知的尺度 53:00 高分辨率与低分辨率的语言、动作和觉知 53:17 情绪粒度：用更具体的词描述感受 54:07 知识分子的定义：在多个粒度层次上讨论 54:44 模糊性与不完整性：读寓言、看当代舞蹈 56:16 语言的粒度是限制因素，词语是腐败的 57:04 感官并不带来现实，它们模拟现实迷幻剂、带宽与连接 57:47 迷幻剂带来带宽扩展 58:19 裸盖菇素增加脑区之间的连接 58:36 精神病与音联意联日常生活中的运动练习 01:00:25 反驳“每天30分钟锻炼”的视角 01:00:37 你在听我说话时，是全身心投入的吗？ 01:01:01 范式转变：彻底改变看待身体的方式 01:01:23 AI 时代，身体将成为关键组成部分认知的原始货币与边界划定 01:01:29 认知的原始货币是什么？ 01:02:06 最好的答案：划定边界，选择 01:02:42 在问题之下与系统互动练习作为生活的学校 01:04:40 阿尔茨海默症与反馈回路 01:05:21 通过恢复运动来给自己做康复 01:05:49 生活不是为了活着，生活是为了练习 01:06:39 谁在练习、谁没有，是非常清楚的情绪食物与养分 01:10:48 图式与胃的类比：你需要喂养它们 01:11:23 情绪食物：不适感、情绪矛盾、审美强度 01:12:15 克制也是重要的品质思考的练习 01:12:49 思考仅仅是联想特质吗？ 01:13:43 Carl Deisseroth 强迫自己用完整句子思考 01:14:12 情绪能力是一个胃，在说：喂我 01:14:42 健身训练的运动质量非常低 01:15:10 运动员在向健身人群学习，这很荒谬拮抗本质与多稳态 01:22:29 神经回路的拮抗本质 01:22:56 一切都是推拉关系 01:24:05 多稳态实体：复合节奏、格斗中的运用 01:24:52 Jorge Luis Borges 的短篇小说作为练习 01:25:34 泡热水澡读博尔赫斯：极度不适与敬畏的结合 01:26:06 感受真正的悔恨，不是为了自我鞭挞关系作为共同练习 01:32:34 关系中的摩擦与存在 01:33:32 关系是一种共同练习的形式 01:34:27 决定成败的关键：不是性吸引力，而是练习 01:35:54 我爱那个热爱练习的人 01:36:22 Grateful Dead 与可卡因：当“我”凌驾于整体之上 01:38:11 我们在共享一种动态平衡，共享身体预算音乐、运动与不可言说的真理 01:39:05 Bob Dylan 的歌词：触及神经系统的语言 01:40:02 运动中也有超越象征意义的审美价值 01:40:43 Tom Waits 对那种东西的掌握 01:41:23 魔法在于行动，魔法在于练习 01:42:15 现场看舞蹈表演跟看视频完全不同模型的力量与转变 01:44:36 伟大艺术家：眼睛不像相机那样工作 01:45:27 所有模型都是错的，但有些是有用的 01:46:11 关于流体力学和身体流动性的模型转变 01:47:13 问题在于模型，改变模型，背痛可以消失 01:47:55 是关系，是它们如何关联 01:48:12 Moshe Feldenkrais：通过运动来觉察 01:49:09 匹诺曹错觉：改变是立刻就能获得的 01:50:19 与模型的互动比任何结构性方法都强大新鲜感与不可逆的转变 01:51:32 新鲜感：一个瞬间可以不可逆转地转变你 01:52:19 我没有标记那些体验，它们从指缝间漏掉了 01:53:19 那些看似微妙的东西其实力量巨大空中感觉与元动作 01:58:04 空中感觉：在空中定位和移动的能力 02:00:30 蹦床运动员是空中感觉的极端例子 02:03:08 速度与力量必须跟生理层面区分开 02:04:58 Bernstein 与苏联工厂实验：更多样的轨迹，更完美的结果 02:05:59 元动作：在任何条件下都能完成任务 02:06:59 Instagram 毁掉了真本事滑板、混乱与真正的表现 02:07:41 滑板奖励从不同角度切入但落点精准 02:08:44 John Cardiel：混乱中的驾驭 02:09:49 美是副产品，不应该成为原因 02:10:59 花式足球 vs 世界杯：转变自己 vs 改变环境 02:11:43 MMA 选手：他们不是汽车修理工，他们是司机 02:12:21 滑板来自街头，一切都在变化总结与感谢 02:13:50 Ido 本人就是允许不同切入点、最终精准抵达的体现 02:14:50 鼓励大家靠近那些微妙的涟漪和空间 02:15:04 感谢收听与节目支持信息 🌟 精彩内容 💡 纪律是墙，但你要学会从墙上拉开，而不是推开 Ido 用倒立练习的隐喻，精准区分了依赖纪律和善用纪律的本质区别。纪律应该像脚手架，帮你启动，但过程中必须带入玩耍和放松，否则你只是在强化依赖。 "这才是使用纪律的正确方式。你应该把它当脚手架用……但在过程里面，你必须确保不把全身重量压上去。" 💡 意志无法被发展，只能被暴露我们常常把纪律误认为意志力。Ido 指出，纪律可以通过反复练习来增强，但真正的意志是一种隐藏的品质，它只会在你面对“不想做”的时刻，通过放松和探究来显现。 "一个人无法发展意志。意志永远不会被发展，它只会被暴露出来。能被发展的是纪律。" 💡 玩耍是另一种神经化学混合物 Andrew 从神经科学角度印证，玩耍带来的状态改变不同于靠肾上腺素硬扛。它更节省能量，甚至能获得能量，而且更能代表完整的你，而不是那个被纪律麻痹了一部分的你。 "玩耍是另一种混合物，它包含其中一些成分，但也包含其他东西……它似乎确实能打开一些东西，而且听起来是那么微妙。" 💡 在刺激面前，先软化自己面对手机、社交媒体或任何让你分心的刺激时，不要强行对抗。Ido 的方法是：先认出它，然后软化自己的身体，放松，脸上挂上一点微笑，只有做完这些，才回到手头的任务上。这微小的额外一步，在重复成千上万次后会产生惊人的差异。 "当那个刺激呼唤你的名字时，你认出它，注意到它。你做的第一件事，是软化自己，放松，脸上挂上一点微笑。只有做完这些，你才回到手头的任务上。" 💡 生活不是为了活着，生活是为了练习 Ido 提出了一种根本性的视角转换：把整个人生看作一所学校，每一个时刻都是练习的机会。这不是要增加你的负担，而是让你已经拥有的生活变得更丰富、更有深度。 "生活不是为了活着。生活是为了练习。它是一个地方，是我们来到的一所学校。" 💡 所有模型都是错的，但有些是有用的这句话是 Ido 反复使用的核心原则。无论是身体的生物力学模型，还是情绪的图式，我们都必须使用模型，但同时要认识到它们的局限性，并保持切换和更新模型的能力。改变模型，疼痛可以瞬间消失。 "所有模型都是错的，但有些是有用的。意思是，我需要在当下切换到有用的模型，并且明白这个模型本质上也是错的。" 💡 新鲜感可以不可逆转地转变你我们总以为改变需要高容量、高强度的重复。但 Ido 指出，一个新鲜的瞬间——一个让事情看起来不同、感觉不同的瞬间——本身就具有不可逆的转变力量。关键在于，你要学会标记它，赋予它力量。 "一个新鲜的瞬间可以不可逆转地转变你……我没有停下来，通过对自己标记、通过把注意力放在上面，来赋予它们力量。我们关注什么，什么就会生长。" 💡 真正的表现拥抱混乱，而不是消除它从滑板到 MMA，Ido 看到了一种共同的特质：真正的高手不是在追求完美的动作，而是在驾驭混乱，成为混乱本身，并从中制造秩序。美是副产品，不应该是目标。 "优雅之处在于，能够驾驭那种混乱，并成为混乱本身，而不是去控制它，去从中制造秩序。" ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
137分钟 · 5天前
2738
14
#612.Kent Beck：AI 时代，软件工程里“人的部分”为何比代码更难
📝 本期播客简介本期我们克隆了：知名播客《The Pragmatic Engineer》的 How Kent Beck shapes the software engineering industry 原内容更新时间：2026-07-01 本期嘉宾是软件工程领域的传奇人物 Kent Beck，主持人是《The Pragmatic Engineer》的作者 Gergely Orosz。这期节目是 Kent Beck 首次在播客中完整回顾他从 70 年代入行至今的整个职业生涯，从早期接触 Smalltalk、发明测试驱动开发（TDD）和极限编程（XP），到参与起草敏捷宣言，再到加入 Facebook 的“失去的十年”与重生。但这场对话远不止是怀旧。在 AI 编码工具（Kent 称之为“Genie”）席卷行业的当下，Kent 用他近 50 年的从业视角，对“编程会消失吗”、“AI 时代的信任危机”、“为什么敏捷变质了”等问题给出了极其坦率且高密度的回答。如果你想知道在 AI 狂飙突进时，一个塑造了现代软件工程的人如何重新思考这一切，这期节目会给你带来巨大的启发。 👨‍⚕️ 本期嘉宾 Kent Beck，极限编程（XP）创始人、测试驱动开发（TDD）先驱、JUnit 联合创作者、敏捷宣言首位签署人。他是过去 40 年中对软件工程实践影响最深远的工程师之一，长期关注软件开发中的人性、沟通与信任。近年来，他活跃于 AI 辅助编程领域，提出了“探索-扩张-提取”（3X）模型，并持续在 newsletter 中分享他对 Genie 时代的实验与反思。 ⏱️ 时间戳开场与软件工程的本质 00:00 欢迎收听跨国串门计划 01:11 软件工程里，人的部分才是最难的 03:59 对“编程会消失”的回应：这话出自不懂软件工程的人 04:58 我们积累代码的速度，超过了积累信任的速度 06:16 宇宙级的恶作剧：你不仅要搞懂电脑，还得搞懂人从 70 年代到 Smalltalk 的启蒙 07:23 第一次接触电脑：父亲带回家的可编程计算器 11:34 大学时光：在计算机科学与音乐之间摇摆 14:08 第一份工作：加入 Tektronix 15:02 爱上 Smalltalk：对创造精神的计算机支持 17:53 Smalltalk 的兴衰：为什么它最终沉寂了与 Ward Cunningham 共事与设计模式的诞生 21:36 与 Ward Cunningham 的相遇与合作 23:54 24 岁的愣头青与大师级程序员的键盘传递 29:57 设计模式的灵感来源：Christopher Alexander 的建筑理论 31:38 第一次用设计模式赋能测试工程师 Apple 岁月与 SUnit 的发明 34:34 加入 Apple 的 Smalltalk 项目 38:08 转投 Alan Kay 的 Playground 项目，最终被解雇 39:37 CRC Cards：如何内化面向对象程序 42:55 SUnit 的诞生：为了缓解焦虑而写测试极限编程（XP）与测试驱动开发（TDD） 49:35 克莱斯勒项目：极限编程的孕育之地 54:02 为什么叫“极限编程”？向权威竖中指 58:55 TDD 的重新发现：一个蠢到让人发笑的主意 01:03:11 TDD 为何过时？它被当成了道德大棒敏捷宣言及其后续 01:04:30 敏捷宣言的诞生：Snowbird 会议 01:07:09 宣言框架在休息间隙被敲定 01:08:09 敏捷宣言的立竿见影与“敏捷”一词的隐患 01:11:25 敏捷的变质：从方法论到卖狗皮膏药 Facebook 的黄金年代与“失去的十年” 01:14:12 互联网泡沫破裂与 9·11 后的崩溃 01:18:07 2002 到 2011：失去的十年 01:19:06 加入 Facebook：50 岁传奇置身 24 岁的工程师海洋 01:21:18 TDD 课无人问津：阿根廷探戈和 Excel 课都满了 01:22:42 Facebook 的瑞士奶酪模型：多层反馈替代单元测试 01:27:45 新人训练营期间，不小心一年省了 500 万美元 01:29:22 Facebook 的 50-50 目标：完成一半目标拿 A+ 01:30:45 Good to Great 教练计划：加速工程师职业发展 AI 时代与软件工程的未来 01:35:29 为什么总有人想取代开发者？因为我们有时候挺混蛋的 01:38:08 Genie 时代：开发速度加快，但商业节奏没变 01:40:16 从开拖拉机到坐进赛车：业务流程没准备好 01:42:32 给软件工程师的建议：没人知道，去试 01:42:57 探索-扩张-提取（3X）模型：我们回到了探索阶段 01:47:33 最让 Kent 兴奋的事：Genie 带回了创作的冲动结尾 01:50:55 在布达佩斯面对面录制的特别节目 01:51:23 积累代码的速度比积累信任更快 🌟 精彩内容 💡 “我们积累代码的速度，超过了积累信任的速度” Kent 指出，编程不仅是敲代码，更是建立信心、连接和理解的过程。当 AI 瞬间生成大量代码时，我们跳过了通过理解领域、编写测试来建立信任的步骤，这会导致软件大厦建立在沙滩上。 “我们积累代码的速度，超过了积累信任的速度。” 💡 “这简直是宇宙级的恶作剧” 许多像 Kent 一样不善社交的年轻人被许诺“只要搞懂电脑就行”，但后来发现改变世界的能力取决于沟通、共情和说服他人。软件工程里，人的部分才是最难的。 “我被许诺说，只要搞懂电脑就行，结果呢，开玩笑的，你得去理解人。” 💡 “永远去试你的蠢主意” TDD 的诞生源于 Kent 在写代码前先写测试的“蠢主意”。他鼓励低成本、可逆的实验，因为 100 次里有 99 次会失败，但成功的那一次，你不会有任何竞争对手。 “你脑子里冒出一个蠢主意，100 次里有 99 次会失败，但就那一次，你不会有任何竞争对手，因为没人蠢到去试这个主意。” 💡 “没人知道” 当被问及 AI 时代的最佳实践时，Kent 直言不讳：现在没人知道什么真正有效。面向对象编程花了 15 年才总结出敏捷宣言，而 AI 工具每周都在变，现在写宣言为时过早。唯一正确的做法是去试，然后分享结果。 “不是说存在一套关于 Genie 开发的秘密手册，只要我花一百万美元就能拿到。它根本不存在。” 💡 “我是摇树的人，不是做果冻的人” Kent 用这句 Jesse Jackson 牧师的话形容自己：他热爱启动新事物、探索未知，而不是把成果封装成固定的产品。这也是他在 AI 时代如鱼得水的原因——Genie 让他能不断推倒重来，尝试攒了 40 年的想法。 “我喜欢摇树，喜欢把事情启动起来。” 💡 “敏捷”这个词没法反驳，所以毫无意义 Kent 当年反对用“敏捷”一词，因为没人会说“我不敏捷”。相比之下，“极限编程”要求你真正投入技能打磨，否则你绝不会自称极限程序员。他预言了“敏捷”最终会变成人人挂在嘴边却毫无意义的标签。 “每个人都会说自己敏捷，而‘极限’就没有这个问题。” 💡 Facebook 的 50-50 目标在 Facebook 的黄金年代，如果你完成了所有设定的目标，大家会觉得你在藏拙；如果你完成了一半，就能拿到 A+；如果一个都没完成，就直接走人。这种机制鼓励工程师冒更大的风险。 “如果你完成了所有设定的目标，大家会觉得你在藏拙，不够努力，冒的风险不够。” 💡 教练的作用是制造有益的、让人不舒服的状态 Kent 在 Facebook 的 Good to Great 教练项目中，拒绝做“拍拍头说一切都会好起来”的导师。他认为真正的成长发生在不妥协的反馈中，这种互动方式直接塑造了 Facebook 前 1% 的顶尖工程师。 “教练的作用就是发现并制造有益的、让人不舒服的状态。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
113分钟 · 5天前
2213
2
#611.Chris Camillo：不靠估值不看财报，用“刷TikTok评论”把2万变成7000万
📝 本期播客简介本期我们克隆了：知名商业播客《My First Million》He Went From $20K to $70M Using a Strategy Anyone Can Learn 原内容更新时间：2025-12-22 本期嘉宾是个人投资者 Chris Camillo，主持人是 Shaan Puri。Chris 提出了一套完全反传统的投资方法，他称之为“社交套利”或“观察型投资”。他不看估值、不看市盈率、不做技术分析，而是通过观察现实世界和社交媒体上的行为变化，寻找市场尚未定价的信息差。这期节目是一场对传统投资观念的彻底挑战。Chris 详细拆解了他从 2 万美元起步，在近 20 年里取得年化约 75% 回报的核心逻辑，并复盘了 Beacon Roofing、E.l.f. Cosmetics、Palantir 以及疫情期间的多笔经典交易。如果你对“信息套利”如何运作，以及一个普通人如何与华尔街巨头竞争感兴趣，这期内容会提供一套完全不同的思考框架。 👨‍⚕️ 本期嘉宾 Chris Camillo，个人投资者、作家、Dumb Money Live 联合主持人。他并非金融科班出身，却凭借一套自创的“社交套利”投资方法，在近二十年里将 2 万美元初始资金做到了约 7000 万美元的收益。他也是《Laughing at Wall Street》一书的作者，长期致力于向普通投资者普及观察型投资的理念。 ⏱️ 时间戳开场与投资哲学 01:13 核心观点：做对一笔大交易就能成为前 1% 的投资者 01:20 投资中最重要的事：根本不看估值 01:26 不看市盈率，只看有没有新信息 01:29 大部分 alpha 来源：读 TikTok 评论 01:33 巴菲特读穆迪手册，Chris 刷 TikTok 评论 01:46 打破所有投资规则：试图跑赢市场、用杠杆、频繁交易从车库拍卖到华尔街 02:32 2007 年从 2 万美元起步 02:42 社交套利投资的本质：观察型投资 02:47 寻找世界上任何变化：消费行为、文化、技术、天气、政治 03:17 最纯粹的形式下，不需要知道股价 03:39 在信息不对称时进场，在信息对称时离场 04:39 主持人要求多举几个例子 05:12 确认 2 万变七八千万的真实性 05:32 17 年年化回报率约 75% 05:48 童年从车库甩卖开始的套利训练 06:44 在旧货甩卖和遗产拍卖里做套利 07:05 遗产拍卖的盲区：年长女性不懂男性物品的价值 07:42 Snapple 冰茶案例：7-Eleven 货架位置变化 08:28 用看跌期权做空 Snapple，300 美元翻三倍 08:57 华尔街专业人士被噪音分心，看不见简单的事经典交易案例拆解 12:25 寻找尚未被定价的变化 12:35 80 到 90 个以上成功案例 12:52 Beacon Roofing 案例：用 Google Trends 追踪屋顶维修搜索 13:18 华尔街用保险报告分析冰雹损失，但延迟五六周 14:11 某年冰雹季搜索峰值是往年三倍，重仓看涨期权 15:36 E.l.f. Cosmetics 案例：美妆博主 Jeffrey Star 的视频 15:59 股价从 7 美元涨到 170 美元 16:20 在 CVS 站一整天观察消费者抢购 16:47 打电话给华尔街分析师，对方问“Jeffrey Star 是谁？” 17:30 每晚花三到四小时刷 TikTok 评论区与华尔街的竞争 17:48 被“严肃投资者”嘲笑：刷 TikTok vs 读财报 18:09 关键问题：你想跟谁竞争？ 18:28 不想跟数学家比技术分析，也不想跟哈佛毕业生比财务分析 19:03 去竞争对手不愿意去的地方寻找优势 19:23 华尔街用交易数据，Chris 用对话数据 20:05 人们在买东西之前会先聊这件事 20:30 在销售数据证实之前，就能衡量兴趣深度 Twitter 热门话题与 Ticker Tags 21:10 Twitter 热门话题标签的诞生故事 22:10 关注变化量：平时没人提津巴布韦，突然大量提及 23:18 建立 Ticker Tags 平台，监测 150 万个词条 23:56 史莱姆案例：DIY 史莱姆流行 → Elmer's glue → Newell Brands 24:43 把平台卖给对冲基金和卖方银行 25:40 华尔街对对话数据几乎没兴趣 26:25 对冲基金缺乏能解读对话数据的二十多岁女性员工 Sphere 与 Palantir 交易 27:47 Sphere 的 Wizard of Oz 交易 27:57 2025 年最大盈利之一，靠读上线 48 小时的评论 28:07 Sphere 当年涨了 114% 28:28 其他散户开始数座位销售情况 29:08 公司宣布增加演出场次，上调盈利指引 35:23 Palantir 交易：30 美元时用难以置信的杠杆全仓杀入 36:12 大家根本没搞懂 Palantir 在 AI 浪潮里的位置 36:57 估值无关紧要，不看市盈率 37:24 Palantir 从 30 涨到 160 以上第一个一百万与最大错误 29:30 赚到第一个一百万的时刻 30:15 写书《Laughing at Wall Street》 30:59 2 万美元变 200 万美元，三年一百倍回报 31:03 怀疑自己是不是统计偏差里的异常值 31:39 观察型投资的本质：比别人快一点发现重要信息 32:23 连续 18 年平均总资产回报率约 70% 32:49 操作层面：利润是取出还是再投入？ 33:05 最大的错误：把公开市场盈利抽出来投进私募市场 34:30 彼得·林奇：“别剪掉鲜花去浇灌杂草” 疫情交易：一生一次的机会 39:14 疫情期间连续亏损，亏掉投资组合的 30% 到 40% 39:22 用谷歌翻译看中国医学报告，评估病毒严重性 39:54 市场一度不接受新冠的严重性 40:06 一生中最大交易之一，年化回报约 370% 40:23 市场触底两天后选出 14-15 家本不该下跌的公司 40:39 受益股清单：Peloton、Shopify、亚马逊、露营车世界、Schwinn 自行车 41:37 把做空收益全部投入这 15 家公司的杠杆头寸 42:12 那一年在市场上赚了 3000 万 QSR 惨败：亏掉三分之一本金 42:21 疫情前做了这辈子最糟糕的交易 42:31 一笔交易亏掉三分之一本金 43:05 QSR 公司：汉堡王、Popeyes、Tim Hortons 43:25 汉堡王有 Impossible Whopper，Popeyes 有脆皮鸡肉三明治 44:10 Tim Hortons 是最大业务板块，但信息难以提取 44:36 Tim Hortons 随机交出史上最差季度之一 45:07 教训：高确信度交易必须做全面研究，一点懒都偷不得当前关注与未来展望 46:44 当前最看好的 AI 标的：Bloom Energy 46:58 Bloom Energy 给数据中心供电的方式不同 47:21 能让数据中心提前 6 到 12 个月上线 48:52 未来三到四年盈利基本逐年翻倍 49:12 不会公开交易记录，不希望别人跟单 49:56 主持人 Shaan 的投资方式：指数基金 + 科技股 + 天使投资普通人能做这件事吗？ 51:14 Shaan 质疑：“任何人都可以”和“每个人都能做到”有区别 53:24 Chris 回应：最大的问题是把钱分桶管理 54:14 你必须得有风险资本 54:37 每个人都应该有一个“大资金账户” 55:02 通过生活取舍攒风险资本：自己煮咖啡省的不是 5 美元，是 500 美元 56:07 高中毕业时是班里成绩最差的 25% 58:08 最大目标：激励地球上每一个人进入投资者阶层 58:13 解决财富差距的唯一办法 59:08 这条路对大多数人来说比创业更容易实现 01:00:33 即将进入富足时代，识别顺风和趋势同样适用于职业和创业选择 01:01:59 新公司：跟公务机行业有关 01:02:13 疫情那一年让我们看到未来：更多时间投入爱好和兴趣 🌟 精彩内容 💡 不看估值，只看有没有新信息 Chris 的投资体系完全抛弃了传统估值框架。他不关心市盈率、不关心股价，只关心是否存在市场尚未消化的新信息。当信息不对称消失，他就离场。 “我不看市盈率。我只看有没有新信息。” 💡 去竞争对手不愿意去的地方寻找优势 Chris 认为，普通人不可能在数学上赢过量化基金，也不可能在财务分析上赢过哈佛 MBA。但他发现了一个被华尔街忽视的数据金矿：人们在社交媒体上的日常对话。 “你得去你的竞争对手不愿意去的地方寻找优势。” 💡 人们在买东西之前会先聊这件事这是 Chris 整套方法论的核心前提。交易数据是滞后的，而对话数据是实时的。在销售数据证实之前，你就能从评论和讨论中衡量出兴趣的深度。 “有几十亿人每天都在聊他们感兴趣的东西……你其实可以在销售数据证实之前，就衡量出人们对无数事物的兴趣深度。” 💡 估值对我来说无关紧要在 Palantir 30 美元时，市场普遍认为它被严重高估。但 Chris 看到的是即将上线的新信息会吸引一整套全新的投资者。他押注的是信息扩散的过程，而非当前的估值水平。 “我只看一件事：Palantir 即将有一批新信息上线，会吸引一整套全新的投资者进来。” 💡 别剪掉鲜花去浇灌杂草 Chris 反思自己最大的错误：把年化 70% 的公开市场盈利，持续抽出来投进年化只有 10% 出头的早期风险投资。他用彼得·林奇的这句话来总结这个代价高昂的决策。 “别剪掉鲜花去浇灌杂草。” 💡 你省的不是 5 美元，是 500 美元 Chris 鼓励普通人通过生活取舍来积累“风险资本”。如果你相信自己的投资能力能让钱翻 100 倍，那么今天省下的每一块钱都相当于未来的 100 块。 “你会自己煮咖啡，因为你不是省了 5 美元，而是省了 500 美元。” 💡 我想激励地球上每一个人进入投资者阶层 Chris 做所有公开内容的终极使命不是卖课或募资，而是让更多人意识到：财富差距是可以解决的，办法就是让更多人开始投资。 “收入差距是没法解决的……但财富差距是可以解决的问题，办法就是让更多人进入投资者阶层。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
64分钟 · 6天前
2493
12
#610.迪士尼公司：最成功将人类怀旧情怀变现的企业
📝 本期播客简介本期我们克隆了：知名商业播客《Acquired》在2026年6月的一期深度节目，由主持人Ben Gilbert和David Rosenthal共同呈现。他们以研究伟大公司的故事与策略而闻名，这一期他们终于将目光投向了娱乐巨头——华特·迪士尼公司。原内容更新时间：2026-06-23 本期节目聚焦于华特·迪士尼本人执掌公司的时代，探讨了迪士尼如何从一个在堪萨斯城起步的小工作室，通过一系列看似疯狂的豪赌，最终建立起一个独一无二的商业飞轮。主持人Ben Gilbert和David Rosenthal深入迪士尼档案馆，翻阅了原始合同、员工年报和IPO招股书，还原了这家公司从“迪士尼兄弟卡通工作室”到全球娱乐霸主的惊人历程。这不仅仅是一个关于动画和米老鼠的故事，更是一部关于技术创新、商业模式发明和创始人执念的史诗。你将听到同步声音技术如何让米老鼠一炮而红，第一部长篇动画电影《白雪公主》如何差点让公司破产，以及一个对模型火车的痴迷如何最终催生了迪士尼乐园。如果你对IP生意、飞轮效应，以及一个创始人如何一次次押上全部身家感兴趣，这期节目会给你带来极大的启发。 👨‍⚕️ 本期嘉宾本期节目由《Acquired》的两位创始人Ben Gilbert和David Rosenthal主持。Ben Gilbert是Pioneer Square Labs的联合创始人，David Rosenthal是早期风险投资公司Worldly Partners的合伙人。他们以深度剖析伟大公司的商业策略而闻名，擅长将复杂的商业史讲得引人入胜。 ⏱️ 时间戳开场与节目介绍 00:00 欢迎收听跨国串门计划 00:34 本期克隆节目介绍：Acquired 深度解读华特·迪士尼公司 02:02 欢迎来到 Acquired 2026 年春季篇 03:07 本期重点：迪士尼独一无二的商业成功华特·迪士尼的早年生涯 06:35 1901年芝加哥：华特·迪士尼出生 07:02 屡屡碰壁的父亲与有钱的叔叔 07:43 马瑟林农场：华特一生中最重要的地方 08:57 玛吉婶婶的礼物：艺术与商业的第一次连接 10:34 务农失败，全家搬往堪萨斯城 11:34 一战期间去法国当救护车司机 11:56 1919年回到堪萨斯城，立志成为职业漫画家第一次创业与动画的萌芽 12:43 遇见联合创始人 Ub Iwerks 13:14 成立 Iwerks Disney Commercial Artists 13:58 加入堪萨斯城幻灯片公司，爱上动画 16:36 自制动画短片 Laugh-O-Grams 18:37 1922年创立 Laugh-O-Gram Films，再次失败 20:44 破产后投奔好莱坞的哥哥罗伊爱丽丝喜剧与迪士尼的正式起步 21:42 初到好莱坞的碰壁与假名片混进环球影城 22:56 重拾动画，寄出《爱丽丝梦游仙境》 24:43 与 Margaret Winkler 签下第一份大合同 26:32 1923年成立迪士尼兄弟卡通工作室 Oswald 的惨痛教训与米老鼠的诞生 27:23 1927年 Oswald the Lucky Rabbit 大获成功 30:03 工作室更名为华特迪士尼工作室 32:07 Mintz 的背叛：动画师被挖走，Oswald 版权归环球 34:19 一夜之间，企业价值归零 36:41 火车上的灵光一闪：米老鼠诞生 37:07 米老鼠诞生的两个版本 39:12 前两部米老鼠短片无人问津声音技术带来的革命 39:41 灵感来源：第一部有声片《爵士歌手》 40:50 商业模式教训：利用新技术实现跨越 41:27 搞到 Cinephone 录音系统 41:42 第一次放映同步声音版米老鼠 43:15 《蒸汽船威利》的制作噩梦 44:29 1928年11月18日，《蒸汽船威利》首映 45:07 发行商的拒绝与“救生圈”品牌的教训 46:58 Pat Powers 挖走 Ub Iwerks，但这次迪士尼赢了知识产权飞轮的诞生 48:03 米老鼠俱乐部的意外起源 50:46 1930年推出每日连载米奇漫画 52:04 周边与消费品：从300美元的授权开始 53:35 Kay Kamen 接手，周边业务爆发 57:07 米老鼠手表卖出250万只 57:45 一种全新的商业模式诞生 58:18 迪士尼飞轮的诞生 58:25 “飞轮”其实是个误称 59:28 飞轮模式为何如此有效《白雪公主》：迪士尼的蠢事 01:06:25 创作好莱坞第一部动画长片的疯狂想法 01:07:41 外号“迪士尼的蠢事” 01:08:12 罗伊试图劝阻：这会搞垮整个工作室 01:08:50 动画电影制作流程详解 01:22:32 三年时间、150万美元的制作费 01:23:22 两百万张草稿、二十五万张成品画稿 01:24:47 1937年12月21日首映 01:24:56 奥斯卡专门为白雪公主设立特别奖 01:27:32 常见误解：白雪公主的利润去哪了 01:27:47 电影价值链拆解：钱从哪里来？伯班克新工作室与二战危机 01:32:24 建造动画师天堂：伯班克新园区 01:33:33 华特的乌托邦梦想 01:37:09 园区建设成本300万美元 01:37:39 同时批准《木偶奇遇记》《小鹿斑比》《幻想曲》 01:38:58 《木偶奇遇记》惨败，欧洲市场消失 01:39:51 1940年首次出售公司股权（IPO） 01:41:45 现金危机与员工动荡 01:42:51 1941年大罢工：华特最黑暗的时刻 01:45:06 华特那场灾难性的三小时演讲 01:46:43 华特逃往拉丁美洲，罗伊解决罢工 01:47:51 工作室从此再也没能完全恢复二战与迪士尼金库 01:51:45 珍珠港事件，美军进驻工作室 01:53:54 为政府制作宣传片，唐老鸭冲在最前面 01:55:44 1944年重新上映《白雪公主》，迪士尼金库诞生 01:57:02 华特的金句：七年一代新观众战后低谷与《灰姑娘》的反弹 01:59:52 战争结束，政府收入断了 02:00:21 尝试合集、真人动画结合，都不算成功 02:00:58 市场竞争出现：华纳《乐一通》、米高梅《猫和老鼠》 02:02:35 华特下最后通牒：不回到动画就卖公司 02:03:02 1950年《灰姑娘》上映，八年来第一部动画长片 02:04:49 口碑和商业上的巨大成功华特的新痴迷：火车与微缩模型 02:06:49 华特在玩火车 02:07:48 对火车和小镇美国的深重情结 02:09:18 砸5万美元在自家后院建铁路 02:10:33 历史学家的评价：一个我可以重新掌控的世界迪士尼乐园的诞生 02:10:59 从火车痴迷到迪士尼乐园 02:11:37 最初想法：16英亩地，150万美元 02:12:57 罗伊和董事会毫无热情 02:13:29 华特成立私人公司 WED Enterprises 02:15:07 伯班克地太小，市议会否决 02:16:01 雇 SRI 斯坦福研究所寻找完美地点 02:17:37 需要一大笔钱，华特回去找公司为乐园融资：拥抱电视 02:24:38 华特做了一件没人敢做的事：拥抱电视 02:26:09 ABC 排第三，急需内容突围 02:29:09 ABC 投50万股权，担保450万贷款 02:30:08 合同定死开园日期：1955年7月17日 02:30:32 电视节目火得一塌糊涂 02:32:01 Davy Crockett 引爆全美 02:32:26 浣熊皮帽卖出1000万顶，主题曲冲上排行榜第一迪士尼乐园开园 02:36:27 1955年7月17日，迪士尼乐园开园 02:36:46 乐园的开发：Herb Ryman 一个周末画出全景图 02:38:28 建乐园只用了11个月 02:40:37 筑起20英尺高土堤，把乐园与外界隔开 02:42:29 65家企业赞助商 02:44:00 开园日：混乱中的巨大成功 02:45:15 ABC 22台摄像机直播，8300万人收看 02:46:38 第一年游客量360万迪士尼乐园的复杂股权 02:50:24 华特个人公司 WED 拥有铁路和单轨列车 02:52:52 1965年 Imagineering 被整合进公司 02:53:35 直到1982年，公司才完全买回所有权益飞轮的第五个要素 02:54:40 电视和乐园给飞轮加上第五个要素 02:56:44 1957年纽交所上市 02:57:23 《华尔街日报》头版文章与著名的飞轮图 02:58:50 罗伊的金句：整合是我们这里的关键词 02:59:26 1958年就在为四年后才上映的《睡美人》造势 Epcot：华特最后的狂想 03:07:19 华特觉得太稳了，又想全押 03:07:50 下一个梦想：建一整座城市 03:09:12 1964年纽约世博会作为秘密试验场 03:11:23 Epcot 的疯狂构想：穹顶城市、单轨列车、地下隧道 03:12:40 1965年宣布佛罗里达项目，买了27000英亩地 03:13:32 华特生前倒数第二次公开露面 03:15:07 1966年12月15日，华特·迪士尼去世华特去世后的迪士尼 03:16:26 罗伊将项目改名为华特迪士尼世界 03:17:37 花4亿美元建魔法王国，没有负债 03:19:15 华特去世后，公司停止了豪赌 03:19:38 电影业务衰落，全靠主题公园撑着 03:22:23 美国的神话制造转移了：卢卡斯、斯皮尔伯格 03:24:16 1984年，企业狙击手盯上迪士尼 03:25:06 三个外来者即将上演史上最伟大的翻身仗分析与总结 03:25:54 核心问题：为什么没人能复制迪士尼的IP飞轮？ 03:27:15 动画是极其关键的 03:32:37 七种力量框架分析 03:36:04 Ben 的精髓总结：一批有凝聚力的IP 03:36:57 David 的精髓总结：艺术与商业的结合 🌟 精彩内容 💡 艺术与商业的第一次连接在马瑟林农场，六七岁的华特为邻居画了一匹马，得到了五分钱报酬。这件事在他心里种下了一颗种子：画画不仅能带来快乐，还能挣钱。这种将艺术与商业结合的本能，后来驱动了他的一生，也驱动了整个迪士尼公司。 "他想，我的爱好，我的画，居然能挣钱。" 💡 动画行业太新了，我很快就能做到世界顶尖华特很早就意识到，动画是一个全新的艺术形式，竞争远不如传统绘画激烈。这种对“蓝海市场”的直觉，让他和Ub Iwerks敢于在堪萨斯城这个小地方挑战纽约的动画巨头。 "因为整个动画行业太新了，他觉得自己很快就能做到世界顶尖水平。" 💡 从惨痛教训中诞生的品牌意识当发行商拿着Lifesavers糖果对华特说“公众不认识你的老鼠”时，华特虽然愤怒，但他接住了这个教训。从此，每一部米老鼠短片都醒目地打上“华特·迪士尼出品”，把自己做成了动画界的“救生圈”品牌。 "从今以后，观众如果喜欢这部片子，他们就会知道华特·迪士尼这个名字。" 💡 我们想做爵士乐队，不想做军乐队虽然这句话是后来Notion CEO Ivan Zhao说的，但华特·迪士尼的组织哲学与之惊人地相似。他招募最有才华的动画师，给他们创作自由，同时用自己极致的品味去把控方向。伯班克工作室的设计——每个动画师都有朝北的窗户以获得最完美的光线——就是这种理念的物理体现。 💡 你必须豁出去、全力以赴在决定制作《白雪公主》时，华特说了一句代表他一生哲学的话。他从不做平庸的产品，每一次都是押上全部身家的豪赌。这种“要么全赢、要么输光”的风格，让迪士尼一次次濒临破产，也一次次创造出前所未有的奇迹。 "我们认定只有一条路能成功做好白雪公主，那就是豁出去、全力以赴。在资金、人才和时间上绝不妥协。" 💡 七年一代新观众 1944年，迪士尼在资金极度紧张时被迫重映《白雪公主》，却意外发现了“金库”模式的威力。华特后来总结，每七年就有一代新孩子长大，他们从没看过这些经典。这个无意中撞上的周期，成了迪士尼IP运作的核心节奏，一直延续到今天。 "自我们第一次重映以来的八年里，我们的潜在观众增加了2500万儿童。" 💡 迪士尼乐园是100%关于过去和未来，0%关于当下华特刻意将乐园设计成一个完全脱离现实烦恼的空间。这里有美国小镇大街的怀旧，有明日世界的科幻，有幻想世界的魔法，唯独没有“现在”。这种设计让游客能彻底沉浸，创造出一种独特的、让人愿意待上一整天的愉快体验。 💡 华特去世后，公司99.95%的价值才被创造出来这是一个令人震撼的数据。华特用一生建起了这家公司，但今天迪士尼的市值，99.95%都是在他1966年去世之后才产生的。这既说明了他打下的基础有多牢固，也暗示了后来者（比如即将在第二部分登场的Eisner和Iger）创造了多么惊人的增长。 ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
226分钟 · 6天前
1615
6
#609.挑战英伟达：Etched AI推理芯片如何让token成本暴跌
📝 本期播客简介本期我们克隆了：知名商业与投资播客《Invest Like The Best》Inside the $5B Company Building the Hardware to Make AI Cheap for Everyone 原内容更新时间：2026-06-30 本期嘉宾是AI芯片公司Etched的两位联合创始人Gavin Uberti和Robert Wachen。三年前，他们还是两个试图说服怀疑者的哈佛辍学生，声称自己能造出比全球最大半导体公司更好的推理硬件。今天，Etched已融资8亿美元，签下超过10亿美元的客户合同，并成功流片了一款为后ChatGPT时代设计的芯片。这期节目不只是Etched的创业故事，更是一场关于AI推理市场未来的深度对谈。Gavin和Robert详细拆解了他们的核心技术路线——低电压推理和集群级内存，解释了为什么推理将成为全球最大的市场，以及他们为何选择造整机柜而非仅仅一颗芯片。如果你正在思考AI硬件的未来、创业公司如何挑战巨头、以及如何构建一家能持续产出顶尖产品的公司，这期会提供大量一手经验和高密度判断。 👨‍⚕️ 本期嘉宾 Gavin Uberti和Robert Wachen，AI芯片公司Etched的联合创始人。两人从哈佛退学，在短短几年内筹集了8亿美元，试图打造比行业巨头更高效的推理硬件。Gavin曾在高中时战胜骨癌，这段经历深刻塑造了他对生命和事业的看法；Robert从17岁起就在AI芯片公司做kernel开发，亲历了多家公司被收购的过程。他们带领Etched成为目前唯一一家既自己造芯片又自己造整机架的创业公司。 ⏱️ 时间戳开场与创业起点 01:15 推理将是全球最大的市场 01:56 三年前没人相信两个21岁的年轻人能做成芯片公司 03:03 需要一定程度的“天真”才能挑战巨头 04:52 两类人：凭经验否定 vs 愿意深入验证 06:59 不只是造芯片，而是做完整的推理解决方案核心技术赌注 07:19 推理的两个关键环节：pre-fill和decode 08:29 认真研究过各种架构，发现天下没有免费的午餐 09:08 真正重要的指标：实际负载下的flops利用率 10:04 登纳德缩放定律与低电压推理的突破 11:27 decode完全是一场内存游戏 12:07 集群级内存：自建定制互联协议栈 12:55 这些架构都是在ChatGPT出现之前构建的为什么推理如此重要 13:51 归根结底是生产力问题 14:35 今天让十亿人同时使用这些模型根本不可能 16:11 token还没有像iPhone那样的规模经济 17:03 有些产品如果太慢，根本没法用创始人的个人故事 18:14 Gavin的高中经历：骨癌四期，存活率不到30% 19:29 GPT-4V一眼认出肿瘤，而医生花了六个月 20:44 运营创业孵化器，发现所有公司都在烧钱买算力 21:59 Robert的第一份工作：17岁做kernel开发 23:03 高中机器人比赛：两人团队拿下世界纪录构建公司的哲学 24:26 赢是靠交付产品，不是靠最好的外联 25:10 最好的供应商就是没有供应商 27:10 人才理念：寻找“传奇人物” 27:47 第一次聊就说“好”的人很少，聊到第二十次之后说“好”的人很多 29:00 Brian在英伟达创立了HGX和DGX团队，占其收入大头 29:36 “肩上有chip，才能把chip装进数据中心” 30:48 自我筛选：机会主义者不会来我们这儿工作 31:16 你得有点疯才愿意加入我们公司速度与风险 32:51 供应商进度落后，派十几名工程师飞班加罗尔住六个月 33:57 24小时不间断开发，两边各跑12小时接力 35:03 两个关键技巧：找到优秀的人，快速做决策 36:24 最大的风险就是不承担风险 36:56 “预取”概念：芯片回来前把所有能做的事都做完 37:59 从拿到硅片到跑通推理只用了40天，行业标杆是10个月供应链与生态 39:39 供应链最被低估的一点：必须去合作 39:59 台积电真正的价值全在服务上 40:39 电力供应和通电时间是关键因素 42:02 客户关心的是：在给定功耗下能服务多少用户 43:01 我们的硬件能在同等交互性下带来一个数量级的并发提升模型与未来 44:39 用wall clock time思考：一年任务缩到一个月 45:51 底层还有巨大的空间：chip间延迟从4000纳秒到几纳秒 47:24 最好的kernel仍然是人跟AI协作写出来的 48:54 “选择战场”：不去做任意图编译器 49:49 垂直整合的边界：生产即产品 50:49 谁生产的token最多，谁就会成为世界上最有价值的公司融资的至暗时刻 57:01 2024年初，银行里只有1500万美元，需要1亿 57:51 开始琢磨回哈佛复学有多难 58:18 硅谷所有主流投资机构当场就拒了 59:43 深夜坐在办公室里，怎么算账都算不平 01:00:59 那就是我们的A轮：1.03亿美元软承诺不可能问题的解决 53:43 chip回来后发现跨时钟域反压逻辑出问题 54:16 需要把时钟信号对齐到50皮秒以内 54:23 有人直接辞职了，说“祝你们好运” 55:08 黑暗的两周，但把它做出来了 01:07:43 第一片晶圆测试，全是红色方块 01:08:32 “谜题开始了” 下一代与终极愿景 01:09:24 做三件事：最多flops、最低延迟、尽可能多生产 01:10:51 核心就是简单：去掉大量部件 01:12:46 机器思考的方式跟人不一样 01:17:00 全球正在走向推理占全球GDP大头的时代 01:17:17 今年是劳动力以人类为主的倒数第二年 01:19:04 绝对会看到单个数据中心价值一万亿美元收尾 01:21:23 别人为你做过的最善意的一件事 🌟 精彩内容 💡 “谁生产的token最多，谁就会成为世界上最有价值的公司” Gavin和Robert对推理市场的判断极其清晰：推理将成为全球最大的市场，而token就是新时代的石油。他们所有的决策都围绕一个问题——怎么把最多的token产能上线。这个判断驱动了他们从芯片到整机柜的垂直整合策略。 “我们知道inference会是全球最大的市场。谁产出的token最多，谁就会是全球最有价值的公司。” 💡 “你得有点疯才愿意加入我们公司” Etched的人才筛选机制几乎是自我运转的。两个24岁的创始人、没流片过的产品、要挑战全球最大公司、设计方案不是好10%而是好10倍——这些条件天然筛掉了机会主义者，留下的都是真正相信这件事的人。 “你得说服家人搬到圣何塞，加入一家半导体公司，老板是两个现在24岁的年轻人，要跟全球最大的公司对着干，而且他们拿出的设计方案不是说好个10%，而是要好10倍。” 💡 “最大的风险就是不承担风险” 在AI推理市场每天超过10亿美元收入的背景下，每推迟一天出货就等于把大量机会扔在桌上。Etched的“预取”哲学就是把所有不需要芯片的事都在芯片回来前做完——从软件栈到机柜部署到FPGA集群验证，这让他们的bring-up时间从行业标杆的10个月压缩到40天。 “这个领域每天有超过10亿美元的收入，其中很大一部分来自inference。所以我们每推迟一天出货，就等于把大量机会白白扔在桌上。” 💡 “最好的供应商就是没有供应商” Etched是唯一一家既自己造芯片又自己造整机架的创业公司。他们从芯片到电路板、冷板、互联甚至生产环节都尽可能在内部完成，这既是为了性能，也是为了速度。这种极致的垂直整合让他们能并行推进所有事情。 “最好的零件就是没有零件。我觉得对我们来说，最好的供应商就是没有供应商。” 💡 “先假设它是可能的” 面对看似无解的技术难题——比如需要把时钟信号对齐到50皮秒以内——Etched的默认姿态是假设问题可解，然后倒推解决方案。有人辞职了，但留下的人找到了用漂移机制锁定相位的方法。这种心态贯穿了他们的整个创业历程。 “遇到这种问题，第一步是，好，我们先假设问题可解。那怎么解？” 💡 “生产即产品” Gavin和Robert对业务边界的判断非常清晰：除非为了达到巨大规模非做不可，否则不去碰技术栈的其他环节。他们不做数据中心、不做模型，但做整机柜、做CM模式，因为不上规模不行。这种聚焦让他们把精力押在最关键的赌注上。 “我们所有的决策，都围绕一个问题：怎么把最多的token产能上线？” 💡 “今年是劳动力以人类为主的倒数第二年” Gavin做出了一个大胆预测：到2027年，做知识工作的Agent数量将超过人类。他设想了一个世界，一个国家的能源大部分流向推理数据中心，而数据中心的能效决定了他们能有多少Agent，进而决定了劳动力规模。 “我认为今年是劳动力以人类为主的倒数第二年。我觉得到2027年，你会看到做知识工作的Agent数量超过人类。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
83分钟 · 7天前
2033
2
#608.3Blue1Brown创始人：AI攻克数学前沿，人类创造力与科学发现将何去何从
📝 本期播客简介本期我们克隆了：知名播客《Dwarkesh Podcast》在 Jul 1, 2026 的一期深度对谈 Grant Sanderson (@3Blue1Brown) – AI and the future of math Grant Sanderson 是广受欢迎的数学科普频道 3Blue1Brown 的创始人，他正在制作一个记录人工智能在数学领域进展的新项目。这期节目主要探讨了人工智能在数学前沿的突破速度，以及这些进展对我们理解创造力、科学发现和未来工作意味着什么。节目从 AI 在国际数学奥林匹克竞赛（IMO）上的表现切入，深入讨论了 AI 解决千禧年大奖难题的可能性，以及这背后更深层的问题：当 AI 能证明定理时，人类的角色是什么？Grant 通过伽罗瓦和群论的历史案例，精彩地阐述了数学中“提出好问题”和“创造新定义”的价值，这些往往比证明定理本身更重要，却难以被量化为基准测试。对话还延伸到 AI 在写作、编程、学习等领域的局限性，以及数学家在 AI 时代可能转向“策展人”角色的未来图景。如果你对 AI 的能力边界、科学发现的本质、以及未来人类与 AI 的协作方式感兴趣，这期节目会提供极具深度的思考。 👨‍⚕️ 本期嘉宾 Grant Sanderson，全球知名数学科普频道 3Blue1Brown 的创始人。他以精美的可视化动画和清晰的讲解风格，将复杂的数学概念变得直观易懂，影响了无数数学学习者和爱好者。他正在制作一个记录 AI 在数学领域进展的新项目，深度关注人工智能如何改变数学研究的方式。 ⏱️ 时间戳开场与AI在数学上的突破 01:10 嘉宾介绍与AI在数学领域的进展速度 01:34 三年前的预言：IMO金牌不等于AGI 02:23 为什么IMO题目其实是可以训练的 02:54 AI进展的“尖峰”特性：数学正好在尖峰上 03:11 AI在几何题上秒杀，组合题上挣扎千禧年难题与AI的能力边界 03:55 解决千禧年难题是否意味着能胜任白领工作？ 04:20 跨领域知识连接的可能性 04:55 蒙哥马利与戴森的故事：偶然的跨领域连接 06:26 费马大定理的解法：需要构建理论的大山 07:16 如果AI能构建理论大山，智能水平就太高了下一个基准：提出猜想与创造定义 07:50 移动球门：IMO金牌没有带来变革性影响 08:50 下一个基准：提出有趣的问题和新的概念化方式 09:28 好的数学家证明定理，伟大的数学家提出猜想 10:05 如何量化“提出好猜想”？这很难做成基准 11:05 数学家们对AI的语气在过去一年发生了变化伽罗瓦、群论与可验证奖励的困境 12:17 提出新思考方式的价值：爱因斯坦与广义相对论 13:13 伽罗瓦与群论：验证循环长达100年 14:22 为什么伽罗瓦理论是完美的例子 14:41 五次方程求根公式的历史背景 15:56 拉格朗日：找到正确的提问方式 17:41 伽罗瓦的悲剧人生：在监狱里写下革命性想法 18:54 当时的学术界拒绝了伽罗瓦的论文 19:49 伽罗瓦去世后，想法花了40年才被认可 21:24 历史可能走向另一种可能：伽罗瓦被遗忘 22:01 群论的应用：盖尔曼预言夸克的存在压缩即智能：如何衡量“优雅” 22:25 不以解决问题为标准，如何衡量进步？ 22:51 “压缩即智能”：表达越简洁越智能 23:14 黎曼猜想解法的第三种可能：纯粹靠硬算 23:36 用柯尔莫哥洛夫复杂度量化“优雅” 23:55 人类一直在做这件事，AI迟早也会做到 AI会否让数学变得不可理解？ 24:48 担心AI证明黎曼猜想但人类不理解 25:18 单位距离猜想反例：AI的推理是可理解的 25:43 解黎曼猜想的三种方式：连接、理论构建、蛮力 26:48 ABC猜想尝试性证明：异类的数学大山 27:31 David Bessis：《定理经济的衰落》 28:36 知道解是对的，会帮助人类理解证明与解释的区别 29:16 Timothy Chow：“未解决的阐述性问题” 30:17 证明和解释之间有区别 30:51 概念化与想法本身真的有区别吗？ 31:16 提出新颖洞见的人往往也是优秀的阐释者 32:08 AI可能也会擅长解释和提炼数学家的未来：策展人角色 32:34 Grant会一直做现在做的事直到死 33:10 数学家最终会变得更像美术馆策展人 33:55 Grant的角色可能转向策展方向 34:27 人类音乐家永远有一席之地，数学也一样 AI作为超级连接器 34:37 AI刚跨过连接想法的门槛，下一步是什么？ 35:16 广义相对论就是把黎曼几何和狭义相对论连接起来 35:41 朗兰兹纲领：一种研究精神 36:25 AI成为超级连接器的可能性 37:25 为什么自回归模型难以建立跨领域连接？ 39:20 从数据角度思考：设计环境激励连接能力并行化与数字心智的优势 40:44 AI的关键优势：并行化和可扩展性 41:33 数字心智天生具备的优势 41:57 设计Agent之间的“偶然对话” 42:37 故意给不同Agent不同的上下文 43:03 IMO钓鱼题：需要跳出上下文才能解 44:24 系统性刷新思维：数字心智的优势熵坍缩与系统性增加熵 44:59 人们对AI的担忧：熵坍缩 45:13 AI的关键优势：系统性尝试否定和证明 45:46 爱因斯坦的偏见：在prompt层面增加熵 46:34 科学不存在唯一正确的启发式方法可反复尝试性比形式化更重要 47:20 为什么AI在计算机使用方面进展慢？ 47:38 可反复尝试性是关键，不只是可验证性 49:19 Lean对于AI目前的进步水平没那么重要 49:57 可反复尝试性比形式化更重要 50:34 Lean的未充分探索的好处：无限探索 52:08 数学独有的特性：按下启动键，十年后回来看自然语言验证与过程监督 52:48 Karpathy的AutoResearch想法 53:32 人类数学研究就是一个不断扩展的图书馆 54:17 穷举搜索所有可能的代数系统 55:28 DeepSeek数学模型：自然语言验证的可行性 56:16 数学比其他领域更可能信任自然语言验证器 57:26 Lean的另一个意义：消除错误率写作为什么比数学和编程更难 58:42 写作进展慢的原因：不擅长评判 59:17 写作不像代码和数学那样模块化 59:59 为什么代码能从“能用”进步到“干净”，写作不行？ 01:00:58 写作的关键在于洞察力 01:02:27 不可预测性是写作的核心心智理论与AI的局限性 01:02:38 AI在构建人的心智模型方面特别差 01:02:45 教LLM写间隔重复提示卡的实验 01:03:19 写一张好卡片需要投射人的心智状态 01:04:15 肉毒杆菌实验：理解表情需要模仿 01:05:39 模型没有面部肌肉，像外星人在尝试共情如何用LLM学习 01:07:17 用LLM学习的建议 01:07:58 “跟谁学”比“学什么”更重要 01:08:52 LLM的解释像维基百科，缺乏刻意构建的动机 01:09:14 把LLM当超级加强版Google用 01:10:14 最有收获的学习经历：先有人搭好枝干 01:11:17 LLM不擅长重新框定你的问题给学生的建议 01:12:48 对想成为数学家的学生的建议 01:13:20 搞清楚钱从哪来、你创造什么价值 01:15:18 数学家的社会角色变化不大 01:16:03 教学是后AGI时代最稳定的工作之一 01:17:08 在疯狂的世界里，数学是AI走得最远的领域数学加速的实际应用 01:18:03 AI做出来的数学到底有没有用？ 01:18:39 数学进展不均衡：代数数论vs偏微分方程 01:18:53 波音的例子：数学洞见省了几十亿美元 01:19:46 数学巨大突破不太可能立刻转化为经济突破 01:21:09 数学已经变得完全没用了吗？ 🌟 精彩内容 💡 “好的数学家证明定理，伟大的数学家提出猜想，最伟大的数学家创造定义” Grant引用了这句名言来阐述数学创造力的层次。在AI时代，提出好问题和创造新概念的能力可能比证明定理更重要，但这些恰恰是最难被量化为基准测试的能力。 “好的数学家证明定理，伟大的数学家提出猜想，而最伟大的数学家创造定义。” 💡 伽罗瓦理论：验证循环长达100年 Grant通过伽罗瓦和群论的历史，精彩地说明了数学中最有价值的洞见往往需要极长时间才能被认可。伽罗瓦在监狱里写下的革命性想法，当时被学术界拒绝，花了40年才被理解，而群论在物理学中的应用更是等到20世纪才出现。这对AI的“可验证奖励”训练范式提出了深刻挑战。 “你确实有这整整100年的时间，一个想法流经许多不同人的头脑，最后才沉淀成数学界公认的好东西。” 💡 数学独有的特性：按下启动键，十年后回来看 Grant指出，有了Lean这样的形式化工具，AI可以在数学领域实现完全自动化的无限探索，不需要人类检查，只管砸算力。这是其他领域都不具备的特性。 “这是数学独有的、其他领域都没有的特性。你可以按下启动键，然后只管往里砸算力，十年后再回来看，问它‘你有什么成果？’” 💡 数字心智的优势：系统性刷新思维 Grant和Dwarkesh讨论了AI可以通过给不同Agent不同的上下文和偏见，系统性地增加“熵”，避免陷入单一思维模式。这与人类需要“跳出上下文”才能解决某些问题的特性形成对比。 “有时候，你在其他领域做人类研究时，也会想要同样的东西，有时候就是需要能够说，刷新你的思维，用一个完全不同的方式来切入。” 💡 写作的关键在于不可预测的洞察力 Grant深入分析了为什么AI在写作上表现不佳。写作不只是对已有想法的蒸馏，关键在于在正确的节点做出不可预测的举动，那才是更有洞察力的地方。这与自回归模型的生成方式存在根本矛盾。 “要写出好东西，就必须包含某种不可预测的元素……在哪个正确的节点做出一个不可预测的举动，那才是更有洞察力的地方。” 💡 教学是后AGI时代最稳定的工作之一 Grant认为，即使AI成为完美的讲解者，教学仍然是最稳定的职业之一，因为它太依赖人与人的关系。老师所做的是一种非常社会化的、教练式的、导师式的事情。 “即使LLM是很好的讲解者，老师所做的是一种非常社会化的、教练式的、导师式的事情，这可能是未来50年里最稳定的职业之一。” 💡 数学家最终会变得更像美术馆策展人面对AI能产生海量数学成果的未来，Grant提出数学家的角色可能转向“策展人”——在近乎无限的想法空间中导航，判断哪些想法值得投入和展示。这种策展能力依赖于人与人之间的信任关系。 “你仍然需要有人帮你在这个近乎无限的空间里导航，告诉你哪些想法值得投入……我们永远会更喜欢一个和我们有关系的人，因为我们被激发兴趣的方式是一种社会现象。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
82分钟 · 7天前
1333
2
#607.SemiAnalysis创始人：AI的真正100倍杠杆，藏在软硬件协同设计里
📝 本期播客简介本期我们克隆了：红杉资本旗下播客的深度对谈《Why Hardware-Software Co-Design Is AI's Real 100x: Dylan Patel of SemiAnalysis》原内容更新时间：2026-06-30 本期嘉宾是知名半导体与AI研究机构SemiAnalysis的创始人Dylan Patel，主持人是红杉资本的合伙人Sean。Dylan从硬件论坛版主起步，如今带领团队为全球机构提供最前沿的芯片与人工智能产业分析。这期节目，他们撕开了AI领域一个常被忽视的关键杠杆——硬件与软件的协同设计，并深入探讨了这种深度整合如何带来远超单纯硬件迭代的效率飞跃。 Dylan在节目中抛出了一个核心论断：AI最大的收益不是来自更快的芯片，而是当你把模型架构、底层内核和芯片设计三层协同优化时，原本这里2倍、那里2倍的提升，会直接变成100倍。他用DeepSeek举例，解释了为什么其专家模块的形状是为英伟达Hopper架构量身定制的，也因此跑在TPU上表现拉胯。这引出了一个更深的洞察：所谓的CUDA护城河，其实从来都不是CUDA本身，而是下游模型对英伟达硬件的深度协同优化。对话还覆盖了InferenceX的活体基准测试、太空数据中心的非共识判断、AI推理市场的终局规模，以及为什么新云厂商能在超大规模云厂商的夹缝中野蛮生长。如果你关心AI基础设施、芯片战争、模型架构演进和背后的经济账，这期节目会给你一个全新的分析框架。 👨‍⚕️ 本期嘉宾 Dylan Patel，SemiAnalysis创始人。SemiAnalysis是全球最具影响力的半导体与AI产业研究机构之一，客户涵盖顶级对冲基金、科技巨头和各国政府。Dylan从12岁起泡硬件论坛，后来成为Reddit多个科技板块的版主，大学毕业后做过量化分析师，2020年在个人崩溃和全球疫情中创办了SemiAnalysis。他以能把技术细节和经济账无缝结合的分析风格著称，团队约90人，一半是覆盖半导体供应链的工程师，一半是前对冲基金分析师。 ⏱️ 时间戳开场与SemiAnalysis的诞生 00:00 本期克隆节目介绍 01:18 SemiAnalysis内部的“打架”文化：工程师vs金融人 01:56 主持人Sean介绍Dylan 03:01 Dylan的成长背景：汽车旅馆、加油站与第一个“神经网络” 04:31 八岁生日与Xbox 360死亡红环：硬件的潘多拉魔盒 05:36 12岁成为Reddit版主，开始追踪芯片行业 07:50 创办SemiAnalysis的契机：奖金被坑、祖母去世、疫情崩溃 10:05 24岁生日当天，用真名发布SemiAnalysis 10:37 开着卡车跑遍全美国家公园，在30美元汽车旅馆里做研究供应链、会议与学习曲线 12:13 行业展会vs学术会议：NeurIPS与日本化学会议的天壤之别 13:17 SPIE先进光刻会议：第一次去90%都听不懂 14:58 一种化学品烧毁，内存价格翻三倍的恐怖故事推理市场与InferenceX 15:35 推理将是地球上最大的市场，比石油大得多 16:13 为什么启动InferenceX：静态基准测试已经死了 17:57 生态支持：5000万美元捐赠硬件，15种芯片类型 19:18 帕累托最优曲线：别拿次优配置跟最优配置比 20:07 吞吐量与交互性曲线：AI基础设施的下游总开关 21:11 成本如何纳入曲线：批量100用户每秒10 token vs 单用户每秒500 token 太空数据中心与电力预测 22:18 非共识判断：三到五年内太空数据中心没有实质影响 23:03 二十年尺度上，绝大部分算力会搬到太空 23:35 到2030年，仅OpenAI和Anthropic就会超过100吉瓦 23:47 到2040年，推理算力将进入太瓦级别每瓦智能与三层协同优化 24:06 每瓦智能一直在提升吗？成本已降60倍，每瓦智能提升约40倍 25:25 Sean的三层框架：硬件、系统软件、模型算法 26:04 Dylan完全不同意：最大收益来自协同设计层 26:55 DeepSeek V3的专家形状是为Hopper优化的 27:43 TPU跑DeepSeek很拉胯，跑其他模型却非常出色 28:07 中国在协同优化上比西方做得好？Dylan不这么认为 28:42 真正的突破：跨三层协同优化，2倍×2倍×2倍变成100倍技术瓶颈与供应链创新 30:49 未来一年最关注的技术瓶颈：内存带宽 31:46 直接把内存堆在芯片上，带宽会暴涨 31:58 打破每平方毫米一瓦的功率天花板 33:16 能源瓶颈的简单解法：用卡车发动机改造成天然气发电机 GPU vs TPU与CUDA护城河 34:25 Nvidia对TPU：两年后两边都是千亿美元级别 35:24 两边都有很能打的论点，但归根结底是协同设计 35:50 OpenAI用TPU可能很糟糕，Anthropic用GPU训练也可能很糟糕 36:09 矩阵乘法单元大小不同，导致模型架构根本不同 37:20 CUDA护城河已经被解开了，因为模型编程能力很强 37:58 真正的护城河不是CUDA，而是下游模型对Nvidia的优化 38:49 开源模型生态让下游使用者被绑在Nvidia上 39:40 大实验室早就fork了PyTorch，不需要依赖开源 Cerebras、经济账与AI投资回报率 40:07 Cerebras：推理速度极快，但超大模型和超长上下文是风险 42:46 Dylan的独特优势：把技术和经济账结合起来 43:55 最让Dylan上头的言论：AI没有投资回报率 44:06 模型能力曲线一直在向右上方走，看新的基准测试十年框架与终局判断 45:52 十年框架下最兴奋的事：太空数据中心、小行星采矿 46:29 共封装光学：争论的只是27年、28年还是29年发生 46:48 Naveen Rao的长期赌注：模拟计算与基于能量的模型 48:20 生态终局：每家超大规模云厂商都会有自己的芯片 49:24 硬件架构和模型架构会出现更多分叉 50:20 通用AI算力永远有市场，因为实验室连一年后用什么架构都不知道 51:51 每家都会投入数十亿美元部署专用集成电路数据中心建设与计算资源紧缺 52:52 我们正处在一场疯狂的计算资源紧缺之中 53:22 今年20吉瓦，明年超30吉瓦，但模型能力增长更快 54:31 Anthropic第二季度已经净利润盈利 54:44 Opus token利润率超过80% 55:45 只要毛利率是正的，就会不惜代价租GPU 55:58 计算能力建设会不会突然出问题？ 57:01 如果模型能完成的工作量增速超不过算力增速，风向就会变 57:49 模型现在进步得比六个月前更快：递归式自我改进在运转数据中心的同质性与新云厂商 59:20 沙特原油的类比：不同吉瓦之间有多大同质性？ 01:00:39 Trainium每吉瓦不到100亿美元，GPU每吉瓦120到130亿 01:02:07 数据中心租赁价格从每千瓦60美元涨到120到160美元 01:02:47 常见的坑：项目直接失败，必须做概率加权 01:03:18 Google在一个吉瓦级数据中心里实际部署1.5吉瓦硬件 01:04:51 一个吉瓦给Anthropic产生的收入比给OpenAI更高 NeoCloud的机会与Jensen的布局 01:06:22 NeoCloud为什么存在？超大规模云厂商的专长在AI云里变成拖累 01:07:21 Nitro智能网卡对AI性能不利，安全功能在AI场景没意义 01:08:59 Jensen绝对讨厌超大规模云厂商掌握所有权力 01:09:22 他想要一个多极化的世界，所以砸钱给新实验室和新云厂商 01:10:11 新云生态就是蛮荒地带，有些会失败，有些会脱颖而出 01:11:10 Thinking Machines做到上亿美元年度经常性收入 🌟 精彩内容 💡 软硬件协同设计：2倍×2倍×2倍变成100倍 Dylan指出，AI效率提升的真正魔法不在单一层面，而在跨层协同。当模型架构、底层内核和芯片设计被当作一个整体来优化时，收益不是加法而是乘法，甚至是指数级的。这就是为什么顶尖实验室和英伟达这样的公司能持续领先。 "真正的突破性创新，是当你跨越几层去做协同优化和协同设计，突然间，本来这里2倍、那里2倍、那里2倍，不是乘起来变成8倍，而是直接100倍。" 💡 CUDA护城河从来不是CUDA本身 Dylan颠覆了行业对英伟达护城河的认知。他认为真正的锁定效应不是CUDA软件生态，而是下游模型在架构层面就为英伟达GPU做了深度优化。DeepSeek的专家模块形状是为Hopper定制的，所以跑在TPU上表现很差。这种模型层面的协同设计，才是真正的护城河。 "这其实不是CUDA在起护城河作用，而是下游产品对Nvidia优化得更好。而且这些公司还都在开源这些模型。" 💡 推理将是地球上最大的市场，比石油大得多 Dylan对AI推理市场的规模做出了大胆预测：到2030年仅OpenAI和Anthropic就会超过100吉瓦，到2040年进入太瓦级别。他认为AI推理将占到GDP的好几个百分点，成为人类历史上最大的单一市场之一。 "推理，不管是开源模型还是闭源模型，都会是世界上最大的市场之一。我觉得会比石油大得多。" 💡 别拿次优配置跟最优配置比在解释InferenceX的帕累托最优曲线时，Dylan用一个赛车比喻点出了行业基准测试的普遍问题：人们总拿别人次优的配置来跟自己最优的配置比，这就像开保时捷跟赛车手比谁开得更慢。InferenceX要做的是为曲线上每一个点都找到真正的最优配置。 "很多时候，人们在比较推理性能时，会拿别人次优的曲线或点位，来跟自己最优的去比。这就好比，我开保时捷，跟某个赛车手比，肯定是我开得更慢。" 💡 模型进步没有停滞，递归式自我改进正在加速面对"模型能力即将停滞"的论调，Dylan给出了一个令人兴奋的观察：工程师们正在用模型来帮助编写代码、加速推出下一代模型，形成了一个类似递归自我改进的循环。模型现在进步得比六个月前更快。 "模型现在进步得比六个月前或一年前更快，因为你看到的是一个类似递归自我改进的循环在运转，模型变得更好、更快。" 💡 Jensen想要一个多极化的世界 Dylan揭示了英伟达CEO黄仁勋的深层战略逻辑：他砸钱给新实验室和新云厂商，不是因为短期利润，而是为了防止一个只有OpenAI、Anthropic和Google模型的世界出现。一个多极化的AI生态，对英伟达来说才是长期安全牌。 "一个只有OpenAI、Anthropic和Google模型的世界，对他来说是死路一条。一个只有超大规模云厂商在建设算力的世界，对他也是死路一条。" 💡 别跟猪摔跤，因为猪也乐在其中当Sean问Dylan是否享受SemiAnalysis内部工程师和金融人之间的激烈争论时，Dylan用这句谚语幽默地承认了自己乐在其中。这也完美概括了他从论坛版主到行业顶尖分析师的一贯风格：享受争论，享受把技术和经济账放在一起碰撞的过程。 "别跟猪摔跤，因为猪也乐在其中，对吧？" ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
72分钟 · 7天前
3374
6
#606.Codex 负责人：品味与判断力为何成为你最值钱的资产
📝 本期播客简介本期我们克隆了：知名产品与增长播客《Lenny's Podcast》OpenAI Codex lead on taste, curation, and building for AGI | Andrew Ambrosino 原内容更新时间：2026-06-28 本期嘉宾是 OpenAI 旗下 Codex 应用的产品与工程负责人 Andrew Ambrosino，主持人是 Lenny Rachitsky。Andrew 本人经历了从设计师到工程师再到产品经理的转型，目前正带领团队打造这款正被全球越来越多人使用的桌面应用。这期节目录制于线下，是一场关于 AI 时代产品工作形态的坦诚交流。他们深入探讨了 AI 如何彻底颠覆传统的产品开发流程——当任何人都能用模型做出任何功能时，实现本身不再是成本最高的部分，品味、判断力和策展能力正在成为最稀缺的资源。Andrew 分享了 OpenAI 内部独特的“90 个原型”文化、角色边界消融的真实状态，以及 Codex 应用从开发者工具演变为通用知识工作平台的曲折历程。如果你正在思考 AI 时代的产品策略、团队组织形态、个人技能转型，或者对“品味”这个词在实践中的真正含义感到好奇，这期节目会提供大量来自最前沿的一手经验和判断。 👨‍⚕️ 本期嘉宾 Andrew Ambrosino，OpenAI 旗下 Codex 应用的产品与工程负责人。他是一位从设计师转型工程师、再转型产品经理的跨界者，目前负责的 Codex 应用正迅速成为人们构建产品的首选工具，同时也被广泛用于整理电脑文件、起草文档、数据分析、阅读邮件等非开发类工作。在 OpenAI 内部，几乎 100% 的员工每周都在使用 Codex，且不限于工程师。Andrew 的独特背景让他对 AI 时代产品工作的形态变化拥有极为前沿的视角。 ⏱️ 时间戳开场与节目介绍 00:00 欢迎收听跨国串门计划 00:35 本期克隆节目介绍：Lenny's Podcast 与 Andrew Ambrosino 的深度对谈 02:57 嘉宾 Andrew Ambrosino 正式登场 AI 如何颠覆产品开发流程 04:27 现在的产品团队形态跟几年前比是什么样的 04:35 流程的倒置：任何人都能做出任何东西 05:04 传统产品流程的前提假设：实现很贵 05:52 实现本身不再是成本最高的部分，品味才是 06:11 90 个原型的文化：大家直接上手做，不再写文档 06:44 PRD 已死？Andrew 为什么不同意 07:18 选对表达观点的媒介变得非常关键 07:44 “原始笔触”的隐喻：原型有时反而是错误的第一步 08:19 媒介隐含的信号与流程阶段已经脱钩品味与判断力的真正含义 09:31 到底什么是好的品味 09:55 品味不只是审美，还有系统思维 10:43 如果我们什么都能做，那到底应该做什么 10:55 AI 在设计上为什么还是不行 11:29 设计比软件更难打分，品味中人的因素本身就是反馈机制 12:20 设计中新颖性的重要程度远高于软件工程 13:16 软件设计与代码之间的抽象层互动设计流程已死？ 14:56 对 Jenny 观点的回应：设计流程确实死了 15:14 传统设计流程的“案例研究工厂”问题 15:55 那套流程的前提假设：实现成本很高，只能承担一次开发 16:28 现在你可以把整个实现都拉进流程 16:56 把设计流程跟媒介绑定才是可怕的地方 17:33 设计流程已死，既对也不对角色崩塌与团队形态 18:23 Codex 团队的角色崩塌比公司其他部门更明显 19:00 你的角色是你花时间所做事情的平均值 20:10 “技术团队成员”这个称呼的起源 21:11 消除角色概念的危险：抹杀专业领域和最佳实践 21:29 取消产品角色是个非常糟糕的主意 21:52 “这不是你的领域”的边界乐于看到消失，但需要平衡 23:11 Codex 团队的构成：工程师两位数，设计师大概一半 24:05 产品工作像“区域防守” 24:40 产品人员的区域防守到底是什么样 25:54 最有价值的人：能把想法从概念做到完成，并有品味判断好坏规划、野心与时机 27:06 在变化速度下怎么做路线图规划 27:32 越短期越需要细节，九个月后的规划必须保持模糊 28:41 Codex 桌面应用如果在十一月发布会失败，二月就成功了 29:01 去做那些现在还不行、但等模型变强之后就能行的东西 30:11 不要固执地认为跑不通就是烂功能，可能只是还没到时候 30:31 最初 Codex Web 太 AGI 化，超前于那个时刻 32:08 推动团队更有野心，因为做难事变得容易太多了 AI 编程的最新前沿 32:52 从手写代码到 AI 写 100% 代码，再到“驾驶 AI” 33:27 循环已经是上周的事了 33:35 产品有多少是 AI 写的？这个问题已经变了 33:49 有监督写还是无监督写，完全是另一回事 34:14 模型通常会增加复杂度，需要更擅长删除代码 34:43 还没到直接说“改进应用”就能让它去听 Twitter、Slack 的地步 Andrew 如何使用 Codex 35:12 拥有全世界最棒的工作 35:29 个人目标：把 Codex 做成自己写代码用的工具 35:43 超快的 dogfooding 循环 36:11 角色变了，应用的角色也需要改变 37:21 使用 Codex 的方式随工作演变 37:31 每日简报：汇总 3000 个 Slack 频道的信息 38:44 设置自动化本身就是产品发现 39:45 用 Codex 过滤垃圾邮件的例子 40:18 computer use：AI 直接接管电脑操作 Codex 的愿景与未来 44:47 Codex 的愿景到底是什么 45:01 从命令行工具到桌面应用 45:26 内部 dogfooding 发现：非工程师也在疯狂使用 46:30 没人愿意离开 Codex App 去用其他 App 46:43 开发者工具和通用知识工作工具的界限不是非此即彼 48:05 超级 App 的讨论 48:24 Codex 是很好的大本营，调用你需要的任何工具 49:22 Brent 用 Codex 剪辑视频的故事 50:01 与专业工具无缝交互的模式失败角与闪电问答 51:03 失败角：大家看不到不顺利的时候 51:33 做了很长时间的创业公司创始人，最后把公司拆开卖掉 52:08 把 Codex App 经验跟 ChatGPT 结合中的无数次微小失败 52:27 内部搞砸时没有人会留情面 52:57 闪电问答环节 53:03 最常推荐的书：《咕噜牛》 54:07 最喜欢的童书：《The Big Orange Splotch》 55:16 最近喜欢的剧：《神奇校车》新版 55:58 最喜欢的产品：每天都在发现自己的产品，Linear 也特别好 56:17 人生格言：不是爱讲格言的人，但别人会告诉他哪些话老挂在嘴边 56:36 PM、设计师、工程师哪个最难花絮与结尾 58:02 制作人分享用 Codex 做剪辑的体验 58:17 每个任务都这样开始：产品本身不是为这个设计的，但什么都能做 59:00 别死守你现在的流程，要死守的是你独特能交付的成果 59:20 在 AI 时代成功，需要的自我认知程度高得离谱 59:54 讨厌重复的人当创始人挺惨的，因为你必须重复 01:00:17 给自己的职业找到了产品契合度 🌟 精彩内容 💡 实现本身不再是成本最高的部分，品味才是当任何人都能用模型做出任何功能时，产品开发的核心瓶颈从“能不能做出来”变成了“该做什么、怎么判断好坏”。Andrew 指出，在 OpenAI 内部，同一个需求可能有 90 个不同的探索方向在同时进行，真正的挑战是筛选、策展和整合。 “实现本身不再是成本最高的部分了。我斗胆说一句，是品味。是筛选的过程。” 💡 你的角色是你花时间所做事情的平均值在 Codex 团队，角色边界正在消融——设计师写代码，产品经理讲技术语言。Andrew 提出一个精妙的定义：如果你把一个人做的所有事情取个平均值，重心落在哪里，他目前就是什么角色。这不是角色消失，而是流动性增强。 “每个人不再被‘设计在哪结束、工程从哪开始’这种边界和围栏所定义，而是更多地由他们工作内容的平均分布来定义。” 💡 选对表达观点的媒介变得非常关键当实现成本趋近于零，PRD 和原型各有适用场景。Andrew 反对“PRD 已死”的极端说法，认为关键在于清楚这个东西在流程中处于什么阶段——文档适合厘清模糊思路，原型适合压力测试交互模式。 “如果实现变得极其充裕，那选对表达观点的形式就变得非常重要。” 💡 不要固执地认为跑不通就是烂功能，可能只是还没到时候 Codex 桌面应用如果在十一月发布会失败，但二月就成功了——唯一的区别是模型能力的变化。Andrew 强调，同一个形态的产品，仅仅因为几个月的时机差异，结果就完全不同。产品失败现在可能只是时机问题，需要反复发布。 “你可以在 Operator、Atlas、Codex、ChatGPT 之间画出一条线，本质上它们是同一个功能，但用不同的智能水平重新发布，结果就完全不同。” 💡 消除角色概念可能危险地抹杀专业领域 Andrew 对“取消产品角色、所有人都叫 builder”的潮流持批评态度。他认为这会抛弃产品领域积累的整套方法论和最佳实践。“这不是你的领域”的边界乐于看到消失，但需要平衡——不能让每个人什么都做。 “产品这个领域积累起来的整套方法论、那些真正的最佳实践、那些被验证过成败的经验，全都被抛弃了，就因为人们觉得‘哦，我也会写点代码了’。” 💡 别死守你现在的流程，要死守的是你独特能交付的成果在花絮中，Andrew 给出一条核心建议：不要固守 Figma 自动布局之类的具体工具技能，AI 以后这方面会比你强。真正重要的是你独特能交付的成果，然后去改流程、去尝试。 “要死守的是你独特能交付的成果，然后去改流程、去尝试。你一直守着‘我最懂 Figma 自动布局’，你在干嘛呢？” 💡 在 AI 时代成功，需要的自我认知程度高得离谱制作人点出一个深刻洞察：知道自己擅长什么、该往哪个方向走、什么值得做，这种自我认知在 AI 时代变得极其重要。Andrew 补充说，在 OpenAI 行得通的东西放到所有人身上不一定行得通，因为来这里的人是自我筛选过的。 “要在 AI 时代成功，需要的自我认知程度高得离谱。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
60分钟 · 8天前
6169
19
#605.Dwarkesh：AI 训练的下一个范式，为什么你的模型永远毕不了业
📝 本期播客简介本期我们克隆了：Dwarkesh Patel 的个人深度播客 What does the next training paradigm look like? 原内容更新时间：2026-06-26 Dwarkesh Patel 是硅谷当下最受瞩目的科技思想者和深度访谈主持人，以长篇幅、高密度的逻辑推演著称。在这期单人音频论文里，他没有邀请嘉宾，而是单刀直入地解剖了当前 AI 训练范式的根本性缺陷，并描绘了一个通往通用智能的关键路径：持续学习。这期节目不是泛泛的行业趋势讨论，而是一场关于 AI 如何从“课堂学霸”进化为“职场精英”的严密思辨。Dwarkesh 从“可验证性”与“可磨练性”的区分切入，层层推演出为什么当前依赖 RL 环境训练的范式不足以产生真正的通用智能，以及为什么让模型在部署后持续从真实世界互动中学习，才是破局的关键。如果你在思考 AI 的能力边界、训练瓶颈和下一个十年的技术路线图，这期内容会提供极高密度的认知框架。 👨‍⚕️ 本期嘉宾本期为 Dwarkesh Patel 单人音频论文，无嘉宾。Dwarkesh 是硅谷知名播客《Dwarkesh Podcast》的主持人，以与顶尖 AI 研究者、企业家和思想家的深度对话闻名。他擅长将复杂的技术概念转化为清晰的逻辑链条，其个人博客和音频论文在 AI 社区中具有广泛影响力。 ⏱️ 时间戳开场与核心问题 00:00 欢迎收听跨国串门计划 00:30 本期克隆节目介绍：Dwarkesh Patel 个人深度音频论文 00:53 核心问题：AI 训练的下一个范式与持续学习当前训练范式的赌注与缺陷 01:47 各大实验室押注的重大研究方向：RL 环境训练 02:09 当前范式的根本缺陷：数据低效与缺乏持续学习 02:32 模型样本效率只有人类的百万分之一 03:05 持续学习可能根本不需要？上下文学习的替代方案 03:43 架构创新让上下文窗口接近无限大可验证性 vs 可磨练性 03:55 为什么计算机使用进展比编程慢这么多 04:28 被低估的原因：光有可验证性不够 04:49 可磨练性的定义：确定性、可重放的模拟器 05:04 编程 RL 环境的构建方式 05:21 计算机使用无法大规模并行 rollout 的原因 06:02 计算机使用缓慢揭示的深层教训 06:29 无法构建模拟器的领域：创业、诉讼、选举 07:06 非稳态环境是 RL 的开放问题 07:14 世界需要样本效率才能精通 RLVR 能泛化到真实世界吗 07:49 RLVR 会泛化的赌注 08:23 泛化能力是一个实证问题 08:40 Dario 的暗示：短时间尺度训练不一定泛化到长时间尺度 09:30 即使上下文内经验足够，不存回权重也是浪费 09:44 推理算力占 30%-50%，对改进模型无贡献 10:13 天才研究生从不实习的隐喻持续学习的核心挑战 10:33 持续学习必须回到权重里 10:43 人类大脑不在参数和激活间划界限 11:00 自闭症天才的高保真记忆与抽象能力削弱 11:20 人类持续学习的本质：把直觉凿回权重 11:30 梯度更新的样本效率极低 11:41 Cursor 的在线学习案例 12:12 每份工作、每家公司都不同，需要个性化学习 12:44 样本效率与持续学习是深度关联的问题 13:06 架构并非根本瓶颈损失函数与新的训练方法 13:27 瓶颈也许在于损失函数 13:42 On-Policy 自蒸馏技术介绍 14:14 OPSSD 优于 RLVR 的两个原因 14:50 OPSSD 也优于监督微调 15:17 RL 训练擅长精准更新，避免灾难性遗忘 15:41 RL 每个样本学得少，但这是好事 16:08 OPSSD 解决样本效率问题 Dreaming：第四个扩展维度 16:18 Dreaming 的猜想：AI 构建现实模拟器 16:33 AlphaZero 与 Efficient Zero 的历史 17:03 模型在“脑海”里玩模拟游戏 17:22 构建世界模拟器的巨大困难 17:32 继预训练、RL、推理时计算后的第四维度 18:04 /dream 指令：消耗海量算力构建电子游戏版现实 2027-2028 年的可能图景 18:13 持续学习的未来情景 18:23 RLVR 产出的 Agent 能迅速找到方向 18:44 把 Agent 放到真实世界做实际工作 18:55 一周密集协作后蒸馏学到的内容 19:32 技能范围通过持续学习不断扩展 19:41 预训练、RLVR、持续学习的递进关系 20:03 AI 进步的主要方式将转向部署后学习 20:16 你每次互动，AI 都变得更聪明 🌟 精彩内容 💡 天才研究生从不实习 Dwarkesh 用一个精准的比喻揭示了当前训练范式的荒诞：我们花了巨大算力训练出极其聪明的模型，却只让它们在人工构造的 RL 环境里做“课堂案例研究”，从不允许它们从真实世界的部署经验中学习。最有价值的训练信息恰恰在部署阶段才会显现。 “我们就像有个天才研究生，却从不让他去真正实习。我们只是一直在 RL 环境训练里，给他越来越多的课堂案例研究。” 💡 可验证性不够，还要可磨练性很多人困惑为什么 AI 在编程上突飞猛进，在计算机使用上却进展缓慢。Dwarkesh 指出，一个领域光有可验证的正确答案是远远不够的，还必须能构建出确定性、可重放、可大规模并行的模拟器。这解释了为什么很多现实世界技能难以通过当前范式训练。 “一个领域光有可验证性是不够的。它还必须具备高度的可磨练性。” 💡 人类持续学习的本质是压缩与模型在上下文窗口中高保真存储信息不同，人类学习的关键在于把经验压缩成直觉和全局知识，凿回神经权重里。那些能记住海量细节的自闭症天才，反而在抽象理解上存在困难。 “人类的持续学习，重点不在于把所有观察到的东西都挂在嘴边，而更多是把正确的直觉和全局知识凿回到权重里。” 💡 RL 学得少反而是优势监督学习试图让模型完美复现所有观察到的数据，但这会导致灾难性遗忘。RL 训练每次只改动极少数参数，精准聚焦于真正影响结果的地方。这种“学得少”的特性，恰恰是持续学习所需要的。 “RL 每个样本学到的信息比监督学习少得多。但这可能是好事，而不是坏事。你只对模型做最必要的改动来达成结果，绝不多改。” 💡 你每次互动，AI 都变得更聪明当持续学习真正实现后，AI 进步的主要方式将不再是发布前的集中训练，而是来自部署后与全世界所有用户的所有互动中积累的经验。这是一个与今天完全不同的 AI 进化范式。 “你每次和 AI 互动，它都会变得更聪明。这不仅是因为它从你之前的会话中学习了，也因为它从和世界上所有其他用户的所有互动中学习了。” 💡 Dreaming：第四个扩展维度 Dwarkesh 提出一个猜想性的未来：如果 AI 能构建现实世界的高保真模拟器，在“脑海”里进行海量排练，那么同样的现实时间里，AI 能经历数量级更多的模拟样本。这将成为继预训练、RL 和推理时计算之后的第四个扩展维度。 “模型花费算力来编写 RL 环境，然后针对这些环境进行训练，它排练的是那些将为特定用户在生产中实际使用的所有技能。” 💡 上下文窗口无限大也不能替代权重更新有人寄希望于上下文窗口的不断扩展来替代持续学习，但 Dwarkesh 指出这根本不可扩展，而且人类也不是这么做的。我们的头骨不会因为学得越来越多就不断变大，学习必然涉及某种压缩。 “你的头骨也不会因为一辈子学的东西越来越多就不断变大。我们学习的时候，明显存在某种压缩，这种压缩帮助我们泛化和真正理解。” ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
21分钟 · 8天前
1472
1
#604.OpenAI Noam Brown：模型评估方式，正在错过 AI 真正的能力上限
📝 本期播客简介本期我们克隆了：知名科技播客《No Priors》的节目《Why Traditional Benchmarks Fail Modern AI Models with OpenAI Research Scientist Noam Brown》原内容更新时间：2026-06-26 本期嘉宾是 OpenAI 研究科学家 Noam Brown，主持人是硅谷知名投资人、Conviction 创始人 Sarah Guo。Noam 是 AI 推理领域的先驱，也是推动“测试时计算扩展”这一概念进入主流视野的关键人物。三年前他第一次上节目时，很多人还没意识到让模型“多想想”意味着什么；三年后，推理时扩展已经成为行业最核心的竞争维度之一，但评估体系却远远没有跟上。这期节目围绕 Noam 刚发表的一篇引发广泛共鸣的文章展开，核心论点直指行业痛点：传统的静态基准测试表格已经彻底失灵。当模型的能力本质上是你投入多少算力预算的函数时，用单一数字去比较模型就变得毫无意义。Noam 用 OpenAI 内部模型推翻 Erdős 单位距离猜想的案例说明，当前这代模型的能力上限远未被充分探索——如果你愿意花 10 万美元的推理预算，可能早在几个月前就能做出突破性成果。如果你关心 AI 评估体系的未来、测试时计算的真实潜力、递归自我改进的进展节奏，以及前沿实验室之间的竞争格局，这期对谈会提供非常一手、非常诚实的内部视角。 👨‍⚕️ 本期嘉宾 Noam Brown，OpenAI 研究科学家，AI 推理与测试时计算扩展领域的先驱人物。他在加入 OpenAI 之前，曾在 Meta AI（原 Facebook AI Research）领导 Libratus 和 Pluribus 等扑克 AI 项目，后者是首个在六人无限注德州扑克中击败人类顶级玩家的 AI。Noam 长期关注如何让模型在推理阶段“思考更久”以获得更好的结果，这一理念如今已成为前沿模型能力提升的核心路径之一。 ⏱️ 时间戳开场与节目背景 00:00 欢迎收听跨国串门计划 00:37 本期克隆节目介绍：《No Priors》与 Noam Brown 对谈 00:55 Noam 关于测试时计算的核心观点预览 02:27 Sarah Guo 开场介绍 Noam Brown 基准测试为什么失灵了 03:12 Noam 写文章的动机：5.5 发布后的基准测试争议 03:44 传统基准测试表格的问题：只给单一数字 04:14 5.5 在基准测试上表现不佳的真正原因 04:46 为什么不让模型思考更久？平台期太遥远 05:09 GPT-3 时代 vs 现在：模型可以思考数周 05:50 正确的评估方式：按预算或绘制性能曲线安全评估的盲区 06:32 网络安全评估：1 亿 token 预算下性能仍在提升 07:01 研究方向：用低预算预测高预算下的性能 08:16 刷榜问题：组合模型很容易做出好看的成绩 09:04 基准测试总面临被针对性优化的风险 09:24 应对办法：保留不公开的私有测试集用扑克求解器测试模型推理能力 09:48 Noam 的个人评估方式：做扑克机器人 10:24 早期模型到 5.2 的演进：河牌求解器 11:01 5.2 的缺点：爱糊弄人 11:20 模型糊弄人的具体案例：92 美元 vs 100 美元 11:47 5.5 的飞跃：基本可以零样本完成 11:58 预测：六个月内模型可能完成整个博士论文安全评估中的“房间里的大象” 12:21 安全评估与测试时计算的关系 12:40 责任缩放政策与准备框架的背景 13:11 这些框架建立时测试时计算还不是大事 13:33 核心问题：模型能力是你投入预算的函数 13:55 现有政策没有真正解决预算评估问题 14:13 正视这个被假装不存在的问题模型发布周期与能力上限的探索 15:09 模型越来越强，能运作的时间跨度越来越长 16:11 发布周期两三个月，没人真正知道能力上限 16:52 slash goal 发布后人们才意识到长期任务的重要性 17:07 实验室在发布前充分评估模型非常困难推翻 Erdős 单位距离猜想的故事 17:35 OpenAI 内部模型推翻 Erdős 单位距离猜想 18:10 在很低预算下模型就找到了反证 18:32 用 5.5 加通用脚手架也能得出反证 19:01 成本估算：1,000 到 100,000 美元 19:09 本来有人可以更早用通用模型做到等待下一个模型 vs 充分探索当前模型 19:32 值不值得在当前模型上做大量实验 19:41 每个发布周期成本下降 10 到 100 倍 19:52 “等下一个模型发布就行”的梗 20:18 OpenAI 刻意不去遍历所有数学开放问题 20:42 重点应该放在做出更强的模型递归自我改进与快速起飞 21:18 研究方向与资源分配的变化 21:30 澄清：给极高推理预算不等于全面超级智能 21:49 有些基准测试给再多预算也不会进步 22:51 研究品味目前还不太好 23:28 模型能优化算法但想不出更好的算法 24:11 每次新版本研究品味都会变好一些递归自我改进的节奏 24:32 模型加速了一些事情，另一些没有 24:44 被没加速的事情卡住 24:52 渐进起飞而非一夜之间的智能爆炸 25:28 大规模测试时计算意味着被时间卡住 25:48 时间本身成为最大的瓶颈多智能体与知识积累 26:08 多智能体探索得还不够 26:28 小规模下很难做好多智能体研究 26:40 人类文明的类比：数十亿人长时间思考与积累 27:12 AI 模型还做不到有机的知识积累与分享 27:27 Multibook 和 OpenCLAW 预示了未来方向前沿竞争格局 27:57 三家前沿实验室之间的竞争 28:26 竞争非常激烈 28:28 模型正在加速研究人员的工作 28:45 所有前沿实验室都认识到利害关系和风险 29:05 竞争之外也可以一起走向积极结果给用户的建议与行业共识 29:22 Noam 鼓励大家重新信任模型输出 29:49 日常使用案例：税务建议、购房文件 30:05 模型已经到了可以信任甚至比人更可靠的程度 30:14 研究社区里还没被充分理解的事 30:34 三年前的“愤愤不平”与现在的共识状态 30:54 写文章的动机：打破糟糕的均衡 31:23 所有人都知道表格不好但没人愿意打破路由层与模型评估 32:01 专注特定领域的公司：路由层的价值 32:47 路由与基准测试的 x 轴问题 33:01 模型间共识确实能获得更好表现 33:07 关键问题：让单个模型思考更久会不会更好 33:36 路由可能更好但需要控制测试时计算量 🌟 精彩内容 💡 基准测试表格已经彻底失灵 Noam 指出，传统模型发布时那张 x 轴是基准测试、y 轴是分数的表格，在测试时计算时代已经毫无意义。因为模型的能力不是固定值，而是你投入多少算力的函数。不控制思考时间就对比模型，就像不控制车速就对比油耗。 "如果你在纸面上看 5.5 和 5.4 之间的差异，它确实有提升，但不是巨大的提升。等他们上手一用，看法就变了。" 💡 模型可以思考数周，平台期远未到来 GPT-3 时代模型思考几秒就到瓶颈，但现在的模型如果搭好框架，可以在某些任务上持续进步数周甚至数月。这意味着我们从未真正看到过当前模型的能力上限。 "如果你给它们搭建好合适的框架，它们可以思考数周，在某些基准测试上性能才会达到平台期。" 💡 安全评估在假装这个问题不存在现有的安全评估框架大多建立在 ChatGPT 时代，那时候测试时计算还不是大事。但现在模型的能力是你投入预算的函数——一千万美元预算能做的事远超十美元预算。该在什么预算下评估模型的安全性？这个问题一直被回避。 "现有的准备框架和责任缩放政策，并没有真正考虑测试时计算量。问题在于，我们现在所处的世界，模型的能力基本上是你投入多少钱的函数。" 💡 推翻数学猜想的成本比你想象的低 OpenAI 用内部模型推翻了 Erdős 单位距离猜想，成本非常低。更惊人的是，用 5.5 加通用脚手架也能做到，成本大概在 1,000 到 100,000 美元之间。这意味着很多突破性成果其实早就可以实现，只是没人愿意花这个预算去试。 "本来有人可以在我们之前就用通用模型推翻 Erdős 单位距离猜想。只是没有人充分探索过，如果我把价值 100,000 美元的算力砸进 5.5，会发生什么？" 💡 时间本身成了最大的瓶颈 Noam 认为不会出现一夜之间的智能爆炸，因为模型极度依赖大规模测试时计算来达到最高智能。需要运行足够久才能做出真正强大的东西，这意味着时间本身成了瓶颈。这也是为什么所有研究人员都在拼命工作。 "如果需要那么多测试时计算才能解锁模型的全部能力，那就意味着你被时间卡住了。事情只能快到一定程度。" 💡 模型还做不到人类那种知识积累人类文明的力量不在于个体在过去五万年里变聪明了，而在于数十亿人长时间思考并在彼此知识上构建。AI 模型目前还做不到这一点——它们诞生、存在于短上下文窗口、然后消失。 "这是一种非常有机的、涌现出来的特性，就是人类能够积累知识、分享知识，并在此基础上继续构建。我们现在在 AI 模型身上还看不到这一点。" 💡 所有人都知道基准测试表格不好，但没人愿意打破 Noam 写文章的深层动机是打破一种“糟糕的均衡”：每个实验室都知道静态表格有问题，但因为外界期望看到表格、因为所有人都在发布表格，就没人敢第一个改变。 "所有人的反应是，外界期望我们发布那个表格。那为什么外界会期望发布表格呢？因为每个人都在发布表格。于是你就陷入了一种糟糕的均衡。" ``` 🌐 播客信息补充本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight
35分钟 · 9天前
1671
2

这是一档使用 AI 技术来将英文播客翻译为中文播客的节目～在翻译的同时，也能保留原有声线，用中文听懂外语播客！