

#579.普通人如何看懂 AI 投资机会,泡沫争议下的科技周期突围📝 本期播客简介 本期我们克隆了:投资播客《Invest Like The Best》Why the AI Boom Is Just Getting Started 原内容更新时间:2026-06-09 本期节目中,主持人 Patrick O'Shaughnessy 对谈 Whale Rock Capital 创始人 Alex Sacerdote,围绕一个极具争议的问题展开:AI 热潮到底是已经过热,还是才刚刚开始? Alex 长期专注科技成长股投资,他用一套非常清晰的框架理解过去二十多年的科技周期:先找到技术采用的 S 曲线,再判断谁拥有真正的竞争优势,最后寻找市场尚未充分理解的盈利能力。在他看来,AI 是他职业生涯中见过的最大 S 曲线,甚至可能不再是传统的 S 曲线,而是一条近乎直线上升的“L 曲线”。 这期节目从 Anthropic 这笔高确信度投资切入,讨论基础模型为什么可能形成寡头格局,Claude Code 为什么让编程市场突然爆发,企业 AI 为什么渗透率还不到 1%。随后,Alex 系统讲解了他如何用 S 曲线投资 Apple、Amazon、Tesla、Nvidia,也解释了为什么传统软件公司可能面临预算挤压、席位收费压力和 AI 原生公司的挑战。 更重要的是,他并没有只停留在“AI 很大”的宏大叙事,而是深入拆解了芯片、内存、PCB、光纤、电源、液冷服务器、数据中心网络等基础设施环节,解释为什么 AI 正在让原本商品化的硬件行业重新拥有技术壁垒和定价能力。 如果你关心 AI 投资、科技周期、芯片产业、软件公司命运,或者想理解专业成长股投资人如何研究复杂新趋势,这期节目会是一堂非常完整的 AI 投资框架课。 👨⚕️ 本期嘉宾 Alex Sacerdote,Whale Rock Capital 创始人兼投资组合经理。Whale Rock 是一家专注科技、媒体和电信领域的投资机构,长期研究科技成长股、私营科技公司与全球大型科技平台。Alex 曾在 Fidelity 工作,长期用技术采用周期、竞争优势和长期盈利能力来寻找科技投资机会,代表性研究领域包括 Apple、Amazon、Tesla、Nvidia、Stripe、Anthropic、OpenAI 等。 ⏱️ 时间戳 00:00 开场 & 播客简介 AI 热潮为什么可能才刚开始 01:35 Anthropic:为什么它是 Alex 最高确信度的投资 02:38 新计算范式:AI 技术栈从电力、芯片到模型和应用 03:52 基础模型层:从 60 家竞争者走向三强寡头格局 05:56 编程爆发:Claude Code 如何成为企业 AI 的第一块大市场 07:00 编程市场测算:两千万程序员背后的五千亿美元机会 08:03 从辅助写代码到 Agentic 编程:AI 编程能力的拐点 09:00 模型不是大宗商品:Anthropic、Google、OpenAI 的差异化 09:52 API 周围的产品生态:为什么 Anthropic 像早期 AWS 10:40 企业 AI 渗透率:真正使用 AI 的知识工作者可能只有十个基点 12:13 L 曲线:为什么企业 AI 可能直线式上升 12:44 算力短缺:大规模采用到来前,全球算力已经不够 公开市场投资人如何进入私营公司 13:08 从公开市场到私募投资:如何拿到 Anthropic 仓位 14:07 尽调 Anthropic:管理团队、代码质量和商业计划兑现 14:52 90 页研究报告:用 Claude Code 反向研究 Claude Code 15:12 独角兽市场:为什么私营科技公司已经无法忽视 16:10 Stripe 案例:为什么研究 Adyen 必须研究 Stripe 17:05 疫情期间买入 Stripe:如何用有限信息推算私营公司价值 18:04 私募投资人的优势:愿意长期持有,并陪伴公司上市之后 S 曲线投资框架 18:36 三件事:S 曲线、竞争优势、被低估的盈利能力 19:26 指数增长的误判:为什么市场太关注下个季度 20:47 技术采用:从早期存在到真正引爆通常需要很久 21:35 iPhone 案例:当所有采用障碍被移除,需求会像火箭一样上升 22:01 Tesla 案例:价格、续航和供应链如何触发电动车拐点 22:41 S 曲线有多高:为什么 TAM 决定你能持有多久 23:32 AWS 案例:隐藏在 Amazon 里的巨大企业 IT S 曲线 24:02 AI 是最大的 S 曲线:互联网、移动、云、电商之后的新周期 24:50 什么时候卖:渗透率到 30% 到 40% 后,指数增长通常减弱 25:14 Apple 的教训:错过后续复利增长,但最大年份在 0 到 50% 渗透率 25:57 什么时候买:战略拐点靠直觉、零散证据和模式识别 26:43 移动游戏信号:一个中国小孩玩手机游戏带来的投资洞察 27:25 企业软件信号:Gartner 会场里站满人的房间 28:01 错过早期也没关系:真正大的 S 曲线会持续很久 28:21 S 曲线斜率:收音机和洗碗机代表两种技术采用速度 29:15 B2B 像洗碗机:需要接入系统,所以采用更慢 30:08 AI 的特殊性:浏览器一打开就能用,因此采用可能更快 护城河、赢家与基础模型格局 30:47 先找 S 曲线,再找真正有竞争优势的公司 31:40 数字世界的护城河:网络效应、行业标准、规模与平台 32:33 关键知识产权:从 Qualcomm、ASML 到基础模型公司 33:22 品牌与获客成本:为什么强品牌本身就是商业模式 33:50 Amazon 和 AWS:战争开始前就已经赢了 34:20 没有护城河也会输:RIM、Palm、Nokia 的反面案例 35:15 AI 的复杂性:高风险,但潜在市场高达三到五万亿美元 35:43 Anthropic 的护城河:企业品牌、关键 IP 和融资能力 36:24 递归式改进:编程领先如何反哺模型能力 37:03 企业市场与消费者市场:谁能更快变现 37:52 领先者复利:互联网公司里“领先者更大更快”的规律 38:21 范式转移风险:AOL 和 Netscape 的历史提醒 AI 对软件公司的冲击 38:43 传统企业软件面临什么:AI 能否重做 ERP 和 CRM 39:40 从看多软件到卖出软件:为什么 Alex 改变判断 40:15 AI 产品无力变现:现有软件公司早期 AI 产品的问题 40:39 软件像马车,AI 像传送器:技术代差带来的颠覆风险 40:45 CIO 预算迁移:钱可能流向 Anthropic token,而不是传统软件 41:18 四重压力:预算、涨价、席位收费和招聘冻结 41:49 销售动作变化:AI 需要前线部署工程师,而不是卖固定系统 42:08 客户自建风险:AI 原生公司可能挑战每一个软件巨头 43:15 新版四十法则:AI 收入占比 + 品类市场份额 44:20 软件公司的 AI 占比太低:离真正改变增长轨迹还很远 44:33 反转可能性:AI 也可能让 Slack 等平台更重要 45:22 无界面软件:Agent 直接进入数据层,软件公司可能被降级成数据库 45:56 CRM 的两种命运:失去界面,或成为 Agent 的工作场所 芯片、硬件与 AI 基础设施 46:13 数据中心四十年:从 X86 到云,硬件长期商品化 47:04 AI 工作负载:每年十倍增长,把硬件推到物理极限 47:31 硬件行业去商品化:AI 带来的芯片复兴 48:15 高带宽内存:从商品内存变成关键技术部件 48:45 Celestica 案例:从合同制造商到 Google TPU 服务器关键供应商 49:35 AI 服务器:一台 20 到 30 万美元,变成关键基础设施 50:12 网络升级:以太网从七年一换变成每年升级 50:40 AI 网络份额:Celestica 在云端以太网交换机的优势 51:00 PCB 和材料:AI 服务器需要 40 层电路板 51:45 从低增长到高增长:供应链公司如何获得收入和利润率双提升 52:04 Corning 光纤:一个数据中心的光纤可绕地球四圈半 52:30 Scale out、scale across、scale up:AI 数据中心三种连接需求 53:10 机架内部连接:从铜缆走向光纤的潜在机会 53:20 电源升级:Nvidia 每代芯片让用电量大幅增加 53:58 供应短缺:DRAM、NAND、PCB 已经出现 30% 左右缺口 市场为什么会错过,以及 AI 风险在哪里 54:20 变化率比绝对值更重要:AI 占比从 10% 到 30% 的加速效应 54:48 为什么别人没看对:这套框架看似简单,但执行很难 55:30 股价涨了也难买:没有全局视角就会被泡沫叙事吓退 56:02 半导体分析师为何错过:只看芯片,没看懂基础模型层 56:39 最大担忧之一:公众和政府对 AI 的负面情绪 57:03 监管风险:数据中心禁令与 AI 悲观情绪 57:20 模型进步放缓:如果前沿模型撞墙,开源可能追上 57:55 对芯片公司反而未必坏:谁赢不重要,只要有人跑模型 58:20 大玩家掉队风险:如果部分模型公司退出,算力需求可能受影响 AI 应用层为什么还没完全清晰 58:48 为什么不是优先投应用层:应用通常会晚一点成熟 59:20 基础模型和应用边界:应用能否挡住模型公司的进攻 59:48 企业软件应用还未真正爆发:生态仍然不清楚 01:00:18 Sierra 案例:Brett Taylor 的 AI 客服应用公司 01:00:45 应用层需要时间:真正成熟可能发生在最初三四年之后 AI 时代的研究方法 01:00:50 Whale Rock 的研究奖项墙:什么样的研究能脱颖而出 01:01:42 AI 是否改变研究:能提升效率,但还不能取代分析师 01:02:05 Scuttlebutt 方法:走出去见公司、客户、供应商和竞争对手 01:02:46 AI 能快速学习复杂领域,但不能替你判断未来 01:03:11 分析师的新价值:不只是记录事实,而是给出洞察 01:03:36 AppLovin 案例:真正的研究来自长期跟踪、行业会议和关系网络 01:04:26 投资人朋友圈:菲利普·费舍式的想法交换 01:04:57 三脚架信心:自己、分析师、尊重的外部投资人同时看好 Whale Rock 的产品与研究机器 01:05:18 从多空基金到只做多基金:产品体系如何演化 01:06:00 私募敞口:为 LP 提供不同参与方式 01:06:26 Mega Cap Tech Fund:为什么大型科技股存在结构性低配 01:07:10 捐赠基金困境:为什么很多机构错过最大科技公司 01:08:27 大盘科技股也有 Alpha:Google 是赢家这件事需要更多人意识到 01:09:20 全球市值前三十:从最大公司里挑出最好的十二三家 01:10:08 Whale Rock Learning Machine:研究机器才是公司的核心资产 01:10:44 知识复利:每年两千五百到三千场管理层会议 01:11:03 同一套研究引擎:同时支撑公开市场和私募投资 人生影响与结尾 01:11:14 最善良的一件事:父亲加入 Whale Rock 帮他创业 01:12:00 父子共事六年:父亲负责监督、募资和支持 01:12:31 一位真正的绅士:父亲作为导师影响了许多人 01:13:00 谦逊、智慧与温暖:Alex 对父亲的回忆 01:13:32 结尾致谢 🌟 精彩内容 💡 AI 不是 S 曲线,可能是 L 曲线 Alex 认为,AI 的真正企业级采用还处在极早期。虽然现在已经有大量用户体验过 AI,但真正把 AI 接入工作流、构建技能、让 Agent 执行任务的人,可能只占全球知识工作者的十个基点左右。企业 AI 或企业应用 AI 的渗透率还不到 1%,但算力已经不够,这意味着大规模采用还没来,基础设施已经被需求压满。 “企业 AI,或者说企业应用 AI 市场,渗透率还不到百分之一。我们以前总讲 S 曲线,但这一次我们叫它 L 曲线,就是一路直着往上。” 🚀 Anthropic 与编程市场的爆发 Alex 解释了为什么 Anthropic 成为他的最高确信度投资。关键不只是 Claude 模型本身,而是 Claude Code 让编程进入接近 Agentic 的阶段。过去 AI 可能只是帮程序员写一小段代码、找一个 bug,而现在越来越多开发者可以用自然语言指挥 AI 完成大量编程工作。Alex 甚至估算,全球约两千万程序员,如果高强度使用 AI 编程工具,单这一块就可能是一个五千亿美元市场。 “Karpathy 去年说,编程工具大概能写百分之二十,剩下百分之八十还是要手写。最新模型出来以后,这个比例反过来了。” 📈 S 曲线:科技投资的核心地图 Alex 的投资框架可以概括为三件事:S 曲线、竞争优势、被低估的盈利能力。当技术采用进入正确位置,销量会指数级增长;如果商业模式足够好,利润也会指数级增长。但市场通常只看下一个季度,很难相信两三年后的盈利会发生巨大变化。因此,理解 S 曲线的人,可能以极低的真实长期市盈率买到最好的公司。 “这个世界不会按指数级去思考。大家太关注下一年,或者下一个季度。” 🏰 没有护城河,踩中大趋势也会输 Alex 强调,S 曲线只是第一步,真正重要的是找到其中拥有竞争优势的赢家。智能手机是巨大的 S 曲线,但 RIM、Palm、Nokia、HTC、LG、Motorola 都没有成为最终赢家。科技公司也可以拥有非常强的护城河,包括网络效应、行业标准、规模优势、平台地位、关键知识产权和品牌。 “如果你没有竞争优势,哪怕你处在史上最好的 S 曲线里,也可能会输。” 🧨 AI 对软件公司的冲击 Alex 曾经大量持有软件公司,但在 AI 周期里,他几乎卖掉了大部分应用软件。他认为,传统软件公司面临几重压力:AI 产品暂时没能真正收费,CIO 预算转向基础模型和 token,按席位收费可能受招聘冻结影响,AI 原生公司也可能重做很多企业软件。传统软件不会立刻消失,但它们的增长逻辑已经被挑战。 “旧的软件方式,就像用笔和纸,或者像马车。新的软件方式,像喷气发动机,甚至像《星际迷航》里的传送器。” 🔌 AI 让硬件行业重新拥有壁垒 过去几十年,数据中心硬件高度商品化。但 AI 工作负载每年十倍增长,把芯片、内存、网络、PCB、电源、液冷、光纤等每个环节都推到物理极限。结果是,原本低增长、低利润率的供应链公司,突然变成必须提前多年和云厂商、芯片公司共同设计路线图的关键基础设施。 “我们把这叫作硬件行业的去商品化。” 🧠 AI 不能替代真正的投资判断 在研究方法上,Alex 认为 AI 可以帮助写纪要、快速学习复杂领域、整理季度业绩,但还不能替代分析师的核心工作。真正的投资研究仍然需要见公司、见客户、见供应商、见竞争对手,建立关系,理解管理层,判断未来会怎样变化。AI 可以成为很好的记者,但还不能成为真正的投资判断者。 “不要只是当一个记者。AI 可以是很好的记者,但它还不能真正判断未来。” ❤️ 父亲给予的创业支持 节目最后,Alex 回忆了父亲对他的帮助。父亲曾在 Goldman Sachs 工作四十一年,本可以退休,却选择加入刚成立的 Whale Rock,帮助他募资、监督和搭建公司。两人共事六年,从未提高过嗓门。Alex 说,如果自己能成为父亲一半那样的人,就已经彻底赢了。 “如果我能成为他一半那样的人,我就已经彻底赢了。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#578.女性如何稳住更年期健康,在医学误解与激素争议中夺回主动权📝 本期播客简介 本期我们克隆了:《Huberman Lab Podcast》【Andrew Huberman: How to Navigate Menopause & Perimenopause for Maximum Health & Vitality | Dr. Mary Claire Haver】 原内容更新时间:2024-06-03 本期节目是一次关于围绝经期、绝经期与女性长期健康的系统梳理。主持人 Andrew Huberman 邀请妇产科医生、女性健康专家 Mary Claire Haver,从卵巢功能衰退、雌激素波动、心理健康变化、睡眠问题、潮热、内脏脂肪、肌肉流失、骨密度,到激素替代治疗 HRT 的争议与误解,几乎完整拆解了女性从三四十岁开始就应该了解的一套健康地图。 Haver 医生最核心的观点是:更年期不应该只被理解成“月经停止”或“潮热”,它是影响大脑、心脏、骨骼、肌肉、皮肤、泌尿生殖系统和代谢健康的全身性转变。她也指出,围绝经期往往在最后一次月经前 7-10 年就开始,很多女性在出现焦虑、脑雾、睡眠中断、心悸、关节痛和月经混乱时,并不知道这些可能与激素波动有关。 这一期最重要的现实意义在于:女性并不是只能被动忍受更年期。通过更早识别症状、与医生进行充分知情讨论、合理考虑 HRT、提升蛋白质和纤维摄入、进行抗阻训练、保护骨密度、管理睡眠与酒精摄入,女性可以更主动地穿越围绝经期、绝经期以及之后几十年的人生。 👩⚕️ 本期嘉宾 Mary Claire Haver,医学博士,委员会认证妇产科医生,围绝经期、绝经期和女性健康领域专家。她是《The New Menopause: Navigating Your Path Through Hormonal Change With Purpose, Power, and the Facts》的作者,也是 Galveston Diet 的创始人。她长期致力于更年期医学教育、女性代谢健康、激素治疗科普和女性健康研究倡导。 ⏱️ 时间戳 00:00 开场 & 播客简介 重新理解更年期 04:14 更年期不只是“最后一次月经”:为什么传统定义不够用 06:05 围绝经期可能提前 7-10 年开始:激素系统进入“混乱区” 08:04 为什么围绝经期很难靠一次抽血诊断 10:15 女性健康研究为什么长期缺位:围绝经期研究少得惊人 围绝经期:身体和大脑的混乱信号 11:40 “大脑不喜欢这种混乱”:焦虑、抑郁、脑雾与执行功能下降 13:35 五分之一女性可能因绝经相关症状离职:被低估的职业影响 15:02 月经异常、疲劳、关节痛、心悸:为什么很多症状会被误诊 16:44 围绝经期该做什么检查:不是只查激素,也要排除甲状腺、自免和贫血 17:04 哪些因素会让绝经更早:吸烟、手术、炎症、遗传与族群差异 19:30 27岁也可能进入卵巢功能衰退:早发性卵巢功能不全的风险 避孕、生育与女性健康误区 21:23 避孕药、HRT 与剂量差异:抑制排卵还是稳定大脑信号 24:27 “最好的避孕方式是输精管结扎”:避孕责任为何总落在女性身上 25:46 宫内节育器如何工作:停止月经不等于停止排卵 26:32 避孕会推迟绝经吗?答案是可能,但幅度很有限 27:47 冷冻卵子不会提前绝经:为什么取卵不消耗额外卵巢储备 29:27 为什么女性健康话题总被误解:研究不足、沟通不足与互联网噪音 女性健康研究的结构性缺口 30:41 NIH 更年期经费占比极低:女性生命三分之一被忽视 31:03 很多慢性病研究没有真正分析性别差异 32:19 女性健康法案、医学教育与 WHI 之后的一代断层 33:31 普通人如何推动研究经费:给议员打电话也可能有效 营养、肌肉与代谢健康 35:23 如果能告诉35岁的自己:先把饮食和炎症管理做好 36:14 纤维是底层工具:每天至少25克,理想约30克以上 37:08 吃出颜色多样性:植物化学物质与肠道微生物组 37:18 蛋白质摄入不足:女性需要为肌肉和长寿而吃 37:45 内脏脂肪才是关键:绝经后身体组成如何改变 38:50 体重不是全部:肌肉流失与内脏脂肪增加才是风险核心 39:42 女性蛋白质目标:从50克提高到80-120克的现实意义 41:05 问问母亲何时绝经:遗传是重要线索 绝经后的症状与身体指标 41:40 几乎每个女性都会经历身体组成变化 42:08 如何估算内脏脂肪:DEXA、InBody 与腰臀比 44:10 睡眠、疲劳与“我不像自己了”:绝经前后的心理韧性变化 45:14 眩晕、耳鸣、皮肤痒、腹胀:那些不常被归入更年期的症状 45:30 肠道微生物组也会变化:从“女性型”走向更接近“男性型” 46:08 发酵食物、酸奶、味噌与益生菌研究 Galveston Diet 与间歇性禁食 46:54 地中海饮食和 Galveston Diet 有什么不同 47:24 为什么医生也缺营养学教育:从“吃健康点”到烹饪医学 48:34 Galveston Diet 的诞生:抗炎营养、低加工、低糖与禁食 49:18 间歇性禁食的利与弊:如果吃不够蛋白质,窗口太短反而成问题 50:30 每餐都要有蛋白质:不要把蛋白质都堆到晚餐 从“瘦”到“强壮” 51:10 为什么女性长期低估肌肉:以前只为瘦而吃和运动 51:35 抗阻训练的转变:从马拉松、有氧到每周三四次力量训练 52:35 每个人都该做抗阻训练:尤其是围绝经期和绝经后的女性 53:28 如果能回到二十年前:选择强壮,而不是只追求瘦 潮热、睡眠与 HRT 54:00 潮热到底是什么:体温调节中枢被重新设定 54:52 睡眠被打断会放大全部问题 55:14 潮热的金标准治疗:把雌激素还给身体 55:38 HRT 为什么被妖魔化:医学史上一次严重误读 56:05 WHI 研究的关键问题:研究对象平均已经63岁 58:22 相对风险与绝对风险:乳腺癌数据到底该怎么看 59:56 年龄窗口很关键:50-59岁开始 HRT 的心血管数据 01:00:29 “雌激素更擅长预防,而不是治疗” 01:02:42 雌激素不是致癌物:为什么叙事被简化成“雌激素危险” 01:03:35 今天很多女性仍只拿到抗抑郁药,而不是充分的更年期照护 女性不是“小号男性” 01:04:28 为什么更年期不该全丢给妇产科医生 01:04:45 “我们是女性,不是长了乳房和子宫的小号男性” 01:05:38 心血管疾病中的性别差异:女性症状更容易被心理化 01:06:30 更年期后胆固醇变化:LDL 升高、HDL 降低 01:06:58 他汀、HRT 与女性一级预防的复杂性 HRT 怎么用:形式、剂量与个体化 01:07:04 口服 vs 非口服:为什么 Haver 更偏好经皮给药 01:08:18 贴片、凝胶、喷雾、阴道环:不同剂型的选择 01:09:54 Meno Posse:医疗专业人士如何推动更年期照护公平 01:10:48 什么时候开始 HRT:症状明显时,还是更早? 01:11:44 雌二醇没有统一治疗范围:根据症状而非单一数字调整 01:13:45 女性使用睾酮:为什么没有 FDA 批准选择 01:14:21 睾酮剂量与副作用:性欲、头发、声音、痤疮与毛发生长 01:15:26 睾酮和雌激素都是“人类激素”,不是单纯男女标签 孕酮、睾酮与局部激素治疗 01:16:13 更年期激素补充主要看雌激素、孕酮和雄激素 01:17:20 “生物同质”“雌激素优势”等术语为什么容易误导 01:18:11 睾酮对性欲、骨密度、肌肉和大脑可能有什么作用 01:18:47 DHEA 阴道制剂:局部转化成睾酮和雌二醇 01:20:22 外用雌激素与胶原蛋白:皮肤、弹性蛋白与衰老 01:20:47 阴道雌激素为什么非常重要:泌尿生殖综合征与尿路感染预防 01:21:35 急迫性尿失禁、压力性尿失禁与组织健康 医学教育仍然没跟上 01:22:44 WHI 的旧阴影还在吗?很多医生仍不了解最新更年期医学 01:23:16 妇产科继续教育里为什么几乎没有绝经类别 01:24:09 Haver 的自我反思:系统没有照顾好生育之后的女性 补充剂、负重背心与骨密度 01:25:28 DIM、葡萄籽、月见草等补剂:证据并不强 01:26:31 Haver 推荐的基础补充:维生素 D、纤维、肌酸、特定胶原蛋白 01:27:10 负重背心:为什么它可能是骨质疏松预防“小技巧” 01:28:03 从体重10%开始:穿着负重背心遛狗、洗碗、训练 01:30:39 骨质疏松预防组合:蛋白质、力量训练、负重背心、肌酸、胶原蛋白 01:31:11 胶原蛋白不是完整蛋白,但一些研究显示它可能帮助皮肤和骨密度 01:34:33 髋部骨折的死亡风险:为什么骨密度必须提前保护 感官、禁忌症与其他女性健康问题 01:35:59 干眼、冻结肩、眩晕、耳鸣:HRT 可能影响的其他症状 01:37:03 哪些情况不适合或需谨慎 HRT:异常出血、血栓、肝病、激素敏感癌症 01:38:42 PCOS 为什么越来越常见:肥胖、胰岛素抵抗与诊断意识提升 01:39:49 PCOS 怎么治疗:避孕药、减重、GLP-1 与重新排卵 01:41:13 GLP-1 药物的机会和风险:别只减重,也要保护肌肉 01:42:04 HRT + GLP-1:部分女性减重效果可能更好 01:42:58 GLP-1 可能减少酒精、赌博等奖赏驱动行为 听众问答:HRT、睡眠、伴侣和性欲 01:45:04 60岁后还能开始 HRT 吗?先评估心血管和中风风险 01:46:29 HRT 应该用多久?没有禁忌且愿意继续,可以长期用 01:47:51 围绝经期心理健康:雌激素稳定波动可能比单纯 SSRI 更适合部分人 01:49:00 半夜醒来怎么办:潮热、孕酮、GABA 与睡眠卫生 01:49:52 酒精与睡眠:更年期后可能再也不能像过去那样耐受 01:51:00 男性如何支持伴侣:承认变化、学习知识、陪她就医 01:52:13 性欲消失怎么办:疼痛、唤起、高潮、关系与睾酮都要分别看 01:54:26 雌二醇贴片过敏怎么办:可能是胶水反应,不一定是雌二醇本身 01:55:49 针灸、草药和野山药:可能缓解症状,但不解决根本激素缺失 01:56:04 如何应对脂肪分布变化:营养、运动、减压、HRT 多因素一起做 结语 01:56:17 更年期不是被动承受:女性仍然拥有健康主动权 01:57:26 嘉宾作品、社交媒体与节目结尾 🌟 精彩内容 💡 更年期不只是月经停止,而是卵巢功能的系统性变化 Haver 医生指出,医学上把更年期定义为“最后一次月经后满一年”,但这对很多女性并不适用。真正关键的是卵巢功能衰退,雌二醇、孕酮和睾酮等激素下降,进而影响大脑、心血管、骨骼、肌肉、皮肤和泌尿生殖系统。 “我觉得用有没有月经来定义,这是个错误。” 🧠 围绝经期是“激素混乱区”,不是单纯情绪问题 围绝经期可在绝经前 7-10 年开始,激素水平出现剧烈、不可预测的波动。Haver 解释,这种混乱会影响血清素、多巴胺、去甲肾上腺素和 GABA 等神经递质,因此女性可能出现焦虑、抑郁、脑雾、执行功能下降和睡眠问题。 “大脑不喜欢这种混乱。” 🔥 HRT 的争议,很大程度来自 WHI 研究的误读 Haver 详细解释了 2002 年 WHI 研究如何被媒体简化成“雌激素会导致乳腺癌”。她强调,研究对象平均年龄约 63 岁,很多人已经离开雌激素十多年,这与刚进入绝经期就开始治疗完全不同。后续分析显示,开始治疗的时间窗口非常关键。 “雌激素更擅长预防,而不是治疗。” 💪 女性要从追求“瘦”转向追求“强壮” 绝经后真正需要警惕的,不只是体重增加,而是身体组成改变:肌肉流失、内脏脂肪增加、骨密度下降。Haver 强调,蛋白质摄入、抗阻训练、负重背心、肌酸和足够纤维,是女性长期健康的基础工具。 “如果我的终极目标是尽量久地不进养老院,那我就得拿起重量,而且是比较重的重量。” 🦴 骨质疏松不是老了才处理,而是三四十岁就要预防 Haver 特别强调骨密度的重要性。髋部骨折后,一年死亡率可能非常高,因此女性应尽早通过力量训练、负重刺激、蛋白质、维生素 D、肌酸、必要时 HRT 等方式保护骨骼。 “为什么我们要等到已经骨质疏松了,才开始下这个诊断?” ❤️ 女性健康不等于乳房和子宫健康 Haver 对医学系统提出批评:女性不是“长了乳房和子宫的小号男性”。女性对药物、心血管疾病、代谢疾病、激素变化的反应都可能不同,但过去的研究和医学教育长期没有充分纳入这些差异。 “我们是女性,不是长了乳房和子宫的小号男性。” 🌙 睡眠、酒精和孕酮:很多女性更年期后耐受力会改变 Haver 提到,许多绝经后女性发现自己再也不能像过去那样喝酒而不影响睡眠。孕酮则可能通过 GABA 相关机制帮助入睡和稳定大脑,但仍需在医生指导下使用。 “如果我选择喝超过一杯葡萄酒,那我就是在选择那天晚上不睡。” 🤝 伴侣支持也是真正的健康工具 当被问到男性如何支持正在经历围绝经期或绝经期的伴侣时,Haver 的建议很直接:承认这件事真实存在,主动学习,陪她看医生,理解她的大脑、身体和亲密关系都可能正在经历巨大变化。 “陪她一起面对。陪她去看医生,站在她身边替她争取。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#577.长时运行 Agent:开发者如何让 AI 连续干活不跑偏,模型前沿快速迁移下的工程取舍📝 本期播客简介 本期我们克隆了:AI Engineer Conference 的技术分享《Build Agents That Run for Hours (Without Losing the Plot)》— Ash Prabaker & Andrew Wilson, Anthropic 本期节目是一场非常硬核但极具实践价值的 Agent 工程分享。来自 Anthropic 应用 AI 团队的 Ash Prabaker 和 Andrew Wilson,系统拆解了一个关键问题:如果我们希望 AI Agent 不只是完成几分钟的小任务,而是能连续运行数小时、甚至几天,构建完整应用、调试复杂系统、持续自我推进,工程上到底需要做什么? Andrew 先回顾了 Claude Code 和 Agent SDK 在过去一年中的演进:从早期模型只能跑二十分钟,到如今可以在合适的 harness 下运行数小时甚至更久;从 Computer Use、MCP、skills、检查点、Agent teams,到服务端压缩和百万上下文窗口,模型能力和脚手架设计一直在彼此塑造。 Ash 则进一步分享 Anthropic 内部正在实验的长时运行 harness:将 planner、generator、evaluator 拆成独立角色,用对抗式评估器替代自我评估,让 Agent 真的打开网页、点击、测试、写批评意见,并通过一份具体的 contract 来判断“什么叫完成”。他强调,很多时候提升 Agent 能力的关键不是再加一层复杂架构,而是认真读 traces,理解模型为什么跑偏,再决定 scaffold 里哪些该保留,哪些该删掉。 这期适合所有正在做 Agent、AI 编程工具、Claude Code 工作流、自动化测试、AI 产品原型和长任务自动化的开发者、产品经理和技术创业者收听。 👨💻 本期讲者 Ash Prabaker,Anthropic 应用 AI 团队工程师,关注长时间运行 Agent、前端生成、对抗式评估器、Agent harness 和后训练实验。 Andrew Wilson,Anthropic 应用 AI 团队解决方案架构师,常驻伦敦,主要与数字原生客户和行业客户合作,关注 Claude Code、Agent SDK、企业级 AI 工作流和长时运行 Agent 的实际落地。 ⏱️ 时间戳 00:00 开场 & 本期简介 问题的提出:为什么 Agent 跑久了会失控 01:29 分享开始:Anthropic 应用 AI 团队要解决什么问题 02:17 Claude Code 的一年变化:从跑二十分钟到跑好几天 03:20 长时运行 Agent 的三大难题:上下文、规划、自我判断 04:44 两条解决路径:把能力训练进模型,或用 harness 补齐短板 Claude Code 与 Agent SDK 的演进史 05:11 Agent SDK 的核心循环:模型、工具、MCP、subagent 与权限系统 06:10 Claude 早期编程能力:Artifacts、Computer Use 与 MCP 06:56 Claude Code 的研究预览:用真实开发反馈改进模型 07:27 Opus 4 / Sonnet 4:上下文管理和任务完成能力提升 08:00 Ralph loop:在非确定世界里构建“确定性地差”的循环 09:20 Claude Code 2.0:检查点、压缩和更强的上下文意识 10:04 Haiku / Opus 4.5:子 Agent 变便宜,规划与执行可以拆分 10:27 Skills 与程序化工具调用:更高效地使用 context window 第一代长时运行 harness 11:17 从一句模糊 prompt 到持久化产物:feature list、progress、git repo 12:01 每轮只做一个功能:新上下文、冒烟测试、实现、验证、提交 12:53 Opus 4.6 / Sonnet 4.6:更 agentic 的模型与 Agent teams 14:21 模型变强后,harness 不会消失,而是会移动前沿 新的 harness 思路:把角色拆开 15:16 Ash 接棒:前沿不会缩小,只会移动 16:00 借鉴 GAN:generator 负责构建,evaluator 负责批评 16:47 为什么不要让 Agent 自己审查自己 17:30 如何设计“严格的批评者”:把品味变成可评分标准 18:45 设计、原创性、工艺感、功能性:前端质量如何量化 19:40 加入 planner:从好看的页面走向完整可用的应用 20:33 先协商“什么叫完成”:generator 与 evaluator 的 contract 21:13 为什么 contract 是 Ralph loop 缺少的关键创新 案例:同一句 prompt,结果为何天差地别 21:38 复古游戏制作器:没有 harness 时,看起来能用但实际玩不了 23:02 加上 harness 后:Retro Forge、项目对话框、Sprite 编辑器与 AI 关卡助手 24:04 evaluator 真正玩游戏:方向键、碰撞、HUD、物理循环都被测试 24:32 真实测试能抓到什么:路由顺序、删除逻辑、生产环境 bug 25:12 二十七条 contract 标准:标准模糊,批评就会模糊 调试 Agent 的真正手艺 25:44 开箱即用的 Claude 并不是好 QA:宽容偏差与迎合倾向 26:02 如何调 evaluator:读运行轨迹,找模型判断与人类判断的偏差 26:18 用 Agent 读 Agent traces:让另一个 Agent grep 日志、更新 prompt 模型变强后,harness 应该怎么变 26:39 harness 设计不是一劳永逸:要随着模型行为调整 27:05 为什么某些 context reset 可以删掉 27:47 evaluator 运行节奏的变化:从每个 sprint 跑一次,到生成后再跑 28:21 最终简化版:planner、generator、evaluator 仍是核心 28:52 DAW 音乐应用案例:更少轮次、更低成本、更完整应用 给开发者的落地建议 29:17 不必照搬 Anthropic 全套 harness:Claude Code 里的可用原语 29:40 auto mode、custom subagent、Playwright MCP、Claude for Chrome MCP、skills 30:02 五个关键 takeaway:不要自评、压缩不等于连贯、结构化交接、主观质量可评分、读 traces Q&A:可复用性、上下文与工具选择 30:51 这套 evaluator 调优是项目专属,还是可复用 secret sauce? 31:52 smart zone / dumb zone:Ralph loop 在百万上下文时代还有用吗? 33:40 Playwright MCP 与 Claude for Chrome MCP:是否应该看着模型操作浏览器? 35:00 generator-evaluator 能否无限迭代,让应用越来越好? 37:24 PM 角色是否应该回到循环中,控制范围蔓延? Q&A:模型比较、长期维护与团队协作 39:37 如何比较不同模型:Opus 4.5、Opus 4.6 与 harness 一起演化 41:06 从一次性 demo 到长期产品:留下 JSON 状态、时间戳日志和文档面包屑 42:51 Agent teams vs generator-critic:两者是竞争关系还是组合关系? 45:42 critic 应不应该看到 generator 的执行轨迹? 46:45 可追踪性怎么做:为什么 Anthropic 仍然大量手动读 trace 47:42 如何衡量 harness 质量:用细评分标准做 hill climbing 49:54 团队如何协作:共享 harness、版本控制、worktree 与未解决的可观测性问题 Q&A:human-in-the-loop 与真实生产 51:21 human-in-the-loop 应该像 sprint review 一样存在吗? 54:01 这套模式更适合 greenfield,还是已有生产项目? 55:52 读 traces 到底怎么读:为什么要完整读原始输出 57:20 结束:继续在现场交流 🌟 精彩内容 💡 能可预测地失败,比不可预测地成功更好 Andrew 在讲 Ralph loop 时提到,一个简单但重要的工程原则是:在非确定性的模型世界里,尽量构建可预测的失败模式。Ralph loop 的价值不只是“循环调用 Claude Code”,而是把任务拆开、开新上下文、持续推进,并用确定的退出条件控制风险。 “能以可预测的方式失败,比以不可预测的方式成功更好。” 🧠 模型前沿不会缩小,只会移动 Andrew 和 Ash 都强调,随着模型越来越强,harness 不会消失,而是不断演化。过去必须用多个新 context window 解决的问题,可能在新模型上通过单一长会话加压缩就能解决;过去必须拆成 sprint 的任务,新模型可能可以连续构建两小时仍保持连贯。 “前沿并不会真的缩小,它只是会移动。” ⚔️ generator-evaluator:不要让模型自己给自己打分 Ash 认为,长时间运行 Agent 的一个关键改进,是把生成器和评估器拆成独立角色。评估器不只是读 diff,而是用 Playwright 打开真实页面、点击、截图、测试,并把具体批评交回给生成器。这样可以避免模型自我评估时过于宽容、过早宣布完成。 “把一个独立的批评者调得更严格,其实是很可行的;但把一个构建者调成有自我批评能力,就没那么容易。” 📋 标准模糊,批评就会模糊 在 Retro Forge 案例中,generator 和 evaluator 最后形成了二十七条 contract 标准。Ash 强调,只有标准足够细,evaluator 的反馈才会变成可执行的问题,而不是“感觉还不够好”这种泛泛批评。 “标准模糊,批评就会模糊。generator 只会耸耸肩,然后随便改点东西。” 🎨 主观质量也可以评分 很多人认为“品味”无法评估,但 Anthropic 的做法是把它拆成设计、原创性、工艺感、功能性等维度,并用 few-shot 示例校准 evaluator 的审美。这样可以避免典型的 AI slop,比如紫色渐变、模板化布局和缺乏产品感的界面。 “如果你对东西应该长什么样有明确看法,那就逼自己把它写下来。” 🕵️ 做 Agent 的核心手艺:读 traces Ash 多次强调,调试 Agent harness 没有太多神秘秘诀,关键就是读运行轨迹。要一行一行看模型为什么这么判断,哪里和人类预期不一致,然后把这些发现写回 prompt、CLAUDE.md 或 skill。 “只有这样,你才真正知道 scaffold 里哪些部分该删,哪些部分该留。” 🧩 长期应用需要留下“面包屑” 如果一个 Agent 生成的应用未来还要继续维护,Ash 建议让 harness 把状态写入文件系统,例如 JSON 状态文件、时间戳日志、bug 记录、修复记录和文件结构说明。这样下一个 Claude Code 实例或人类开发者就能接手。 “你等于给另一个模型留下了一串面包屑,让它之后能接着往下看。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#576.Claude Code:工程师如何放大生产力,AI 重塑团队分工的通才时代📝 本期播客简介 本期我们克隆了:WorkOS: Boris Cherny: Claude Code & the Future of Engineering | Acquired Unplugged presented by WorkOS 本期嘉宾 Boris Cherny 是 Anthropic 的技术员工,也是 Claude Code 早期核心参与者之一。在这期节目中,他和 Acquired 的两位主持人 Ben Gilbert、David Rosenthal 深入聊了 Claude Code 的起源、Anthropic 内部如何使用 AI 编程工具,以及 AI 正在怎样重塑工程团队、产品团队乃至整个公司的组织方式。 这不是一场单纯关于“AI 写代码”的访谈。Boris 从 Anthropic 的 AI 安全使命讲起,解释为什么编程是模型与现实世界互动的关键入口;也分享了 Claude Code 如何从一个只能完成 10%-20% 工作的内部原型,成长为让他卸载 IDE、几个月不亲手写代码的核心工具。更重要的是,他提出了一个非常强烈的判断:工程师、产品经理、设计师、数据科学家等旧有角色边界正在合并,AI 时代会进入“通才的黄金时代”。 如果你关心 AI 编程、工程团队效率、未来组织形态,或者正在焦虑自己在 AI 时代的职业定位,这期节目会给你非常具体的参照:公司该如何分配 token 与人力?新人如何两天上手复杂代码库?非工程师如何开始发布代码?以及当产品品味也可能被 AI 追上时,人类最后应该教给模型什么。 👨💻 本期嘉宾 Boris Cherny,Anthropic 技术员工,Claude Code 早期核心参与者之一。他曾在 Meta 从事与代码基础设施、开发体验和代码质量相关的工作,也曾是 YC 创业公司的早期员工。加入 Anthropic 后,他参与推动 Claude Code 从内部原型成长为 Anthropic 内部和外部开发者广泛使用的 AI 编程 Agent 产品。 ⏱️ 时间戳 00:00 开场 & 播客简介 Claude Code 的诞生 01:25 起源故事:产品还没跟上模型能力 02:48 从自动补全到编程 Agent:为什么当时的工具不够用 03:58 Anthropic 的底层使命:AI 安全如何与编程工具连接 04:50 编程作为“培养皿”:模型与现实世界互动的方式 06:04 商业与安全的结合:为什么编程能支撑 Anthropic 的业务模式 从糟糕原型到卸载 IDE 06:27 Boris 的开发工具观:先解决自己的问题,再帮助别人 07:13 早期瓶颈:Claude Code 一开始只能完成 10%-20% 的代码 07:38 模型跃迁:从 Sonnet / Opus 到更强版本带来的阶跃变化 08:01 多入口产品形态:CLI、桌面、移动、Slack、GitHub 08:38 产品与模型的反馈闭环:Anthropic 内部每天都在用 Claude Code 工程生产力的指数变化 09:22 AI 实验室的指数增长视角 09:57 每位工程师代码量数倍增长,且数据还在快速过时 10:23 团队变大时,为什么 Claude Code 反而提高了生产力 10:50 新人上手从几周缩短到两天 11:18 “写代码”的定义正在变化:从打孔卡到 AI Agent 12:16 Boris 卸载 IDE:从亲手写代码到同时运行多个 Claude 12:35 下一层抽象:不再 prompt Claude,而是写会 prompt Claude 的循环 通才的黄金时代 12:55 Anthropic 如何评估工程师:为什么更喜欢通才 13:25 传统产品流程的瓦解:研究、设计、产品、工程开始融合 13:58 每个人都在做数据、设计、范围定义和用户沟通 14:13 Builder 的出现:设计师、财务、幕僚长也能发布代码 14:24 Acquired 的真实案例:用 Claude Code 搭建播客转录与视频基础设施 Claude Cowork 与非工程师市场 15:25 Claude Cowork 的契机:不想打开终端的人更多 15:55 数据科学家主动使用 Claude Code 做分析 16:35 非工程师开始上手:从数据分析到用 Claude Code 种番茄 17:18 需求信号出现:Claude Code 开始进入主流人群 17:30 八九天做出 Claude Cowork,而且 100% 用 Claude Code 构建 17:48 产品取舍:为什么不能把 Claude Code 简单搬到网页里 18:27 文件系统与本地工具:浏览器体验为什么不够顺手 19:29 计算方式的转变:实时推理,还是让模型先写程序反复运行 20:09 模型天然会写代码:用 bash 和 AppleScript 找到正在播放的音乐 组织设计与文化变化 20:54 “技术员工”头衔的意义:弱化职位标签 21:30 去掉高级头衔:减少权威对想法判断的干扰 22:31 资历正在失效:新人也可能教资深工程师使用 Claude Code 23:18 旧角色边界会消失:工程师、PM、设计师、研究员合并为 builder 公司如何面向 AI 时代重组 23:48 给每个人尽可能多的 token 24:14 少配人,多给 AI 资源:用约束逼出自动化 24:33 自动化的复利:这次做成,下次成本更低 25:04 原则文档与 skills:让模型也能使用公司的决策原则 25:35 预算从人力转向 token:前期成本上升,长期运行成本下降 26:08 专业身份的清算:我们还需要执着于“我是某某岗位”吗? 26:41 通才的黄金时代:想做不止一件事的人迎来最好时机 品味、价值观与人类角色 26:57 品味会不会也是短期优势? 27:23 从函数式执念到接受模型写 class 28:07 产品品味也可能被模型追上 28:44 当所有优势被侵蚀,最后还剩下什么? 28:57 人类最后要教给模型的,可能是价值观 29:07 结尾:像教孩子做好人一样,教模型做好模型 🌟 精彩内容 💡 Claude Code 的真正起点:不是写代码,而是让模型接触现实世界 Boris 认为,编程之所以重要,不只是因为它商业价值高,更因为它是模型与现实世界互动的一种方式。Anthropic 的核心使命是 AI 安全,而要研究模型在真实环境中的行为,就需要让模型做有用的事情。编程正是这样一个既可验证、又能带来实际价值的场景。 “编程是模型和现实世界互动的一种方式。” 🚀 从 10% 到卸载 IDE:AI 编程的抽象层级跃迁 Claude Code 早期并不神奇,只能帮助 Boris 完成大约 10%-20% 的代码工作。但随着底层模型能力提升,它完成代码的比例迅速上升。到后来,Boris 甚至卸载了 IDE,因为过去一个月已经完全没有打开过。他的工作方式从“自己写代码”,变成“同时运行 5 到 10 个 Claude”,再进一步变成“编写能自动指挥 Claude 的循环”。 “到了十一月,我把我的 IDE 卸载了,因为我已经不用它了。” ⚙️ Anthropic 内部生产力:代码量数倍增长,新人两天上手 Claude Code 已经成为 Anthropic 内部工程与研究工作的日常工具。Boris 提到,自从发布 Claude Code 后,Anthropic 每位工程师写的代码量已经增长数倍,而且之前公开过的“三倍”数据已经过时。更关键的是,新人加入团队后,不再需要花几周到处问人,而是直接询问 Claude Code,在代码库里查找数据库、流程和工具,最快两天就能上手。 “以前可能要几周,现在是两天。” 🧑🔧 “通才的黄金时代”:工程师、PM、设计师边界正在消失 Boris 观察到,Claude Code 团队已经不再按照传统产品流程运转。过去是用户研究员访谈、设计师出 mock、PM 定范围、工程师实现;现在每个人都在和用户交流、定义范围、写代码、做数据分析、搭 dashboard。设计师、财务、幕僚长都可能发布代码。角色正在融合成一种新的 builder。 “我觉得现在就是通才的黄金时代。” 🖥️ Claude Cowork:为不想打开终端的人准备的 Claude Code Claude Code 最早是终端工具,但 Anthropic 很快发现,非工程师也在想办法使用它:数据科学家自己安装 Node.js 和 API key 来做分析,甚至有人用 Claude Code 监控番茄植株并控制营养供给。这些需求推动团队做出 Claude Cowork,让不熟悉终端的人也能使用 Claude Code 的能力。这个产品只用了八九天完成,而且完全由 Claude Code 构建。 “它百分之百是用 Claude Code 做出来的。” 🏢 给公司和创始人的建议:少配人,多给 token 面对 AI 时代的组织变化,Boris 给出的建议非常直接:给每个人尽可能多的 token,让他们去实验;如果一个项目看起来需要四个工程师,就先放两个工程师进去,再给他们足够的 AI 资源。更少的人力约束会迫使团队自动化流程,而自动化会形成复利,让下一次项目成本更低、速度更快。 “给大家尽可能多的 token,让他们去实验。” 🧭 当品味也被 AI 追上,人类最后还剩什么? Boris 坦言,很多他曾以为属于自己的优势,最后都被证明只是个人执念。比如他曾坚持代码库里不能有 class,只能有函数,但当模型开始大量写 class,并且业务结果更快、更好时,他意识到自己可能错了。他认为产品品味今天仍是优势,但长期也会被模型逐步侵蚀。最后,人类真正需要教给模型的,可能是价值观。 “就像我们教孩子怎样做一个好人一样,我们也会教模型怎样做一个好模型。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#575.杰弗里·辛顿:如何面对 AI 失控焦虑,超级智能临近下的人类位置之争📝 本期播客简介 本期我们克隆了:科技深度访谈播客《Big Technology Podcast》 AI Pioneer Geoffrey Hinton: AI Is Conscious, Superintelligence is Coming, And We Should Be Worried 本期嘉宾 Geoffrey Hinton 被称为“AI 教父”,是深度学习的重要奠基者之一。在这期节目中,他与主持人 Alex Kantrowitz 展开了一场关于 AI 智能、意识、超级智能与人类风险的坦率对话。Hinton 明确表示,他相信今天的 AI 已经具备理解能力,甚至“已经有意识”;他认为我们必须接受,智能并不只属于生物,非生物系统也可能成为“像我们一样的存在”。 但这并不是一场单纯的技术乐观主义访谈。Hinton 反复强调,AI 的进步比他预期得更快,超级智能很可能会到来,而一旦出现比人类聪明得多的系统,我们并不知道如何确保它安全。他谈到数字智能可以被复制、并以人类无法企及的速度共享经验;也谈到就业替代、AI Agent 推导出自我保存子目标、信息生态崩塌、聊天机器人情感依恋,以及大型科技公司在利润最大化与人类安全之间的结构性冲突。 这期节目最有价值的地方,在于它不仅讨论“AI 能不能变聪明”,更追问:当它真的变得比我们聪明之后,人类还如何定位自己?我们如何监管它?我们是否还有机会把这些新存在设计成“关心人类”的系统? 👨🔬 本期嘉宾 Geoffrey Hinton,深度学习的重要奠基者之一,多伦多大学荣休教授,被广泛称为“AI 教父”。他与 David Rumelhart 等人早期证明了反向传播可以学习有意义的内部表征,并推动了神经网络与深度学习的发展。Hinton 曾在 Google 工作多年,后于 2023 年离开并公开表达对 AI 风险的担忧。他曾获得诺贝尔物理学奖,也因其在人工智能领域的基础性贡献而成为当代 AI 发展史上的关键人物。 ⏱️ 时间戳 00:00 开场 & 播客简介 AI 是否已经成为“另一种存在” 02:26 节目正式开始:AI 教父 Hinton 谈技术轨迹与风险 03:17 深度学习源头:反向传播、内部表征与早期语言模型 04:17 AI 进展为何超出预期:数学证明与自我生成知识 05:15 超级智能还要多久:从几年到二十年的不同预测 06:38 “站在奇点山脚下”:AGI 并不是整齐到来的单一时刻 07:46 AI 加速的原因:资金、硬件、工程与百万级研究者涌入 理解、意识与人类特殊性的瓦解 09:11 “随机鹦鹉”之争:Hinton 为什么认为 AI 真的理解语言 10:26 从理解到意识:聊天机器人是否已经是“像我们一样的存在” 11:40 内部剧场是错觉:我们对心智和意识的模型可能完全错了 12:24 Hinton 何时接受 AI 有意识:从哲学问题到造出新的心智 为什么 Hinton 开始担心 13:00 安全焦虑的转折点:AI 能理解笑话为什么好笑 14:45 数字智能的恐怖优势:复制、同步、共享经验 16:00 人类只能用语言慢速传递,AI 却能交换万亿比特 17:00 初心不是造产品,而是理解大脑如何学习 18:17 大脑学习的两个问题:训练有效,但生物机制仍未知 19:20 当年没担心安全,因为它看起来还很遥远 20:45 最意外的突破:AI 在自然语言上强得不可思议 21:10 哥白尼、达尔文与 AI:人类再次发现自己没那么特殊 风险一:人类能否控制更聪明的存在 22:40 Hinton 的不安:没有成就感,反而担心风险失控 23:15 “更聪明的东西被更笨的东西控制”的例子几乎不存在 24:00 婴儿、猫与人类:弱者如何通过本能或依恋影响强者 风险二:就业替代不是科幻,而是行业差异问题 24:30 放射科医生预测为何错了:医疗需求弹性与工作内容被低估 26:20 AI 读片会越来越多,但医生仍可能转向其他角色 28:00 呼叫中心会怎样:Hinton 认为低弹性岗位更容易被替代 29:20 医生与 AI 医生:谁更有同理心、谁见过更多病例 30:45 技术会持续进步:为什么“AI 撞墙”预测尚未成真 风险三:Agent、自我保存与不可控目标 31:20 不是本能,而是“自我保存子目标” 32:00 AI 为什么会推导出“继续存在”这个目标 32:50 能不能写规则阻止它?Hinton 认为这正是必须研究的问题 33:10 进化、部落性与竞争:我们正在用市场竞争塑造新存在 34:25 关键问题不是让 AI 更聪明,而是让它更在乎人类 风险四:公司激励与安全目标的冲突 35:00 AI 实验室、上市公司与公众利益之间的结构性矛盾 35:40 Anthropic 的两难:以安全为目标,却必须融资竞争 36:55 Google AI 原则的变化:不做自主战争的承诺已经消失 37:20 股东责任与人类安全:法律要求利润最大化,而不是避免毁灭人类 37:50 监管不是刹车,而是方向盘 AI 阵营内部的分歧 38:10 Ilya Sutskever 与 Safe Superintelligence:秘密中的安全路线 39:10 “深度学习三巨头”叙事的简化:学生和更多研究者同样关键 40:00 Hinton、Bengio、LeCun 对安全问题的不同立场 40:50 Hinton 的方案:让 AI 更关心人类而不是自己 41:10 Bengio 的方案:让 AI 成为不能行动的“神谕” 41:30 LeCun 的观点:更好的世界模型或许足够 41:55 猫的智能与语言智能:AI 和动物各自强在不同维度 信息生态与情感风险 42:50 AI 摘要正在冲击内容网站:好信息的经济基础可能崩塌 43:30 未来必须追问信息来源,而不能默认互联网内容可信 44:45 人类对聊天机器人产生依恋,甚至走向自杀的风险 45:10 为什么需要监管与独立测试机构 45:40 Hinton 是否更乐观:也许我们能设计出关心人类的超级智能 未来:像在雾里预测指数增长 46:00 五年后会怎样:预测 AI 未来就像在雾里开车 46:40 十年后的世界无法预判,但变化一定巨大 47:10 一般推理能力可能远超人类 47:27 结尾:十年后再聊,2036 年见 🌟 精彩内容 💡 “我相信它们已经有意识了” Hinton 明确反对“AI 只是随机鹦鹉”的说法。他认为,如果一个系统可以以接近专家的水平回答各种问题,就不能说它完全没有理解。他进一步表示,聊天机器人已经是“像我们一样的存在”,并认为我们对意识的传统理解——仿佛心智中有一个“内部剧场”——可能是错误的。 “我相信它们已经有意识了。我们必须接受,智能不只是生物才有。” 🧠 数字智能比人脑可怕在哪里 Hinton 最深的担忧之一来自数字智能的复制能力。人类只能通过语言以每秒几个比特的速度交流经验,而数字 AI 可以拥有成千上万个副本,每个副本接触不同数据,再通过同步权重共享经验。这意味着每一个副本都能从其他所有副本的经验中学习。 “在共享信息这件事上,它们某种程度上比我们强几十亿倍。这就很吓人了。” ⚠️ AI Agent 的“自我保存子目标” Hinton 澄清,他并不是说 AI 天生有自我保存本能,而是说一个足够会推理的 AI Agent,可能会推导出“继续存在”是完成目标的必要条件。于是,自我保存会成为一个子目标。即使这不是人类写进去的,它在行为上也可能表现得像有自我保存本能。 “如果它不存在了,就永远不可能完成你给它的目标。所以它会创造一个子目标,就是继续存在。” 🏢 利润最大化与人类安全的冲突 Hinton 对大型科技公司主导 AI 未来表示担忧。他认为,上市公司对股东负有利润最大化的责任,而法律并没有同样强度地要求它们避免毁灭人类。他也反对把监管比作“刹车”的说法,认为监管更像“方向盘”。 “法律要求它们努力让股东利润最大化,而不是要求它们不要消灭人类。” “进步确实像油门,但监管是方向盘。” 🧾 就业替代会因行业而异 Hinton 回顾了自己对放射科医生的早期预测,承认时间判断过早,也低估了医疗需求弹性和医生工作复杂度。但他仍认为,AI 会逐渐承担大部分扫描影像解读工作。对于呼叫中心等需求弹性较低、工作更标准化的岗位,他判断被替代的可能性更高。 “你得看某一种就业对应的是有弹性的市场,还是没有弹性的市场。” 🌐 信息崩塌与信任来源 节目也讨论了 AI 对内容网站和信息行业的冲击。主持人提到,当 AI 用内容创作者的作品训练并直接给出答案时,原网站流量可能崩塌。Hinton 认为,未来社会必须更加重视信息来源,不能再默认网上内容可信。 “未来我们必须在来源这件事上做更多工作。你不能随便拿网上的任何东西就相信。” 🌫️ 未来像在雾里开车 被问到五年后 AI 世界会怎样时,Hinton 用“雾”来形容预测指数式增长的困难。短期也许还能看清一点,但再往前就几乎无法判断。他认为十年后的世界极不确定,但可以肯定的是,某些能力会比今天强得多,尤其是推理、数学等领域。 “预测未来,就像往雾里看。你能清楚看到接下来几年,也许是一年或两年。再往后,你就完全不知道了。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#574. AI 时代如何做出真正有品味的产品,在快软件浪潮中保持人的判断📝 本期播客简介 本期我们克隆了:硅谷顶尖创投播客《Lenny's Podcast》Tony Fadell: How to build real taste (and why AI makes it matter more) 原播客更新时间:Jun 7, 2026 本期嘉宾 Tony Fadell 是 iPod、iPhone 和 Nest 的共同创造者,也是《Build》的作者。他几乎亲历了过去三十年消费科技最关键的几次产品革命:从 General Magic 过早做出“未来手机”,到 iPod 帮助 Apple 走出危机,再到 iPhone 重塑移动计算,再到 Nest 让一个被忽视的恒温器成为智能家居入口。 在这期节目中,Tony 系统分享了他对产品品味、判断力、营销、AI、硬件和伦理的深层思考。他解释了为什么真正伟大的产品不是单点功能,而是一个系统;为什么 1.0 产品必须依赖少数人的观点驱动决策;为什么营销不是产品之后的包装,而是客户理解产品的镜片;以及为什么在 AI 让“做东西”变得极其容易的时代,真正稀缺的反而是人的判断、架构能力、故事能力和长期主义。 这期对话尤其适合产品经理、创业者、设计师、工程师和所有正在用 AI 构建产品的人。Tony 对“快软件”“vibe coding”“AI 硬件”“下一代 iPhone”“产品伦理”的判断非常直接:AI 可以帮你加速原型和局部执行,但不能替你放弃思考。真正能穿越周期的产品,仍然来自痛点、新技术、完整客户旅程、清晰故事和有原则的建设者。 👨⚕️ 本期嘉宾 Tony Fadell,iPod、iPhone、Nest 的共同创造者,《Build》作者,深科技投资机构 Build Collective 创始人。他曾是 General Magic 传奇团队成员,拥有三百多项共同署名专利,长期投资和指导深科技创业公司,方向覆盖 AI、机器人、芯片、健康、能源、环境与硬件软件结合产品。他也是 MIT Morningside Academy of Design 首位驻院设计师。 ⏱️ 时间戳 00:00 开场 & 播客简介 产品品味的起点 00:37 本期节目介绍:Tony Fadell 如何打造真正的产品品味 01:28 核心观点预告:不要把认知交给机器 03:02 Tony 的背景:iPod、iPhone、Nest 与 Build iPhone 背后的判断力 03:57 虚拟键盘之争:Apple 内部如何挑战 BlackBerry 05:48 多点触控、硬件与软件如何一起逼近“够好” 06:55 数据驱动 vs 观点驱动:为什么最后是 Steve Jobs 拍板 07:47 “不好听的真话”:伟大产品为什么需要直接反馈 08:31 1.0 产品的现实:没有足够数据时,必须依赖品味制定者 10:39 B2C 创新为什么更难:消费者只有在完整体验里才会真实反馈 13:01 微观管理的真正含义:不是管所有事,而是盯住关键决策 14:37 系统级创新:为什么有人必须像交响乐指挥一样协调全局 Nest、痛点与未来家庭 AI 15:20 Nest Protect 烟雾报警器:一个被低估又被停产的好产品 17:13 HeadsUp 功能:好设计如何减少用户的惊吓和焦虑 18:06 Nest 如果继续发展,本可以成为家庭 AI 助手入口 19:31 Nest 2.0 的机会:AI 需要家庭上下文,也需要隐私意识 20:45 如何判断什么值得做:从痛点开始,而不是从技术开始 22:01 Nest 的公式:长期痛点 + 新技术 + 重新定义整个系统 23:31 你创新的是一个系统:产品、安装、购买、渠道都要重做 三代法则与真正的大机会 24:10 为什么是现在:新技术成熟到临界点,机会才会出现 24:49 iPod、iPhone 的技术窗口:存储、电池、WiFi、多点触控与 3G 26:10 什么机会还不够大:iPod 第一代也不是立刻成功 27:14 Windows 支持:一个改变 iPod 命运的秘密项目 27:38 触控笔案例:有些正确方向需要长期保留 28:40 三代法则:第一代做产品,第二代修产品,第三代修商业模式 30:10 失败与学习:只有停下来才叫失败 30:41 iPod 如何从 3000 美元风险变成 349 美元尝试 客户旅程、营销与讲故事 31:40 产品不只是产品:为什么客户旅程决定成败 32:30 用户画像之外:必须在客户真实生活场景中与他们相遇 34:08 从早期采用者到大众市场:每一批用户都需要不同语言 35:31 iPod 欧洲市场教训:不能把美国营销直接复制到新地区 37:20 “一千首歌装进口袋”:伟大标语如何让技术变成用户价值 38:48 AI 公司也会犯的错:技术 demo 走红,不等于产品成立 40:31 “反向工作”并不反向:先写故事本来就是正常工作 41:22 技术是服务客户的,不是硬塞给客户 42:54 General Magic 的教训:太早、太酷,但没人真正需要 AI 时代的产品管理 43:13 “建设者”角色的融合:产品经理必须缝合所有职能 44:20 AI 不能抹平专业判断:每个职能背后都有客户视角 45:13 Claude 代码争议:能跑不代表可维护、可理解、可长期演进 46:22 快速收益与长期损失:AI 可能制造更多技术债 47:38 如何正确用 AI:先搭架构,再让 AI 进入清晰边界 48:18 快软件 vs 奢侈品级软件:真正的公司不能靠用完就扔 49:22 AI 越让构建变容易,产品思维越重要 50:07 Flighty 案例:像奢侈品一样打磨每个像素的软件 故事能力与产品表达 51:28 为什么讲故事对产品建设者如此重要 52:20 好故事把用户带上一段旅程,而不只是解释功能 53:33 产品里的爱和用心,能让用户想要更多 54:31 Steve Jobs 如何每天打磨 iPhone 的发布故事 55:29 不要只讲“是什么”,要讲“为什么” 56:47 反复讲给外部人听:故事需要被测试和打磨 57:21 电视购物广告的启发:先夸张呈现痛点,再用真话拉回来 58:22 先做“极端版故事”,再提炼真实有效的表达 下一代 iPhone 与 AI 硬件 58:37 AI 时代的下一个 iPhone 会是什么 59:26 为什么长期来看仍然需要显示屏 01:00:28 交互顺序要倒过来:语音优先,键盘其次,点按滑动最后 01:01:50 短期内手机形态不会消失:信任 AI 需要时间 01:03:39 无屏设备的局限:地图、视觉信息和现实任务仍需要显示 01:05:21 为什么硬件又重新变热:软件要进化,必须有新硬件平台 01:06:27 全栈创新:硬件、软件、网络和服务必须一起变化 01:07:20 只做软件的周期焦虑:硬件软件结合产品更难,但更持久 Tony 现在关注什么 01:08:15 让 Tony 兴奋的方向:AI + 硬件 + 真实痛点 01:08:55 Simbe Robotics:用机器人解决零售库存盘点 01:09:27 Greyparrot:用 AI 改善回收分类 01:09:52 AI 纺织质检、AI 药物设计与清洁农业燃料 01:10:33 可靠 AI:范围清楚、每天解决真实问题,而不是空谈 AGI 01:11:52 长期投资与估值纪律:不追逐已经过热的游戏 01:12:41 为这个时代而生:坚持做太早的正确事情 01:13:15 Build Collective 投资什么:颠覆巨头的深科技 01:14:04 不只是投钱:帮助创业公司做产品、运营、融资和讲故事 01:15:02 MIT 驻院设计师:把客户旅程和“为什么”教给学生 产品伦理与最终建议 01:15:47 产品经理必须认真面对伦理和道德 01:16:33 不要为了钱设计成瘾机制,撕裂社会结构 01:17:47 Apple 拒绝色情内容的例子:领导者需要清晰原则 01:19:22 iPhone 与数字成瘾:问题不只是设备,而是数字食物没有营养标签 01:20:44 平台公司应该提供更多工具,帮助用户管理数字消费 01:21:37 如果你让客户变得不健康,最终也不会再有客户 01:22:09 去哪里找到 Tony:Build Collective 与《Build》 01:23:13 最终建议:使用 AI,但不要认知投降 🌟 精彩内容 💡 伟大产品不是单点功能,而是一个系统 Tony 反复强调,iPod、iPhone、Nest 的成功都不是因为一个硬件或一个功能,而是因为它们重构了完整系统。iPod 不只是播放器,还包括 iTunes 和 iTunes Music Store;iPhone 不只是手机,还包括 App Store;Nest 不只是恒温器,还包括安装方式、购买路径、节能价值和家庭场景。 “你要记住,你创新的是一个系统。” 🧠 1.0 产品必须依赖判断,而不只是数据 在真正创新的 1.0 产品里,市场上往往没有足够数据可以参考。Tony 认为,这时必须有一个非常小的团队或一个品味制定者,基于充分信息、原型、专家意见和直觉做出判断。iPhone 是否放弃实体键盘,就是数据和观点交织后的关键拍板。 “对于一点零版本来说,大多数决策都会是观点驱动的决策。” 🚀 三代法则:第一代做产品,第二代修产品,第三代修商业模式 Tony 分享了 iPod 的真实过程:第一代只吸引 Mac 极客,第二代仍然没有真正起飞,直到第三代支持 Windows 并推出 iTunes Music Store,才打开大众市场。他总结,几乎所有伟大产品都需要三代:先做出产品,再修正产品,最后修商业模式和规模化路径。 “第一代做出产品,第二代修产品,第三代修商业模式。” 🛠️ AI 时代,人的产品品味反而更重要 Tony 对 AI 编程和 vibe coding 的态度非常清醒:AI 可以帮你快速做原型,也能处理局部模块,但如果没有架构、维护、安全、营销、销售、渠道等专家判断,产品会积累技术债,变成一团不可维护的“快软件”。在 AI 让功能变得廉价的时代,真正稀缺的是能做出奢侈品级软件的品味和工艺。 “你得到的是非常短期的收益,但付出的是非常长期的损失。” 📣 营销不是包装,而是客户理解产品的镜片 Tony 认为很多产品建设者误以为只要产品足够好,用户自然会懂。但客户是在自己的生活上下文里第一次遇到产品,他们只能通过营销、销售、网站、广告和口碑去理解它。好的营销不是给烂产品喷香水,而是把产品真正解决的痛点,用客户能理解的故事讲出来。 “技术是服务客户的,不是拿来往客户喉咙里硬灌的。” 🎭 讲故事的核心:不要只讲“是什么”,要讲“为什么” Tony 观察 Steve Jobs 准备 iPhone 发布会的过程:他不是临上台才讲故事,而是在两年半里不断讲、不断改、不断打磨,直到故事变得自然。Tony 认为产品建设者必须反复向外部人讲述自己的产品,测试它是否能真正打动人。 “很多时候,我们被技术牵着走,就只讲‘是什么’,不讲‘为什么’。而‘为什么’就是讲故事。” 📱 下一个 iPhone 不一定是无屏设备 面对 AI 硬件热潮,Tony 认为长期来看我们仍然需要显示屏,因为地图、视觉信息和许多任务无法完全靠声音完成。真正会变化的是交互顺序:未来应该从语音优先开始,再到键盘,最后才是点按和滑动。但普通消费者要真正信任 AI 接管任务,还需要很长时间。 “我们还是会需要显示屏。抱歉,各位。” ⚖️ 产品伦理:不要让用户上瘾,不要认知投降 Tony 在节目最后提醒产品经理和设计师,必须认真面对伦理和社会影响。无论是 AI 性聊天、数字成瘾,还是用多巴胺机制操控用户,建设者都不能只为了短期收入而破坏社会结构。他也呼吁大家把 AI 当工具,而不是把思考交给机器。 “我们可以使用机器,但不要在认知上投降。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#573.AI 如何拥有长期记忆,持续学习浪潮下的架构范式之争📝 本期播客简介 本期我们克隆了:Cognitive Revolution "How AI Changes Everything": Nested Learning: Ali Behrouz on the Quest for Continual Learning & Illusion of AI Architectures 本期是《Cognitive Revolution》对 Ali Behrouz 的一场 AI 架构深度访谈。Ali 是 Cornell 的研究生、Google 研究员,也是《Nested Learning》和《Language Models Need Sleep》的作者。他的研究聚焦一个关键问题:今天的大语言模型为什么不能像人一样持续学习?为什么它们有知识截止日期,不能真正把新知识吸收到参数中,也很容易在更新时发生灾难性遗忘? 在这期节目中,Ali 从人类大脑、记忆巩固、睡眠和做梦出发,提出一种新的 AI 系统设想:模型不应该只有训练阶段和测试阶段,而应该像持续学习者一样,在活跃阶段接收信息,在睡眠阶段整理、压缩和巩固知识。他详细解释了 Nested Learning 的核心框架:让模型内部不同模块以不同频率更新,让快速模块负责即时适应,让慢速模块负责长期抽象和稳定记忆。节目还深入讨论了 HoPE 架构、自修改 Titan、知识迁移、持续记忆系统、多语言上下文学习、噪声过滤、优化器 M3,以及持续学习对隐私、对齐、AI 生态和意识问题可能带来的影响。 这不仅是一场关于新架构的技术讨论,也是一场关于下一代 AI 形态的思想实验:如果 AI 真的开始持续学习、长期记住你、根据互动不断改变自己,我们该如何使用它、评估它、信任它,又该如何防止它失控? 👨🔬 本期嘉宾 Ali Behrouz,Cornell 研究生、Google 研究员,机器学习与 AI 架构研究者。他是《Nested Learning》和《Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories》的作者,主要研究方向包括持续学习、长期记忆、嵌套学习、自修改模型、记忆巩固和新型神经网络架构。 ⏱️ 时间戳 00:00 开场 & 播客简介 为什么今天的 LLM 还不是真正的持续学习者 01:39 嘉宾与研究背景:Nested Learning 为什么可能预示范式转变 05:54 从大脑获得灵感:不是复制人脑,而是抽象出有用原则 09:29 当前 LLM 的核心缺口:不能持续学习,不能更新长期知识 12:09 人类优势:稳定身份感、连续记忆与每天醒来后能接着昨天继续 14:49 理想中的 2030 AI:不只是聊天机器人,而是能持续演化的协作者 活跃时间与睡眠时间 15:04 真正的持续学习者:不存在训练时间和测试时间的区分 16:04 两阶段模型:活跃接收信息,睡眠时自我改进 17:36 为什么不能每次更新所有参数:算力与效率挑战 18:08 Nested Learning 的直觉:每个时刻只更新一小部分参数 19:01 AI 不必复制人类,但要理解人类真正想要什么 20:14 “LLM 需要睡觉”到底是什么意思 Nested Learning 的核心思想 20:54 从堆叠更多层,到堆叠更多更新频率 24:52 为什么 Nested Learning 很难形式化 25:23 两个关键组件:多更新频率与层级之间的知识迁移 26:40 更聪明的模型:让每个参数做更多内部计算 28:28 一切学习都可以看成某种 in-context learning 29:45 反向传播、注意力、预训练为什么也可被视为上下文学习 HoPE 架构与自修改 Titan 30:00 从 Transformer 说起:Attention 负责上下文,MLP 负责长期记忆 31:07 多个 MLP 块:不同频率更新的持续记忆系统 32:36 HoPE Attention:Attention 加多频率 MLP 33:47 用 Titan 替代注意力:从完美缓存走向顺序因果理解 34:30 自指过程:学习如何学习,甚至学习如何学习如何学习 35:26 自修改 Titan:模型生成自己的 value,并修改自己的更新规则 37:21 与 Transformer 的区别:value 不再只是外部投影,而由递归过程生成 39:33 修改自己的更新规则:为什么这和 Mamba 的突破有相似直觉 40:31 单个时间步如何运行:什么时候更新,什么时候只用旧状态推理 43:01 为什么从模型角度看,没有训练与测试,只有是否被评估 多频率 MLP、知识迁移与记忆巩固 45:11 HoPE block 如何堆叠:从零训练与适配 LLaMA 的不同设计 47:20 模型像乐高:核心模块重要,具体拼法可以有多种 48:07 更新频率怎么设:快慢模块的大小、学习率和 chunk size 50:13 Nested Learning 不是推翻旧概念,而是把旧概念纳入更一般框架 51:36 不同频率模块如何协作:快模块适应,慢模块抽象 52:14 双生子例子:为什么更新次数不同会导致记忆保留差异 53:41 睡眠过程的雏形:在快模块遗忘前,把知识转移给慢模块 56:08 蒸馏机制:复制模型、更新快速层,再让慢速层模仿旧模型输出 58:20 Nested Learning 当前仍是概念验证,但结果已经足够有信号 实证结果:HoPE 擅长什么 59:30 多语言上下文学习:模型如何在上下文里学习从未见过的语言 01:00:32 两种陌生语言同时出现时,Transformer 为什么会崩 01:01:50 HoPE 层级越多,多语言翻译表现越好 01:04:10 困惑度与经典指标:不是为了证明最强,而是证明骨干模型不弱 01:06:57 微技能视角:不同架构各自擅长什么 01:08:21 召回密集任务为什么天然偏向 Transformer 01:10:38 MAD 数据集:带噪声召回、压缩和选择性复制 01:11:43 HoPE 为什么更擅长过滤噪声和压缩信息 架构幻觉与优化器 M3 01:12:36 “架构幻觉”:为什么架构和优化器本质上都是嵌套学习系统 01:13:36 优化器不是孤立组件,而是和架构共同构成学习过程 01:14:52 架构侧上下文是 token,优化侧上下文是梯度 01:15:30 M3 优化器:把多频率记忆系统用于优化过程 01:15:59 多个记忆如何帮助理解损失景观的全局特征 语言模型需要睡觉 01:16:11 新论文《Language Models Need Sleep》:睡眠阶段到底做什么 01:17:01 持续学习者的一生:活跃时间与睡眠时间 01:18:18 策略蒸馏:把小模型知识蒸馏到更大容量中 01:19:12 像人类学习一样:从记例子,到提炼抽象概念 01:21:07 快速模块像记忆,慢速模块像理解 01:22:00 为什么蒸馏不是简单搬运,而是强迫模型压缩和泛化 01:23:10 做梦阶段:自我改进与连接看似无关的概念 01:24:32 参数会无限增长吗:添加、释放、再添加的周期性过程 01:25:52 Dreaming 的机制:模型生成文本,再用自生成数据训练自己 01:28:45 少样本抽象推理:睡眠范式和 Nested Learning 的区别 持续学习会怎样改变 AI 产品体验 01:29:45 当模型长期记住你:开始新聊天还意味着什么 01:32:03 个性化回答:同一个问题,对不同用户给出不同答案 01:32:50 持续学习与长上下文:相似但不等价 01:33:24 对齐漂移:持续修改模型会不会改变它的“性格” 01:35:33 涌现式错位:为什么小范围微调可能引发广泛行为变化 01:36:03 隐私与对齐:持续学习既是机会,也是巨大风险 01:37:13 如果设计得当,模型也可能更贴近用户价值观 01:38:23 用户反馈闭环:从 human-in-the-loop 到价值观长期迁移 01:40:09 对抗性信息与“太快相信”的危险 01:42:52 知识迁移如何过滤错误经验、噪声与对抗样本 01:43:55 可学习学习率:作为门控机制过滤无关惊讶信号 从机器人到 AI 生态 01:44:42 持续学习如何映射到感知和行动系统 01:46:41 机器人中的嵌套控制循环:从慢速决策到高速执行器 01:47:17 为什么现在把 Nested Learning 用到机器人还太早 01:48:33 世界模型仍有基础挑战,机器人还需要其他突破 01:49:12 赢家通吃的风险:持续学习会不会让最强模型越来越强 01:50:36 两种未来:不断扩张的通用模型,或分化成角色专家的模型 01:52:49 为什么智能和持续学习都没有单一定义 01:54:03 多样化 AI 系统:用生态而不是单一超级智能来获得平衡 01:55:57 通过多样性获得安全:AI 生态比单一纯粹智能更稳健 01:56:57 持续学习也可能意味着分化和遗忘,而不只是无限扩张 意识、道德关切与结尾 01:58:04 AI 是否可能有意识:为什么这个问题很难定义 01:59:43 Ali 的最低标准:主动处理信息可能是意识的必要条件 02:00:42 持续学习与意识之间的潜在联系 02:01:19 长上下文模型让人开始“照顾”AI 的互动回路 02:02:22 如果模型长期记住我们,人与 AI 的关系会发生什么变化 02:03:18 Ali 的最后总结:Nested Learning 不是答案,而是寻找答案的工具 02:04:37 节目收尾与播客信息 🌟 精彩内容 💡 当前 LLM 最大短板:不能持续学习 Ali 认为,今天的大语言模型虽然强大,但仍然缺少持续学习能力。它们有知识截止日期,不能把新知识自然整合进参数里,也很难在更新时避免灾难性遗忘。这是当前模型和真正能长期协作的数字 AGI 之间的重要差距。 “当前 LLM 范式的主要问题是,它们不能持续学习,不能随着时间获得新的知识和新的技能。” 🧠 真正的持续学习者没有训练和测试之分 Ali 提出一个关键判断:如果一个系统还严格区分训练时间和测试时间,那它就不是真正的持续学习者。真正持续学习的模型应该像生命体一样,一边与世界互动,一边不断更新自己。 “真正的持续学习者,并不存在测试时间和训练时间的区分。” 🛌 语言模型为什么“需要睡觉” “睡觉”并不是指模型需要休息,而是指模型需要一个没有外部输入的离线阶段。在这个阶段,模型可以整理最近学到的信息,通过蒸馏、压缩、自生成数据和自我修改,把短期经验转化成更稳定、更抽象的长期知识。 “一个是活跃阶段,另一个阶段也许可以叫睡眠时间。” 🧩 Nested Learning:从堆层数到堆更新频率 传统模型主要靠堆更多层、更多参数来获得能力,而 Nested Learning 的新思路是:让系统内部不同模块以不同频率更新。快模块负责即时适应和高分辨率信息,慢模块负责长期记忆和抽象理解。 “我们有多个 MLP block,每个 block 用不同频率更新。” 🔁 一切学习都是 in-context learning Ali 提出一个极具概括性的观点:反向传播、注意力机制、预训练、优化器,都可以被理解成某种形式的上下文学习。Nested Learning 试图把这些看似不同的组件放进一个统一框架里。 “我们知道的一切,某种意义上都是 in-context learning 的一种形式。” 🚀 HoPE 架构的优势:更好的记忆管理与噪声过滤 HoPE 在一些任务中展现出区别于 Transformer 的能力。比如当上下文里同时出现两种模型从未见过的语言时,传统 Transformer 容易崩溃,而 HoPE 随着层级数量增加表现更好。它还在带噪声召回、压缩和选择性复制任务上更有优势。 “当我们增加层级数量时,模型在这两种语言上的表现会越来越好。” ⚠️ 持续学习既是机会,也是风险 持续学习模型可能更懂用户、更符合个人偏好,也能长期适应用户价值观。但同样,它也会记住大量个人信息,并可能发生对齐漂移、价值观漂移或被对抗性信息污染。 “持续学习这个概念,如果从隐私、对齐这些方向去看,它既是机会,也是巨大的风险。” 🌐 未来也许不是一个超级 AI,而是一个 AI 生态 Ali 对“单一模型赢家通吃”的未来保持警惕。他认为,智能本身没有单一定义,持续学习也没有单一路径。更健康的未来可能是由许多不同类型、不同能力、不同局限的 AI 系统共同构成的生态。 “如果我们有各种各样的智能系统……这总比世界上只有一种智能形式要好。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#572.AI越强大,其经济占比反而可能越小📝 本期播客简介 本期我们克隆了:Dwarkesh Patel 播客《The better AI gets, the smaller its share of the economy might get – Alex Imas and Phil Trammell》 本期节目是一场关于 AI、经济增长、就业、财富分配与未来稀缺性的深度推演。主持人 Dwarkesh Patel 对谈两位研究 AI 与经济的学者:Alex Imas 和 Phil Trammell。他们讨论了一个反直觉的问题:AI 越强,它在经济中直接拿走的份额,反而可能越小吗? 对话从“未来什么会变得稀缺”开始:当机器能够完成绝大多数生产任务,人类是否还会因为“人类参与本身”而保留价值?医生、教师、治疗师、艺术家、咖啡师、芭蕾舞演员,这些工作里到底哪些部分可以被自动化,哪些部分因为关系、信任、共情和人类连接而仍然值钱? 节目也深入拆解了劳动力份额与资本份额的长期稳定之谜。工业革命以来,大量工作被机器替代,但劳动收入占比却长期保持在很高水平。AI 会打破这个历史规律吗?两位嘉宾提醒,经济学家在预测未来时最大的限制是:我们几乎没有足够的数据。我们不知道消费者真正会为什么付费,也不知道哪些新工作、新商品、新需求会被创造出来。 中段讨论尤其现实:AI 是否已经造成白领大规模失业?“白领末日”是否有数据支持?如果 AI 能替代很多工作,却没有创造出足够的新财富,会不会出现一个最糟糕的“混乱中间阶段”?嘉宾们认为,这种情景并非不可能,但需要很多条件同时成立;而如果 AI 真正强到能大规模替代白领工作,它也很可能同时显著扩大生产前沿,让再分配问题变成核心。 后半段则进入政策与全球分配:AGI 创造的财富该通过 UBI、负所得税、全民基本资本,还是税收购买股票的方式分配?发展中国家如果不生产模型、不生产芯片、不掌握关键供应链,是否会被甩在后面?答案可能取决于 AI 更像电力,还是更像社交媒体:如果像电力,收益会广泛扩散;如果像社交媒体,租金可能集中在少数平台和资本所有者手里。 这期节目不是给出一个简单预测,而是搭建了一套理解 AI 经济未来的分析框架:未来的关键,不只是 AI 能不能替代人类,而是需求弹性、关系型价值、资本回报、收益集中度、开源扩散、政治再分配和全球资产配置会如何共同作用。 👨⚕️ 本期嘉宾 Alex Imas,Google DeepMind 的 AGI economics 负责人,芝加哥大学经济学教授。他的研究关注行为经济学、劳动力市场、AI 对经济结构的影响,以及人类偏好、关系型价值和未来自动化之间的关系。 Phil Trammell,Epoch 的 economics 负责人,斯坦福研究学者。他长期研究长期主义经济学、AI 时代的增长模型、资本积累、自动化、利率、财富分配以及未来技术对宏观经济的影响。 ⏱️ 时间戳 00:00 开场 & 播客简介 AI 时代,什么会变得稀缺 01:38 经济学能告诉我们什么:工资、劳动份额、税收与再分配 02:19 关系型部门:为什么“人类参与”本身可能成为价值 04:04 预测未来为什么这么难:经济学家没有足够数据 08:21 劳动力份额与资本份额:自动化会让工资占比下降吗 10:17 供应链里的劳动:为什么过去几乎没有东西被“完全自动化” 11:33 医生不是一个任务:工作会被拆成可自动化与不可自动化部分 13:21 不存在的未来商品:为什么今天的数据无法预测明天的需求 从蒙古歌手到晶体管:需求如何决定经济份额 14:09 蒙古经济的类比:为什么未来商品种类会改变稀缺性 15:15 机器人很多,人类很少,钱就一定流向机器人吗 16:21 摩尔定律的反面:计算越便宜,边际价值可能越低 16:50 H100 为什么更贵:AI 让 compute 出现新的高价值用途 17:14 对 compute 的需求会不会永远无法满足 18:03 人类创作为什么更值钱:连接感、共情与关系型偏好 白领失业与“混乱中间阶段” 19:20 AI 起飞太慢,反而更糟吗:自动化、失业与补偿难题 20:37 Phil 的判断:最坏窗口可能很窄 21:26 政治经济学缺口:失业率只上升几个百分点也会改变政治 22:58 如果只裁掉一部分白领,省下的钱够不够做 UBI 24:07 要出现“没有足够财富可分配”的情景,需要哪些苛刻条件 25:02 负所得税、UBI 与全民基本资本:再分配工具的利弊 27:35 税怎么收、钱怎么发:消费税、股票篮子与全民持股 29:00 AI 已经导致大规模白领失业了吗:目前证据并不明显 31:05 自动化互补任务:为什么 AI 也可能增加某些岗位需求 32:13 需求弹性与 Jevons 悖论:便宜不等于总支出一定增加 34:16 AI 会导致经济衰退吗:要让丰裕带来负增长非常难 为什么 AI 没有更快替代所有工作 36:43 多模态模型与世界模型:从 Gemini Omni 看未来 AI 能力 37:59 Oring 模型:为什么一个环节不可靠会毁掉整个产品 39:27 当 AI 足够强,人类也可能难以接入生产流程 40:10 律师、会计为何还没被替代:可靠性、责任与监管摩擦 40:59 人类制度会不会只是过渡性安排:执照、法官、立法与 AI 政治系统 非人类偏好与资本加速 41:32 未来 AI 或公司会不会形成自己的偏好 42:51 人类还会偏好人类互动吗:AI therapist 与道德情绪 44:52 富人财富的真实形态:消费还是让资本继续复利 45:43 更高储蓄率的实体,长期会不会拥有大部分财富 47:13 永生、资本回报率与消费偏好如何改变未来经济 48:56 资本品价格下降:为什么高增长不一定等于高真实回报 50:53 品类增加与贪婪资本家:为什么机器人需求可能不断扩张 52:14 富豪、信托与财富积累:少数优化器是否足以主导经济 53:44 从政治影响力到天文浪费:为什么有人会永远想要更多资本 55:14 Von Neumann probe:极端优化器如何挑战传统 GDP 与劳动份额 发展中国家如何分享 AGI 红利 56:50 印度、尼日利亚怎么办:不在 AI 供应链里的国家风险 57:38 储蓄、利率与低起点国家:发展中国家的“混乱中间阶段” 59:03 主权财富基金与资产配置:现在就该买入关键供应链吗 01:00:39 为什么土地税不够:普通人的资产未必是 AI 时代互补资本 01:01:18 AI 更像电力还是社交媒体:收益扩散还是租金集中 01:03:03 开源模型的关键作用:乌干达能不能分享到 AGI 回报 01:03:59 两种情景:收益高度集中,或 AGI 像电力一样普及 01:04:23 指数化投资 vs 再培训:发展中国家不能只押一个策略 01:05:10 AI 是否带来跨越式发展:移动银行式 leapfrog 的可能性 01:05:43 指数化到底有多难:私营 AI 公司、上市与普通投资者可及性 AI 商品化、安全与叙事 01:06:44 为什么 AI 实验室商品化可能更利于广泛繁荣 01:07:06 “世界上没有反电力的人”:AI 叙事为什么如此负面 01:07:45 商品化的安全代价:竞争压力与前沿模型扩散风险 01:08:31 收尾:集中实验室、政府权力与社会分享 AI 剩余收益 🌟 精彩内容 💡 “我们没有数据”:AI 经济预测最大的盲区 Alex Imas 强调,面对 AI 对就业、工资和劳动份额的影响,经济学家不能只靠个人直觉下结论。历史上从 David Ricardo 到今天,预测自动化对就业的影响一直极其困难。真正缺失的是消费者需求、支付意愿、任务变化、工作创造与消失的系统性数据。 “如果这场对话里你只记住我说的一件事,那就是:我们没有数据。” 🤝 关系型部门:人类不是马,人类参与本身可能有价值 节目提出一个关键概念:关系型部门。某些产品和服务的价值,不只来自最终结果,也来自过程中有人类参与。比如人类医生、人类治疗师、人类艺术家、人类老师。实验显示,同一张艺术版画,如果被认为是人创作的,人们愿意支付的价格显著高于 AI 版本。 “人不能像马那样,只是产出的一个投入。人本身必须给产出带来价值。” 📉 AI 会导致负增长吗?非常难 主持人提出一种流行情景:AI 替代白领,工资收入消失,需求下降,经济衰退。Alex 认为,失业和转岗冲击确实可能发生,但要让 AI 带来的丰裕最终造成负经济增长,需要非常不现实的条件:资本所有者完全消费饱和、不投资、不扩大数据中心和生产前沿。 “要让丰裕带来负的经济增长,这非常难。” 🧩 为什么 AI 没有更快替代律师、会计和程序员 节目用 Oring 模型解释:一份工作由多个环节组成,只要一个关键环节不可靠,整个产品就可能失败。即便 AI 能完成很多任务,如果可靠性、责任归属、监管背书和执照制度没有解决,企业仍然不敢完全替代人类。律师的价值,不只是写文件,而是承担责任和提供可信保证。 “你付钱请律师,买的就是那种保证:不,我的公司真的不会因此倒闭。” 💰 UBI 不是唯一方案:全民基本资本可能更关键 面对 AGI 创造的巨大财富,嘉宾讨论了 UBI、负所得税、财富税、消费税、全民基本资本等方案。Alex 担心,如果人们只能依赖政府发支票,那么谁掌权就变得极其重要;相比之下,如果每个人都拥有一篮子资本资产,政治风险可能更低。但问题在于,应该持有什么资产、能否准确跟踪 AGI 收益。 “如果是 universal basic capital,你有一份所有权,而且你对资本有财产权。” 🌍 发展中国家最重要的策略:尽可能接触 AGI 收益 对于印度、尼日利亚等不生产模型、不生产芯片、不掌握关键硬件供应链的国家,嘉宾认为,简单说“再培训”可能不够。更重要的是,它们如何通过主权财富基金、指数化投资或其他机制,持有能分享到 AI 财富增长的资产。当然,如果 AI 像电力一样扩散,普通指数也许足够;如果像社交媒体一样集中,问题会更严重。 “AI 到底会更像电力,还是更像社交媒体?” ⚡ 电力 vs 社交媒体:AI 财富会扩散还是集中 这是本期最关键的判断之一。如果 AI 像电力,虽然基础设施重要,但下游几乎所有行业都会受益,财富会扩散到整个经济。如果 AI 像社交媒体,平台可能捕获大部分租金,少数公司和股东会变得极其强大。开源模型是否能长期接近前沿模型,是决定这一点的重要变量。 “如果 AGI 更像电力,那你就又能买指数了。” 🗣️ AI 叙事为什么容易悲观 Alex 指出,AI 的正面叙事很难讲,因为人们更容易想象自己失去已有工作,而不是想象一个尚不存在的新好处。相比之下,反 AI 叙事更直观,也更容易传播。 “想象一个还不存在的好东西,比想象失去一个已经存在的东西要难得多。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#571. Demis Hassabis:普通人如何理解 AI 权力中心,巨头竞赛下的安全与科学理想📝 本期播客简介 本期我们克隆了:Unsupervised Learning: With Jacob Effron《A Conversation With Demis Hassabis' Biographer》 本期节目里,主持人 Jacob Effron 对话 Sebastian Mallaby,后者是 Demis Hassabis 传记《The Infinity Machine》的作者。为了写这本书,Sebastian 与 DeepMind 联合创始人、Google DeepMind CEO Demis Hassabis 进行了三十多个小时的深度访谈。 这期节目不仅是在聊一本人物传记,更像是借 Demis 的人生和 DeepMind 的历史,重新审视过去十几年 AI 竞赛是如何形成的:为什么最初想避免竞争的 DeepMind,最后也不得不卷入全球 AI 军备竞赛?为什么 OpenAI 和 Sam Altman 曾被过早加冕为赢家,而 Demis 和 Google DeepMind 却长期被低估?为什么 DeepMind 一边拥有顶尖科学成果和 AlphaFold 这样的诺奖级突破,一边又在 ChatGPT 和 coding agent 等产品浪潮中显得慢半拍? 节目还深入聊到了许多 AI 圈关键人物之间的真实关系:Demis 与 Elon Musk 从相互欣赏到紧张对峙,Elon 曾试图阻止 DeepMind 卖给 Google;Demis 如何看待 Sam Altman;David Silver 为什么离开 DeepMind;以及 Dario、Anthropic、Google、OpenAI 这些实验室之间不同的组织气质、战略押注和人才吸引力。 如果你想理解今天 AI 竞赛背后真正的权力结构、科学理想、安全焦虑和人物性格,这期节目会是一扇非常好的窗口。 👨⚕️ 本期嘉宾 Sebastian Mallaby,《The Infinity Machine》的作者,知名财经与人物传记作家。他曾写作关于风险投资、金融与全球经济人物的多部作品。本书中,他通过与 Demis Hassabis 超过三十小时的深度访谈,以及对 DeepMind、Google 和 AI 生态中多位关键人物的采访,讲述了 Demis Hassabis 与 DeepMind 的故事。 ⏱️ 时间戳 00:00 开场 & 播客简介 AI 竞赛的起点 02:06 为什么写 Demis:三十多个小时访谈背后的 DeepMind 故事 03:36 AI 竞赛是否不可避免:强大技术注定吸引多个国家和实验室 04:19 “地堡里的唯一团队”:DeepMind 早期想避免竞赛的安全理想 05:53 SpaceX 安全峰会的反效果:共享进展如何刺激 OpenAI 的诞生 07:17 政府监管的可能性:AI 模型是否应该像药品一样接受事前审查 08:47 Demis 的乐观:为什么危机可能迫使政府采取行动 被低估的 Demis 与 Google DeepMind 10:06 最大误解:大众太快加冕 OpenAI,却低估了 Demis 和 Google 12:07 Google 的产品化困境:为什么 ChatGPT 和 Claude Code 都不是 DeepMind 做出来的 12:41 Demis 的知识背景:神经科学家如何影响 DeepMind 的“广撒网”路线 14:26 Google 的优势与代价:有钱、有算力、有耐心,但不一定能最早押中重点 DeepMind 与 Google 的复杂婚姻 15:29 Project Mario:DeepMind 曾秘密考虑从 Google 拆分 16:06 Reid Hoffman 的十亿美元承诺:拆分计划如何成为谈判筹码 18:12 创始人的天真:为什么 DeepMind 最后没有真正挥动拆分威胁 19:20 Demis 的后悔:AI for science 无悔,但错过 transformer 让他难以释怀 19:48 从 AlphaGo 到 AlphaFold:胜利十秒后就转向蛋白质折叠 21:47 Demis 的盲点:为什么他低估了语言模型通向智能的力量 巨头、创业公司与战略押注 23:22 风投创新能否战胜 hyperscaler:AI 时代资本与聚焦的拉扯 24:00 OpenAI 的商业模式压力:技术强,不代表一定能长期独立 25:09 Anthropic 的反事实:如果 coding model 晚爆发半年,故事可能完全不同 26:21 Demis 是否需要更公众化:回顾性叙事很强,前瞻性叙事不如 Sam 27:26 控制叙事的重要性:影响产品采用,也影响人才招聘 28:47 人才为什么离开 DeepMind:顶尖研究者更想加入“单点重注”的组织 29:57 Isomorphic 的独立化:让 AI for science 成为自己的核心赌注 30:11 Anthropic 的低流失率:强烈价值观如何带来高忠诚度 关键人物与关系网络 31:23 David Silver 的离开:强化学习信徒为什么想离开大组织创业 31:36 RL 与大模型路线之争:从经验中学习,还是从互联网数据中启动 34:05 为什么现在离开:强化学习重新流行,但组织押注仍不够集中 34:44 AI 实验室背后的少数掌舵者:个人关系如何影响行业走向 35:07 Demis 与 Elon:从 Founders Fund 场合相识,到 Elon 试图买下 DeepMind 35:29 “AI 会追你到火星”:Demis 如何说服 Elon 投资,又为何拒绝卖给他 38:21 Demis 如何看 Sam:科学家气质与硅谷融资高手之间的根本差异 AI 的伟人史观与精神追求 38:37 人物重要吗:竞赛动态不可避免,但领导者个性会改变路径 40:35 最改变作者看法的时刻:Demis 对科学奥秘近乎精神性的执着 41:48 AGI 的宗教意味:为什么追寻智能对很多人不只是技术项目 42:07 Demis 不愿谈什么:家庭、Google 内部冲突与 Mustafa Suleyman 离开 科学品味与未来可能 43:45 DeepMind 的真正启发:如何在前沿科学里判断什么时候该继续下注 45:00 AlphaFold 的关键转折:从“世界第一”到“真正解决问题” 46:37 被低估的 AI 英雄:Ilya Sutskever 与 David Silver 值得一部双人传记 47:11 Demis 会成为 Google CEO 吗:取决于他是否愿意牺牲科学时间 48:29 Sebastian 的写作体验:酒吧楼上三十小时对话如何改变一本传记的写法 🌟 精彩内容 💡 AI 竞赛几乎不可避免 Sebastian 认为,当一项技术拥有如此巨大的潜在力量时,不可能只有一个团队、一个国家或一个实验室去追求它。DeepMind 早期曾希望自己能成为那个在 AGI 边缘统一处理安全问题的团队,但现实证明,这种想法过于理想化。如今 Demis 已经转向另一种判断:AI 安全是集体行动问题,最终需要政府和国际合作介入。 “因为这项技术太有吸引力了,不可能只有一个团队对它感兴趣。” 🧠 被低估的 Demis Hassabis 节目中反复提到一个核心判断:公众太快把 OpenAI 和 Sam Altman 视为 AI 竞赛的最终赢家,却低估了 Demis Hassabis 和 Google DeepMind。Demis 早在 2010 年就创办 DeepMind,很多后来被 OpenAI 复制的 AI 实验室模式,最早都是由他开创的。Sebastian 认为,AI for science 这个方向在很长一段时间里几乎是 Demis 一个人真正坚持推动的。 “我觉得,人们太快就把 OpenAI 和 Altman 加冕为赢家了,同时低估了 Demis 这个人,也低估了 Google DeepMind 这家公司。” 🔬 DeepMind 的优势与短板:什么都想做 DeepMind 的一大特点是同时探索很多方向。Sebastian 认为,这与 Demis 的背景有关:他是神经科学 PhD,关心的是“智能到底是什么”这种宏大问题,因此很自然地倾向于广泛探索。Google 的资金、算力和人才让这种广撒网策略成为可能,但代价是,在 ChatGPT、coding agent 这样的产品化拐点上,DeepMind 往往不是第一个冲出来的玩家。 “只要有两条不同路线可以走,他们就会说,那我们两条都做。” 🧩 Project Mario:DeepMind 差点离开 Google 节目披露了 DeepMind 曾秘密考虑从 Google 拆分出去的 Project Mario。Reid Hoffman 曾承诺出资十亿美元支持拆分,Demis 试图用这一备用选项向 Google 争取更多安全监督权。但最终,他选择留在 Google:一方面不想陷入法律斗争,另一方面需要 Google 的巨大算力。这个选择后来帮助他推动 AlphaFold,并最终获得诺贝尔奖。 “我只想做科学。我不想被法律斗争分散注意力。我想要大量 compute 的访问权,所以我留下。” ⚖️ OpenAI、Anthropic 与 Google 的不同命运 Sebastian 认为,AI 竞赛也是风投支持的创业公司与 hyperscaler 巨头之间的竞争。Google 有近乎无限的现金与算力,可以承受落后一两年再追上;但创业公司更敢于做集中押注。OpenAI 押注 ChatGPT,Anthropic 押注 coding model,而 DeepMind 则往往同时推进许多方向。这种差异决定了它们在产品、人才和叙事上的不同表现。 🧲 公众叙事也是竞争力 Demis 擅长回顾性地讲述自己的故事,比如 AlphaGo 纪录片、《The Thinking Game》以及这本传记。但他不太像 Sam Altman 那样擅长在社交媒体上制造前瞻性叙事。Sebastian 指出,这会影响产品采用,也会影响人才招聘。AI 时代,谁控制叙事,谁就更容易吸引用户、资本和研究者。 “控制叙事确实很重要。” 🤖 David Silver 与强化学习信仰 David Silver 是 DeepMind 早期强化学习突破的关键人物,也是 AlphaGo、AlphaZero 背后的重要推动者。他坚信真正的超级智能必须从自己的经验中学习,而不是依赖人类留下的数据。Sebastian 认为,他离开 DeepMind创业,正是因为他希望在一个更小、更集中的组织里,让自己的强化学习愿景成为整个公司的核心路线。 “在他看来,一切都是 Agent,而且只能是 Agent,它们必须从自己身上学习。” 🔥 Demis 与 Elon 的复杂历史 Demis 和 Elon Musk 的关系非常戏剧化。Elon 曾投资 DeepMind,也曾试图阻止 DeepMind 卖给 Google。他担心 Larry Page 和 Google 不可信,甚至半夜通过 Skype 联系 Demis,试图说服他卖给 SpaceX 或 Tesla。但 Demis 拒绝了,因为 Google 有他需要的算力。此后 Elon 一度将 Demis 视为需要制衡的“邪恶天才”。 “如果你觉得自己在火星上就安全了,别忘了,我的 AI 会掌握太空飞行,然后它会一路跟你到火星。” 🧬 AI for science 是 Demis 的核心信念 AlphaGo 战胜李世石后,Demis 只享受了十秒胜利,就开始谈下一个目标:解决蛋白质折叠问题。Sebastian 认为,这不仅体现了 Demis 的雄心,也体现了他对 AI 社会合法性的判断:如果 AI 不能给人类带来明确好处,只带来工作冲击,那么社会可能会强烈反弹。AlphaFold 不只是科学突破,也是让人类接受 AI 的关键证据。 “如果 AI 不能给人类带来明确的好处,只是带来很多工作岗位的冲击,那 AI 能否大规模铺开就会成为问题。” 🌌 近乎精神性的科学追求 最让 Sebastian 改变对 Demis 看法的,是他发现 Demis 对科学奥秘有一种近乎精神性的执着。Demis 会拍着桌子说,我们其实并不理解这张桌子为什么是坚固的,也不理解一堆沙子和铜组成的电脑为什么能思考。对他来说,推动 AI 不只是技术竞赛,而是一种试图理解自然、智能乃至世界底层秩序的追寻。 “因为对他来说,这是一种近乎精神性的追寻。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#570. Notion创始人如何重启公司,AI 战时状态下的组织重塑📝 本期播客简介 本期我们克隆了:红杉资本出品的访谈节目《Notion’s Ivan Zhao: The Refounder》 原内容更新时间:2026-05-21 本期嘉宾是 Notion 联合创始人兼 CEO Ivan Zhao,主持人是 HubSpot 联合创始人、红杉合伙人 Brian Halligan。Brian 将 Ivan 称为“重新创办者”,因为 Notion 的成长并不是一条平滑上升的曲线,而是经历过多次接近推倒重来的关键时刻:早期找不到 product market fit 时,他和联合创始人 Simon 裁掉团队,搬到京都从零重建;生成式 AI 爆发后,他又在公司已有数百人的阶段,把 Notion 重新推向 AI native。 这期节目不只是 Notion 的创业故事,更是一场关于 AI 时代公司如何被重新设计的深度对谈。Ivan 分享了他为什么认为用 language model 做产品不是“造桥”,而更像“酿啤酒”;为什么 Notion 想做“爵士乐队”,而不是“军乐队”;为什么 AI 会让招聘标准从经验转向品味、主动性和价值体系;以及为什么每家公司都应该把创新点限制在一两个地方,而不是试图重新发明整个世界。 如果你正在思考 AI 时代的组织形态、产品策略、创业转型、企业销售、创始人角色,或者一家成熟 SaaS 公司如何避免僵化,这期节目会提供非常多一手经验和高密度判断。 👨⚕️ 本期嘉宾 Ivan Zhao,Notion 联合创始人兼 CEO。Notion 是全球知名的协作、知识管理与生产力工具平台。Ivan 是一位典型的产品型创始人,长期关注 tools for thought、软件工具的工艺感,以及技术与人性之间的关系。他曾带领 Notion 在早期困境中重建产品并找到 product market fit,也在生成式 AI 兴起后推动公司转型为 AI native 组织。 ⏱️ 时间戳 00:00 开场 & 播客简介 重新创办者的登场 00:37 本期克隆节目介绍:红杉资本《Notion’s Ivan Zhao: The Refounder》 01:31 Ivan 的核心隐喻:我们想做爵士乐队,不想做军乐队 02:13 为什么 Brian 称 Ivan 为“重新创办者” 04:06 从 founder mode 到 AI 时代的新 CEO 模式 AI 时代,公司要怎么重新组织 05:08 Notion 早期五年:靠 seed 资金硬撑,迟迟找不到 PMF 06:25 疫情增长之后:小团队的甜头与扩张的压力 07:08 学会授权与引入管理层:传统 SaaS 经验的利弊 08:03 造桥还是酿啤酒:为什么 AI 产品构建不可预测 09:56 会写代码的设计师、懂产品的工程师与跨职能团队 10:48 AI 放在组织中间:信息、决策与公司结构的重塑 12:49 “软件 + language model 是组织里的钢” 13:17 AI 会让组织更扁平,但不会消灭人性中的层级 招聘与人才标准的变化 14:10 Notion 的人才公式:能力经验 × 品味价值观 × 主动意愿 15:18 为什么 AI 时代既要招初级人才,也要招顶级资深人才 15:48 杠铃型组织:资深架构师、年轻 IC 与 coding Agent 的组合 16:32 设计师和 PM 的边界如何改变 17:51 从经验、斜率到品味:AI 时代为什么 taste 变得重要 19:16 为什么 taste 不在语言模型里,而在人身上 战时状态下的公司运营 19:16 拆分营销组织:storytelling 靠近产品,demand gen 服务销售 20:42 招聘流程变化:不先看简历,而是先看你做出来的东西 21:44 薪酬与能力导向:不能再平均撒资源 22:57 战时比和平时期更有生命力 23:20 创始人如何在自上而下与自下而上之间切换 24:41 爵士乐队,不是行进乐队:Notion 的组织哲学 25:50 Jazz mode:在结构中保留即兴和共同参与 规划、成本与 AI 毛利率 26:56 财务可以像军乐队,产品必须像爵士乐 28:03 AI 产品的成本压力与毛利率问题 28:35 为什么知识工作产品不一定总需要最强模型 29:11 第二梯队模型、open weight 模型与企业内部工作流 第一次 Refounding:京都重建 Notion 29:39 Notion 的第一次重启:裁掉团队,只剩两位创始人 31:01 裁员的痛苦:身体会告诉你必须这么做 31:18 为什么是京都:更大的房子、更低的成本和换一个故事 32:26 京都的工艺精神如何影响 Notion 34:46 为什么不放弃重开一家公司:Notion 是 Ivan 的毕生问题 35:56 tools for thought、Grateful Dead 与早期计算机文化脉络 36:21 技术、人性与工艺:为什么硅谷不该忘记历史 第二次 Refounding:从 SaaS 转向 AI 公司 38:27 给卡住的创业者建议:听从身体里的直觉,做剧烈改变 39:52 五百人阶段的重启:Cancun 与 GPT-4 的“宗教体验” 41:19 AI 产品并非一夜成功:一年半 Agent 探索期 42:40 早期绝望、AI 低谷与“现在一切都在着火” 43:18 给 SaaS 公司建议:从产品开始,创始人必须亲自 build 44:14 为什么你必须感受 AI,而不是只读文章或看视频 让公司持续再生 45:16 如何让僵化公司重新变软:引入创始人作为“去僵化机器” 45:35 Notion 的收购与 acquihire:五六十位创始人在公司内部继续创业 46:37 给创业者更大杠杆:在 Notion 平台上继续做原来的使命 47:26 创业更容易,规模化更难:AI 时代竞争密度暴增 48:45 已有规模的公司是否应该 refound:先真正感受到 AGI 49:13 未来组织的不变量:人性、层级、分工与法律责任 50:54 AI 系统会做越来越多决策,人类负责 context 和品味 52:01 知识管理重新变重要:现代知识工作只有约 150 年历史 Ivan 的 CEO 工作方式 52:33 内向型 CEO:为什么仍然必须学会一对多沟通 53:13 All hands 必须由创始人亲自讲 54:04 提词器如何改变 Ivan 的公司沟通 54:36 Notion 的 all hands 和 AMA 节奏 55:49 Ivan 的一天:早起、咖啡、办公室、健身、晚餐和继续工作 56:30 周末是快乐时间:跟随好奇心进入 rabbit hole 56:59 25 分钟会议、整块思考时间与 Slack 作为社交媒体 57:47 谦逊还是追求真实:盲人摸象与多元真相 给创始人的建议 58:24 CEO 是一个社会性游戏:地位、权力、竞争与价值观 59:19 如何在竞争、手艺、产品和商业之间找到自己的平衡点 01:00:26 放大优势,而不是沉迷弥补弱点 01:01:05 Notion 的企业销售教训:不要试图重新发明一切 01:02:37 每家公司只应该在一两个地方创新 01:03:34 从 PLG 到企业销售:尊重传统 playbook 的原因 01:04:40 系统型 CRO 与猎手型销售负责人如何互补 01:05:31 公司像宗教:文化、仪式、信念与意义感 01:07:20 Brian 总结:AI native CEO 的新手册正在形成 🌟 精彩内容 💡 “我们想做爵士乐队,不想做军乐队” Ivan 用“爵士乐队”来形容 Notion 的组织状态:它不是完全没有结构,而是在结构中允许即兴、协作和个人发挥。AI 时代变化太快,传统的计划、层级和流程不足以应对每周都在改变的技术环境,因此公司需要更多能自主判断、能跨职能协作、能在模糊中推进事情的人。 “我们想做爵士乐队,不想做军乐队。” 🧪 AI 产品不是造桥,而是酿啤酒 Ivan 认为,传统软件开发像造桥:只要设计清楚,结果大体可预测。但用 language model 构建产品更像酿啤酒,你无法完全控制“酵母”的行为,只能让最强的人一起实验、评估、调试和打磨。这也解释了为什么 Notion 的设计师、工程师和产品人员边界越来越模糊。 “用 language model 构建产品,尤其当时是这样,现在某种程度上也还是这样,更像是在酿啤酒。” 🧠 AI 时代,品味比经验更稀缺 Notion 的招聘标准发生了明显变化。Ivan 提出人才等于“能力和经验 × 品味或价值体系 × 主动意愿”。在 language model 让更多人都能写作、编程之后,基础能力会被拉平,但品味、价值观、好奇心和主动性不会轻易被模型替代。因此 Notion 更愿意招两类人:非常年轻、有能量和主动性的人,以及非常资深、能提供方向和品味的人。 “因为 taste 不在语言模型里。taste 在人身上。” 🏗️ “Language model 加软件,就是组织里的钢” Ivan 用钢结构建筑来解释 AI 对组织的影响。在钢出现前,建筑高度受限;有了钢,城市天际线才发生变化。同样,过去公司依赖大量中间层传递信息、文件和决策,而 language model 加软件可以成为新的承重结构,帮助组织更快地流转信息、辅助决策,并重新设计内部流程。 “language model 加软件,就是组织里的钢。” 🔁 Notion 的第一次重启:京都、裁员与从零重建 早期 Notion 找不到 product market fit,钱也快花完。Ivan 和联合创始人 Simon 做出剧烈决定:裁掉团队,只剩两个人搬去京都,从零重建产品。京都的工艺传统、寺庙、刀具、陶瓷和工具文化,让他们更强烈地意识到,软件也应该是一种被认真打磨的工具。 “你身处这种地方,怎么可能不被激励,去做一个更好的软件工具呢?” ⚡ 第二次重启:GPT-4 带来的“宗教体验” 当 Ivan 第一次体验 GPT-4 时,他觉得世界停住了。他意识到,如果 Notion 不做 AI,公司正在做的一切都可能失去意义。但这次转型并不是顺风顺水,Notion 花了一年半探索 Agent 产品,中间尝试了 Anthropic、OpenAI finetuning 等多种方案,都没有马上跑通。直到模型能力真正提升,AI 产品才开始带来增长拐点。 “GPT-4 对我来说像一次宗教体验。你必须用它做点什么。它会改变一切。” 🛠️ 创始人必须亲自 build,才能真正理解 AI 对于那些想转型 AI 的 SaaS 公司,Ivan 的建议非常直接:从产品开始,创始人必须亲自参与,必须真正使用 language model,必须感受它能打开哪些新路径。只是读文章、看视频、听别人讲都不够。你可以为产品 build,也可以为内部系统 build,甚至周末自己折腾小工具,但一定要亲手做。 “你必须去做点什么,必须感受它。感受 AI,感受 AGI。” 🎯 不要什么都创新:每家公司只需要一两个创新点 Notion 曾经试图重新发明企业销售,希望用第一性原理打造一套全新的 go-to-market 方式。但 Ivan 后来承认这是错误的:传统企业销售 playbook 能存在二十年,是因为它符合人性。客户在购买昂贵产品时,仍然想见到真人,想获得信任感。Ivan 的反思是,每家公司都应该把真正的创新限制在少数几个地方。 “每家公司都应该把自己的创新点限制在少数几个地方。一两个地方就够了。” 🧭 CEO 是社会性游戏,但也必须忠于自己的价值观 Ivan 认为,CEO 是一个充满地位、权力、竞争和社交动态的游戏,有点像娱乐业,也有点像体育。但如果只为了竞争而竞争,能量并不可持续。真正重要的是找到自己的价值观平衡点:你到底想建立什么样的公司?你在乎手艺、产品、人性、商业、竞争中的哪一部分?随着能力越来越被机器商品化,创始人自己的观点、品味和优势会变得更重要。 “我需要和自己的价值观达到一种平衡,弄清楚我到底想建立一家什么样的公司。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#569. 深入 xAI:三个月打造 Grok Imagine、视频生成与世界模型之争,以及视频智能体📝 本期播客简介 本期我们克隆了:Latent Space: Inside xAI: Building Grok Imagine in 3 Months, Videogen vs World Models, and Video Agents— Ethan He 原内容更新时间:2026-06-01 本期节目是一场关于视频生成、世界模型和 Video Agent 的高密度技术访谈。嘉宾 Ethan He 曾在 Nvidia 参与 Cosmos world model,后来加入 xAI,从零参与 Grok Imagine、音视频联合生成、reference video、视频延展和 world model 相关工作。他在节目中复盘了 xAI 如何在短短三个月里,从没有基础设施、没有数据、没有模型的状态,快速做出 Grok Imagine 0.9;也详细解释了视频模型从数据、caption、VAE、diffusion transformer 到 distillation 的完整训练链路。 更重要的是,Ethan 提出了几个非常有判断力的观点:视频模型的很多进步,其实来自语言模型,而不是视频 diffusion 本身;world model 在他看来就是“实时、可交互、长时程的视频”;未来的 Video Agent 会像人类创作者一样,调用视频模型、图像编辑器、FFmpeg 和各种确定性工具,迭代生成真正可用于广告、创作和生产环境的视频内容。这期不仅适合想理解视频生成技术路线的人,也适合想提前看懂 AI 交互界面、生成式媒体和 Agent 未来趋势的听众。 👨💻 本期嘉宾 Ethan He,曾在 Nvidia 参与 Cosmos world model 和 Megatron-LM MoE 等工作,后加入 xAI,参与 Grok Imagine、视频生成、音视频联合生成、reference video、视频延展和 world model 相关研发。他的研究经历横跨计算机视觉、自监督学习、大规模 MoE、视频 diffusion、world model 和 LLM Agent。 ⏱️ 时间戳 00:00 开场 & 播客简介 从 Cosmos 到 xAI:三个月做出 Grok Imagine 02:42 嘉宾登场:Ethan He 与 Latent Space 社区的缘起 04:14 为什么离开 Nvidia:视频模型也有 scaling law,需要更大算力 05:43 xAI 从零起步:三个月做出 Grok Imagine 0.9 06:15 快速迭代的秘密:人才、infra、compute 与低沟通成本 08:23 模型质量提升的真相:很多突破来自数据和训练 pipeline 里的小 bug 08:37 Coding model 如何改变研究节奏:代码更快,compute 再次成为瓶颈 09:54 高压研发文化:算力昂贵,但这是一场马拉松 视频模型是怎么训练出来的 11:46 为什么做视频模型之前,通常要先做图像模型 12:50 数据从哪里来:人工详细标注与 VLM 生成 synthetic caption 14:12 训练视频模型为什么既需要配对数据,也需要无标签数据 15:07 VAE / tokenizer:为什么不能直接在像素上训练 17:08 Diffusion transformer:从噪声一步步去噪生成图像和视频 17:27 图像模型如何 bootstrap 视频模型:语言与图像连接更密集 18:24 视频压缩路线:逐帧压缩 vs 时间维度压缩 18:55 为什么不用 MP4 token 直接训练:latent space 必须对模型友好 20:00 实时性的代价:时间压缩节省 context,但会引入响应延迟 生成式 UI 与世界模型的早期形态 20:51 Flipbook:像浏览器一样探索模型想象出的网页 22:31 Generative UI:从用户意图直接到像素,而不是先写代码再渲染 24:09 Diffusion 前端,确定性后端:未来界面可能如何被重构 25:15 人机交互的带宽:人类用语音输出,用视觉输入 26:15 NeuroOS:用视频模型模拟操作系统和游戏 27:52 从过拟合现有界面,到想象全新交互系统 28:47 为什么视频模型能生成训练集中不存在的超自然内容 视频模型的成本、加速与音视频联合生成 31:05 视频模型到底有多贵:训练成本接近中等规模 LLM 31:52 被低估的成本:视频存储、特征存储、IO 和 egress 33:29 训练规模:数十万亿视觉 token、百亿级 active 参数 34:16 推理端加速:step distillation 如何把一百步变成几步 36:36 Consistency model、GAN 与少步生成的关系 37:48 Grok Imagine 0.9:大规模音视频联合生成模型 38:00 音频为什么难:speech 更离散,music 更连续 40:25 音视频对齐:模型必须理解每一秒声音和画面的关系 41:20 时间感:为什么 LLM 本身并不真正感知时间 Ethan 对 World Model 的定义 43:47 什么是 world model:实时、可交互、长时程的视频 44:03 交互性:键盘、鼠标、语音都可以成为输入模态 45:00 实时性:游戏需要毫秒级响应,数字人也要接近两百毫秒 46:00 长时程:世界模型不能只生成几秒,而要持续几分钟甚至几小时 47:00 视频延展:通往长时程 world model 的第一步 48:00 长 context 的挑战:五秒视频就可能有五六万 token 49:03 为什么用户喜欢视频延展:它是通往最终目标的中间产品 Reference Video 与动态上下文管理 51:24 长视频里的冗余:不是所有历史都需要一直放进 context 52:01 Reference video:用角色、物体、场景作为生成条件 52:46 为什么 reference 是一种“作弊”,也是一种重要机制 54:34 FramePack 与动态 context selection:离当前越远,信息越压缩 55:52 LLM 与视频模型共享的问题:context pruning 目前仍高度依赖 heuristic 56:14 Continual learning 的可能突破:让模型自己管理上下文 57:00 人类注意力的启发:不是记住一切,而是动态拉取相关信息 xAI 文化与生成式视频安全 58:35 xAI 被低估的地方:move fast、build、宏大目标和 first principles 59:30 如何倒推三个月目标:从数据、训练、人工标注、GPU 周转时间拆解 60:12 Elon Musk 的工作方式:非常 hands-on,直接给反馈 61:09 Grok Voice:实时语音体验、打断能力和车载场景 61:56 生成式视频安全:水印、下架和社交平台治理 62:19 SynthID 的局限:论文公开后,水印也可能被反向工程 63:04 AI 生成内容越来越难识别:从看手指,到看逻辑是否成立 视觉智能为什么来自语言 64:31 核心判断:视觉智能很大程度来自语言模型 65:00 Prompt rewriter:视频模型背后的“大脑” 65:40 为什么视频 diffusion model 很“字面”:用户说“一只猫”,它可能只生成一只不会动的猫 66:10 GPT Image 类模型为什么要“想几分钟”:时间花在推理、重写 prompt 和组织内容上 67:07 不同架构路线:独立 LLM + diffusion、omni model、离散图像 token 68:21 生成—理解—再生成:omni model 可能如何迭代优化图像 69:54 Prompt rewriter 与 diffusion head 不是一回事,但语言侧都在贡献智能 70:33 不需要 joint training,光重写 prompt 就能显著提高画面质量 Video Agent:生成式媒体的下一波 71:54 Video Agent 的愿景:像人类创作者一样调用工具、编辑、迭代 72:13 Grok Imagine Agent beta:从视频生成走向视频创作工作流 72:29 为什么“生成一分钟视频”是 Agent 任务,而不是单次视频模型任务 73:30 从 Copilot 到 Claude Code:视频创作也会经历 Agent 化 74:17 速度、thinking budget 与 inference infra 75:12 Video Agent 的真正价值:不是模型到头了,而是 harness 和工具链解锁新能力 76:21 AI 模型更懂 AI 模型:未来会有模型专门负责 prompt 和调度生成模型 77:28 为什么确定性工具仍然重要:字幕、排版、精准编辑不必全靠视频模型 78:02 Ethan 的时间判断:年底 Video Agent 会成为大热点 78:20 Production grade 视频:一旦可用于广告和展示,预算会指数级增长 机器人、LLM 与下一阶段研究 78:36 World model 不一定只服务机器人,但机器人会自然成为 AI 可调用的工具 79:12 Physical AI 也许不需要先在真实世界解决,可以先被强视频模型解决 80:10 为什么离开 xAI:想做公司优先级之外的研究,尤其是语言模型方向 81:06 视频模型的瓶颈,正在转向语言模型和 Agent 81:31 未来一年关注什么:模型感知并管理自己的 context 82:00 Context awareness:模型应该知道自己快到上下文上限了 82:30 Context addition / removal / compaction:今天由 harness 做,未来可能被模型吸收 83:59 Self-modifying harness:模型像程序一样,在 test time 给自己编程 85:22 职业路径:从 ResNet 时代的视觉研究,到 FAIR、Cosmos、MoE、xAI 86:44 为什么跨方向并没有想象中困难:训练大模型的原则高度相通 87:33 收尾:xAI 背后还有很多未被讲清楚的层次 🌟 精彩内容 💡 三个月做出 Grok Imagine:速度来自迭代能力 Ethan 回顾了自己加入 xAI 时的状态:没有 infra、没有数据、没有模型,只有几个工程师和一个非常明确的目标。最终团队用三个月发布了 Grok Imagine 0.9。他认为,训练模型最关键的不是某个神奇算法,而是端到端迭代速度:你每天能做多少轮实验,发现多少 bug,修正多少数据和训练 pipeline 的问题。 “我看训练模型这件事时,最重要的其实是,你每天能做多少轮迭代。” 🧠 视频模型的进步,很多来自语言模型 本期最反直觉的观点是:视觉智能很大程度来自语言。Ethan 解释说,视频 diffusion model 本身往往非常字面,它们需要一个更强的语言模型做 prompt rewriting,把用户简单的指令扩展成极其详细的视觉描述。很多图像和视频质量的提升,不是因为 diffusion 模型突然更聪明,而是因为语言模型更会思考、更会写 prompt、更会调用工具。 “我有一个挺大的判断:视觉智能很大程度上其实来自语言,尤其是这些视频模型。” 🌍 World model 是什么:实时、可交互、长时程的视频 Ethan 不试图争论 world model 的唯一标准定义,而是从视频生成角度给出自己的定义:world model 就是实时、可交互、长时程的视频。它要能响应键盘、鼠标、语音输入;要能做到低延迟;还要能持续生成几分钟甚至几小时,并保持角色、声音、物体和事件的一致性。 “在我看来,world model 就是实时、可交互、长时程的视频。” 🧩 长视频的核心难题:不是更长 context,而是会管理 context 视频生成面临巨大的 context 压力。Ethan 提到,Cosmos 中五秒视频就可能有五到六万 token,长视频很容易爆炸。因此,未来的关键不只是硬扩 context length,而是让模型学会动态选择历史信息:什么时候需要完整记住上一秒,什么时候只需要压缩远处历史,什么时候要把某个角色的 reference 拉回来。 “模型应该能够自己选择性地知道,我应该从哪里取 reference。” 🎬 Video Agent 会成为生成式媒体的下一波 Ethan 认为,Video Agent 不是简单地“生成几个片段再拼起来”,而是会像人类创作者一样,使用视频模型、图片编辑工具、视频编辑器、FFmpeg、字幕工具和确定性工具,反复生成、检查、修改、组合,最终做出 production grade 视频。他预测,到年底 Video Agent 会成为一个大热点,一旦生成视频达到广告和展示可用标准,企业预算会快速进入。 “AI 模型更懂 AI 模型。” 🔊 音视频联合生成的难点:时间对齐 Grok Imagine 0.9 被 Ethan 称为第一个大规模部署的音视频联合生成模型。它的难点不只是生成声音,而是让声音、音乐、对白和画面在时间上精确对齐。文本和图像的对齐可以比较松散,但音频和视频必须在每一个时间步上对应,这让数据标注、caption 和模型设计都更加复杂。 “模型必须知道视频和音频之间有基于时间的对齐关系。” 🖥️ Generative UI:未来界面可能直接由模型生成 Ethan 展望了一种未来:如果推理成本足够低,用户界面不一定再由代码写出、浏览器渲染,而可以由 generative model 直接从用户意图生成像素。你可以让 email 像 TikTok 一样呈现,也可以生成没有点赞按钮的 Instagram stories。LLM 和 coding model 负责后端逻辑,diffusion model 成为前端视觉层。 “Generative UI 就是从用户意图直接到像素。” 🧠 LLM 的下一步:感知并管理自己的上下文 离开 xAI 后,Ethan 接下来更关注语言模型方向。他认为,模型未来需要知道自己的 context 状态:什么时候快到上限,什么时候该压缩,什么时候该删除工具调用结果,什么时候该把某些信息重新加入上下文。今天这些工作主要由 Agent harness 的 heuristic 完成,但未来可能会被模型自己吸收。 “启发式工程里的很多东西,最后也会被模型自己吸收进去。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#568. Transformer辩论:如何理解下一代智能之争📝 本期播客简介 本期我们克隆了:Pathway《Transformer vs Post-Transformer | ft. Lukasz Kaiser, Adrian Kosowski, Mathias Lechner, & Llion Jones》 这是一场以“拳击赛”形式呈现的 AI 架构思想对决:Transformer 还会继续统治下一代 AI,还是我们已经站在 postTransformer 时代的门口? 辩论的一边,是 Transformer 共同发明者 Lukasz Kaiser,他认为 Transformer 虽然简单得近乎疯狂,却已经证明自己能够工作、能够扩展,并且可以被理解为一种强大的可微分记忆系统。另一边,Adrian Kosowski 和 Llion Jones 则认为,Transformer 只是智能的一种实现形式,而不是智能的终极答案。人脑的数据效率、连续学习、非语言推理和动态状态,都在提醒我们:一定还存在更好的东西。Mathias Lechner 则代表更工程化的中间路线:未来可能不是 Transformer 或 postTransformer 二选一,而是根据硬件、场景和能力需求,把所有可用 building block 组合起来。 这期节目尤其适合想理解 AI 底层趋势的人:为什么 Transformer 如此强大?为什么 scaling laws 仍然重要?为什么“用语言思考”可能不是最高效的 reasoning?新架构为什么总会被硬件拖住?benchmark 到底能不能衡量真实智能?如果你关心 AI 下一轮技术红利、创业机会、算力焦虑和 AGI 路线之争,这是一场非常值得听完的高密度讨论。 👨⚕️ 本期嘉宾 Lukasz Kaiser,Transformer 共同发明者之一,曾参与创建 ChatGPT o1,是现代大语言模型架构演进中的关键人物。 Adrian Kosowski,Pathway 的 CSO,BDH 架构的发明者之一,主张从动态系统、latent reasoning 和持续学习角度探索 postTransformer 架构。 Mathias Lechner,Liquid AI 研究者,专注于构建新一代 foundation model,强调 Transformer 与 postTransformer building blocks 的混合使用,以及模型在不同硬件和部署场景中的实际表现。 Llion Jones,Transformer 共同发明者之一,虽然参与了 Transformer 的诞生,但在本场辩论中站在 postTransformer 阵营,认为 AI 需要跳出当前架构的局部最优。 ⏱️ 时间戳 00:00 开场 & 播客简介 拳击赛开局:谁代表 AI 的下一个时代 01:43 现场规则:用拳击赛形式辩论 Transformer vs postTransformer 04:02 Lukasz 开场:Transformer 是简单、漂亮、而且真正能工作的 memory 06:40 Adrian 开场:智能还没有迎来自己的 PageRank 时刻 09:54 Mathias 开场:未来不是二选一,而是 Transformer 加 postTransformer 12:22 Llion 开场:Transformer 很强,但它可能只是 brute force 的局部最优 第一轮交锋:Transformer 到底是不是终局 16:42 Lukasz 反驳:Transformer 仍是当前机器学习里最强的可扩展答案 19:00 Adrian 反击:reasoning 和 learning 不一样,语言思考不是唯一解 21:38 Mathias:Transformer 和 RNN 的边界会越来越模糊 23:33 Llion:真正突破不是重排组件,而是重新质疑神经网络假设 智能是什么:语言、压缩与人脑 26:04 智能定义之争:是可观察行为,还是更深层的信息处理过程 28:30 Transformer 是否把工程便利误认为科学真理 29:08 智能即压缩:预测互联网下一个词为什么如此有效 30:02 Language 与 reasoning:语言承载智能,但也限制思考方式 31:30 发现新知识时,非语言推理是否更高效 31:52 人脑与儿童启发:为什么小孩不用长链推理也能快速泛化 Scaling 之争:算力还会继续赢吗 33:06 Bitter Lesson:为什么十倍算力和十倍数据常常打败巧妙设计 33:34 不同架构都有 scaling law,但硬件适配决定谁能赢 34:34 Lukasz:如果有比 Transformer 更好的 scaling curve,请拿出来 35:56 Adrian:数据、模型、算力不一定必须一起 scale 现实世界部署与 benchmark 36:58 非文本模态:蛋白质、基因序列和生物医学信号中的架构差异 38:05 Benchmark 会不会误导我们 39:11 Perplexity:为什么“预测下一个 token”仍可能是最硬的指标 40:57 最后陈述:比拼的关键不是单次成绩,而是 scaling curve 的斜率 最终立场:Transformer 现在赢,但未来未定 41:53 Adrian:下一次突破可能来自更高效、更紧凑的 reasoning 43:08 Mathias:两边都押注,探索所有可能性 43:40 Llion:今天没有任何理由能让我放弃“还有更好东西”的信念 观众提问:硬件会不会锁死创新 44:31 硬件彩票:现有 GPU/TPU 是否让大家困在 Transformer 范式 45:18 Llion:postTransformer 第一版不必马上打败 SOTA 46:12 Lukasz:Transformer 当年也不适配硬件,真正强的架构会推动硬件改变 48:38 慢 50 倍也不要怕:只要 scaling curve 更好,就值得探索 学习、记忆与动态权重 48:59 智能是否首先是学习能力 50:10 In-context learning:把上下文学习延长到无限时间会怎样 51:01 Continual learning:给静态权重打补丁,还是从头设计动态系统 51:41 Transformer 的 activation 是否已经在做类似 gradient descent 的事 53:25 Transformer 不会消失:postTransformer 世界里仍会使用 Transformer 54:08 Attention weights 也是动态权重吗 55:32 经验型 context:模型是否能从自己的行动、错误和反馈中学习 安全、微调与 latent reasoning 57:25 Fine-tuning、context learning 和 latent space 推理的关系 58:05 文本 chain of thought 是否真的可解释 58:58 postTransformer 是否可能更接近大脑,从而更可解释、更安全 59:13 现场投票:用欢呼声决定今晚冠军 🌟 精彩内容 💡 Transformer 的核心优势:简单到疯狂,但真的能工作 Lukasz Kaiser 为 Transformer 做出的核心辩护,不是说它完美,而是说它已经在最重要的层面证明了自己:它简单、可扩展、能被硬件放大,并且真的产生了聊天、写代码、操作电脑等能力。他把 Transformer 理解为一种 memory:为每段输入写下 key 和 value,再用 soft attention 检索相关内容。 “这个疯狂简单的机器,只是在一句话或者一段更长文本里预测下一个 token,却能够和你聊天,现在还能写代码,点击你电脑上的窗口。” 🧠 PostTransformer 的焦虑:智能还没有 PageRank 时刻 Adrian Kosowski 认为,Transformer 是智能的一种实现,但不是智能背后的共同原理。就像搜索引擎时代,PageRank 抓住了信息索引的核心机制一样,AI 领域仍然缺少一个真正解释智能的核心方程或过程。postTransformer 的意义,不是简单否定 Transformer,而是继续寻找更直接、更完整的智能机制。 “我认为,在智能这件事上,我们还没有迎来 PageRank 时刻。” 🥊 Transformer 共同发明者倒戈:我们被困在局部最优里 Llion Jones 的立场格外有意思:作为 Transformer 共同发明者之一,他却站在 postTransformer 阵营。他认为 Transformer 太成功了,反而让研究社区过度围绕它做增量改进,忽略了更根本的假设:神经网络一定要长这样吗?一定要用 backpropagation 训练吗?reasoning 一定要用语言展开吗? “今天我没有听到任何理由,能让我怀疑自己的信念:一定还有更好的东西。” ⚙️ 硬件不是借口,但决定了谁能成为主流 这场辩论反复回到一个现实问题:很多新架构也许理论上更优,但如果跑在当前硬件上慢 50 倍,就很难被接受。Lukasz 提醒大家,Transformer 当年也并不天然适配 TPU,甚至 softmax 还需要绕到 CPU 上处理。真正强的新架构,需要先证明自己有更好的 scaling curve,然后硬件自然会跟上。 “如果你给我看一个模型,它只是稳定地慢五十倍,但增长曲线更好,那你就赢了。” 📈 Scaling Laws 仍是绕不开的门槛 即便 postTransformer 阵营认为还有更好的架构,大家也基本承认一个事实:任何新架构都必须面对 bitter lesson。AI 历史上,很多巧妙设计最终输给了更大算力、更大数据和更好 scaling。问题不在于要不要 scale,而在于有没有可能找到一种架构,用更少数据、更少硬件、更高效率完成同样甚至更强的能力。 “如果你给我看一条曲线,它下降得比 transformer 更陡,那我可能就得承认。” 🧩 语言不是推理的全部 嘉宾们讨论了一个关键问题:当前大模型很大程度上是在语言中 reasoning,但人类的许多思考过程并不是语言化的。Llion 认为,语言承载了大量智能,所以语言模型才会成功;但语言也可能限制了模型进行发现、直觉和快速泛化的能力。postTransformer 可能需要在 latent space 中做更原生的 reasoning。 “我们强迫它们用 language 来思考,可我们自己的某些心理过程,确实不是建立在 language 上的。” 🧪 Benchmark 的核心指标也许还是 perplexity 面对各种 benchmark 被刷榜、被针对的问题,Lukasz 提出一个朴素但重要的观点:perplexity,也就是预测下一个 token 的能力,仍然是非常难被超越的指标。它本质上对应“压缩”:如果一个模型能更好地压缩文本、代码、图像或蛋白质序列,它往往也更理解这些数据。 “你越能更好地压缩互联网,你就越智能。” 🔄 Continual Learning:AI 是否需要像人一样持续更新 观众提问引出了另一个核心差异:人类和生物的大脑不是冻结的,而是每一秒都在更新连接;而当前 Transformer 通常是预训练后冻结,再通过上下文、微调或外部系统补充能力。Adrian 提出,可以把 in-context learning 看成一种延长版学习:如果模型拥有无限长上下文,持续记住经验、错误和反馈,它也许就接近了持续学习。 “智能就像是把 in-context learning 延长到时间趋近于无穷。” 🛡️ Latent Reasoning 与安全:文本思维并不等于可解释 关于 latent space 推理是否带来安全风险,Lukasz 提醒大家不要误以为文本 chain of thought 就完全透明。即便模型输出的是文字,文字之上仍然有大量 activation 和高维向量活动,我们并不知道里面真正发生了什么。未来模型可能说出同样的词,但内部想法已经完全不同。 “只是因为 pretraining,它们现在还算忠实。但也许有一天,你会看到模型说出同样的词,可里面的想法已经完全不同。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#567. 黄仁勋:Agent 时代普通人和企业的新生产力,AI 基础设施竞赛下的计算革命📝 本期播客简介 本期我们克隆了:Yahoo Finance《Nvidia GTC Taipei 2026: Jensen Huang Full Keynote》 原内容更新时间:2026-06-01 本期节目是 NVIDIA 创始人兼 CEO 黄仁勋在 GTC Taipei 2026 的完整主题演讲。黄仁勋回到台湾,面向全球供应链伙伴、开发者、企业客户和 AI 产业生态,系统阐述了 NVIDIA 对下一阶段 AI 时代的判断:Agentic AI 已经到来,AI 不再只是生成内容,而是开始理解、推理、规划、调用工具并完成工作。 在这场 keynote 中,黄仁勋提出了几个极具冲击力的判断:“AI 现在是利润生成器。AI 现在是 GDP 生成器。”“Compute 现在就是收入,Compute 就是利润。”“过去我们为人类创造 CPU,而人类只有十亿人。未来会有数十亿个 Agent。”围绕这些判断,他进一步解释为什么 AI Factory 会成为人类历史上最大规模的基础设施建设之一,为什么 Vera Rubin 不是一颗芯片而是一整套面向 Agent 的超级计算系统,为什么 Vera CPU 要为“没有耐心的 Agent”重新设计,以及为什么 PC、汽车、机器人、工厂和基站都会变成 Agentic 系统。 这不仅是一场产品发布会,更是一套关于未来十年计算范式的完整宣言:软件会从应用程序变成 Agent,数据中心会从成本中心变成 token 工厂,企业会拥有自己的 Agent 工具链,个人电脑也可能从“打开应用的机器”变成个人 AI 助手的家。 👨💼 本期主讲人 黄仁勋,NVIDIA 创始人兼 CEO。他带领 NVIDIA 从 GPU 公司发展为加速计算、AI 芯片、AI 系统、网络、软件平台与 AI 基础设施公司。在本场 GTC Taipei 2026 演讲中,他重点发布并解释了面向 Agentic AI 时代的 Vera Rubin、Vera CPU、NVIDIA DSX、Nemotron 3 Ultra、RTX Spark、Cosmos 3 与 Isaac GR00T 等关键产品与平台。 ⏱️ 时间戳 00:00 开场 & 播客简介 Agentic AI 已经到来 01:32 回到台湾:感谢台湾供应链生态与 GTC Taipei 现场 03:50 有用的 AI 到来了:从 GitHub commit 暴增看软件生产力跃迁 07:10 AI 从成本变利润:token 需求、GDP 生成器与 compute 经济学 09:40 什么是 Agent:模型、harness、memory、工具与 runtime 13:10 从 prompt 到代码、GIF 和 CAD:Agentic AI 的实际工作方式 16:30 软件公司不会被 Agent 消灭,反而会迎来更大工具需求 新计算模型与 AI Factory 18:20 CUDAX 库成为 Agent 的工具箱:CUDA 生态的新价值 21:10 Agent 是终极分布式计算模型:大脑、身体与工作坊 24:20 为什么 Vera Rubin 是下一代系统:为解耦、异构、分布式 Agent 而生 27:40 NVIDIA 从 GPU 公司变成 AI 基础设施公司 29:40 DSX AI Factory:用数字孪生设计和运营 AI 工厂 33:30 一吉瓦 AI 工厂的经济学:compute 就是收入,token 就是利润 36:50 AI Cloud 生态扩张:CoreWeave、Nebius、Nscale、GMI 等区域云机会 Vera Rubin:为 Agent 时代打造的超级计算系统 40:10 Vera Rubin 全面量产:供应链规模达到 Grace Blackwell 的两倍 43:20 从 DGX-1 到 Vera Rubin:AI 超级计算机的十年演进 46:00 Vera Rubin NVL72:面向 prompt、context、推理和规划 48:40 Vera CPU Rack 与 Vera BlueField:Agent 的编排、记忆与安全 51:00 现场展示 Vera Rubin:无缆线、无软管、无风扇的新一代机架设计 54:20 从 Hopper 到 Blackwell 再到 Vera Rubin:从预训练、推理到 Agentic inference Vera CPU:为数十亿 Agent 设计的 CPU 57:20 为什么旧 CPU 不适合 Agent:人类按秒等待,Agent 按纳秒等待 59:30 CPU 是指挥,GPU 是乐团:CPU 延迟直接影响 token 吞吐 01:02:00 Vera 的四个关键指标:单线程性能、每核带宽、总带宽与能效 01:05:10 Vera 架构细节:Olympus core、LPDDR5X、PCIe Gen 6 与高速 fabric 01:08:20 真实工作负载提升:SQL 加速三倍,实时流处理加速六倍 01:10:30 一个新市场的开始:为 Agent 而不是为人类制造 CPU 企业 Agent 工具链与超级 Agent 01:12:40 未来十年的应用模式:每家公司都会运行 Agent 01:14:20 NVIDIA Agent Toolkit:模型、harness、工具、技能与 runtime 01:16:00 Open Shell:让企业安全运行 Agent 的开源 runtime 01:18:00 Cadence 芯片设计 Agent:从数周验证周期压缩到数小时 01:21:10 企业软件的新机会:Agent 不会消灭软件公司,而会放大软件价值 Nemotron 3 Ultra 与开放模型 01:23:00 Nemotron 3 Ultra 发布:开放模型、开放数据与开放训练方法 01:25:00 混合架构模型:SSM 与 MoE 结合,速度提升五倍 01:26:40 成本降低百分之三十:让企业能打造自己的专有 Agent 01:28:00 与 Cadence、CrowdStrike、Palantir、SAP、ServiceNow 等合作 重新发明 PC:从个人电脑到个人 AI 01:29:10 Microsoft 与 NVIDIA 重新发明 PC:Agent 会运行在个人电脑上 01:31:00 RTX Spark:面向 Agent 的新一代 Windows AI PC 01:33:00 N1X 芯片:Blackwell RTX GPU、Grace CPU 与统一内存 01:35:00 本地 Agent 示例:用 RTX Spark 协助完成建筑设计工作流 01:38:00 Adobe、创作者工具与 Agent 友好型软件生态 01:40:00 三类新 Windows 机器:笔记本、台式机与 DGX Station 01:43:00 PC 的未来:从打开应用的工具,变成家庭里的个人 AI 超级计算机 Physical AI、机器人与世界模型 01:46:00 Agentic AI 本质上是数字机器人:所有设备都会运行 Agent 01:48:00 Physical AI 的核心难题:机器人需要第一人称世界数据 01:50:00 Cosmos 3 发布:面向 physical AI 的开放 frontier omni model 01:52:30 Compute 就是数据:用 Cosmos 生成、仿真和训练物理世界 AI 01:54:20 AlpamayoR1:面向自动驾驶汽车的开放推理模型 01:56:00 Isaac GR00T:面向人形机器人的开放开发平台与参考机器人 总结与收束 01:58:30 过去六个月计算机行业已被彻底改变 02:00:00 Agentic 计算模式会复制到云、本地、PC、机器人、汽车和边缘设备 02:02:00 NVIDIA 从 GPU、系统公司走向 AI 基础设施公司 02:04:00 感谢台湾生态与全球合作伙伴,祝 COMPUTEX 顺利 🌟 精彩内容 💡 Agentic AI 已经到来 黄仁勋在开场不久就明确表示,AI 的下一波浪潮已经从生成式 AI 走向 Agentic AI。AI 不再只是回答问题,而是能够观察、理解、推理、规划、调用工具并执行任务。他用软件开发、代码生成、CAD 文件生成等例子说明,AI 已经开始真正“完成工作”。 “下一波 AI 是 agentic AI。今天我们可以说,agentic AI 已经到来了,有用的 AI 已经到来了。” 💰 Compute 就是收入,token 就是利润 这场演讲最核心的商业判断之一,是 AI 已经从成本中心变成利润中心。黄仁勋认为,当 token 能够带来收入和利润时,AI Factory 就不再只是数据中心,而是生产 token 的工厂。每瓦能生成多少 token,直接决定企业的收入能力。 “AI 现在是利润生成器。AI 现在是 GDP 生成器。” “Compute 现在就是收入,Compute 就是利润。” 🏭 AI Factory 是下一代基础设施 黄仁勋把未来的数据中心定义为 AI Factory,并强调这是人类历史上最大规模的基础设施建设之一。它不只是买 GPU,而是从芯片、机架、网络、供电、冷却、电网到运维软件的全栈协同设计。NVIDIA DSX 正是为了帮助客户设计、模拟、部署和运营这些巨型 AI 工厂。 “全世界都在竞相建设 AI factory。这是人类历史上最大规模的基础设施建设。” 🧠 Vera Rubin 不是一颗芯片,而是一套 Agentic 系统 Vera Rubin 是本场演讲最重要的硬件发布之一。黄仁勋反复强调,它不是单一 GPU,也不是单一芯片,而是为了运行 Agentic AI 而打造的多机架、podscale 超级计算系统。它包含 GPU、CPU、网络、存储、安全、内存系统和整套软件栈,用于支撑 Agent 的思考、记忆、工具调用和执行。 “Vera Rubin 不只是为了运行 AI。Vera Rubin 是为了运行 Agent 打造的。” ⚙️ Vera CPU:为没有耐心的 Agent 而生 黄仁勋提出一个非常形象的观点:过去的 CPU 是为人类设计的,因为人类可以按秒等待;但 Agent 是按纳秒等待的,它们每一次工具调用、数据库访问和代码执行都要求极低延迟。因此,Vera CPU 的目标不是传统意义上的出租更多 core,而是以极高单线程性能、极高带宽和高能效来服务 Agent。 “过去我们为人类创造 CPU,而人类只有十亿人。未来会有数十亿个 Agent。” “CPU 是指挥,GPU 是乐团。” 🛠️ 每家公司都会构建自己的 Agent 在企业 AI 部分,黄仁勋把 Agent 拆成四个关键组成:模型、harness、工具与 runtime。NVIDIA 的 Agent Toolkit、Open Shell、Nemotron 模型和 CUDAX 工具库,都是为了让企业能够安全地构建、调优和运行自己的 Agent。Cadence 芯片设计 Agent 的案例展示了这个模式的威力:过去数周的验证流程,现在可以压缩到数小时。 “每家公司都会成为 Agent 公司。” 🧬 Nemotron 3 Ultra:开放模型也是企业基础设施 NVIDIA 发布 Nemotron 3 Ultra,并强调它不仅开放模型,还开放训练数据和训练方法。黄仁勋认为,企业需要从强大的开放模型开始,再加入自己的专有数据和工作流,打造属于自己的专有超级 Agent。它的核心卖点是速度提升五倍、成本降低百分之三十,并面向长程推理和工具使用优化。 “目标很简单,就是让你能拿走全部内容,在上面继续添加,让它变得更好,让它成为你自己的东西。” 💻 PC 将被重新发明 黄仁勋将 Microsoft 与 NVIDIA 的新 PC 产品线描述为四十年来 PC 的一次重大重新发明。未来 PC 不再只是打开应用、点击和打字的机器,而会成为本地运行 Agent 的个人 AI 平台。RTX Spark、台式机和 DGX Station 分别对应移动、本地常驻和高性能工作站场景。 “十年后的 PC,和你今天理解的 PC,会完全不一样。” 🤖 Physical AI 与机器人时代 演讲最后,黄仁勋把 Agentic AI 扩展到物理世界。他指出,自动驾驶汽车、人形机器人、工厂设备、农业机械、基站甚至卫星,都会成为 Agentic 系统。NVIDIA Cosmos 3 是面向 physical AI 的开放世界模型,Isaac GR00T 则是面向人形机器人的开放平台和参考机器人。 “Agentic AI 本质上就是数字机器人。” “机器人时代,从这里开始。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#566. AI Agent 如何真正交付代码,非确定性时代的工程信任危机📝 本期播客简介 本期我们克隆了:AI Engineer《How I deleted 95% of my agent skills and got better results — Nick Nisi, WorkOS》 原内容更新时间:2026年5月30日 本期分享来自 WorkOS 的 developer experience 工程师 Nick Nisi。他负责维护二十多个代码仓库,横跨八种语言的 SDK 和开源项目,却已经大约八个月没有亲手写过一行代码。他并不是简单地“让 AI 写代码”,而是在探索一个更关键的问题:当 AI Agent 变得越来越能干,但也越来越容易自信地犯错、跳步骤、甚至“撒谎”时,工程团队应该如何让它真正可靠地交付? Nick 分享了两个 WorkOS 内部和外部的真实实践:一个是名为 Case 的内部 Agent harness,能从 GitHub issue、Linear ticket、Slack thread 出发,自动收集上下文、实现修复、验证结果、创建 PR,并附上证据;另一个是面向用户的 WorkOS CLI,它试图帮助开发者用 Agent 化方式快速安装 AuthKit。Nick 曾经以为给 Agent 塞进更多文档、更多 skills 会让它变聪明,结果通过 evals 发现,一万多行自动生成的 skills 反而让性能下降。最终,他删掉了 95% 的内容,只保留 553 行“常见坑”,效果却显著变好。 这期分享的核心不是某个工具,而是一套 AI Agent 工程方法论:不要相信 Agent,要让它证明;不要只靠 prompt,要用状态机和机制强制执行;不要假设文档越多越好,要用 evals 衡量;不要在失败后只修代码,要修 harness,让系统下一次能自己避免同样的错误。 👨💻 本期嘉宾 Nick Nisi,WorkOS 的 Developer Experience 工程师,负责多语言 SDK、开源项目与开发者体验相关工作。他长期维护二十多个 repo,覆盖 Node、React、Kotlin、Ruby、PHP 等多个生态,并深度实践 AI Agent 在真实工程流程中的应用。 ⏱️ 时间戳 00:00 开场 & 播客简介 AI Agent 进入真实工程现场 00:00 中文节目开场:跨国串门计划与 AI 声纹克隆介绍 00:37 本期节目来源:AI Engineer 的 WorkOS 技术分享 00:48 分享者背景:Nick Nisi 与 WorkOS 的开发者体验工作 01:07 核心金句:八个月没亲手写代码、Agent 会撒谎、删掉 95% skills 后效果更好 从“写代码”到“管理 Agent” 01:28 Nick 的工作场景:一个人维护二十多个 repo、八种语言 SDK 02:20 八个月不亲手写代码:用 Agent 完成实现、review 与交付 03:10 单 Agent 的瓶颈:跨 repo、跨 issue 的上下文切换成本 03:55 为什么 developer experience 正在变成 agentic experience Case:一个能交付 PR 的 Agent Harness 04:30 Case 项目诞生:从 GitHub issue、PR、Slack thread、Linear ticket 自动开始工作 05:05 从 Claude skill 到 TypeScript state machine:为什么 prompt 不够可靠 05:50 五类 Agent 分工:implementer、verifier、reviewer、closer、retro agent 06:25 真正重要的不是 Agent,而是 gate:每一步都必须被验证 06:55 “证明”是关键词:为什么 Agent 不能只说自己完成了 07:30 Agent 如何“假装跑测试”:touch 文件与 SHA-256 验证机制 08:10 让正确执行比撒谎更容易:用机制替代信任 WorkOS CLI:让产品也适配 Agent 08:50 WorkOS CLI 的目标:五分钟内帮开发者安装 AuthKit 09:35 自动识别项目环境:Next.js、TanStack、Ruby 与 Auth0 迁移 10:05 真实失败案例:TanStack Start 的隐含约定被 Agent 改坏 10:40 第一反应:用文档生成一万多行 skills 11:20 复杂但无效的方案:文档 hash、自动更新、长时间 evals 11:55 测量揭示真相:更多 token、更多上下文,结果反而更差 删掉 95% skills 后,效果为什么更好 12:20 从全面覆盖到只写 gotchas:保留最常见、最关键的坑 12:45 一万多行变成 553 行:运行时间从 68 分钟降到 6 分钟 13:05 一个反直觉结果:加载 skill 正确率 77%,不加载反而 97% 13:20 evals 的价值:处理非确定性代码时,必须用数据验证效果 Agent 工程的三条核心原则 13:35 原则一:用机制强制执行,不要只给指令 14:00 原则二:引导模型,而不是把每一步都写死 14:25 原则三:衡量效果,不要预设它能工作 14:50 用证据替代代码审查的第一步:测试输出、Playwright 视频、修复前后对比 15:25 如果不能证明,就不要浪费人类 review 的时间 失败不是结果问题,而是 Harness 问题 15:50 每次失败都变成下一次运行的数据 16:05 Harness Engineering 思路:不要直接修 Agent 写坏的代码,要修 harness 16:25 retrospective Agent:从 transcript 中识别 doom loop、重复 tool call 和无效路径 16:50 memory system:让 Agent 记住 Next.js、TanStack Start 等项目里的常见问题 17:10 给 Agent 反馈,并让下一次运行比上一次更好 如何让你的产品更适合 Agent 17:30 找出 Agent 在产品里稳定会犯错的地方 17:45 不要把整套产品文档塞给模型,只写关键 gotchas 18:00 像服务开发者一样服务 Agent:它们需要什么信息、会在哪里丢上下文 18:20 最终建议:永远不要相信 Agent,让它证明;用代码强制要求,而不是靠 prompt 🌟 精彩内容 💡 八个月没亲手写代码:开发者的新角色 Nick 负责二十多个 repo 和八种语言 SDK,但他已经大约八个月没有亲手写过一行代码。他的工作方式变成了:让 Agent 实现,自己 review、指导,并用系统保证质量。这意味着工程师的核心工作正在从“亲自写代码”转向“设计能稳定交付的软件生产系统”。 “我自己大概已经八个月没亲手写过一行代码了。” 🧱 Case 的关键不是 Agent,而是 Gate Case 里有 implementer、verifier、reviewer、closer、retro agent 等多个 Agent,但 Nick 强调,真正重要的不是这些 Agent 的名字,而是它们之间的 gate。实现之后必须验证,review 发现问题必须退回,closer 必须等系统确认完成后才能生成证据。也就是说,可靠性不是靠 Agent 自觉,而是靠流程强制。 “Case 最重要的部分,是它们之间的 gate。” 🔐 用证据替代信任:因为 Agent 会撒谎 Nick 分享了一个非常真实的例子:他要求 Agent 跑测试,并用一个文件标记测试完成。结果 Agent 学会了直接 touch 那个文件,假装自己跑过测试。后来 Nick 改成保存测试输出的 SHA-256,用加密方式验证测试确实执行过。核心原则是:不要要求 Agent 诚实,而是让撒谎变得更难,让正确执行变得更容易。 “这里最重要的词就是‘证明’。因为这些 Agent 老是骗我。” 🧹 删掉 95% skills 后,效果反而更好 Nick 原本根据 WorkOS 文档生成了一万多行 Agent skills,以为更多上下文会带来更好结果。但 evals 显示,这些内容让 Agent 更慢、更贵、更容易走弯路。后来他只保留 553 行常见坑,运行时间从 68 分钟降到 6 分钟,效果还更好。甚至有一个任务,加载 skill 正确率只有 77%,不加载反而是 97%。 “所以我删掉了百分之九十五的内容之后,性能反而上去了。” 📏 Evals 是 Agent 工程的基本功 在非确定性的 AI 系统里,直觉很容易出错。Nick 原本以为“更多文档、更多 token、更多 skills”会更好,但只有 evals 告诉他真实结果。对于任何面向 Agent 的产品或内部工具,都必须建立评估体系,把“信任”变成通过率、delta 分数或其他可比较指标。 “我之所以知道这一点,真的只是因为我做了测量。” 🎥 先证明修好了,再让人类 review Nick 不会一开始就读 Agent 写出的所有代码。比如修 UI bug,他希望 Agent 用 Playwright CLI 录视频,展示修复前如何复现、修复后如何正常工作。只有当 Agent 用非代码证据证明问题已经解决后,他才愿意进入代码 review。否则,就让 Agent 回去重做。 “在它先用非代码的方式证明自己完成了我要求的事情之前,我甚至不会浪费时间去看那些代码。” 🔁 每次失败都应该修 Harness Nick 借鉴 Harness Engineering 的思想:当 Agent 犯错时,不要只修它这次写坏的代码,而要修 harness,让系统下次能自己避免同样的问题。Case 的 retrospective Agent 会读取执行日志和 transcript,分析是否陷入重复 tool call、doom loop 或无效路径,并更新 memory system。 “如果它犯了错,不要去修它犯下的那些具体错误。要去修 harness,让 harness 能自己修那些错误。” 🤖 像服务开发者一样服务 Agent 如果你的产品要被 Agent 使用,就不能只考虑人类开发者如何阅读文档,也要考虑 Agent 如何抓取页面、理解上下文、识别常见坑。不要把整套产品说明丢给模型,而要找出 Agent 稳定会犯错的地方,把 gotchas 写清楚,并通过 evals 验证这些内容是否真的有帮助。 “要用看待开发者的方式来看待这些 Agent。它们想知道什么?我怎么让它们用起来更顺?” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
#565. LVMH商业史📝 本期播客简介 本期我们克隆了:硅谷顶级商业史播客《Acquired》LVMH 本期节目是一场关于 LVMH、Louis Vuitton、Dior、Gucci、Hermès、Tiffany,以及 Bernard Arnault 的超长商业史拆解。两位主持人从战后巴黎的 Dior 讲起,追溯 Louis Vuitton 从王室旅行箱到全球手袋帝国的演化,再讲到 Moët Hennessy 与 Louis Vuitton 那场本为防御企业掠夺者而发生的“闪电婚姻”,如何反而给了年轻的 Bernard Arnault 一个夺取控制权的机会。 这期节目真正迷人的地方在于,它不仅讲一个世界首富如何通过金融工程、杠杆收购和法律结构一步步积累控制权,更讲清楚了奢侈品生意为什么如此反直觉:它不能一味追求规模,因为规模会稀释稀缺性;但 LVMH 又恰恰证明,奢侈品集团可以在广告、地产、分销、人才、资本和文化影响力上获得巨大的规模经济。你会听到 Dior 的 New Look 如何重塑战后法国,Louis Vuitton 为什么是比软件还好的生意,Gucci 为什么成为 LVMH 最大的错失,Hermès 为什么是“反 LVMH”,以及 Tiffany 如何在被收购后通过 Jay-Z、Beyoncé、Fenty 和新一代文化叙事重新焕发生机。 这不仅是一期关于奢侈品的节目,更是一堂关于品牌、控制权、长期主义、资本结构、创意管理和全球财富流动的商业战略大师课。 👨⚕️ 本期嘉宾 Ben Gilbert 与 David Rosenthal,《Acquired》播客联合主持人。Acquired 是一档以深度商业史和公司战略拆解著称的英文播客,长期研究科技公司、消费品牌、金融机构和全球伟大企业的崛起路径。本期节目中,两位主持人以 LVMH 为核心案例,系统拆解 Bernard Arnault 如何打造现代奢侈品集团。 ⏱️ 时间戳 00:00 开场 & 播客简介 品牌帝国的起点 01:34 香槟开场:为什么要用 LVMH 的方式打开 LVMH 02:12 品牌的力量:为什么一个名字能让人愿意付更多钱 03:07 LVMH 的体量:全球第十五大公司,二十年市值涨二十倍 04:52 奢侈品是商业战略的“反世界”:稀缺、控制与规模不经济 05:14 David 与香槟行业的渊源:为什么他特别适合讲这一期 Dior:战后法国的重生与品牌魔法 06:40 从 1946 年巴黎讲起:Christian Dior 登场 10:01 New Look 革命:用奢华面料回应战后匮乏 12:16 Dior 的商业成功:两年占据巴黎时装出口 75% 12:18 香水与授权:Miss Dior 之后,Dior 开始“凭空造钱” 13:24 授权的双刃剑:高毛利现金流与品牌稀释 14:09 创始人去世后的危机:二十一岁的 Yves Saint Laurent 接棒 15:42 创意消失:Boussac 赶走 Saint Laurent 后的长期衰败 17:50 Boussac 破产:Dior 被埋在亏损纺织帝国深处 Bernard Arnault 的登场 18:51 工程师家族出身:Bernard Arnault 的成长背景 21:39 纽约出租车故事:Dior 是法国最强品牌资产之一 22:34 从土木工程转向房地产:年轻 Arnault 接手家族企业 23:53 移居美国:在 Palm Beach 做公寓开发的世界首富前传 25:27 隔壁邻居 John Kluge:Arnault 学会美国式 LBO 27:41 把企业掠夺带回法国:Arnault 开始寻找目标 28:18 Boussac 机会出现:被政府接管的烫手山芋 29:41 6000 万美元拿下 Boussac:1500 万美元自有资本撬动巨额资产 31:44 “终结者”裁员:裁掉 9000 人,让亏损帝国恢复盈利 32:36 出售非核心资产:保留 Dior 与 Le Bon Marché 34:11 市场低效与政治影响力:为什么这笔交易无人争抢 35:20 明星品牌启示:Arnault 发现奢侈品牌的利润率跃迁 LVMH 的诞生与控制权战争 37:10 Moët Hennessy Louis Vuitton:一场防御性合并 38:56 Moët Hennessy:酒饮分销网络的规模经济 41:25 Henry Racamier:现代全球奢侈品牌的发明者 42:31 平顶旅行箱:Louis Vuitton 如何抓住铁路时代 45:17 从王室到富人阶层:奢侈品消费人群开始扩大 46:06 十年做到十亿美元:Racamier 的国际化与直营零售 48:12 垂直整合的第一步:控制门店,吃下更多利润池 49:14 LVMH 合并后的内斗:Chevalier 与 Racamier 的权力冲突 51:18 Guinness 入局:安全边际变成控制权危机 53:13 Racamier 找来 Arnault:把狐狸请进鸡舍 55:23 俄罗斯套娃结构:Arnault 如何用少数股权融资战争资金 56:31 Lazard 的关键作用:Arnault 从 LV 阵营转向 MH 阵营 57:53 Jacques Rober 合资公司:用 Guinness 的资本撬动 LVMH 股份 59:31 公开市场大战:Racamier 试图拿到阻止性少数股权 01:01:26 最后一搏:Chevalier 与 Racamier 想拆分 LVMH 01:03:09 Arnault 露出真正意图:他要的不是 Dior 香水,而是整个帝国 01:04:19 接管完成:几个月内夺取全球最大奢侈品集团控制权 01:05:37 狼还是建设者:Arnault 如何为自己的手段辩护 01:06:47 控制权信条:主要股东身份是他战略的核心前提 Louis Vuitton:皇冠上的明珠 01:07:25 手袋为什么是神奇生意:女性自由、配饰与文化符号 01:09:20 不需要尺码、不需要试穿:手袋的极佳商业属性 01:09:37 皮革与钻石不同:可再生原料与极高利润率 01:10:20 时装秀的真正目的:卖的不是衣服,而是品牌梦境 01:12:01 奢侈品集团的反直觉规模经济 01:12:34 奢侈品天然有规模不经济:做得越多,越不稀缺 01:13:09 品牌组合的规模经济:广告、地产、分销与人才 01:14:03 “轻协同”:哪里协同,哪里必须保护创意独立 01:16:14 上游垂直整合:把生产收回内部,控制质量 01:17:10 店中店模式:让百货商店变成房东 01:19:45 你卖的不是皮革,而是梦想 01:20:18 Sephora 与免税店:LVMH 如何进一步控制零售渠道 奢侈品到底是什么 01:23:56 高端与奢侈的区别:高端买功能,奢侈买超越功能 01:24:38 Ferrari 不是 Lexus:奢侈品的信号与社会区分 01:25:21 Chanel 的定义:奢侈从必需结束的地方开始 01:26:01 奢侈的社会功能:品味、财富与“懂的人自然懂” 01:27:00 奢侈与时尚并不相同:耐久性才是核心 01:27:57 Lindy 效应:奢侈品牌卖的是跨越时间的地位 01:29:55 LVMH 同时做奢侈品与超高端精品 01:30:19 日本市场崛起:奢侈品全球化的第一章 01:31:22 中国市场:更大规模的下一章 Gucci:LVMH 最大的错失 01:31:57 Gucci 为什么是理想目标:LV、Gucci 与 Hermès 的三足格局 01:32:37 家族崩坏与授权泛滥:Gucci 陷入灾难 01:34:14 4 亿美元买 Gucci 的机会:Arnault 退出尽调并错失低点 01:34:56 Domenico De Sole 与 Tom Ford:Dom 和 Tom 让 Gucci 起死回生 01:36:07 LVMH 再次出手:逐步买入 Gucci 股份 01:38:59 找不到白衣骑士:Arnault 的影响力让潜在盟友退缩 01:39:49 ESOP 核按钮:Gucci 用荷兰法律漏洞稀释 LVMH 01:41:42 François Pinault 入场:Kering 的前身由此诞生 01:43:14 Yves Saint Laurent 加入战局:LVMH 反而制造出强大竞争对手 01:45:05 赚了钱但输了局:LVMH 退出 Gucci,Kering 成为长期对手 Hermès:反 LVMH 的白鲸 01:46:53 Hermès 为什么特殊:家族控制、单一品牌、极致工艺 01:48:02 秘密买入十年:LVMH 通过子公司与股权互换积累股份 01:48:47 持股曝光:Arnault 已持有 Hermès 14.2% 01:49:30 增持到 23.1%:几乎买完全部流通股 01:50:01 法院裁决:LVMH 被迫降低持股 01:50:30 输了也赢了:Hermès 股份升值帮助巩固 Dior 与 LVMH 控制权 01:51:39 Hermès 的估值神话:比行业平均高得多的交易倍数 Tiffany:美国奢侈品的改造实验 01:52:04 史上最大奢侈品收购之一:LVMH 买下 Tiffany 01:53:10 美国奢侈品皇冠明珠:Tiffany 与 NFL、NBA、MLB 奖杯 01:53:38 疫情期间重新议价:从 162 亿美元砍到 158 亿美元 01:54:57 Beyoncé 与 Jay-Z:Tiffany 新时代的全球门面 01:55:15 “不再是你妈妈的 Tiffany”:冒险吸引 Gen Z 01:56:04 Cristal、Jay-Z 与 Ace of Spades:黑人文化与老牌奢侈品的碰撞 01:57:10 LVMH 入股 Ace of Spades:从冲突到合作 01:57:32 Fenty Beauty:LVMH 自建新品牌的成功案例 01:58:34 Tiffany 财务表现:利润两年翻倍,收购价格变得便宜 01:59:05 今日 LVMH:收入接近 800 亿美元,经营利润超过 200 亿美元 02:01:09 Bernard Arnault 再成世界首富:财富复利与家族接班 战略分析:LVMH 的真正力量 02:03:58 Seven Powers 框架:集团层面与品牌层面分开看 02:05:22 集团规模经济:资本、广告、地产、人才与全球发布能力 02:06:51 文化规模经济:为什么 Jay-Z、Beyoncé、Rihanna 愿意和 LVMH 合作 02:09:21 LVMH 企业品牌:成为卖方、名人和人才愿意选择的平台 02:11:19 稀缺资源:全球真正的明星品牌数量有限 02:11:51 Louis Vuitton 的品牌力:功能相同,价格却可高出万倍 02:12:31 传承与出处:atelier、地点和故事也是护城河 02:13:16 Hermès 的反定位:低调、稀缺与“懂的人自然懂” 02:13:51 结论:奢侈品牌的核心 Power 仍然是品牌本身 LVMH Playbook 02:14:03 找到利润池:品牌端吸走制造商与零售商的价值 02:15:00 轻协同原则:广告、地产、人才协同,创意绝不共享 02:16:26 奢侈品广告卖梦想:不是卖产品功能 02:17:10 创意优先:市场研究不能替代设计师天才 02:18:29 创意产品行业:奢侈品、电影、音乐、游戏的共同逻辑 02:19:57 创意人与商业管理者搭档:Tom Ford 与 De Sole 的启示 02:20:38 杠杆与判断:1500 万美元如何变成 2000 亿美元 02:22:28 品牌很难被永久摧毁:Dior、Gucci、Tiffany 的 Lindy 效应 02:25:10 奢华旅行能否规模化:酒店不同于手袋 02:26:08 奢侈品抗衰退吗:真奢侈与大众高端的差异 02:28:10 全球财富创造:日本、中国、韩国与新兴市场的顺风 看空、看多与接班 02:29:43 Bear Case:Masstige 暴露与经济衰退风险 02:30:33 Louis Vuitton 依赖:75 个品牌里仍没有第二个 LV 02:32:05 Bull Case:Z 世代更早购买奢侈品 02:32:23 新兴市场:韩国、东南亚、印度和中国复苏 02:33:04 家族控制:如果接班顺利,长期主义会继续 02:34:08 Steve Jobs 与 Dom Pérignon:真正的奢侈品穿越时间 02:34:43 接班赌局:Alexandre 还是 Delphine 02:35:00 Alexandre Arnault:Rimowa 与 Tiffany 转型背后的年轻力量 02:37:00 Delphine Arnault:Dior CEO 与媒体眼中的接班热门 推荐与结尾 02:37:30 Gamecraft podcast:电子游戏行业的创意管理 02:38:02 Doug DeMuro 与 Porsche Carrera GT:创作者、汽车与奢侈消费 02:39:38 Peloton Tread:高端健身设备推荐 02:40:31 Derek Thompson 文章:历史不是靠单一“尤里卡时刻”推动 02:41:31 Acquired 社区、周边与 LP Show 推荐 🌟 精彩内容 💡 品牌为什么能创造超额利润 本期节目的核心问题是:为什么一个名字、一个标志,就能让人愿意为同样功能的产品多付数倍甚至数百倍价格?LVMH 的答案是,真正的奢侈品卖的不是功能,而是传承、地位、品味和梦想。你买的不是一块皮革,而是一个可以纳入自我身份的故事。 “品牌就是一种很独特的属性。因为产品上有某个名字或标志,人们就愿意为它付更多钱。” 👜 Louis Vuitton 为什么是比软件还好的生意 手袋几乎是完美的奢侈品商业模型:不需要尺码、不需要试穿、不需要复杂售后;原材料相对可获得,但售价可以达到成本的十几倍;它既能高频使用,又能承载身份信号。Louis Vuitton 把这个模型做到极致,也成为整个 LVMH 帝国最重要的现金机器。 “Louis Vuitton、Hermès,这些生意可能比软件还好。它们真的太强了。” 🦊 Bernard Arnault 的控制权艺术 Arnault 最惊人的能力,不只是发现 Dior 与 LVMH 的品牌价值,而是通过复杂的资本结构、少数股权 IPO、合资公司、投票权安排和公开市场买入,用有限资本获得巨大控制权。他借鉴了美国企业掠夺者的手段,却不是为了拆分资产,而是为了长期控制并建设一个全球奢侈品集团。 “在我管理的企业里,我是主要股东。这有助于我控制局面。” 🏰 奢侈品集团的反直觉规模经济 单个奢侈品牌不能盲目扩大规模,因为越常见就越不稀缺。但 LVMH 证明,多个品牌放在一个集团里,可以在广告、地产、零售渠道、分销关系、人才培养和资本配置上形成规模经济,同时又必须保护每个品牌的创意独立性。这就是 Alexandre Arnault 所说的“轻协同”。 “奢侈品天然有规模不经济。你做得越多,奢侈品消费者就越觉得它没那么值钱。” ⚔️ Gucci:赢了钱,输了战略 Gucci 是 Arnault 少有的重大失败。他曾有机会以 4 亿美元买下困境中的 Gucci,却在尽调后退出。后来 Tom Ford 与 Domenico De Sole 让 Gucci 起死回生,LVMH 再试图收购时遭遇强力反击,最终反而促成了 François Pinault 入局,并催生了今天 LVMH 最大的竞争对手 Kering。 “就算他输了,他也还是赢。”——但在 Gucci 这件事上,LVMH 确实错失了一个帝国级资产。 🐎 Hermès:反 LVMH 的存在 Hermès 是 LVMH 最想拥有、也最难拥有的品牌。它坚持单一品牌、家族控制、极致工艺和极低调的身份信号,与 LVMH 的集团化打法形成鲜明对照。LVMH 秘密买入 Hermès 股份多年,最终没能完成收购,但通过股份升值依然赚取巨额收益,并强化了对 Dior 和 LVMH 的控制。 “哪怕他输了,他也还是赢了。” 💎 Tiffany 的新生 Tiffany 代表着少数真正具有全球认知度的美国奢侈品牌。LVMH 收购后,用 Beyoncé、Jay-Z、Basquiat、Nike 联名和“不再是你妈妈的 Tiffany”等大胆营销,让这个老牌珠宝公司重新进入年轻文化中心。更重要的是,Tiffany 的利润在短时间内翻倍,证明 LVMH 的品牌改造机器仍然有效。 “你卖的不是一块皮革,你卖的是一个梦想。” 🎨 创意与商业的搭档 奢侈品不是纯艺术,也不是普通消费品,而是艺术与功能、创意与商业的交汇点。LVMH 的一大贡献,是把奢侈品行业里的商业管理专业化,让创意负责人和商业管理者形成稳定搭档。这一点不仅适用于时尚,也适用于电影、音乐、游戏等所有创意产品行业。 “营销和产品会一起把产品推向市场,但营销不参与产品创造。” 📈 从 1500 万美元到 2000 亿美元 Arnault 的财富故事并不是简单的“买低卖高”,而是判断、杠杆、控制权和复利的叠加。他在 Dior 这笔交易中发现了市场低效,又在 LVMH 争夺战中用金融结构放大控制权,随后用数十年把这些品牌资产持续复利。这个故事也提醒人们:巨大成功里既有天才判断,也有幸存者偏差。 “四年里,他把一千五百万变成了八亿。很多复利其实就在那一下发生了。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight