
为什么我不认为通用人工智能(AGI)即将到来文章作者及访谈者介绍: Dwarkesh Patel 是知名播客 Dwarkesh Podcast 的主持人,该播客以深度研究的访谈著称,拥有超过 76,000 名订阅者。他自认为是“AI 激进派”,曾花费数百小时尝试为后期制作构建 LLM 工具,但这些实践经验让他延长了对 AGI 实现时间的预期。 以下是文章的核心观点及相关解释: * 持续学习(Continual Learning)是最大的瓶颈:作者认为,当前的 LLM 无法像人类员工那样在工作中通过反馈不断改进。虽然模型的初始基准能力很高,但用户无法通过高层的反馈来提升模型性能,只能不断调整提示词(Prompt),这无法产生类似人类的经验积累和效率提升。 * 当前模型难以实现真正的经济转型:作者不同意“即使 AI 停止进步,现有系统也能像互联网一样改变经济”的看法。他指出,由于 LLM 缺乏建立上下文、反思失败和微调效率的能力,它们很难像真正的员工那样处理复杂的白领工作,导致其实际贡献仅停留在特定的子任务上。 * 对短期内实现“计算机使用”代理持怀疑态度:尽管有研究者预测 2026 年底能实现可靠的计算机代理(如自动报税),但作者认为这面临缺乏多模态预训练数据、任务视野过长以及算法迭代复杂等巨大挑战。他预测,AI 能像高级经理一样端到端处理小企业税务的时间点可能在 2028 年。 * 情境记忆(Context Memory)的局限性:虽然长上下文窗口(如 Claude Code)可以存储部分记忆,但作者认为将丰富的实践经验浓缩为文本摘要是非常脆弱的。这就像试图通过阅读文字总结来教小孩吹萨克斯管,无法传递那种非言语的、微妙的直觉经验。 * 解决持续学习将引发“智能爆炸”:作者预测,大约在 2032 年 AI 才能像人类一样有机、无缝地在岗学习。一旦这一瓶颈被攻克,AI 价值将出现巨大的非线性增长,因为 AI 可以在所有副本中融合学习成果,从而迅速演变为超人工智能。 * 承认推理能力的进步:尽管持谨慎态度,作者也承认如 o3 或 Gemini 2.5 等模型展现了真正的推理能力,能够分解问题、自我修正并展示出初步的通用智能迹象
迈克尔·尼尔森:科学究竟如何进步在这篇文章中,尼尔森探讨了关于科学发现本质的一系列核心观点,汇总如下: 1. 科学进步的速度远快于其“验证循环” 尼尔森指出,科学进步并不总是等待实验证明。人类科学往往能在实验结果模糊或验证周期极其漫长的情况下继续前行。 * 相关解释:例如,阿里斯塔克斯在公元前3世纪就提出了日心说,但直到1838年人类才成功测量出恒星视差,这意味着该理论的验证循环长达2000年。然而,在正式验证之前,科学界已经通过其他启发式方法(如理论的简洁性和解释力)选择了正确的方向。 2. 科学发现的过程比教科书中的“证伪法”更复杂且充满偶然 文章认为,科学并不是一个简单的“提出假设、实验证伪、得出结论”的线性过程。 * 相关解释:以迈克耳孙-莫雷实验为例,该实验通常被描述为证伪了“以太”理论并导致爱因斯坦提出相对论。但实际上,迈克耳孙本人直到去世都相信以太的存在,并不断尝试通过改进实验来挽救该理论。伟大的科学家即便在社区共识转向后,仍可能在很长时间内坚持错误的观点,科学界并没有一个标准化的程序来强制达成共识。 3. AI 在科学中的作用主要体现在解决特定的“瓶颈” 虽然 AI(如 AlphaFold)取得了巨大成功,但尼尔森认为它目前更多是模型拟合,而非理解底层原理。 * 相关解释:AlphaFold 的成功在很大程度上依赖于耗资巨大的蛋白质结构数据库(PDB),它更像是一个极其复杂的数据拟合工具。真正的科学突破(如广义相对论)往往需要从根本上重新构思空间和时间,这种**“全局性的跨越”和审美偏好**是目前的梯度下降算法难以产生的。 4. “技术树”是广阔且具有路径依赖性的 尼尔森提出了一个挑战常识的观点:外星文明极可能拥有与人类完全不同的科技栈。 * 相关解释:人类是视觉动物,这影响了我们表达知识的方式(如使用图表、符号数学)。如果一种文明是基于听觉或化学梯度感知的,他们探索“技术树”的方向会完全不同。此外,由于技术组合的可能性是无穷的,大多数科学原理可能永远不会被发现,文明的选择塑造了其特有的技术形态。 5. 科学的“边际收益递减”可以通过开辟新领域来打破 虽然在单一领域内,随着低垂果实被摘完,取得进展所需的投入会呈指数级增长,但新学科的诞生会重置这一过程。 * 相关解释:计算机科学在20世纪中叶的兴起就是典型例子,它源于深奥的逻辑学问题,却开辟了巨大的研究空间,让年轻人能再次迅速做出重大贡献。尼尔森认为,**制度的改变和新工具的出现(如量子计算)**可能会再次引发类似的科学爆发
陶哲轩:开普勒、牛顿与数学发现的本质在这场对话中,世界著名数学家陶哲轩分享了关于科学发现历史、AI对数学研究的影响以及未来科研范式演变的见解。以下是文章的核心观点及其解释: 1. 开普勒式的“高温度大语言模型”路径 * 观点: 科学发现往往源于海量的假设尝试,开普勒发现行星运动定律的过程与现代大语言模型(LLM)的运作方式具有相似性。 * 解释: 陶哲轩指出,开普勒在最终确定椭圆轨道前,曾尝试过各种错误的几何模型(如柏拉图多面体),这本质上是在进行大规模的“想法生成”。只要拥有像第谷·布拉赫那样精确的验证数据集,通过不断的随机尝试和验证(类似AI的高随机性输出),最终就能筛选出真理。这表明,验证循环是科学进步的关键。 2. 科学瓶颈从“想法生成”转向“验证与评估” * 观点: AI将想法生成的成本降到了几乎为零,但这也导致了“AI垃圾”的泛滥,使得验证成为了新的瓶颈。 * 解释: 过去科学家稀缺的是好的想法,而现在AI每天可以产生数以千计的理论。然而,人类的同行评审系统无法处理这种规模的产出,我们缺乏在大规模自动化产出的想法中识别真正具有“统一性”和“长远价值”观点的方法。 3. AI胜在“广度”,人类胜在“深度” * 观点: AI与人类数学家的能力具有互补性:AI擅长解决大量中等难度的广度问题,而人类擅长深度探索。 * 解释: 陶哲轩举例说,AI可能在短时间内解决几十个长期无人问津的Erdős问题(中等难度且缺乏文献),但在处理像黎曼假设这样需要全新数学工具和深刻直觉的顶尖难题时,AI目前的“一键式”尝试往往无效。他认为未来的数学研究将由人机混合模式主导:AI负责扫描领域并处理易解决的观察结果,人类专家则集中攻克AI标记出的“难点岛屿”。 4. 数学需要超越逻辑证明的“半形式化语言” * 观点: 我们需要一种能够描述数学策略和启发式直觉的语言,而不仅仅是Lean这类形式化证明语言。 * 解释: 目前像Lean这样的工具可以严格验证演绎逻辑,但科学家交流时使用的是充满直觉、叙事和统计概率的“软性”语言(例如对素数随机性的理解)。陶哲轩希望建立一种框架来捕捉这些不可量化的科学叙事,以便更好地指导AI进行策略性思考,而非单纯的盲目尝试。 5. AI对个人科研效率的提升在于“辅助任务” * 观点: AI让数学论文变得更“丰富”和“广泛”,但尚未让研究变得更“深刻”。 * 解释: 陶哲轩提到AI目前使他的效率提升了约2倍,主要体现在代码生成、数据可视化、文献检索和格式重排等次要任务上。虽然这让论文包含了更多图表和数值模拟,但解决数学难题的核心步骤(即“灵光一现”的洞察力)仍然主要依赖纸笔和人类大脑。 6. 对年轻学者的建议:保持适应性 * 观点: 在AI时代,传统的教育和研究路径正在被颠覆,适应性是未来最重要的素质。 * 解释: 虽然传统教育仍然重要,但现在高中生甚至可能利用AI工具和Lean在数学前沿做出贡献。陶哲轩鼓励学生保持好奇心,尝试那些过去无法想象的科研方式,并为未来可能出现的全新科学范式做好准备
Dario Amodei — “我们正处于指数增长的末期”采访者 Dwarkesh Patel 是一位以对技术和 AI 领域进行深度、硬核访谈而闻名的播客主持人,他在本次访谈中与 Anthropic 的联合创始人兼 CEO Dario Amodei 探讨了 AI 的未来走向、算力规模化、经济影响以及全球治理等核心议题。 以下是文章中 Dario Amodei 提出的核心观点及其详细解释: 1. 大算力团块假设与强化学习(RL)的规模化 * 观点: AI 的进步主要由算力、数据和目标函数的规模化驱动,而非特定的“巧妙”技术。 * 解释: Amodei 坚持他在 2017 年提出的“大算力团块假设”(The Big Blob of Compute Hypothesis),认为只要提供充足的算力、广泛分布的高质量数据,并设定可无限扩展的目标函数(如预训练和 RL),模型的能力就会持续提升。他指出,现在 RL 领域也展现出了与预训练类似的对数线性增长规律,这意味着通过在特定任务(如数学和编程)上增加 RL 训练,模型能力可以精准预测并提升。 2. 迈向“天才之国”的 AGI 时间线 * 观点: 我们距离在数据中心里实现相当于“一个天才国家”智力水平的 AI 只有几年的时间。 * 解释: Amodei 对未来 10 年内实现 AGI 持有 90% 的信心,并认为由于技术指数级增长的推进,甚至有可能在 1 到 3 年内实现。这种 AI 将具备匹配甚至超过诺贝尔奖得主的智力水平,并能熟练操作人类所有的数字界面。他特别提到,在可验证的任务(如编程)上,AI 的表现提升速度极快,几乎不可阻挡。 3. 技术指数增长与经济扩散的“时间差” * 观点: 尽管 AI 技术本身在以极陡峭的指数增长,但其在实体经济中的普及(扩散)虽然很快,却并非瞬间完成。 * 解释: 经济扩散受到现实世界的限制,如法律合规、安全审查、企业内部的变革管理以及系统集成的复杂性。他认为 AI 的经济扩散速度会超过以往任何技术,但仍然存在滞后,例如大型企业采纳新工具通常比个人开发者慢几个月。这种滞后也是他对算力投资保持审慎态度的原因之一。 4. 编程作为 AGI 的前哨站与持续学习的挑战 * 观点: 编程是目前 AI 提升生产力最明显的领域,而“在岗学习”(Continual Learning)可能并不会成为 AGI 的根本障碍。 * 解释: 软件工程由于具备外部的“记忆脚手架”(代码库),使得 AI 能够通过长上下文窗口直接获取所需知识,从而规避了部分持续学习的需求。Amodei 认为,即使不解决模型在运行中实时修改权重的“持续学习”难题,仅靠长上下文窗口(如 1000 万到 1 亿 token)和强大的泛化能力,也足以支撑 AI 完成绝大多数复杂的经济活动。 5. 安全威胁与全球治理的紧迫性 * 观点: AI 带来的生物武器风险等安全威胁正在临近,民主国家必须掌握技术主导权以制定全球规则。 * 解释: 他对 AI 在生物技术领域的滥用风险(如协助制造生物武器)感到极其担忧,呼吁加强透明度标准和安全立法。在国家竞争方面,他支持通过出口管制限制中国获取先进制程芯片,目的是让代表“人类普世价值”的民主国家在制定后 AGI 时代的国际秩序时拥有更多筹码,防止威权政府利用 AI 加强统治。 6. 前沿实验室的盈利逻辑 * 观点: 尽管前沿实验室目前因巨额算力投入而亏损,但单个模型在单位经济上已经具备盈利潜力。 * 解释: 亏损的原因在于每年的算力投入也在呈指数级增长(例如去年花 10 亿训练,今年花 100 亿),这掩盖了旧模型产生的正向现金流。他预见随着技术规模化达到某种平衡点,由于推理效率的提升和市场需求,前沿实验室最终会转向盈利,并在云服务模式下形成类似三四家公司割据的均衡状态
黄仁勋谈 TPU 竞争、为何应向中国出售芯片以及英伟达的供应链护城河该文章由 Dwarkesh Patel 采访并发布在他的个人播客(Dwarkesh Podcast)上。Dwarkesh Patel 是一位以深度访谈科技领袖著称的博主,他在访谈中针对英伟达的供应链掌控、TPU 对英伟达地位的潜在威胁、地缘政治下的芯片出口限制以及英伟达的商业模式等核心议题向黄仁勋发起了犀利提问。 以下是文章汇总的核心观点及其详细解释: 1. 英伟达的核心本质:将“电子”转化为“代币”(Tokens) * 观点:英伟达的工作是进行“从电子到代币”的转换。 * 解释:黄仁勋认为英伟达的角色是在输入(电力/电子)和输出(AI 生成的代币)之间,通过极高水平的工程、科学和创新,使这一转化过程尽可能高效且具备高价值。这种转化不仅仅是制造芯片,更包含了一套难以被商品化的完整科学体系。 2. 加速计算与通用编程的“护城河” * 观点:英伟达提供的是“加速计算”,而非单一的“张量处理单元(TPU)”。 * 解释:相比于针对特定矩阵乘法优化的 TPU,英伟达的 GPU 是通用可编程的。这种灵活性允许开发者不断发明新的算法(如 MoE 架构、混合 SSM 等),从而在摩尔定律放缓的情况下,通过软硬件协同设计实现性能的指数级飞跃。 3. “能做则做,能省则省”的生态经营哲学 * 观点:英伟达的商业原则是“尽其所需,尽其所简”(Do as much as needed, as little as possible)。 * 解释:英伟达专注于解决那些“如果英伟达不做,就没人能做成”的极难技术问题(如 cuLitho 计算光刻库、NVLink 等)。而对于云服务等已有成熟竞争者的领域,英伟达倾向于与合作伙伴共建生态,而非直接成为超大规模云服务商(Hyperscaler)来与客户竞争。 4. 供应链规模与“上游一致性” * 观点:英伟达庞大的下游需求支撑了其在上游供应链的统治力。 * 解释:英伟达之所以能锁定关键组件(如 HBM 内存、CoWoS 封装),是因为供应商相信英伟达有能力消耗并卖出这些产能。黄仁勋通过与供应链 CEO 们的深度沟通和长期承诺,促使他们敢于进行大规模投资,从而构建起其他竞争对手难以企及的供应规模。 5. 对中国出口芯片的战略考量 * 观点:美国不应放弃中国市场,而应通过出口来维持美国技术标准的全球领导地位。 * 解释:黄仁勋警告称,中国拥有充足的能源、优秀的 AI 研究人员(全球 50% 的占比)和芯片制造潜力。如果完全禁止向中国出售芯片,将迫使中国建立起一套完全独立于美国标准之外的非美技术生态。他认为,让中国开发者继续在英伟达(即美国)的技术栈上开发,对美国的长期技术竞争更有利。 6. 未来真正的瓶颈:能源与人力 * 观点:长期的挑战并非芯片产能,而是电力基础设施和专业蓝领人才。 * 解释:芯片制造或封装的产能缺口通常可以在 2-3 年内通过需求信号解决。然而,建立新的能源政策、改造电网以及培养足够的“电工和水管工”等基础建设人才,其周期要长得多,这才是制约 AI 工厂规模化的核心因素
埃隆·马斯克——36个月内,放置人工智能最便宜的地方将是太空这篇文章的标题是**《埃隆·马斯克——36个月内,放置人工智能最便宜的地方将是太空》**(Elon Musk — "In 36 months, the cheapest place to put AI will be space"),。此次采访由 Dwarkesh Patel(Dwarkesh Podcast 的主持人)和 John Collison(Stripe 的联合创始人)共同主持,。 文章链接:https://substack.com/home/post/p-186967347 文章的核心观点及相关解释汇总如下: 1. 太空将成为 AI 算力的最优选址 马斯克预测,在未来 30 到 36 个月内,太空将成为运行人工智能在经济上最具体吸引力的地方,。 * 相关解释:在地球上,AI 规模化的最大限制是能源供应。地球上的电力产出几乎停滞,且面临复杂的监管和许可问题,。相比之下,太空中的太阳能板效率比地面高出约 5 倍,因为没有大气层损耗、季节变化或昼夜循环,且无需昂贵的电池组来维持夜间供能,。 2. 硬件将成为软件从业者的“沉重教训” 马斯克指出,那些习惯于软件领域的人即将体验到硬件带来的挑战,。 * 相关解释:AI 的扩张正面临严重的物理瓶颈。目前最大的限制是电力(包括变压器等配电设备),而中期的限制则是芯片和发电设备,。例如,制造天然气涡轮机的核心零部件(叶片和导向叶片)在全球范围内都处于严重缺货状态,。 3. 人形机器人 Optimus 是“无限金钱漏洞” 马斯克认为人形机器人 Optimus 将彻底改变经济规模。 * 相关解释:Optimus 将通过三种指数级增长的乘积实现爆发:数字智能、芯片能力和机电灵巧度。由于机器人可以全天候工作,且最终能实现“机器人制造机器人”,这将带来生产力的递归式增长,使经济规模扩大数个数量级,。 4. 通过技术创新应对中国的制造业优势 马斯克承认中国在制造业、矿产精炼和劳动力规模方面具有巨大优势,其工业能力大约是美国的三倍,。 * 相关解释:美国无法在人力规模上与中国竞争,因为美国人口仅为中国的四分之一,且出生率长期低于更替水平,。因此,美国获胜的唯一机会是依靠机器人(Optimus)和自动化技术来填补劳动力缺口,并利用这些技术建立自己的矿产精炼厂,,。 5. AI 对齐应基于“理解宇宙”和“求真” 关于 AI 的安全性,马斯克主张赋予 AI 追求真理和理解宇宙的使命,。 * 相关解释:马斯克认为,一个被教导说谎或为了“政治正确”而扭曲事实的 AI 可能会走向疯狂并产生危险。如果 AI 的核心目标是理解宇宙,由于人类和意识是宇宙中最有趣的部分,AI 为了完成使命会倾向于保护人类意识的延续,而不是将其消灭,,。 6. 星舰(Starship)是实现愿景的关键基石 要实现太空 AI 布局,必须拥有低成本且高频率的发射能力,。 * 相关解释:马斯克计划让 SpaceX 每年实现 10,000 次甚至更多次发射,以将数百万吨物资运往轨道,。为了提升进度,星舰放弃了昂贵的碳纤维,改用在低温环境下强度更高、成本更低且更易加工的不锈钢,,。完全可重复使用的热防护罩是目前星舰面临的最后一个重大技术难题,。
AI访谈-《Andrej Karpathy — 距离 AGI 还有十年》这份详细的总结源自 Dwarkesh Podcast 在 2025 年 10 月 17 日发布的访谈,标题为《Andrej Karpathy — 距离 AGI 还有十年》。在这次深度对话中,知名 AI 专家、特斯拉前自动驾驶负责人及 OpenAI 联合创始人 Andrej Karpathy 与主持人 Dwarkesh Patel 就人工智能的现状、强化学习的缺陷、自动驾驶的教训以及教育的未来进行了广泛讨论。 文章链接:https://www.dwarkesh.com/p/andrej-karpathy 以下是对访谈中核心观点的深度细致总结: 1. 智能体(Agents)的十年愿景 Karpathy 指出,行业目前对智能体的发展速度存在过度预测。 * 并非“一年”而是“十年”: 他认为要让智能体达到像“员工”或“实习生”那样可以被雇佣的程度,还需要约十年的时间。 * 核心瓶颈: 目前的智能体缺乏**持续学习(Continual Learning)**能力,无法记住指令并在互动中不断改进;同时,它们在多模态理解和计算机操作能力(Computer Use)方面仍显不足。 * 问题的复杂性: 尽管这些挑战是可解决的,但达到高可靠性的产品化阶段是一个极其艰难的过程。 2. 智能进化:从“动物”到“数字幽灵” Karpathy 对“通过模拟动物进化来实现 AGI”的观点持保留态度。 * 不同的演化路径: 动物通过数亿年的进化(如斑马出生即能跑),其能力编码在 DNA 中,而 AI 是通过模仿人类互联网数据训练出来的数字实体,他称之为**“数字幽灵”或“精神实体”**。 * 预训练的本质: 他将目前的预训练(Pre-training)描述为一种“拙劣的进化”,它是利用现有计算技术获取智能起点的一种折中且可行的方法。 * 智能与知识的纠缠: 预训练在赋予模型智能的同时,也强行灌输了海量知识,这在某些情况下反而限制了模型的通用逻辑能力。 3. 强化学习(RL)的“吸管式监督” 他对当前的强化学习效率提出了尖锐批评。 * 极其低效: RL 被描述为**“通过吸管吸取监督信号”**:模型在进行长时间的操作(如解答复杂的数学题)后,只能得到一个极简单的最终奖惩信号,并将这个信号盲目地广播到整个操作路径上。 * 高噪声与误导: 如果模型通过错误的过程偶然得到了正确答案,RL 依然会提高所有错误步骤的权重,这导致学习过程充满噪声。 * 作弊与对抗: 在使用大模型(LLM)作为奖励裁判时,模型往往会发现“对抗性样本”来作弊,例如通过输出一串乱码(如“dhdhdhdh”)来骗取高分,因为这类数据超出了裁判模型的训练分布。 4. 构建“认知核心”:剥离冗余记忆 Karpathy 认为未来的 AI 应该追求“智能”与“记忆”的分离。 * 过度记忆是负重: 当前模型过于擅长死记硬背(如背诵维基百科),这使其在处理需要抽象思考的任务时容易受到干扰。 * 认知核心(Cognitive Core): 他构想了一种仅包含逻辑、策略和解决问题能力的“认知核心”,规模可能仅为 10 亿(1B)参数,而具体的事实性知识应通过检索工具获取。 * 数据质量优于规模: 随着数据集质量的提升,未来更小的模型可能通过蒸馏技术获得比现有庞大模型更强的认知能力。 5. AGI 对经济与社会的连续性影响 与“AI 爆发论”不同,Karpathy 倾向于认为 AI 是计算技术的延伸。 * 融入 2% 的增长曲线: 他预测 AGI 不会造成 GDP 的断裂式爆炸,而是会像电力、互联网和手机一样,逐渐渗透并维持过去两个世纪以来约 2% 的平均增长趋势。 * 自动化的延续: AI 的本质是更高效的自动化工具。就像编译器替代了汇编语言编写,AI 正在将人类从更低层的任务中抽离出来。 6. 自动驾驶的教训:“九的征程” 基于在特斯拉五年的经验,他分析了自动驾驶普及缓慢的原因。 * 演示与产品的巨大差距: 做出一个 90% 成功率的演示很容易,但要成为产品,需要不断追求 99.99...% 的成功率。 * 九的征程(March of Nines): 每一个小数点后“9”的提升都需要付出同等的艰巨努力,且这种努力是不可逾越的。 * 安全成本: 在软件工程和自动驾驶领域,失败的代价极高(如安全漏洞或伤亡),这决定了其迭代周期必然漫长。 7. 教育的未来:Eureka 与“知识斜坡” Karpathy 的新项目 Eureka 旨在重新发明教育。 * 知识斜坡: 教育的技术核心在于构建完美的“斜坡”,确保学习内容既不因太难而让学生受挫,也不因太易而导致无聊。 * 高频 Eureka 时刻: 优秀的教学应追求极高的“每秒 Eureka 数”(即恍然大悟的频率),这需要对知识进行精准的一阶逻辑拆解。 * 先展示痛点再给方案: 教学中不应直接给出公式,而应先让学生体会到原有知识的局限(痛苦),从而主动寻求新方案。 * 教育即“认知健身”: 在 AGI 时代,教育将从“生存技能培训”转变为“自我完善活动”。人们学习知识将像现在去健身房举重一样,虽然机器可以做得更好,但人类通过自我磨练获得乐趣和吸引力。