#614.NVIDIA 核心科学家 Bryan Catanzaro:当算力堆到极限,开源模型如何靠“效率”继续变强

#614.NVIDIA 核心科学家 Bryan Catanzaro:当算力堆到极限,开源模型如何靠“效率”继续变强

65分钟 ·
播放数565
·
评论数0

📝 本期播客简介

本期我们克隆了:知名科技播客《The MAD Podcast with Matt Turck》Why NVIDIA Is Giving Away AI Models | Bryan Catanzaro

原内容更新时间:2026-07-02

本期嘉宾是 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro,主持人是风险投资家 Matt Turck。Bryan 是 AI 基础设施领域真正的幕后关键人物,他参与创建了 cuDNN,共同发明了 DLSS,并主导了 Nemotron 开源模型家族。这期节目围绕一个核心矛盾展开:NVIDIA 作为一家芯片公司,为什么要投入巨资构建前沿 AI 模型,然后免费开放给全世界?

对话深入探讨了开源 AI 的现状、中美之间的技术竞赛,以及 Nemotron 模型背后的架构创新。Bryan 详细拆解了混合 Mamba-Transformer 架构、混合专家(MOE)、多 token 预测和多教师蒸馏等硬核技术,并分享了 NVIDIA 内部如何组织数百名研究员高效协作,而不是各自为战写一百篇论文。如果你关心 AI 模型效率、开源生态的未来,以及大型研究机构的运作方式,这期节目会提供非常扎实的一手信息。

👨‍⚕️ 本期嘉宾

Bryan Catanzaro,NVIDIA 应用深度学习研究副总裁。他 2008 年加入 NVIDIA,是早期将 GPU 用于深度学习的先驱之一,曾参与创建 cuDNN(NVIDIA 首个深度学习产品库),共同发明了实时 AI 图形技术 DLSS,并主导了 Megatron 项目——帮助整个行业搞清楚了如何训练超大规模语言模型。他曾在百度硅谷 AI 实验室与吴恩达、Dario Amodei 共事,目前领导 Nemotron 开源基础模型家族。

⏱️ 时间戳

开场与开源 AI 现状

00:00 本期克隆节目介绍

01:45 主持人 Matt Turck 开场,介绍嘉宾 Bryan Catanzaro

02:46 开源 AI 势头正猛,Nemotron 3 Ultra 刚发布

03:10 闭源与开源之间的差距现在有多大?

04:20 整个 AI 社区都在飞速前进,差距不是最重要的

04:48 推动开源 AI 持续进步的动力是什么?

05:43 开源模型的进步是否依赖蒸馏闭源模型?

07:18 如何看待中国 AI 社区的贡献与创新?

09:12 客户使用开源模型最根本的优势:定制化与数据安全

Bryan 的个人经历与 NVIDIA 的 AI 之路

10:42 Bryan 的职业生涯起点:2008 年加入 NVIDIA

11:03 早期用 GPU 做 AI 被学术界视为异类

12:05 从 Copperhead 到 cuDNN 的诞生

12:39 加入百度硅谷 AI 实验室,与吴恩达、Dario Amodei 共事

13:05 回忆 Dario Amodei:信念的力量与对时机的精准把握

14:40 2016 年重返 NVIDIA,黄仁勋亲自打电话邀请

15:30 第一个项目 DLSS:用 AI 生成游戏画面中 96% 的像素

16:27 2017 年启动 Megatron 项目,押注 Transformer

Nemotron 的使命与架构创新

18:00 NVIDIA 为什么要构建自己的前沿模型家族?

18:16 Nemotron 的第一个任务:理解如何构建未来的系统

19:08 Nemotron 的第二个任务:支持整个 AI 生态

19:58 摩尔定律已死,加速计算比以往更有价值

21:26 Nemotron 项目的发展历程与关键节点

24:41 Nemotron Coalition 联盟:在模型构建之前就与合作伙伴协作

26:51 Nemotron 家族:Nano、Super、Ultra 的定位与用例

27:43 Nemotron 的核心目标:打造最强的 Agent 推理模型

28:03 Nemotron 的效率哲学:用 4 位精度进行预训练

28:42 4 位与 16 位精度的区别,以及为什么效率决定智能上限

深入技术架构

31:23 混合 Mamba-Transformer 架构:状态空间模型与注意力机制的结合

33:27 混合专家(MOE)架构解析:让模型学会“按需查阅”

35:07 MOE 对硬件设计的影响:NVL72 的诞生逻辑

36:18 隐式 MOE:通过降维投影节省通信带宽

37:04 MOE 是否已成为前沿 AI 的默认架构?

37:38 100 万 token 长上下文窗口的意义

38:35 上下文压缩与 Agent 工作流

39:09 多 token 预测:如何在不损失准确率的情况下实现 4 倍加速

41:44 多教师蒸馏:用多个专家模型联合训练一个全能学生模型

大型研究机构的组织与协作

43:41 多教师蒸馏既是技术问题,也是人员组织问题

43:52 Post-training 与强化学习的数据从何而来?

45:58 AI 泛化的下一步:从编程、数学走向更复杂的领域

47:22 NVIDIA 的研究组织架构:任务是老板,不是组织架构图

48:12 Nemotron 名字的由来:NeMo 与 Megatron 团队的融合

49:29 如何让 500 人高效协作:内部想法分享与评估流程

50:23 GPU 算力如何分配?两周一次的预算审核周期

52:09 如何平衡有用的研究与探索性研究:研究需要“自举”

53:35 NVIDIA 的登月项目是自下而上还是自上而下?

55:27 NVIDIA 为何在巨大成功后仍保持创业精神?

AI 的未来、安全与人类命运

57:10 Bryan 为什么不认同奇点理论?

57:32 智能的维度太多,纯粹智能只是没有轮子的发动机

58:44 AI 将解锁巨大能力,但转型对人类社会是深刻挑战

59:25 外部大脑的隐喻:厨房是我们的外部胃,AI 是外部大脑

01:01:06 如何看待公众对 AI 的抵制情绪?

01:02:22 AI 安全:为什么 Bryan 认为开放技术天生更安全?

01:03:54 多元主义比单一文化更安全:从信仰自由到 AI 开放的类比

🌟 精彩内容

💡 智能的价值太高,我们注定会在极限上运行

Bryan 指出,无论极限是经济预算还是电力供应,每个组织都会把算力推到极限,因为智能的回报太大了。这意味着获得更多智能的唯一途径不是堆更多资源,而是提高效率。

“如果你接受我们会在极限上运行这个前提,那意味着要获得更多智能,就得提高效率。如果已经在极限上了,靠加力是得不到更多智能的。”

💡 厨房是外部胃,AI 是外部大脑

他用一个极具画面感的比喻解释 AI 对人类文明的意义:人类发明厨房作为外部胃来加工食物,这催生了农业和有组织的社会。现在我们在创造外部大脑,其影响将同样深远,但没人真正知道答案。

“我们造工具,造外部器官来帮我们解决问题。我们有外部胃,叫厨房。现在我们正在创造外部大脑。外部大脑意味着什么?影响相当深远,其实没人真正知道。”

💡 纯粹智能只是没有轮子的发动机

Bryan 不认同奇点理论,因为智能的维度太多。国际数学奥林匹克冠军未必能当好 CEO,音乐人的智能可能是 PhD 理解不了的。智能的影响力取决于它被放在什么环境里。

“纯粹的智能有点像发动机的马力,但一台没有轮子的发动机,光在那转,哪儿也去不了。”

💡 任务是老板,不是组织架构

NVIDIA 内部有大约 10 个团队深度参与 Nemotron 的构建,分布在从 GPU 设计到企业软件的不同部门。协作方式不是靠层级命令,而是靠共同的任务目标把大家凝聚起来。

“我们总喜欢说,任务是老板,而不是组织架构。但这意味着,大家必须自己摸索出协作的方式,这很有挑战性,因为人类天生就是部落动物。”

💡 研究需要自举,而不是等资源到位

每个研究员都相信只要给自己 1000 倍 GPU 就能改变世界,但资源永远有限。Bryan 的解决哲学是“自举”:先做小的实验拿到信号,再一点点争取更多资源,通过快速迭代滚雪球。

“解决鸡和蛋问题的方法就是自举。这是一种迭代式的问题解决方法,你先做点小的,拿到某种信号表明这是个好 idea,然后告诉别人。接着你再多要一点点资源。”

💡 开放技术天生更安全,因为阳光更充足

在 AI 安全的争议中,Bryan 持一个不那么正统的观点:让更多人参与评估和贡献安全方案,比让一小群人替所有人负责安全更可靠。他引用了几百年来关于信仰自由和言论自由的历史教训。

“我认为开放技术通常更安全,因为阳光更充足。当有更多人思考一项技术的安全性、评估它,并为让它更安全做出贡献时,我觉得这天生就比让一小群人替所有人负责安全要更安全。”

💡 中国 AI 社区的开放对世界是件非常好的事

基于在百度工作的亲身经历,Bryan 驳斥了“中国 AI 进展全靠山寨”的刻板印象。他特别感谢中国同行多年来对开源生态的贡献,并鼓励其他地区的实验室也保持这种开放精神。

“中国 AI 社区对他们所构建的东西如此开放,这对世界来说是件非常好的事。我认为这让大量公司得以构建出没有那个社区就做不出来的东西,也推动了整个 AI 生态系统的技术进步。”

```

🌐 播客信息补充

本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的

使用 AI 进行翻译,因此可能会有一些地方不通顺;

如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight