#607.SemiAnalysis创始人：AI的真正100倍杠杆，藏在软硬件协同设计里

📝 本期播客简介

本期我们克隆了：红杉资本旗下播客的深度对谈《Why Hardware-Software Co-Design Is AI's Real 100x: Dylan Patel of SemiAnalysis》

原内容更新时间：2026-06-30

本期嘉宾是知名半导体与AI研究机构SemiAnalysis的创始人Dylan Patel，主持人是红杉资本的合伙人Sean。Dylan从硬件论坛版主起步，如今带领团队为全球机构提供最前沿的芯片与人工智能产业分析。这期节目，他们撕开了AI领域一个常被忽视的关键杠杆——硬件与软件的协同设计，并深入探讨了这种深度整合如何带来远超单纯硬件迭代的效率飞跃。

Dylan在节目中抛出了一个核心论断：AI最大的收益不是来自更快的芯片，而是当你把模型架构、底层内核和芯片设计三层协同优化时，原本这里2倍、那里2倍的提升，会直接变成100倍。他用DeepSeek举例，解释了为什么其专家模块的形状是为英伟达Hopper架构量身定制的，也因此跑在TPU上表现拉胯。这引出了一个更深的洞察：所谓的CUDA护城河，其实从来都不是CUDA本身，而是下游模型对英伟达硬件的深度协同优化。

对话还覆盖了InferenceX的活体基准测试、太空数据中心的非共识判断、AI推理市场的终局规模，以及为什么新云厂商能在超大规模云厂商的夹缝中野蛮生长。如果你关心AI基础设施、芯片战争、模型架构演进和背后的经济账，这期节目会给你一个全新的分析框架。

👨‍⚕️ 本期嘉宾

Dylan Patel，SemiAnalysis创始人。SemiAnalysis是全球最具影响力的半导体与AI产业研究机构之一，客户涵盖顶级对冲基金、科技巨头和各国政府。Dylan从12岁起泡硬件论坛，后来成为Reddit多个科技板块的版主，大学毕业后做过量化分析师，2020年在个人崩溃和全球疫情中创办了SemiAnalysis。他以能把技术细节和经济账无缝结合的分析风格著称，团队约90人，一半是覆盖半导体供应链的工程师，一半是前对冲基金分析师。

⏱️ 时间戳

开场与SemiAnalysis的诞生

00:00 本期克隆节目介绍

01:18 SemiAnalysis内部的“打架”文化：工程师vs金融人

01:56 主持人Sean介绍Dylan

03:01 Dylan的成长背景：汽车旅馆、加油站与第一个“神经网络”

04:31 八岁生日与Xbox 360死亡红环：硬件的潘多拉魔盒

05:36 12岁成为Reddit版主，开始追踪芯片行业

07:50 创办SemiAnalysis的契机：奖金被坑、祖母去世、疫情崩溃

10:05 24岁生日当天，用真名发布SemiAnalysis

10:37 开着卡车跑遍全美国家公园，在30美元汽车旅馆里做研究

供应链、会议与学习曲线

12:13 行业展会vs学术会议：NeurIPS与日本化学会议的天壤之别

13:17 SPIE先进光刻会议：第一次去90%都听不懂

14:58 一种化学品烧毁，内存价格翻三倍的恐怖故事

推理市场与InferenceX

15:35 推理将是地球上最大的市场，比石油大得多

16:13 为什么启动InferenceX：静态基准测试已经死了

17:57 生态支持：5000万美元捐赠硬件，15种芯片类型

19:18 帕累托最优曲线：别拿次优配置跟最优配置比

20:07 吞吐量与交互性曲线：AI基础设施的下游总开关

21:11 成本如何纳入曲线：批量100用户每秒10 token vs 单用户每秒500 token

太空数据中心与电力预测

22:18 非共识判断：三到五年内太空数据中心没有实质影响

23:03 二十年尺度上，绝大部分算力会搬到太空

23:35 到2030年，仅OpenAI和Anthropic就会超过100吉瓦

23:47 到2040年，推理算力将进入太瓦级别

每瓦智能与三层协同优化

24:06 每瓦智能一直在提升吗？成本已降60倍，每瓦智能提升约40倍

25:25 Sean的三层框架：硬件、系统软件、模型算法

26:04 Dylan完全不同意：最大收益来自协同设计层

26:55 DeepSeek V3的专家形状是为Hopper优化的

27:43 TPU跑DeepSeek很拉胯，跑其他模型却非常出色

28:07 中国在协同优化上比西方做得好？Dylan不这么认为

28:42 真正的突破：跨三层协同优化，2倍×2倍×2倍变成100倍

技术瓶颈与供应链创新

30:49 未来一年最关注的技术瓶颈：内存带宽

31:46 直接把内存堆在芯片上，带宽会暴涨

31:58 打破每平方毫米一瓦的功率天花板

33:16 能源瓶颈的简单解法：用卡车发动机改造成天然气发电机

GPU vs TPU与CUDA护城河

34:25 Nvidia对TPU：两年后两边都是千亿美元级别

35:24 两边都有很能打的论点，但归根结底是协同设计

35:50 OpenAI用TPU可能很糟糕，Anthropic用GPU训练也可能很糟糕

36:09 矩阵乘法单元大小不同，导致模型架构根本不同

37:20 CUDA护城河已经被解开了，因为模型编程能力很强

37:58 真正的护城河不是CUDA，而是下游模型对Nvidia的优化

38:49 开源模型生态让下游使用者被绑在Nvidia上

39:40 大实验室早就fork了PyTorch，不需要依赖开源

Cerebras、经济账与AI投资回报率

40:07 Cerebras：推理速度极快，但超大模型和超长上下文是风险

42:46 Dylan的独特优势：把技术和经济账结合起来

43:55 最让Dylan上头的言论：AI没有投资回报率

44:06 模型能力曲线一直在向右上方走，看新的基准测试

十年框架与终局判断

45:52 十年框架下最兴奋的事：太空数据中心、小行星采矿

46:29 共封装光学：争论的只是27年、28年还是29年发生

46:48 Naveen Rao的长期赌注：模拟计算与基于能量的模型

48:20 生态终局：每家超大规模云厂商都会有自己的芯片

49:24 硬件架构和模型架构会出现更多分叉

50:20 通用AI算力永远有市场，因为实验室连一年后用什么架构都不知道

51:51 每家都会投入数十亿美元部署专用集成电路

数据中心建设与计算资源紧缺

52:52 我们正处在一场疯狂的计算资源紧缺之中

53:22 今年20吉瓦，明年超30吉瓦，但模型能力增长更快

54:31 Anthropic第二季度已经净利润盈利

54:44 Opus token利润率超过80%

55:45 只要毛利率是正的，就会不惜代价租GPU

55:58 计算能力建设会不会突然出问题？

57:01 如果模型能完成的工作量增速超不过算力增速，风向就会变

57:49 模型现在进步得比六个月前更快：递归式自我改进在运转

数据中心的同质性与新云厂商

59:20 沙特原油的类比：不同吉瓦之间有多大同质性？

01:00:39 Trainium每吉瓦不到100亿美元，GPU每吉瓦120到130亿

01:02:07 数据中心租赁价格从每千瓦60美元涨到120到160美元

01:02:47 常见的坑：项目直接失败，必须做概率加权

01:03:18 Google在一个吉瓦级数据中心里实际部署1.5吉瓦硬件

01:04:51 一个吉瓦给Anthropic产生的收入比给OpenAI更高

NeoCloud的机会与Jensen的布局

01:06:22 NeoCloud为什么存在？超大规模云厂商的专长在AI云里变成拖累

01:07:21 Nitro智能网卡对AI性能不利，安全功能在AI场景没意义

01:08:59 Jensen绝对讨厌超大规模云厂商掌握所有权力

01:09:22 他想要一个多极化的世界，所以砸钱给新实验室和新云厂商

01:10:11 新云生态就是蛮荒地带，有些会失败，有些会脱颖而出

01:11:10 Thinking Machines做到上亿美元年度经常性收入

🌟 精彩内容

💡 软硬件协同设计：2倍×2倍×2倍变成100倍

Dylan指出，AI效率提升的真正魔法不在单一层面，而在跨层协同。当模型架构、底层内核和芯片设计被当作一个整体来优化时，收益不是加法而是乘法，甚至是指数级的。这就是为什么顶尖实验室和英伟达这样的公司能持续领先。

"真正的突破性创新，是当你跨越几层去做协同优化和协同设计，突然间，本来这里2倍、那里2倍、那里2倍，不是乘起来变成8倍，而是直接100倍。"

💡 CUDA护城河从来不是CUDA本身

Dylan颠覆了行业对英伟达护城河的认知。他认为真正的锁定效应不是CUDA软件生态，而是下游模型在架构层面就为英伟达GPU做了深度优化。DeepSeek的专家模块形状是为Hopper定制的，所以跑在TPU上表现很差。这种模型层面的协同设计，才是真正的护城河。

"这其实不是CUDA在起护城河作用，而是下游产品对Nvidia优化得更好。而且这些公司还都在开源这些模型。"

💡 推理将是地球上最大的市场，比石油大得多

Dylan对AI推理市场的规模做出了大胆预测：到2030年仅OpenAI和Anthropic就会超过100吉瓦，到2040年进入太瓦级别。他认为AI推理将占到GDP的好几个百分点，成为人类历史上最大的单一市场之一。

"推理，不管是开源模型还是闭源模型，都会是世界上最大的市场之一。我觉得会比石油大得多。"

💡 别拿次优配置跟最优配置比

在解释InferenceX的帕累托最优曲线时，Dylan用一个赛车比喻点出了行业基准测试的普遍问题：人们总拿别人次优的配置来跟自己最优的配置比，这就像开保时捷跟赛车手比谁开得更慢。InferenceX要做的是为曲线上每一个点都找到真正的最优配置。

"很多时候，人们在比较推理性能时，会拿别人次优的曲线或点位，来跟自己最优的去比。这就好比，我开保时捷，跟某个赛车手比，肯定是我开得更慢。"

💡 模型进步没有停滞，递归式自我改进正在加速

面对"模型能力即将停滞"的论调，Dylan给出了一个令人兴奋的观察：工程师们正在用模型来帮助编写代码、加速推出下一代模型，形成了一个类似递归自我改进的循环。模型现在进步得比六个月前更快。

"模型现在进步得比六个月前或一年前更快，因为你看到的是一个类似递归自我改进的循环在运转，模型变得更好、更快。"

💡 Jensen想要一个多极化的世界

Dylan揭示了英伟达CEO黄仁勋的深层战略逻辑：他砸钱给新实验室和新云厂商，不是因为短期利润，而是为了防止一个只有OpenAI、Anthropic和Google模型的世界出现。一个多极化的AI生态，对英伟达来说才是长期安全牌。

"一个只有OpenAI、Anthropic和Google模型的世界，对他来说是死路一条。一个只有超大规模云厂商在建设算力的世界，对他也是死路一条。"

💡 别跟猪摔跤，因为猪也乐在其中

当Sean问Dylan是否享受SemiAnalysis内部工程师和金融人之间的激烈争论时，Dylan用这句谚语幽默地承认了自己乐在其中。这也完美概括了他从论坛版主到行业顶尖分析师的一贯风格：享受争论，享受把技术和经济账放在一起碰撞的过程。

"别跟猪摔跤，因为猪也乐在其中，对吧？"

```

🌐 播客信息补充

本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的

使用 AI 进行翻译，因此可能会有一些地方不通顺；

如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight