66.直击GTC现场：与姚欣、季宇盘点英伟达的野望，与2026 AI Q1季报

卫诗婕｜漫谈Light the Star

136分钟 ·4个月前

39603

104

一年一度的英伟达GTC大会在美西时间3月17日上午11点于加州圣何塞开幕。

开幕前夕，小龙虾Openclaw掀起的Agengt热，着实为本届GTC带去了空前的热度。 AI 正走过奇点，AI 基建会发生怎样的变化？

一期一会，我又邀请了《漫谈》的老朋友，PPIO 派欧云创始人姚欣 Bill 返场。去年GTC，Bill 和我考古了英伟达的30年成长史和精彩的算力风云，如果是对英伟达毫无了解的朋友，欢迎先前往漫谈的第28和29期节目补补课，那是一段非常精彩的商业史。

今年，Bill 在 GTC 开幕前与我录制了这期播客，他的导读不仅标出了本届 GTC 的看点，也涵盖了 2026 Q1 的 AI 动向季报。

而为了更准确地理解本届 GTC 的亮点和技术趋势，我又找到了这期节目的第二位嘉宾，国产 GPU 行云的创始人季宇，季宇博士是芯片行业专家，也是华为天才少年，参与过华为昇腾芯片项目，2024 年正式开始芯片创业。他会为我们校准本届 GTC 老黄开幕演讲中，一些新产品亮相（也有一些产品消失～）背后的产业逻辑与风向。

特别说明，本期节目不构成任何投资建议。

本期嘉宾：

姚欣（PPIO 派欧云创始人兼CEO ）

季宇（行云集成电路创始人兼CEO）

本期Shownotes：

Part 1. 对姚欣的访谈：在GTC开始前2小时，押题本届GTC的看点

04:54 算力需求井喷：谷歌半年时间 TOKEN 增长超过 13 倍

06:22推理爆发：Scaling Law 逐渐后移，Agent 时代来临

09:00 奇点已至

11:59 英伟达收购Groq，与万众瞩目的 LPU

15:49 模型与应用厂商趋势：长程任务、个性化智能、多模态适应

21:18 Ruby 系列芯片进化对算力行业的影响与趋势

24:56 AI工厂建构中，光互联将成半导体热点

34:52 Gemini、Claude 崩溃：中东战争，如何影响了全球AI服务？

38:08 如何理解英伟达五层蛋糕理论？

45:56 AI 进入加速时代：硅谷情绪乐观，投资人决心重来一遍

01:02:13 Agent OS、开闭源竞争、与半导体产能

01:10:41 从benchmark 到衡量替代人力产能的ROI：AI 正式走向应用时代

01:14:55 一超多雄格局，与费曼架构看点

Part2. 与季宇观看黄仁勋演讲直播：英伟达的野望、AI大型机器时代与一些问号

01:19:07 行云在做的事，与英伟达的关系

“看完GTC只有一个感受，琳琅满目”（这是一种褒扬吗？）

01:21:26 IBM 与英伟达，以及 AI 的大型机器

01:24:49 AI工厂，与五层蛋糕

01:25:21 激进的LPU：高并发时可能存在隐患，英伟达方案的错配

01:42:04 TPU、LPU与GPU在推理层面的应用分析

01:47:31 Agent 时代的算力需求

01:53:47 大型机与普惠机的鸿沟：英伟达一路狂奔而去

01:59:51 消失的 CPX：半导体产能紧俏后遗症

02:02:21 Nvidia 的小心机：异构堆叠与非标产品推广

02:11:27 “LPU 是我唯一看不懂的英伟达的选择”

02:12:36 “去年是 amazaing 的一年”

推荐阅读：《季宇：困在“大型机”里的AI产业》

加入听友群👇

展开Show Notes

卫诗婕_漫谈LTS

2026.3.19

置顶

嘉宾福利：置顶评论位帮招聘🌟
AI已进入Agent时代。PPIO正努力打造全球最高效的Token工厂与Agent沙盒。寻找死磕GPU极限的算子/推理系统专家，及精通微虚拟机、容器网络、大模型API路由的Infra极客。别再修补旧系统，加入我们，打穿算力成本，为下一代智能经济建造基础设施！欢迎投递简历至xinmeier@ppio.com

行云集成电路：重塑计算机形态，推动AI普惠。急寻推理框架开发、cuda算子、编译器大牛，加入我们，共筑AGI基石！欢迎投递简历至aaronwen@xingyun.ai

是sia不咯

2026.3.19

一些词语/背景解释，边听边查kimi记录的。适合像我这样的普通听众，没听明白的时候看：

奇点：
它指的是一个技术临界点——当人工智能的智能水平达到并超越人类智能时，技术进步将呈指数级爆炸式增长，人类社会将发生根本性变革。最早由计算机科学家冯·诺伊曼提出，后经未来学家雷·库兹韦尔（Ray Kurzweil）发扬光大。

SRAM：
Static Random Access Memory，静态随机存取存储器。
为什么Groq用SRAM做AI推理？
Groq 是一家做AI推理芯片的独角兽，他们的核心设计就是：用大量SRAM替代HBM（高带宽内存），其路线是"用钞能力换速度"——SRAM贵，但延迟极低。如果NVIDIA能把这种思路融合进GPU，就能兼顾通用性和推理速度。

DRAM：
Dynamic Random-Access Memory，动态随机存取存储器。

LPU：
Language Processing Unit（语言处理单元）。这是Groq专门为大模型推理设计的专用芯片。专为大模型对话推理设计的"加速器"。
* 特点：用的sram, IO存储高，吞吐率高，同时价格也很高。
* 特定场景：极高吞吐，极强稳定性，且贵。如ai coding。

长程任务：
Long-horizon tasks，指需多步骤、长时间、持续执行的复杂任务。非常典型的给agent这一类的场景，做长时间任务模拟。
如：openclaw小龙虾；athropic的coworkers，自动接管你的桌面，做很多任务的整理，帮你处理excel的报表。（引发saas软件末日论）

NCP：
英伟达合作伙伴，NVIDIA Cloud Partner。

星际之门铁三角的循环投资：
OpenAI、英伟达、oracle。英伟达投openAI做模型，甲骨文提供云计算，买英伟达芯片。（62期年终总结提到过）

英伟达的五层蛋糕：
* 第5层：AI应用（ChatGPT/Cursor等） ← 英伟达不做，让客户做
* 第4层：AI模型（GPT-4/Claude等） ← 英伟达支持，不直接做
* 第3层：AI框架（CUDA/Dynamo等） ← 英伟达垄断
* 第2层：AI集群（NVLink/InfiniBand） ← 英伟达垄断
* 第1层：AI芯片（GPU/LPU/网络芯片） ← 英伟达垄断
* 第0层：能源（电力/散热/土地） ← 留给NCP和本地企业

Nebius：
原Yandex分拆的欧洲AI云厂商。英伟达20亿美元投资是地缘政治驱动的战略卡位——扶持非美系、非大厂系的独立AI云，构建全球"主权AI"算力联盟，同时锁定欧洲市场对抗AWS/Google。这是黄仁勋"AI工厂设备商"定位的又一落地，也验证了MoE时代分布式算力需求的爆发。

是sia不咯:英伟达的架构时间线： 2020：Ampere，上一代 2022：Hopper，训练为主 2024：Blackwell，训练+推理 2025-2026：Rubin，当前主力 2026-2027：Feynman，下一代旗舰

是sia不咯:硅谷的模型、应用公司的方向： 1、长程任务，非常典型的给agent这一类的场景，做长时间任务模拟。如小龙虾，athropic的coworkers 2、个性化的智能，personal intelligence。和商业化相关。比如，谷歌的Gemini，自动的去读取你所有历史，绘画、邮件，聊天等，给出你的结果；国内，龙虾版飞书、微信。 3、多模态/全模态/混合模态的适应。比如字节Seedance。基于这三个方向，对应的英伟达的重点： 1、长程任务，长时间运行任务海量token消耗。 2、优化显存、内存。 a.上下文压缩技术。把200万Token的长上下文压缩到显存能容纳的范围，类似KV Cache压缩、动态稀疏注意力等技术。 b.场景感知的资源调度，不同场景（Coding vs 数据分析 vs 多模态）动态分配显存和算力。

共4条回复