66.直击GTC现场:与姚欣、季宇盘点英伟达的野望,与2026 AI Q1季报卫诗婕|漫谈Light the Star

66.直击GTC现场:与姚欣、季宇盘点英伟达的野望,与2026 AI Q1季报

136分钟 ·
播放数23587
·
评论数89

一年一度的英伟达GTC大会在美西时间3月17日上午11点于加州圣何塞开幕。

开幕前夕,小龙虾Openclaw掀起的Agengt热,着实为本届GTC带去了空前的热度。 AI 正走过奇点,AI 基建会发生怎样的变化?

一期一会,我又邀请了《漫谈》的老朋友,PPIO 派欧云创始人姚欣 Bill 返场。去年GTC,Bill 和我考古了英伟达的30年成长史和精彩的算力风云,如果是对英伟达毫无了解的朋友,欢迎先前往漫谈的第28和29期节目补补课,那是一段非常精彩的商业史。

今年,Bill 在 GTC 开幕前与我录制了这期播客,他的导读不仅标出了本届 GTC 的看点,也涵盖了 2026 Q1 的 AI 动向季报。

而为了更准确地理解本届 GTC 的亮点和技术趋势,我又找到了这期节目的第二位嘉宾,国产 GPU  行云的创始人季宇,季宇博士是芯片行业专家,也是华为天才少年,参与过华为昇腾芯片项目,2024 年正式开始芯片创业。他会为我们校准本届 GTC 老黄开幕演讲中,一些新产品亮相(也有一些产品消失~)背后的产业逻辑与风向。

特别说明,本期节目不构成任何投资建议。

本期嘉宾:

姚欣 (PPIO 派欧云创始人兼CEO )

季宇(行云集成电路创始人兼CEO)

本期Shownotes:

Part 1. 对姚欣的访谈:在GTC开始前2小时,押题本届GTC的看点

04:54 算力需求井喷:谷歌半年时间 TOKEN 增长超过 13 倍

06:22推理爆发:Scaling Law 逐渐后移,Agent 时代来临

09:00 奇点已至

11:59 英伟达收购Groq,与万众瞩目的 LPU

15:49 模型与应用厂商趋势:长程任务、个性化智能、多模态适应

21:18 Ruby 系列芯片进化对算力行业的影响与趋势

24:56 AI工厂建构中,光互联将成半导体热点

34:52 Gemini、Claude 崩溃:中东战争,如何影响了全球AI服务?

38:08 如何理解英伟达五层蛋糕理论?

45:56 AI 进入加速时代:硅谷情绪乐观,投资人决心重来一遍

01:02:13 Agent OS、开闭源竞争、与半导体产能

01:10:41 从benchmark 到衡量替代人力产能的ROI:AI 正式走向应用时代

01:14:55 一超多雄格局,与费曼架构看点

Part2. 与季宇观看黄仁勋演讲直播:英伟达的野望、AI大型机器时代与一些问号

01:19:07 行云在做的事,与英伟达的关系

“看完GTC只有一个感受,琳琅满目”(这是一种褒扬吗?)

01:21:26 IBM 与英伟达,以及 AI 的大型机器

01:24:49 AI工厂,与五层蛋糕

01:25:21 激进的LPU:高并发时可能存在隐患,英伟达方案的错配

01:42:04 TPU、LPU与GPU在推理层面的应用分析

01:47:31 Agent 时代的算力需求

01:53:47 大型机与普惠机的鸿沟:英伟达一路狂奔而去

01:59:51 消失的 CPX:半导体产能紧俏后遗症

02:02:21 Nvidia 的小心机:异构堆叠与非标产品推广

02:11:27 “LPU 是我唯一看不懂的英伟达的选择”

02:12:36 “去年是 amazaing 的一年”

推荐阅读:《季宇:困在“大型机”里的AI产业

加入听友群👇

展开Show Notes
置顶
嘉宾福利:置顶评论位帮招聘🌟
AI已进入Agent时代。PPIO正努力打造全球最高效的Token工厂与Agent沙盒。寻找死磕GPU极限的算子/推理系统专家,及精通微虚拟机、容器网络、大模型API路由的Infra极客。别再修补旧系统,加入我们,打穿算力成本,为下一代智能经济建造基础设施!欢迎投递简历至xinmeier@ppio.com

行云集成电路:重塑计算机形态,推动AI普惠。急寻推理框架开发、cuda算子、编译器大牛,加入我们,共筑AGI基石!欢迎投递简历至aaronwen@xingyun.ai
一些词语/背景解释,边听边查kimi记录的。适合像我这样的普通听众,没听明白的时候看:

奇点:
它指的是一个技术临界点——当人工智能的智能水平达到并超越人类智能时,技术进步将呈指数级爆炸式增长,人类社会将发生根本性变革。最早由计算机科学家冯·诺伊曼提出,后经未来学家雷·库兹韦尔(Ray Kurzweil)发扬光大。

SRAM:
Static Random Access Memory,静态随机存取存储器。
为什么Groq用SRAM做AI推理?
Groq 是一家做AI推理芯片的独角兽,他们的核心设计就是:用大量SRAM替代HBM(高带宽内存),其路线是"用钞能力换速度"——SRAM贵,但延迟极低。如果NVIDIA能把这种思路融合进GPU,就能兼顾通用性和推理速度。

DRAM:
Dynamic Random-Access Memory,动态随机存取存储器。

LPU:
Language Processing Unit(语言处理单元)。这是Groq专门为大模型推理设计的专用芯片。专为大模型对话推理设计的"加速器"。
* 特点:用的sram, IO存储高,吞吐率高,同时价格也很高。
* 特定场景:极高吞吐,极强稳定性,且贵。如ai coding。


长程任务:
Long-horizon tasks,指需多步骤、长时间、持续执行的复杂任务。非常典型的给agent这一类的场景,做长时间任务模拟。
如:openclaw小龙虾;athropic的coworkers,自动接管你的桌面,做很多任务的整理,帮你处理excel的报表。(引发saas软件末日论)

NCP:
英伟达合作伙伴,NVIDIA Cloud Partner。

星际之门铁三角的循环投资:
OpenAI、英伟达、oracle。英伟达投openAI做 模型,甲骨文提供云计算,买英伟达芯片。(62期年终总结提到过)

英伟达的五层蛋糕:
* 第5层:AI应用(ChatGPT/Cursor等) ← 英伟达不做,让客户做
* 第4层:AI模型(GPT-4/Claude等) ← 英伟达支持,不直接做
* 第3层:AI框架(CUDA/Dynamo等) ← 英伟达垄断
* 第2层:AI集群(NVLink/InfiniBand) ← 英伟达垄断
* 第1层:AI芯片(GPU/LPU/网络芯片) ← 英伟达垄断
* 第0层:能源(电力/散热/土地) ← 留给NCP和本地企业

Nebius:
原Yandex分拆的欧洲AI云厂商。英伟达20亿美元投资是地缘政治驱动的战略卡位——扶持非美系、非大厂系的独立AI云,构建全球"主权AI"算力联盟,同时锁定欧洲市场对抗AWS/Google。这是黄仁勋"AI工厂设备商"定位的又一落地,也验证了MoE时代分布式算力需求的爆发。
是sia不咯:英伟达的架构时间线: 2020:Ampere,上一代 2022:Hopper,训练为主 2024:Blackwell,训练+推理 2025-2026:Rubin,当前主力 2026-2027:Feynman,下一代旗舰
是sia不咯:硅谷的模型、应用公司的方向: 1、长程任务,非常典型的给agent这一类的场景,做长时间任务模拟。如小龙虾,athropic的coworkers 2、个性化的智能,personal intelligence。和商业化相关。 比如,谷歌的Gemini,自动的去读取你所有历史,绘画、邮件,聊天等,给出你的结果;国内,龙虾版飞书、微信。 3、多模态/全模态/混合模态的适应。比如字节Seedance。 基于这三个方向,对应的英伟达的重点: 1、长程任务,长时间运行任务海量token消耗。 2、优化显存、内存。 a.上下文压缩技术。把200万Token的长上下文压缩到显存能容纳的范围,类似KV Cache压缩、动态稀疏注意力等技术。 b.场景感知的资源调度,不同场景(Coding vs 数据分析 vs 多模态)动态分配显存和算力。
4条回复
vvvvve
vvvvve
3天前
太牛了,今天的嘉宾很硬核,给了很多内部观点,可能小白不那么友好但对行内人来说绝对信息量满满,谢谢诗婕和嘉宾
卫诗婕_漫谈LTS
:
😊🙏
庄明浩
庄明浩
3天前
你这长度可以分两期发啊 亲
卫诗婕_漫谈LTS
:
懒 一锅出
庄明浩:任性
3条回复
dong6
dong6
1 天前
前半场通俗易懂深入浅出,后半场昏昏欲睡
卫诗婕_漫谈LTS
:
后半场其实很干货哒
其实我觉得未来AI算力不是一般人烧得起的,OPC的愿景很美好,但最后受益的还是金字塔顶的人,人类社会不管玩什么花活,底层逻辑是变不了的
卫诗婕_漫谈LTS
:
嗯…其实我挺同意底层逻辑的不变的…
殿宇
殿宇
14小时前
这种有深度的内容,太好了
卫诗婕_漫谈LTS
:
❤️
Voilalala
Voilalala
1 天前
这期嘉宾很赞👍🏻
卫诗婕_漫谈LTS
:
🌟
楠_T8KE
楠_T8KE
1 天前
作为一个文艺从业者路过来了解这个完全陌生,但因权益侵占问题(盗用声音,盗用作品等)产生了剧烈交集的行业,主播们见解很专业。想请问主播对于技术进步过程中对人权益的侵占是怎么看待的呢?
卫诗婕_漫谈LTS
:
很好的问题 我一直打算做节目聊这个话题
Tuffy
Tuffy
2天前
听第三遍了,每次听都有新知识!感恩美女主播和嘉宾~
卫诗婕_漫谈LTS
:
千小时播客收听时长,好厉害😯
能听专业的人讲专业的事,真的很难得,也很荣幸。虽然有些听不懂,但还是收获了很多,感谢主播做了一期这么好的节目
卫诗婕_漫谈LTS
:
❤️
HD613174x
HD613174x
3天前
黑白,半张脸,新头像不是很好看。。
卫诗婕_漫谈LTS
:
尽力不靠好看🙃
黑阿尔:又点评上了
3条回复
金林慧鸽
金林慧鸽
9小时前
1:54:27 主持人的洞见很敏锐啊,Nv肯定在布局个人消费级
卫诗婕_漫谈LTS
:
只是猜测🥲
听下来就一个感受:空头们 投降吧!唱衰掩饰不了你们踏空一年一年又一年的尴尬
卫诗婕_漫谈LTS
:
😄
把英伟达的野心和行业的现实扒得透透的,听着太过瘾!
卫诗婕_漫谈LTS
:
👀
颂雪
颂雪
2天前
我还觉得以后管理层会大大减少
卫诗婕_漫谈LTS
:
我倒觉得阶段性减少 长远未必
干货满满,还在等67,68,69……
1:52:21 不太认可每个人都买自己的设备运行模型,就像现在不会每个人都买一个发电设备一样
金林慧鸽
金林慧鸽
9小时前
1:45:19 LPU听下来感觉就是近存计算的一种方案,这个方案现在适不适合当下的推理需求确实不太清晰,但近存计算本身还是值得探索的一种技术路线
算力需求井喷的数字真的让人头皮发麻!AI的奇点真的已经来了
卫诗婕_漫谈LTS
:
下一期节目会专门讲这个话题👀