⏱️ 章节大纲
00:00 — 开头:那个让 Multi-Agent 卡死的真实问题
Multi-Agent 投研系统跑复杂研报,需要数小时甚至整晚
真正的问题不是 GPU 算力不足,而是「数据搬运」被卡住
05:00 — 第一章:AI 产业正在进入诡异新阶段
GPU 还没跑满,内存已经先崩了
Compute-centric → Memory-centric 的历史性转移
CXL(Compute Express Link)成为关键词
10:00 — 第二章:为什么 AI 突然「极度缺内存」?
美光 700%、西部数据 900%、闪迪 3300% 的疯狂背后
KV Cache:被二级市场忽视的核心问题
70B 模型 + 百万 Token = KV Cache 膨胀至数百 GB 甚至 TB
15:00 — 第三章:分层内存时代
Tier 0(HBM)→ Tier 1(DDR5/CXL)→ Tier 2(NVMe)→ Tier 3(对象存储)
HBM 的致命短板:太快、也太贵,像顶级学区房
18:00 — 第四章:CXL 改变了什么
Stranded Memory(搁浅内存):GPU-A 爆满、GPU-B 闲置
NVLink 解决算力上限;CXL 解决成本下限
Memory Pooling(内存池化):共享水网 vs 独立别墅
23:00 — 第五章:英伟达也在转型
从 GPU-centric 到 Context-centric
Grace-Blackwell:CPU + GPU + 内存织物全栈方案
26:00 — 第六章:反直觉——CPU 迎来结构性复兴
CXL 时代,CPU 重新成为神经中枢
ARM 全面压倒 x86;DeepSeek v4 加速这一趋势
30:00 — 第七章:产业链财富密码(四大关键节点)
Retimer:Astera Labs、Credo Technology
CXL Switch:博通、Marvell
被重估的 CPU 层:ARM、AMD、Intel
Memory Controller:Rambus
35:00 — 第八章:DeepSeek 算法压缩 + CXL 硬件池化,双剑合璧 40:00 — 结语:AI 的下一阶段,不再是算力战争
� 本期核心观点
AI 瓶颈已从算力转向内存(Compute-centric → Memory-centric)
KV Cache 是被忽视的核心问题
CXL = 内存互联网协议(Memory Pooling 是核心)
NVLink 和 CXL 互补,不是竞争
CPU 结构性复兴(ARM 压倒 x86)
产业链四大节点:Retimer → CXL Switch → CPU → Memory Orchestration
算法节流 + CXL 开源 = 终极解法
� 适合听众
AI产品经理、技术负责人、关注AI基础设施的投资人、寻找Alpha的二级市场研究者
� 关键词
CXL Memory WallKV CacheHBMMemory PoolingContext MemoryARMDeepSeekRetimerCXL Switch

