当你向大语言模型提问时,你可能不知道,为了生成一个词(Token),芯片的数学运算单元有超过99%的时间都处于空闲状态,仅仅是在苦苦等待数据从内存中传来。这就是AI算力领域最致命的硬件瓶颈——“内存墙”。
本期节目我们将硬核拆解这场关乎未来的AI算力底层之战。AI计算的市场正在发生翻天覆地的变化,推理工作负载已经占据了所有AI计算的50%以上,预计到2030年将催生出一个高达2550亿美元的巨大市场。面对英伟达(NVIDIA)占据约80%市场份额以及其坚不可摧的CUDA生态护城河,一群激进的挑战者正试图通过彻底重构芯片架构来“跨越内存墙”。
正如业内所言:“GPU是通用的锤子,而推理工作负载需要的是手术刀”。未来的算力形态将走向何方?谁又能在这场2550亿美元的硅基豪赌中笑到最后?
【本期高光看点】
- 生成一个Token的真实代价:为什么说AI推理根本不是计算问题,而是内存问题?SRAM与HBM路线有何本质区别?
- Groq的极致狂飙与被收编:完全抛弃片外内存,靠纯SRAM实现零延迟方差的确定性速度,以及它是如何逼迫英伟达豪掷约200亿美元将其收入麾下的。
- Cerebras的“大晶圆崇拜”:不切分芯片,直接把整个硅晶圆(餐盘大小)做成一颗拥有4万亿个晶体管的超级芯片,带宽达到英伟达H100的6300倍。
- Etched的孤注一掷:砍掉一切不相关功能,将所有晶体管直接硬编码给Transformer架构。如果Transformer消失,这家估值50亿美元的公司就会瞬间倒闭。
- 百花齐放的算力异类:Jim Keller带领的Tenstorrent如何把高昂的AI芯片价格打下来(仅售999美元起)?SambaNova的芯片又是如何在毫秒间为不同模型“变形”重构的?
- 群雄逐鹿的宏观战局:除了初创公司,谷歌、亚马逊等云计算巨头自研芯片的威胁,以及中国AI芯片(如华为升腾910C)在封锁下的突围现状。
声明:本集节目的音频内容、摘要文案及封面艺术图均完全由人工智能(AI)生成。内容基于截止 2026 年 3 月的公开市场信息整理分析而成,仅供信息参考,不构成任何投资建议。市场有风险,投资需谨慎。

