23|GPU 出租的真实账单 -- 一张 H100 每小时 $3.9 的生意经

23|GPU 出租的真实账单 -- 一张 H100 每小时 $3.9 的生意经

20分钟 ·
播放数4
·
评论数0

【本期简介】欢迎收听《AI 损益表》云厂商系列的第一期。

当全世界都在谈论 AI 泡沫时,位于风暴中心的云服务商们正经历着史上最大规模的军备竞赛。本期节目,我们将深挖云厂商的“地基”——GPU 租赁经济学。一张价值数万美元的 NVIDIA H100 运抵数据中心后,它是如何被定价的?它的电费、折旧和运维成本是多少?为什么利用率才是决定云厂商生死的那个“隐形变量”?

在逐一拆解 AWS、Azure 和 Google Cloud 的具体账单前,请先听懂这本底层逻辑账 。


【本期内容提要】

1. 买入:一张 H100 的总拥有成本 (TCO)

硬件采购:2024 年高峰期 H100 市场价约 $30,000 至 $40,000 。

固定折旧:按 5 年折旧计算,每张 GPU 还没开机,每小时就要计入约 $0.68 的固定成本 。隐性开支:电力(满负荷 700 瓦)、冷却、网络与运维,通常使总成本达到采购价的 1.5 到 2 倍 。

2. 租出:巨头间的价格暗战

大厂定价(按需):Azure 最贵(约 $6.98/小时),Google Cloud 约 $3.0,而 AWS 在 2025 年 6 月大幅调价后约为 $3.9 。

二线突围:Lambda、CoreWeave 等专业厂商通过更灵活的价格(低至 $1.25)威胁巨头份额。

价格战预测:预计到 2026 年中,H100 价格将跌破 $2/小时。

3. 关键变量:利用率与回本周期

非线性影响:利用率 60% 时,回本周期约 3.5 年;若跌至 40%,则需 5 年以上。

错峰难题:AI 工作负载的“峰谷”特性(白天训练、晚上闲置)是云厂商面临的最大管理挑战。

4. 破局之道:自研芯片的“去 NVIDIA 化”

Project Rainier:AWS 部署近 50 万颗自研 Trainium2 芯片,专供 Anthropic 的 Claude 模型 。

成本优势:对于特定推理任务,自研芯片实例的价格仅为 H100 的一半 。


【本期红黑榜】

🚩 红榜:超级云厂商的规模护城河 五大巨头在 2025-2027 年间预计投入超过 1 万亿美元。这种凭借庞大采购量、低融资成本和长期合同锁定的能力,构成了极高的竞争壁垒 。

💀 黑榜:利用率风险与资本错配 如果 AI 需求增长不及预期,这 1 万亿美元的基础设施投资可能演变成史上最大规模的资本错配,固定折旧将吞噬掉所有利润 。