23｜GPU 出租的真实账单 -- 一张 H100 每小时 $3.9 的生意经 - The AI P&L (AI损益表）

【本期简介】欢迎收听《AI 损益表》云厂商系列的第一期。

当全世界都在谈论 AI 泡沫时，位于风暴中心的云服务商们正经历着史上最大规模的军备竞赛。本期节目，我们将深挖云厂商的“地基”——GPU 租赁经济学。一张价值数万美元的 NVIDIA H100 运抵数据中心后，它是如何被定价的？它的电费、折旧和运维成本是多少？为什么利用率才是决定云厂商生死的那个“隐形变量”？

在逐一拆解 AWS、Azure 和 Google Cloud 的具体账单前，请先听懂这本底层逻辑账。

【本期内容提要】

1. 买入：一张 H100 的总拥有成本 (TCO)

硬件采购：2024 年高峰期 H100 市场价约 $30,000 至 $40,000 。

固定折旧：按 5 年折旧计算，每张 GPU 还没开机，每小时就要计入约 $0.68 的固定成本。隐性开支：电力（满负荷 700 瓦）、冷却、网络与运维，通常使总成本达到采购价的 1.5 到 2 倍。

2. 租出：巨头间的价格暗战

大厂定价（按需）：Azure 最贵（约 $6.98/小时），Google Cloud 约 $3.0，而 AWS 在 2025 年 6 月大幅调价后约为 $3.9 。

二线突围：Lambda、CoreWeave 等专业厂商通过更灵活的价格（低至 $1.25）威胁巨头份额。

价格战预测：预计到 2026 年中，H100 价格将跌破 $2/小时。

3. 关键变量：利用率与回本周期

非线性影响：利用率 60% 时，回本周期约 3.5 年；若跌至 40%，则需 5 年以上。

错峰难题：AI 工作负载的“峰谷”特性（白天训练、晚上闲置）是云厂商面临的最大管理挑战。

4. 破局之道：自研芯片的“去 NVIDIA 化”

Project Rainier：AWS 部署近 50 万颗自研 Trainium2 芯片，专供 Anthropic 的 Claude 模型。

成本优势：对于特定推理任务，自研芯片实例的价格仅为 H100 的一半。

【本期红黑榜】

🚩 红榜：超级云厂商的规模护城河 五大巨头在 2025-2027 年间预计投入超过 1 万亿美元。这种凭借庞大采购量、低融资成本和长期合同锁定的能力，构成了极高的竞争壁垒。

💀 黑榜：利用率风险与资本错配 如果 AI 需求增长不及预期，这 1 万亿美元的基础设施投资可能演变成史上最大规模的资本错配，固定折旧将吞噬掉所有利润。