E149|科技巨头们开始抢电?聊聊AI用电荒和核聚变创业热

E149|科技巨头们开始抢电?聊聊AI用电荒和核聚变创业热

62分钟 ·
播放数29861
·
评论数105

你知道每使用一次ChatGPT,OpenAI需要交多少电费吗?前阵子模型微调平台OpenPipe创始人Kyle Corbitt爆料称,如果在美国一个州内使用超过10万个H100芯片,就会使电网瘫痪。英国、爱尔兰等国家也已经在限制AI数据中心对电力系统的占用。

在新技术诞生和应用的历史潮流中,我们经常发现,技术本身并非是最大的障碍,往往伴随而来的是对现有基础设施建设的挑战,比如家家户户会用到的电力系统。

所以AI巨头们的竞赛,不仅仅要囤芯片,还需要屯变压器,还要抢电。未来3-5年内,AI带来的电力短缺到底有多少?如果大基建跟不上,巨头们的解决方案还有哪些?我们今天就来掀开数据中心的电表看一看。

【主播】
泓君Jane,硅谷101创始人,播客主理人

【嘉宾】
徐熠兴(Ethan),微软能源战略部资深项目经理
项江,瀚海聚能CEO

【你将听到】
「AI用电荒」
01:52 AI耗电现状:美国的AI数据中心当前耗电量堪比纽约市
03:05 未来电力需求预测,电力单位的概念解释
06:00 OpenAI导致微软电网崩溃?AI用电的特殊性和波动性,对传统电网设计的冲击
11:25 美国电力行业面临的挑战:未来三五年,AI会和居民抢电吗?
16:10 AI意外加重了能源转型的负担:电力将成为AI发展的新瓶颈
17:43 硅谷公司们怎么布局数据中心?短期靠抢电,长期选址时考虑与电力公司的合作
22:19 中国当前的电力供应结构:几种发电方式、基础设施建设能力相对好

「能源现状与解决办法」
25:45 中国先进核能的“三步走”规划:热堆、快堆、核聚变堆
27:00 科技巨头们的新难题:既要考虑气候变化又要发展AI,真贵
29:43 AI消耗的能源有可能减少吗?AI训练数据耗尽 or GPU的效率提高
35:36 核能作为未来能源解决方案的潜力:几种清洁能源的成本对比
39:28 核裂变vs核聚变,选谁?
42:57 什么时候能用上核聚变发的电?科学问题差不多了,还是巨大的成本问题
48:16 Helion Energy与微软的对赌协议
50:04 核聚变公司的几大流派

「未来对策」
53:00 美国、中国和欧洲数据中心的选址问题:数据资产、东数西算
55:42 电网负担的解决方案:能源转型、分布式储能
59:00 AI和能源行业相辅相成:AI赋能核聚变

【名词解释】
电力单位换算
电量单位:千瓦时(kWh)、度
电力单位:千瓦(KW)、兆瓦(MW)、吉瓦(GW)
1 GW(吉瓦) = 1000 MW(兆瓦)
= 1000000 KW (千瓦)
= 1000000000 W(瓦特)

「星际之门」计划:微软与 OpenAI开发的全新人工智能超级计算机,计划投入 1000 亿美元,配备数百万专用AI芯片,以提供前所未有的计算能力,预计于2028年完成。

东数西算工程:“数”指的是数据,“算”指的是算力。“东数西算”是通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动,于2022年2月正式启动。

「托克马克」:托克马克(Tokamak)是一种环形容器,它通过约束电磁波驱动,创造氘、氚实现聚变的环境和超高温,并实现人类对核聚变反应的控制。托卡马克的名字来源于环形(toroidal)、真空室(kamera)、磁(magnet)和线圈(kotushka)这几个俄语单词的结合,目前是实现可控核聚变的主流方式。中国科学家设计并建成的EAST(Experimental Advanced Superconducting Tokamak,全超导托卡马克核聚变实验装置)是这一领域的一个突出成就。

「氘氘(D-D)反应」&「氘氚(D-T)反应」:是指氢的两种同位素氘(Deuterium,化学符号D)和氚(Tritium,化学符号T)之间发生的核聚变反应。氘氘反应是指两个氘原子核聚合在一起,生成一个氦原子核和一个中子,同时释放出能量。这种反应在自然界中很少见,但在实验室条件下可以被诱发。氘氚反应是将氘核与氚核碰撞而产生的核聚变反应,它是目前研究中最容易实现的核聚变方式之一。

「Helion Energy」:一家总部位于华盛顿州雷德蒙德市的核聚变公司,专注于开发磁惯约束性聚变(MIF)技术。微软是其长期合作伙伴,计划在未来五年内从Helion购买电力。

「CFS」:全称Commonwealth Fusion Systems,一家美国核聚变发电公司,从麻省理工学院分拆出来后,于 2018 年在马萨诸塞州剑桥市成立。其既定目标是建造一座基于ARC托克马克设计的小型聚变发电厂。

「BEV」:全称Breakthrough Energy Ventures,是由比尔·盖茨牵头成立的投资公司,专注于投资清洁能源创新科技,以应对气候变化所带来的挑战。该基金成立于2016年12月12日。

【后期】
Amei

【BGM】
Listen to the Forest Weep - Hanna Lindgren
Morning Breaks - David Celeste

【在这里找到我们】
公众号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music
联系我们:podcast@sv101.net

本期节目仅代表嘉宾个人观点

Special Guests: 徐熠兴 and 项江.

展开Show Notes
HD953518q
HD953518q
2024.4.30
AI到底有多耗电这个问题始终没有被讨论清楚,就在一个模糊的结论中继续往前了。最近很火的,ChatGPT每天耗电50万度,这个耗电量大吗?每天50万度电,每小时的功率也就2万千瓦,对比起来,厦门这样一个二线城市,2023年最高负荷700万千瓦+,平均负荷400万千瓦+,2万千瓦连零头都不到。换种计算方式,陆上风电机组单台功率在0.2万千瓦左右,ChatGPT这样一个全球top 1级别的产品,也就十台风电机组满发就能满足,现在随便一个风电场装机都是大几万到几十万千瓦起步了,何况数据中心这种波动小、需求稳定(意味着简单)的负荷已经很优质了。电力行业已经存在100多年了,早就进入了需求驱动的状态,所以电力真的会制约AI的发展吗?
兿甄Stella:楼主对负荷的讨论十分充分,但是个人认为更难解决的是电网如何灵活满足短时内波动巨大的需求(比如AI算力对电力在几秒内飙升又回落)。因为电网需要保持实时平衡,这就意味着发电设施需要在负荷在突然飙升的时候找到匹配可调度的发电机组(调峰机组)或者储能,使其开始发电或释放电力资源。这样的灵活性机组在电网系统内实际是有限的,(比如很多CCGT气电机组)而且因为一年内多数时间不会启用,它们的利用小时数偏低,光靠发电收益的话其实很难回本,开发商也不愿意去投资的。而电力系统本身因为碳中和转型也在加入和渗透更多可再生能源,光伏风电本身很难按照煤电气电在可控时间按可控量去发电,他们本身也是一种波动性的电力供应,也给供给侧增加了许多不确定醒
Alex1900:感觉耗电讲的清楚的。节目里面说2030左右数据中心耗电40吉瓦甚至更高。还说了这个耗电量相当于5个纽约,比厦门大多了。 AI不止是一个chatgpt,应用非常广,视频生成,药物研发,科研都要用,里面讲的AI是所有应用总和,不单是chatgpt。 chatgpt只是大家都熟悉的一个例子。节目里说chatgpt只需要大概需要 15MW的电力训练90 天。这个用电不大,但是之后的推理应用用电很大。虽然传统数据中心波动小,节目里说的是新的AI数据中心波动大,这个是以前没遇到过的新问题,现在的电网也没见过这么大的负载波动那么大的情况,不过之后应该都能解决。中国前几年也出现暂时的电荒,美国电网建设不如中国,挺有可能会出现一段时间的供电不足。
23条回复
HedgeSage
HedgeSage
2024.5.01
泓君,你能不能把自己训练成一个提问大模型?
我们都想拥有你的提问能力!
史上最强人肉Prompter!
硅谷101陈茜:哈哈哈哈 这个表扬好硬核!
阿盼爱吃小番茄:同意听同意٩(˃̶͈̀௰˂̶͈́)و
3条回复
aphazero
aphazero
2024.5.01
希望能出一期再讲讲核聚变技术……
THEBADDESTFE:我也希望
Ragn
Ragn
2024.4.30
09:32 所以我理解嘉宾也不清楚为啥会出现这样的大幅波动 只能推测
HD781228y:我觉得就是gpu的功耗在变化。。。cpu没有这么大的功耗变化,所以之前的数据中心波动不明显
Alex1900:几十万个gpu的用电功率同时变化会导致大波动。
辛钦
辛钦
2024.4.30
30:22 泓君问的问题真的太到位了…这期真的高质量👍👍
Davidfan188
Davidfan188
2024.5.01
作为国内idc行业10多年的老兵,真羡慕对岸的idc行业发展,新基建后建设的数据中心都是空壳结构
王强_Andy:都是空壳怎么理解呢?
想飞的大笨象:只有建筑,也许会有机柜,没有服务器。我也见过。
3条回复
Julia_Scott
Julia_Scott
2024.5.01
1:01:03 前面听着觉得人类蛮好笑的,缺芯缺数缺能源,如果硅基耗能成本高于碳基,一不小心还可能整出个气候突变重演恐龙灭绝,人类能在那之前逃离地球么🤔听到最后,居然是ai和能源携手共进的美好愿景!人类真有意思🤣
国际能源署(IEA)不久前刚刚发布了2024版的全球电力报告,发现2022年的全球数据中心、人工智能和加密货币这三大板块的总耗电量达到了460TWh,几乎占到全世界总用电量的2%。其中加密货币贡献了大约0.4%,也就是说数据中心和人工智能大约消耗了全球总用电量的1.6%。其中40%的能耗来自计算,40%来自冷却,20%来自其他设备。随着ChatGPT的异军突起,国际能源署预计到2026年时这三大板块的总用电量将翻番,达到1000TWh左右的水平,相当于增加了一个瑞典或者德国的总用电量。
三峡水电站全年的发电量大约为100TWh。
涂雅TOYA
涂雅TOYA
2024.5.02
1MW的负荷会为AI巨头带来1000万美金的年收入,这里有点不太明白,成本结构里能耗占多少占比?是每多1MW的电能供给,就可以增多1000万美金的收入?
小sang
小sang
2024.5.01
2028实现可控核聚变????!!怎么听上去很不靠谱啊?!
wang3yi:现在的确在小规模实验上已经证实了, 但是推广到商用还有很长时间, 下一个重大结点就是iter project, 看能不能在这个堆上复制结果。 但是我觉得离完全商用,至少还有10年时间。 我本身不太懂核聚变。
想飞的大笨象:美国那家实验室已经两次宣布实现正收益。它玩了个文字游戏,消耗的能源从那个节点算起。是只计算打中的激光的消耗,还是发射的所有的激光消耗,还是加上产生激光所有设备的能源消耗。
5条回复
J_Lock
J_Lock
2024.5.08
09:43 我也遇到过但不是在大模型上。我观察的不一定准确,模型运算会存在大量的数据交换,当我们处理数据的时候,会设定batch size(类似于打包)。当这个batch size的数据处理完再处理下一个batch size的数据。但读取数据一般是通过cpu、内存和硬盘,然后再与显存进行数据交换。所以我感觉是读取数据的时候会有瞬间的提升
内容方向感很好,自从新一轮GAIs概念爆发以来,能源行业发展更受到各方关注,新能源技术、储能、调峰技术和平衡负载等方向成为大家热议内容,希望再加一期,深度探讨包括核聚变发电等新形态的技术前沿内容
苹果派RT
苹果派RT
2024.5.06
前后逻辑有点问题,既然ai的功耗这么不稳定,那么使用核能供电就不可行啊,因为核电是基本不能用来调峰的
渺渺予怀:用电和发电之间有存储过程啊
苹果派RT:风光也需要调峰配储啊,这么看来核能并没有比风光好到哪里去,真正可调节可以给数据中心供电的只有气电了
3条回复
HD482838j
HD482838j
2024.5.05
感觉嘉宾都不是很懂,应该邀请一个电力工程师来讲讲。
目前的分布式储能也就能起到个平抑峰谷吧。
HU10
HU10
2024.5.05
重庆供电局听到这期播客 估计笑兮了
说了半天,也没说明白AI的训练到底𣊬时负荷多大,时间多久,AI到什么程度才能稳定运行,运行负荷水平。对电厂,电网,电力系统也是一知百解……工业用电和家庭用电能比么?运行要求,运行时长,安全等级都不一样~
小sang
小sang
2024.5.01
但是我担心这是不是美帝自己的问题??
欢喜HD
欢喜HD
2024.5.02
似乎是海外独角兽的一篇访谈翻译,2.5%-10%的用电量相比AI带来的智能提升简直不值一提,尤其是Sam的万物摩尔定律真的能实现的话。当然,比如模型计算1+1和解释1+1使用的能耗是一样的确实值得questionable
美国的经济增长靠华尔街,中国的经济增长是制造业,那耗电量能一样吗?