互联网、云计算、大数据、人工智能等新一代信息通信技术已成为人类生产生活的一部分。为了储存和运算处理由此所产生的海量数据,数据中心的机架数量和算力规模不断扩大,耗电量随之快速增长。尤其是2022年11月美国Open AI公司发布里程碑式产品Chat GPT以来,AI大模型掀起技术创新和应用浪潮,正在重塑千行百业,AI算力需求爆发式增长,驱动数据中心用电量飙升。
数据中心迅速增长的用电量和用电负荷,对电力系统,既是机遇,也是挑战。随着智能算力在负荷中的占比不断提高,数据中心用电负荷的波动性将增大,更加依赖支撑性电源。2025年1月,特朗普再次就职美国总统,预计美国将新建火电以满足算力飙涨的用电需求。
(来源:中国电力企业管理 作者:陈愚)
算力规模和用电量
算力的基本概念和增速情况
2020年11月,国家信息中心发布了《智能计算中心规划建设指南》,对智能计算中心进行定义:基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,通过算力的生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、产业创新聚集,有力促进AI产业化、产业AI化及政府治理智能化。
综合算力是集算力、存力、运力于一体的新质生产力。算力是数据的处理能力,存力是数据的存储能力,运力是数据的网络传输能力。
算力分为基础算力、智能算力和超算算力,分别提供基础通用计算、人工智能计算和科学工程计算。其中,通用算力是基于CPU芯片的服务器所提供的计算能力;智能算力是基于AI芯片(如GPU、MLU)的加速计算平台提供人工智能训练和推理的计算能力;超算算力是基于超级计算机等高性能计算集群所提供的计算能力。
截至2023年底,我国算力总规模近5年年均增速近30%,我国在用数据中心机架总规模超过810万标准机架,算力总规模230EFLOPS(每秒230百亿亿次浮点运算),居全球第二位;其中,智能算力占比25%。根据《算力基础设施高质量发展行动计划》(工信部联通信〔2023〕180号),2025年,我国算力规模将超过300EFLOPS,智能算力占比达到35%。2024~2025年,算力年均增速大于14.2%。
数据中心耗电量
目前,笔者搜索资料,主要用“月之暗面”的Kimi大模型,替代传统的搜索引擎。根据国际能源署的估算,谷歌单次搜索耗电0.3瓦时/次,大模型ChatGPT单次应用耗电约2.9瓦时/次。AI替代传统技术的存量应用,以及因AI生成等技术带来的增量应用,驱动用电量剧增。
据估算,2019年,我国数据中心用电量600~700 亿千瓦时,用电量占比0.8%~1%;中国算力平台测算,2023年,中国数据中心用电量约1500亿千瓦时,占全社会用电量1.6%;年均增速约21%。(经咨询中电联,数据中心用电量为估算,尚未分类统计)因为芯片性能的提高、电能利用效率(Power Usage Effectiveness,PUE=数据中心总能耗/IT设备总能耗)的优化,2019~2023年数据中心用电量年增速21%,低于算力规模年均增速30%,高于同期全社会用电量年均增速6.1%。据中国信通院预测,在高、中、低三种方案下,2030年,我国数据中心用电量将超7000亿、4000亿和3000亿千瓦时。
2008年以来,美国的用电量在4.4万亿千瓦时上下浮动,无明显增长。据国际能源署估算,2022年美国数据中心用电量约2000亿千瓦时,约占美国用电量的4.5%,2026年将增至2600亿千瓦时,占比提高至约6%,2023~2026年的年均增速为6.8%。
数据中心的负荷特性
我国数据中心的用电负荷特性
分析传统风冷数据中心的运营成本,其中电费占比高达60%~70%;在用电量中,IT设备自身耗电约占45%,制冷耗电约占43%;其PUE(数据中心总能耗/IT设备总能耗约)约为2。数据中心通过在气温较低区域布局、采用液冷技术等方式,降低制冷用电量。目前全国数据中心平均PUE为1.46。根据《新型数据中心发展三年行动计划(2021~2023年)》(工信部通信〔2021〕76号),到2023年底,新建大型及以上数据中心PUE降低到1.3以下,严寒和寒冷地区力争降低到1.25以下。
目前,我国数据中心的日负荷特性为日内负荷波动较小,基本不受节假日影响。年负荷特性主要受制冷负荷影响,呈现季节特性,最大用电负荷出现在夏季,分别较春秋季、冬季高10%、15%左右,对夏峰保供提出了挑战。
随着PUE的降低,未来新建大型数据中心的用电,以IT设备自身耗电为主,空调用电量约为IT设备自身耗电量的25%~30%。未来数据中心的负荷特性首先受IT设备自身耗电量影响,其次受季节气温变化影响。
智算中心的布局和负荷特性
目前,智算中心占算力的25%,2025年占比将提高至35%。随着人工智能的发展,智算中心算力占比将继续提高。例如,上海《临港新片区加快构建算力产业生态行动方案(2023~2025年)》(沪自贸临管委〔2023〕94号)提出,2025年智能算力占比达到 80%。
智能算力在实际应用中包含两个环节:训练(Training)和推理(Inference),亦即智算中心IT设备自身耗电量的用途。训练是AI大模型学习如何执行特定任务的过程。模型会接收大量的数据(称为训练数据集),训练目的是使模型能够对新的、未见过的数据作出准确的预测或决策。推理是AI大模型训练完成后,使用训练中学到的知识来处理新数据。模型接收新的输入数据,并使用训练好的逻辑判断和参数来生成预测或决策。以人生阶段类比,训练类似于学生时代,推理类似于参加工作。
训练和推理的布局和响应:训练阶段需配套大规模的、最高端的芯片,是一次性的,应集中布局,训练地点可优选成本最低的区域,无需靠近用户;训练必须持续进行,一旦开始无法中止。推理,可梯级利用从训练中退役的芯片,是用户利用AI的长期过程。考虑到数据的网络传输能力是有限的(类似特高压输电线路的输电通道和容量是有限的),智算中心布局在接近用户和降低运营成本之间进行平衡,响应时长要求较低的、输入输出数据量较小的推理需求,可疏散到运营成本较低的区域(东数西算);运行时点需跟随用户需求。
推理的耗电量高于训练。以Chat GPT-3为例,其训练过程耗电约128.7万千瓦时;推理阶段,Chat GPT每天响应约1.95亿个需求,每个请求耗电约2.9瓦时,一天耗电约56万千瓦时。GPT-3在训练阶段消耗的电量,仅能支撑Chat GPT推理2.5天。
数据中心用电负荷的波动性将增大。智能算力的占比将逐渐提高,甚至成为主体。智算中心的用电量以推理耗电为主,用电负荷特性以推理的负荷特性为主。训练过程必须持续进行,无法中断。推理过程需实时响应,负荷特性和使用者作息规律的相关性增大,将趋同于第三产业、生活用电的负荷规律,波动性增大。未来,我国数据中心用电负荷将呈现出更强的波动性。
据调研,部分智算中心已呈现出用电峰谷差较大的特点,负荷调节难度较大。
数据中心用电依赖支撑性电源
数据中心对供电可靠性的要求较高,例如,A级数据中心,要求双重电源供电,配套蓄电池(备用时间不低于15分钟)、UPS和柴油发电机,以保证数据中心平稳、不间断的供电。
数据中心用电负荷目前呈现出类似二产的平稳特性,未来随着智算产业占比的提高,其用电负荷将趋向于三产和生活用电的波动特性。风光发电具备波动性、间歇性、随机性,甚至极热无风、极寒凝冻、晚峰无光,越是负荷峰值时期,越难以保证出力;水电有丰枯年、丰枯季,径流式水电发电没有调节能力;储能、抽蓄仅具备日内调节能力。
因此,仅凭风光储,无法保障数据中心的供电,需要煤电、气电、核电、有调节能力的水电等支撑性电源,以保障数据中心的平稳用电。
美国或将新建火电以满足数据中心用电需求
近年来,美国曾多地发生缺电、停电事件,例如:加利福尼亚州、得克萨斯州、弗吉尼亚州、缅因州、新罕布什尔州、俄克拉荷马州、路易斯安那州、弗吉尼亚州;其中,弗吉尼亚州、加利福尼亚州、得克萨斯州等地是数据中心重镇。
美国公用事业公司迫切需要新建电源、强化电网。部分地区推迟了煤电退役、拟新建气电项目。亚马逊、谷歌、微软、甲骨文等大型科技公司将视线转向低碳、稳定发电的核电。2024年10月,亚马逊签署了多项核能供电的相关协议:与公用事业企业Dominion Energy签署协议,将投资超过5亿美元开发小型模块化核反应堆(SMR),为云计算平台AWS供能;与公用事业公司Energy Northwest达成协议,参与开发投资SMR。谷歌与核能初创公司Kairos Power签署协议,拟合作建造7座SMR。微软与能源公司Constellation达成了类似的购买协议并重启了位于宾夕法尼亚州三哩岛核电站的部分设备。比尔·盖茨投资初创公司TerraPower,该公司正与公用事业公司PacifiCorp合作开发小型反应堆。Open AI创始人奥特曼投资了一家核能初创公司Oklo。
但是,核电开发周期长,即便以我国“基建狂魔”的速度来看,核电从选址到投产也需要10年时间(厂址论证5年,建设5年),何况美国科技巨头参与的多是研发项目,考虑堆型选择和机选优化所需时间,核电项目需要5~15年时间才能投产发电,远水难解近渴。
在特朗普的上一个总统任期(2017~2020年)内,美国取消了对煤炭、电力、石油和天然气行业的多项环保限制,并退出《巴黎气候协定》。2021年1月20日,拜登就任美国总统当日,宣布美国将重新加入《巴黎协定》;次月正式重新加入。2025年1月20日,特朗普再次就职美国总统,并宣布:再次退出《巴黎气候协定》;鼓励开采本土石油、天然气并出口,降低能源价格,控制通胀;结束绿色新政(Green New Deal),撤销电动汽车的强制购买令。根据特朗普参选美国总统的施政纲领,美国可能退出《巴黎协定》的母公约——《联合国气候变化框架公约》(UNFCCC)。一旦美国退出UNFCCC,想再次加入,需要参议院2/3多数的支持,以美国现在的党派分歧程度,退出后重回UNFCCC是非常困难的。
特朗普再次上任后,可以预见化石能源和火电(尤其是气电)将在美国迎来新发展。气电项目建设周期比水电、核电短,是支撑美国数据中心用电的最优选。
算力是未来的公用事业,是电力的下游
算力基础设施是新型信息基础设施的重要组成部分,对于助推产业转型升级、赋能科技创新进步、满足人民美好生活需要和实现社会高效能治理具有重要意义。未来,随着AI手机、AI电脑等硬件的推广,各种大模型等软件的渗透率提高,算力将像电力、自来水和互联网一样,成为日常生活中不可或缺的一项公用事业服务。
将算力和电力产业链进行对比,芯片、平台等软硬件供应商,类似于电力装备制造商;数据中心类似电厂,为公众提供算力、存力等服务;科研院所、政府机构、大公司(腾讯、阿里、美团、抖音等)等大型用户有能力自建数据中心(类似自备电厂),中小型用户和个人用户,需要使用公共数据中心提供的算力服务。
电费是数据中心重要的运营成本,算力是电力的下游产业。发电企业多有构建上下游一体化产业链等战略布局,例如:煤炭、电力一体化,铀矿、电力一体化,今后或可考虑资源入股算力行业,进一步延伸产业链。