“电老虎”数据中心,AI如何发挥作用?

科技云报道

    随着我国“双碳”目标的提出,数据中心的节能降耗成为社会关注焦点。
    
    在过去几年,一座座数据中心拔地而起,大规模的服务器串联而成的计算系统支撑了海量的数据处理和运算。数据中心机架数量由2016年的124万架上升至2019年的227万架,四年间上涨了83.1%。
    这些数据中心耗电量大,功率密度高达30-50kW,有些甚至已经升级为100kW的机架,是名副其实的“电老虎”。
    然而,在“碳中和”的时代命题下,数据中心必须走向节能减排、降本增效。
    无论是国家发展改革委等四部门印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》,还是工信部发布的《新型数据中心发展三年行动计划(2021-2023年)》,均对加强绿色数据中心建设、提升节能降耗水平提出要求,强调提高绿色技术产品应用、提升能源高效清洁利用水平和优化数据中心绿色管理能力的路径。
    那么,绿色数据中心到底要如何实现?
    AI提高能源利用率的范本
    PUE(Power Usage Effectiveness),即电源使用效率,是一项衡量数据中心运营、管理水平的关键指标,也是数据中心绿色、节能、环保程度的代名词。
    根据国际正常运行时间协会2014年的数据中心调查,全球大型数据中心PUE的合理值界于1.6-2.0之间,PUE平均值为1.7。而国内数据中心同期PUE为 2.5-3.0,IDC行业整体处于粗放式的发展阶段。
    在传统大型数椐中心机房中,IT设备仅占用电耗能的46%,另有40%以上用在了泵、冷却器和冷却塔等大型工业制冷设备上。为了维持机房恒定温度,数据中心通常把进风温度控制在20-25度。
    从【PUE=数据中心总耗电/IT设备耗电】的计算公式不难看出,制冷环节是导致数据中心能耗飙升的主要元凶,也是PUE居高不下的原因。
    如今,行业级的AI智能解决方案,正以提高能源利用效率的方式,推进数据中心的建设和升级。
    作为数据中心节能领域的佼佼者——Google,基于AI为数据中心节省能耗,成为IDC行业用智能技术“武装”自己的学习范本。
    2016年,Google为已经很节能高效的15座数据中心,节省了40%以上的冷却耗能,约占数据中心用电总成本的15%,PUE降低至1.12。
    在这个过程中,基于通用智能框架的AI派上了用场,由Google数据中心部门和Deepmind来操刀,他们认为用类神经网络可以提高Google数据中心的效率。
    为期12个月的开发阶段中,AI预测PUE的精准度被优化到了99.6%。为了让模型准确预测数据中心的效率,算法从数千个传感器中提取出数据中心冷却系统的快照,输入到深层神经网络;然后根据不同组合预测潜在行为对能源消耗的影响,帮助Google决定何时清理热交换器,从而提高设备冷却性能。
    Google每个数据中心都有各自的供电和冷却设施,而且分布在不同的气候区。虽然季节性天气变化也会影响PUE值,但对于谷歌遍布世界各地的所有数据中心,都已成功地把PUE值保持到一个较低的水平,即使在湿热的亚特兰大夏季也不例外。
    2018年前后,Google完成了这套AI系统的升级,不需要人工干预即可直接控制数据中心的制冷系统,而且可以被数据中心的操作专家有效监控。同时,这套基于云端的AI控制系统已经为Google多家数据中心应用,节约了大量的能源。
    
    中国绿色数据中心的AI探索
    按照中国工信部的要求,2022年新建大型、超大型数据中心PUE必须达到1.4以下。如何运用新技术、新架构降低能源损耗、实现数据中心的绿色发展,成为IDC行业的关注热点。
    如今,中国各大互联网和IDC巨头,已开启了AI推进中国数据中心建设和升级的探索之路。
    以华为乌兰察布云数据中心为例,采用间接蒸发冷却解决方案和iCooling能效优化技术,年均PUE降低至1.15。与传统冷冻水解决方案相比,该数据中心每年可节省耗电量超过1600万度,每年减少二氧化碳排放量约8140吨。
    贵安华为云数据中心在2021年9月投入使用时,对外宣布的PUE是1.12,相当于大部分的电力资源都在数据中心中被利用起来,基本与Google数据中心的能耗持平。
    这其中,AI和大数据分析技术起到了削峰平谷的作用,服务器可根据业务功率变化实时调整制冷功率,提升能效和运维效率。满负荷运行情况下,理论上每年可节省10.1亿度电和81万吨的碳排放。
    同样引入AI技术的,还有百度阳泉数据中心。其深度学习模型根据室外天气湿度、温度和负荷,自主判断并切换制冷模式、预冷模式和节约模式这三种冷水机组运行模式。
    此外,阳泉数据中心的AI智能预警功能,可以根据负载预判设备的运行情况,然后给出维护策略。单体数据中心的年均PUE最高可降至1.08,PUE明显优于1.59的全球平均水平。
    在绿色数据中心方面,阿里云以低碳选址、清洁能源、液冷技术等融合AI应用,加速绿色节能技术创新及迭代升级,做到“少用电、用好电、用绿电”。
    在这届冬奥会上,阿里提供的奥运云数据中心大量采用了风能、太阳能等清洁能源,并采用AI技术,使得奥运地数据中心的能耗比传统的数据中心下降了70%,PUE能耗比达到1.09,核算下来每年可以节约8万吨煤。
    2020年9月-2021年8月间,万国数据北京六号数据中心在投运仅一年多且年均负荷未达较理想状态下的平均PUE值为1.25,年应用风电量超过1000万千瓦时,2021年全年预计碳减排量超过2200吨,在PUE值、减排量、可再生能源利用等方面均属行业领先水平。
    针对IT、制冷及供配电等主要耗能设备,万国数据使用了大量主流的绿色节能技术,包括通过将AI植入BA系统,实现年节约用电量约17万千瓦时,利用万国数据运维升级版水处理智能化改造方案实现每年降低2%左右耗电量。
    
    结语
    可以看到的是,AI技术在数据中心节能减排过程中已效果初显,且正在引爆更多可能。AI技术在数据中心中还可以实现更多应用,如:运维、故障诊断、预警等,使得数据中心全方位实现智能化运行。 不可否认,智能化的底座正在给IDC行业带来从追赶到超越的更多信心。
    【科技云报道原创】
    转载请注明“科技云报道”并附本文链接