新基建时代,数据中心将迎来AI赋能下的进化浪潮
在新基建政策的加持下,5G网络,人工智能以及工业互联网都会获得巨大的发展。这些技术将使得数据量以几何倍数激增。在这样的背景下,为5G、人工智能等应用输出超强AI算力的大型数据中心,以及服务近场数据处理的边缘数据中心势必会加快建造和部署。据科智咨询(中国IDC圈)最新发布的《2019-2020中国IDC产业发展研究报告》预计,2019-2022年中国IDC业务市场规模复合增长率为26.9%。与此同时,服务器,制冷技术,以及传统基建当中的供配电系统,网络带宽等领域的发展也将被带动。这将是一个完整而庞大的生态版图。
4月9日,IPF2020浪潮云数据中心合作伙伴大会首次在线上举行,超过5000家分销商、ISV、SI等合作伙伴在线出席本次大会。结合新基建的时代发展趋势,浪潮集团执行总裁、首席科学家王恩东首次提出“智算中心”将成为智慧时代经济社会运行所必须的重要基础设施,它将成为智慧时代最主要的计算力生产中心和供应中心。
所谓智算中心,以融合架构计算系统为平台,以数据为资源,能够以强大的计算力驱动AI模型来对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务的形式,向组织及个人进行供应,正在成为社会经济运行的重要基础设施。
在会后,中国IDC圈的记者有幸采访到了浪潮公司的多位相关负责人,并就新基建时代数据中心未来的发展趋势,技术演进等进行了深入探讨。
人工智能计算力需求将使智算中心成为主流
计算力需求的增长将直接推动社会进步。举例来说,2016年,全球最大的数据中心大约是58万平方米,但是到了2019年,已经达到了99万平方米,相当于140个足球场。在三年的时间里,最大规模数据中心的面积增长了75%。这就充分说明了,近些年来社会经济进步对于计算力的巨大需求。从浪潮的角度来看,计算力就是生产力。而且这个不光是简单的计算力,是一个智慧计算的概念。
当前,人工智能的计算需求正在以极快的速度增长,全球顶尖科技公司谷歌、微软、Facebook、阿里巴巴、百度等公司都在大步迈向人工智能。浪潮认为,未来80%的计算力需求来自于人工智能,承载这种AI算力的中心,即智算中心将成为主流。
从形态上来说,智算中心需要满足“开放标准”、“集约高效”、“普适普惠”这三个标准。从硬件到软件、从芯片到架构、从建设模式到应用服务,智算中心都应该是标准化和开放化的。开放计算的发展为智算中心提供了坚实的产业基础;集约高效,要求智算中心的建设要有超大规模,要采用领先的技术,以保障自身的先进性;与此同时智算中心必须做到普适普惠,让计算力易用、可用和低成本,智慧计算可以像水电一样,成为社会基本公共服务,融入生产生活的全部场景。
浪潮集团高级副总裁彭震先生描述道,智算中心更多是新经济基础建设问题,不是一个屋子放了一堆服务器的数据中心的概念,更像是给数字时代提供了一个算力工厂的基建,可以把智算中心类比成一个大型电厂,基于开放计算的融合架构、AI等创新技术是构建电厂的关键技术;数据是电厂最重要的原材料,经过智算中心计算力加工后,就可以生成对外的智慧计算服务。
数据中心发展要求新技术同步跟进
据工信部数据显示,我国中大型、超大型数据中心的规模增速达到约68%。其中各类在用数据中心达近28.5万个,全年耗电量约占我国全社会用电量的2%。数据中心能耗高的原因除了IT设备的正常消耗以外,还有来自散热系统,运维故障等多方面因素使然。虽然对计算力的需求使得数据中心必须大规模建设,但由此带来的能耗问题却又使得核心城市不得不推出各类政策对其加以限制。这就形成了社会需求与城市承载能力之间的尖锐矛盾。
浪潮服务器产品线总经理沈荣先生表示,要想解决上述矛盾,就必须要有更多的新技术与之并行发展。除此之外,当今的数据中心由于大部分是依靠人工运维管理,不仅进一步推高了能耗水平,同时也导致故障率一直居高不下。在未来数据中心遍地的时代,这显然是不可接受的。对于数据中心而言,如何在提升性能的同时降低成本,提供业务弹性和资源利用率,并提升运营管理的效率,就成为了行业必须考虑的问题。浪潮认为,开放计算是构建未来数据中心——智算中心的基础。
开放计算通过开放式架构将所有设备统一在一个标准之下,同时通过高度集成,模块化和定制化等方式降低用户使用成本并提升运营效率。事实上,高度集成化作为一种新的节能方案,在国外已经有了较为成熟的应用。比如2012年Amazon 就约有 1 万个整机柜采购量。
整机柜服务器之所以受到青睐,主要是由于采用了一体化设计和部署,可以将计算、网络、存储以及散热、供电、管理等模块集于一身。其部署密度较传统的机架式设备提升1-3倍,能源效率可以达到90%以上。同时,在部署速度方面也更为高效,整机柜也比机架式设备高出数倍以上。目前浪潮SR整机柜服务器已经批量应用在百度、阿里、中国移动、12306、奥鹏教育等互联网、通信、交通等行业,并取得了不错的用户反馈。
另一方面,智算中心要支撑智慧时代的AI算力需求,还面临着新技术快速落地问题。目前,新型的AI芯片研发设计竞争日趋激烈,但由于标准繁杂,技术路线多样,导致芯片的接口、互联、协议上互不兼容。这就让数据中心用户在AI计算基础设施建设中不得不面临硬件分裂化和生态割裂化的重大挑战。
基于上述认知,在本次IPF2020上,浪潮发布了全球首款基于OAI(Open Accelerator Infrastructure)项目的AI计算系统MX1,支持多厂商的OAM(OCP Accelerator Module)规范标准的AI芯片,适用超大规模深度神经网络模型AI计算需求。
当前,MX1可以支持互联带宽可达224Gbps,理论支持互联带宽最高可达896Gbps,支持全互联 (Fully-connected) 和混合立体互联HCM (Hybrid Cube Mesh),可扩展构建高达32颗AI芯片,实现超大规模神经网络模型并行计算,充分释放算力。
疫情加速数字化转型,开放融合引领ICT发展趋势
疫情让很多线下活动纷纷搬到线上,从线上课堂、线上问诊、到线上办公,新的生活、工作、生产方式在加速落地。这对于企业业务的数字化转型而言,事实上起到了助推作用。
在这些看得见的智慧服务背后,是人工智能、大数据、云计算、5G等领域的新型基础设施在支撑。
过去我们讲基建,基本都是在投资实体经济。但今天我们提的新基建,围绕数据中心,AI,5G这样的领域,这些领域没有实体,他更多的像是一种数字化时代,我们原来讲数字孪生,未来社会有物理社会,数字化社会,两者互存,相互促进,疫情从某种角度极大的提升了数字化社会的加速成长。
疫情对世界各国在数字化方面会有较大的提升促进作用,这些变化从长久来说会促进我们的经济不断创新与发展。在未来,计算力就是生产力,未来的社会就是智慧计算驱动的社会。
整个ICT产业的发展趋势是开源开放。彭震认为,产业会面临越来越多的挑战,这些挑战依靠一个厂商解决不了,所以,全球的开发者会聚集在一起开发解决方案,然后把成果以开源方式分享给所有人,迅速上规模,形成生态。开放计算是智算中心的发展基石,浪潮持续引领和驱动开放计算,旨在推进开放计算技术的融合,构建真正的开放生态。目前浪潮已经在ODCC、OCP以及OPEN19等多个开放组织当中扮演重要角色。并将自身的技术与会员伙伴分享,一方面浪潮可以在技术标准开发和测试中,让这些标准更为可行和完善,减少不必要的技术成本,另一方面,浪潮可以高效协同产业上下游为这些标准做好产业配套,缩短从技术标准到应用的产业落地。
在这样的背景下,未来云数据中心的建设与部署速度将会空前加快。正如前文所述,在未来随着人工智能的普及,80%的计算力需求来自于人工智能,但是如果缺乏协调统一的标准,那么不仅数据中心建设无法保障,进化为智算中心也将无从谈起。要想解决这个问题,将需要行业上下通力合作,而开放和融合将走上前台。