智算中心操作系统 从量变到质变
电影《狄仁杰之通天帝国》的故事,围绕着象征至高无上皇权的通天浮屠的建造展开。高六十六丈的通天浮屠全靠一根坚实的“通天柱”撑起。如果将巍峨高耸的通天浮屠比作新型智算中心,那么起到核心支撑作用的智算中心操作系统就是那根犹如定海神针般存在的通天柱。
智算中心 智慧时代的新能力底座
最先看到“智算中心”,可能很多人心里会嘀咕,这又是谁在“创造”新名词吧?其实,“智算中心”背景深厚,来头不小。
2020年4月9日,浪潮在IPF上于业内率先提出“智算中心”的概念,指出智算中心将成为智慧时代经济社会运行所必须的重要基础设施。
在2020年4月20日国家发改委举行的新闻发布会上,官方首次明确了“新基建”的范围,包括“信息基础设施、融合基础设施、创新基础设施”三个方面。其中,关于信息基础设施的描述——包括以5G、物联网、工业互联网、卫星互联网为代表的通信网络基础设施,以人工智能、云计算、区块链等为代表的新技术基础设施和以数据中心、智能计算中心为代表的算力基础设施等,就明确提出“智能计算中心”的说法。
2020年11月17日,在第十届全球智慧城市大会上,国家信息中心信息化和产业发展部联合浪潮发布了《智能计算中心规划建设指南》(以下简称《指南》)。这是首份对智能计算中心进行全面深入解读的权威报告。《指南》给出了智能计算中心更清晰的定义:智能计算中心是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,通过算力的生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、产业创新聚集,有力促进AI产业化、产业AI化及政府治理智能化。
国家信息中心信息化和产业发展部主任单志广进一步解读:智算中心是在传统计算中心基础之上提出的一种面向未来人工智能所构建的新型算力设施,是智慧时代非常重要的基础设施和赋能平台。与云数据中心和超算中心相比,智算中心更强调以智生智,通过构建领先的人工智能算力基础设施来承载AI技术创新,促进数据开放共享,加速智能生态建设,带动智能产业的聚合。
计算的发展就像时代跳动的脉搏。从最初的数值计算到科学计算、关键计算,再到今天的智能计算,随着数字化进程的加速,算力成了数字经济发展的重要驱动。如同水利、交通之于农业社会,“铁公基”、电力之于工业社会,智算中心就是智能社会不可或缺的新型基础设施。它以开放架构计算系统为平台,融合多元算力,并以数据为生产资料,赋能各行各业的智能化应用场景。
一句话,智算中心是智慧时代的必然产物,也是智能社会要着力打造的能力底座。
智算中心操作系统 从量变到质变
不管是以前我们常说的云计算中心,还是现在提及频率越来越高的智算中心,其实它们都是数据中心的一种,是不断向前演进的发展路径。过去十年中,浪潮云海OS作为云计算中心的操作系统,有力地推动了政企上云和数字化转型的进程。如今,面向丰富多彩的人工智能应用的智算中心,是不是仍然需要一个核心的操作系统呢?答案是肯定的,而且浪潮云海OS自身的演进也自然而然地实现了这一跨越。
【浪潮信息副总裁 张东】
在浪潮云海创新论坛(IIF2020)上,浪潮发布云海云图生态3.0战略的同时,也揭开了智算中心操作系统的面纱。浪潮信息副总裁张东表示,浪潮从一开始做软件,就定位在对大规模数据中心进行基础性管理层面。数据中心在持续向前演进,基础管理软件这一层始终是必须的,浪潮做数据中心操作系统的初衷也不会改变。那么浪潮云海OS从云计算中心操作系统升级至智算中心操作系统也就水到渠成,顺理成章了。
您可能会问,从云计算中心操作系统到智算中心操作系统,难道只是换了个“马甲”,实质上都是云海OS,这不是新瓶装旧酒吗?
回顾云海OS的发展历程,在过去十年中,云海OS经历了数次升级,从云计算中心操作系统变身智算中心操作系统只是其中的又一次升级。“这是一个量变的积累过程,但在某种程度上,也是质变的一次飞跃。”张东表示。
众所周知,数据中心操作系统的结构在过去几十年中都没有太大的变化,虚拟化的引入算是一次大的变革,之后就是容器的出现,从单线程到多线程,从单用户到多用户,这些早就是数据中心操作系统的“常态化”模式。
演进从何而来?就是要从不变中找到变化的因素,从众多不确定性中找到确定性。虽然对数据中心来说,最基础的管理资源模式和架构没有发生根本性的变化,但是数据中心支撑的资源种类却与之前相比有了很大不同,比如非易失内存、FPGA等的出现,从某种意义上已经改变了现在的计算。因此,从操作系统底层基础架构来看,变化也随之而来,比如对非易失内存、FPGA以及更多种类加速器的支持等。张东表示,这种改变的重要意义在于,不仅仅是支持了更多新的资源,而是改变了处理数据或支撑虚拟机、大数据运算的方式。正是这些变化催生了智算中心操作系统。
操作系统是底层基础设施资源与上层应用之间的中间层。从中间资源管理层的角度审视操作系统,除了传统的物理机、虚拟机和后来加入的容器以外,用户还希望在统一的架构下,将大数据、人工智能等原来被认为不太适合放在云中的应用也能一并纳入进来。诸如此类的新需求也是智算中心操作系统需要持续完善和满足的。
智算中心与云计算中心相比最大的区别在于,它不仅仅是对资源的汇集和调度,而是通过“上云、用数、赋智”,更好地使用智算中心里的数据,同时更好地利用算力驱动AI的模型、算法,从而产生更多智慧化的应用。为此,智算中心操作系统必须对智算中心里更大规模、更加复杂的资源,以及多元化的算力进行有效的统一调度与管理。开放、融合、敏捷和智能化就是对智算中心操作系统最准确的定位和描述。
融合与智能化 通向未来之路
历史的车轮总会滚滚向前,而数据中心的演进也会永无止境。从云计算中心到智算中心,这是我们今天正在经历的变化。那么未来呢,数据中心将何去何从?
“2020年上半年,我们首次提出‘智算中心’时也在一直探讨,这是不是一个阶段性的产物。”张东分析说,“从云计算、大数据到人工智能,以后短时间内再出现一种全新的应用形态的可能性不太大。人工智能很可能就是IT人的终极目标,即在某些适合的领域用机器替代人甚至超越人。我们努力的方向就是让机器更好地产生智能。智算中心也是相同的目标,打造人工智能计算的数据中心。”
当然,数据中心本身的形态可能会继续变化。比如,从硬件形态上说,数据中心现在已基本实现了基础架构资源的“大融合”,包括计算、存储、网络等。未来十年或者二十年,数据中心应该还会沿着融合的框架继续发展,但是也不排除发生新变化的可能性。因为目前的融合还不够到位,并没有完全实现我们理想中的整个数据中心可以像一台计算机一样运行。数据中心所有资源的完全池化,这是一个明确的发展方向。
从更多细节来看,数据中心的供电方式会不会由传统的交流变成直流供电,数据中心的制冷模式有可能变成全液冷、浸没式的,机柜的形态也会发生变化,机柜甚至会慢慢消失,再有一个关键变量就是人工智能技术的发展……这些都可能是改变未来数据中心形态的因素。
从数字化转型到数智化升级,这是企业迈向智慧时代的必由之路。浪潮不仅为智算中心的建设和运维指明了方向和思路,并且给出了生产就绪的演进路径——智算中心操作系统。从云数据中心操作系统到智算中心操作系统,浪潮云海OS这根“通天柱”越来越长,也越来越稳固。