第三只眼看超级计算机500强榜单


    近日,在德国法兰克福举行的第34届国际超级计算大会上,最新的全球高性能计算机500强榜单(以下简称500强榜单)公布。美国的两台全球高性能计算机“顶点”(Summit)和“山脊”(Sierra)排在前两位。来自中国的神威·太湖之光和天河二号名列第三和第四名。
    消息甫出,便成为焦点新闻。随即也有另一种观点出现,对于一般人而言,这个500强榜单,重要吗?
    比拼速度为的是什么
    会提出这个问题的,可能多半是非计算机专业人士。
    如果从宣传角度来看,新华社、光明日报等众多主流媒体都对500强榜单做了报道,这从一个侧面可以看出,榜单还是比较重要的。
    多数媒体在报道500强榜单时,都强调了浮点的运算速度,其实这一概念显示的是计算机的运算速度。比如,位列榜单第一名的“顶点”,其浮点运算速度就达到了每秒14.86亿亿次。因其运算速度极快,高性能计算机也被称为超级计算机或超算。
    计算机的运行速度快,这一点意义重大。国家超级计算广州中心主任卢宇彤告诉科技日报记者,如果想让天气预报可预测的时间多一天,那么对参与数据计算的计算机的性能要求就得提高一个数量级,大约10倍。
    就是为了快这24小时,数据的计算量增加了数倍,如果计算机不够快,可能等机器算出结果后,48小时都过去了,也就失去了预报的意义。
    许多科学家都希望,能早点用上超算。
    几年前,记者曾在中国科学院大气物理研究所,参加过几次地球系统数值模拟装置立项研讨会。与会专家们想用超算来研究地球系统的大气圈、水圈、冰冻圈、岩石圈、生物圈之间的相互联系。其中涉及每个圈层的观测、研究数据量都是极大的,单独完成一个圈层的数据研究,可能就得使用一个超算。而要把这5个圈层联合起来研究,就需要运算速度更快的超算才行。
    每年参会图的是什么
    其实,我们还可以把500强榜单看成是业界研究机构及厂家的商业竞争成绩单。参与榜单评选和参加超算展会的机构或厂商之间都是竞争关系。专家们共同制定了评选标准,各国相互比拼谁的超算最快、应用最广。榜单公布结果,公平公正,省得自吹自擂。
    当然榜单的第一名肯定是耀眼的明星。这次的冠军、美国超算“顶点”,已连续第三次夺冠,借助500强榜单展示其不俗的实力。
    然而,一些厂家虽没挤进前10名,但依然要参加每年的展会。那他们图什么呢?
    这些厂家一方面是为了展示自己的最新技术,了解国际最尖端的超算发展水平,通过技术和产业交流,共同促进全球超算发展;另一方面,他们也是为了品牌和市场效应,通过在大会上进行展示,让业界其他国家了解自己的技术和应用水平,进一步拓展国际品牌知名度并开拓国际应用市场。
    从这个意义上说,此次在法兰克福参展的中国厂家,如联想、中科曙光、浪潮、华为等,在全球超算专家及用户面前展示了他们最新的超算技术及成果。
    参展厂家“秀”的是什么
    超算厂家参加500强榜单的评选,凭的是自己的产品技术。而厂家到超算展会上现场展示产品,“秀”的也是自己产品的最新技术。中科曙光高性能计算产品事业部总工程师戴荣博士说,计算速度最快的超算,一定是应用了最先进的技术。
    如今超级计算机的发展,面临许多技术性问题。厂商要想获得技术进展,不但要解决集成电路的散热问题,还要解决计算机功耗高等一系列难题。
    中科曙光此次就把“新一代硅立方高性能计算机”带到了会场。这款机器采用了浸没式液冷技术,计算机系统的电能使用效率值可降至1.04以下,相当于40瓦的功率即可冷却1000瓦的设备,而传统的风冷系统则需要500瓦到1000瓦的功耗。在同等计算能力的前提下,应用该技术可节省40%的耗能。此外,采用这种液冷系统,其余热量还可被二次利用,比如用于楼宇的供暖等。
    除散热和节能优势外,此超算系统,还应用了最新的网络技术。现在超算的计算核心数目已从最初的几十万个扩展到如今的几百万个,各计算单元如何保持高效互连与协同是一个巨大的技术难题。假如把两台互相协作的机器比作两人在工作,它们二者要“对话”,即通信互动需要即时进行,不能一方发出信号,另一方经过很长时间才回答,这样会影响系统的效率。
    戴荣说,一台超算系统内任意两个节点之间的通信和响应时间越短越理想,高带宽、低延时是最理想状态。“在我们的新机器里,就应用了这种高带宽、低延时的高速网络技术。”