爆发前夜,华为的AI超算将会引领什么?
超算和AI一直是两个并驾齐驱的赛道。一直以来超算重视硬件算力,一般用于国防、模拟、生物、天文科学研究等领域,比如我国的天河、神威,美国阿贡国家实验室和劳伦斯·利弗莫尔国家实验的米拉和泰坦。
而AI领域,在早期阶段各团队强调在算法和调参上不断优化,而且当时的计算机架构并不适合做卷积神经网络的训练,在CPU上训练出一个模型可能达数年之久。
直到从深度学习的开山鼻祖Geoff Hinton的学生Alex Krizhevsky在GPU上成功训练出突破性的深度神经网络之后,专用于AI硬件的概念才被各界所看重。
对于AI来说,算力与硬件架构同等重要,也就是在这种理念指导下,超算能力在AI的应用开始显得分外重要。
不论从目前国际产业竞争形势亦或是产业自身革新,AI超算背后的硬件和框架如何发展,将会是国内AI下一轮爆发关键基础。在国内AI赛道,华为作为全球顶尖的ICT基础设施和智能终端供应商,已经携“昇腾”处理器给出了完整的AI超算解决方案。
这对于国内AI的研发和应用效率的提升,毫无疑问是一场及时雨。
近日华为出席ISC(高性能计算大会)后,全球AI赛道产业链上下游给予了高度关注。
关键领域没有岁月静好,超算融合AI已风起云涌
国运之争的核心是产业实力的综合竞争,而AI已经成为国运之争中的一环。
国内三十年岁月静好的改革开放红利已经到了战略博弈的临界点,像AI这种尖端产业正在成为大国博弈的桥头堡。
硬件是AI算法迭代的基础,没有技术之上的硬件自主权,就如同只有施工图纸而没有钢筋水泥,难以摆脱被控制的窒息感。
2018年美国公布了超算“Summit”,这台超级计算机是由IBM在英伟达帮助下开发,它的峰值计算能力可以达到每秒20亿亿次。
更重要的,Summit是史上第一台既支持传统计算,也支持运行人工智能应用程序的超级计算机,机器学习和神经网络等运行都可以在其上实现。
今年6月23日,全球超级计算机500强榜单更新,中国以226台部署量位列第一,美国一114台名列第二,日本以30台位居第三。但是在TOP500的榜单系统,有333套采用了英伟达的技术。
我国的AI超算解决方案直到华为的达芬奇架构公布后才有系统的解决方案,中国在AI超算领域的研发和应用,还需要点一把火,加一把劲。
框架和硬件“两开花”,研发标准统一才是“战斗力”
华为在2018年7月创新推出针对AI计算的达芬奇架构,在项目下公布了“昇腾”AI处理器+AI开源计算框架“MindSpore”。
由于华为给出了从硬件到框架一整套的解决方案,特别契合当下AI超算硬件成为新基建的公共特性。
这将会对AI业态造成三个方面的显著正面影响:AI全行业渗透、提升开发效率以及降低算力成本。
1.全栈高算力平台,带动AI全行业渗透
在以往的AI开发中,架构、API、生态和运维都需要专门人才进行支持和管理,开发环境复杂,人才数量少,全球的AI人才供需比只有1%,只有三万核心专家。从行业上看,中国市场含有AI的应用仅有10%,全行业AI渗透率只有4%。
国内AI的研究很火热,2019年斯坦福人工智能索引报告显示中国的人工智能论文数量超过欧盟,但是行业应用有限。
要实现全面超越,形成产业聚集优势,亟需AI超算的基础设施,带动全行业的AI应用和转型。
华为的AI超算解决方案从硬件标准、运算集群和运维管理上都为应用者提供了统一方案。
在硬件标准上,“昇腾”的Da Vinci架构架构中含有Cube、Vector、Scalar三种计算单元,平均算力是业界算力的两倍。
基于“昇腾”处理器的Atlas集群在全球最快AI训练集群的基础上,部署了普惠性的AI开发平台ModelArts和CANN开发工具。
尤其是ModelArts,作为一个“一站式”的开发平台,让AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts上完成。
这极大地降低了AI开发的门槛。这样一个专供AI的基础性商业超算系统已经成型。
基于这个系统,使用者可以极大减少资源调度成本,降低开发成本,最主要的是降低算力成本。
由于AI正在成为通用目的技术,使用场景会越来越广,同时也意味着后入场的行业引入AI的门票费会越来越高,华为的超算架构让更多场景与AI融合降低了门槛,促进了AI向全行业渗透。
1 2 下一页>