中国HPC的高潜力与AI融合的未来

2024.04.22 Ai芯天下

前言：
    如今生成式AI风头正热，并且又是一次新产业革命的引爆点；
    而这个引爆点之所以能出现，离不开背后的HPC高性能计算与大数据基础设施这两点；
    目前新的增长热点出现，HPC与AI正在加速融合之中。
    作者 | 方文三
    图片来源 |  网络

    全球正在进入HPC大周期
    受益于其以更高的速度处理大量数据的能力，全球超算行业应用主要集中在生命科学、CAE、机械工程、金融、EDA、地理、机械设计、政府、学术研究、国防和气象等领域。
    根据Hyperion Research的统计数据，2022年全球超算行业市场规模为309.55亿美元，同比增长4.24%，预计今年全球HPC市场预计将增长至500亿美元。
    云端HPC部署方面，根据数据显示，2020-2022年，用户上公有云的速度和应用速度加快，促使HPC云上支出增速大大高于HPC线下本地部署规模，2022年全球HPC云上支出市场规模达到63.04亿美元，同比增长23.61%。

    HPC的高速发展对底层芯片提出了新的要求
    一个完整的计算机系统，通常由硬件系统和软件系统两大部分组成，其中硬件是计算机系统运行的基石，而硬件由各种各样的芯片集合组成。
    这意味着在高性能计算高速发展的时代，对CPU、GPU、TPU、NPU、FPGA、ASIC、SoC等高性能计算芯片，以及通信芯片、接口芯片、存储芯片等的需求量有望持续上升。
    在百亿级市场的积极驱动下，各大主流芯片企业皆纷纷入局高性能计算市场并加大投入，以期望在市场红利期分得一块蛋糕。
    对于高性能计算来说，算力是第一要素，通常需要达到每秒万亿次级的计算速度，这对系统的处理器、内存带宽、运算方式、系统I / O、存储等都提出了更高的要求。
    如何解决构建下一代超级计算机面临的性能、延迟、功耗及安全性问题，成为了行业关注的重点。

    全球超级计算机排行榜单
    超级计算机，是HPC的主要实现方式之一。
    此前，HPC由于其专业度极高的特点被局限在科研实验室、大型企业和特定的学术组织研究中。
    不过随着近两年AI技术与IoT应用之间的互相驱动，5G将数据传输管道大大拓宽之后，给了数据囤积量进一步拓展的空间，让HPC也逐渐变得日益重要。
    目前，国产高性能计算机已经取得了不错的成绩。
    在61期全球超级计算机 TOP500 榜单中，中国国家并行计算机工程技术研究中心（NRCPC）开发并安装在位于中国江苏省无锡市的国家超级计算中心的神威太湖之光以 93 Pflop/s位列第七。
    神威·太湖之光超级计算机甚至曾连续获得top500四届冠军，该系统全部使用中国自主知识产权的处理器芯片。
    天河二号甲（银河二号甲）是由中国国防科技大学（NUDT）开发并部署在中国广州国家超级计算机中心的系统，目前以 61.4 Pflop/s 被列为第十名。
    天河二号采用麒麟操作系统，目前使用英特尔处理器，将来计划用国产处理器替换。

    HPC成国际芯片龙头争夺要地
    为了做HPC领域的领导者，英伟达、AMD、英特尔在 HPC 应用领域也是进展不断。
    迄今为止，英伟达已推出了面向HPC和AI训练的 Volta、Ampere、Hopper 等架构，并以此为基础推出了V100、A100、H100等高端 GPU。
    其中Hopper H100采用台积电4 nm工艺，具有800亿个晶体管，在性能、效率上远超Ampere A100，是英伟达专为超级计算机设计的产品。
    英伟达还发布新一代GH200 Grace Hopper 超级芯片平台，是一款为大规模AI和高性能计算应用量身打造的加速芯片。
    AMD已经在高性能计算领域推出一系列性能领先的产品，涵盖了服务器CPU、加速器，桌面CPU、移动CPU等众多领域，全方位覆盖数字经济的高算力需求。此外，充分利用小芯片技术，用先进的2.5D和3D封装技术，使AMD能够灵活的进行异构计算解决方案系统级优化。
    作为高性能计算领域的创新引领者和推动者，英特尔近年来推出了英特尔至强处理器，英特尔至强融核处理器（Xeon Phi）、3D XPoint全新非易失性存储技术、英特尔可扩展系统框架（英特尔SSF）以及英特尔Omni-Path架构 (Intel OPA)等众多创新产品和技术。
    英特尔基于Xe HPC微架构的数据中心GPU Ponte Vecchio是迄今最复杂的SoC，包含1000亿个晶体管，提供领先的浮点运算和计算密度，以加速AI、HPC和高级分析工作负载。
    未来计算架构的发展趋势是CPU和GPU融合集成，从而形成互联、互补、互通的融合模式，以缩小计算和存储单元的通信成本。

    HPC与AI互相融合
    HPC与AI、大数据、数据分析和量子计算的融合加速了基础设施整合，以实现从小规模、中型到EB规模的最佳性能/成本比，并创造出以前没有涉及的新HPC业务市场。
    并行化深度学习：深度学习是AI的重要分支，但在训练大型深度神经网络时需要大量的计算资源。
    HPC技术可以通过并行化计算和优化算法，加速深度学习的训练过程。
    高性能优化：AI算法中存在很多计算密集型任务，如矩阵运算、卷积等。
    通过使用高性能的计算库、优化算法和并行计算技术，可以提高算法的计算性能和效率，减少运行时间。
    分布式推理：在部署大规模AI模型时，分布式推理技术可以通过将模型分发到多个计算节点上，并利用HPC集群的计算能力，加速推理过程。
    这种并行推理技术可以提高响应速度和吞吐量，适用于实时应用和大规模数据处理。
    多模态融合：AI算法通常需要处理多种数据类型和模态，如图像、语音、文本等。
    通过结合HPC技术，可以实现多模态数据的并行处理和融合。
    大规模数据处理：AI算法对于大规模数据的处理和分析需要强大的计算能力和存储系统。
    HPC技术可以提供高速的数据传输、分布式存储和并行计算能力，以支持大规模数据的处理。

    结尾：
    超算基础设施群建设已成为各国推动科技创新的重要着力点，新一代计算系统的陆续上线为实现更大规模、更复杂的超算应用提供了基础。
    同时，高性能计算与AI的融合在推动超算系统与应用发生巨大且迅速的变化，超算技术的发展面临越来越多的挑战。
    内容参考来源于：半导体产业纵横：中国HPC，潜力无限