赛先生的新旅行:昇腾AI带来的科学智能变革

脑极体

    《三体》动画即将开播,又一次引发了全球科幻迷的无限热情。提到《三体》,大家有很多深刻记忆。其中之一是三体人在入侵地球之前,首先是派智子锁死地球的基础科学进步,从而限制人类的整体发展。
    很多人会担心,物理、化学、生物等基础科学似乎已经很久没有突破性进展。《三体》里预言的科学瓶颈,是不是已经来临?事实并非如此。
    
    1919年1月15日,《新青年》第六卷首次提出了“赛先生”(科学)的号召。一百年过去,赛先生在今天,应该会惊叹于科学事业已经有了新动力。AI技术与科学研究的相遇,正在打开智能科学的大门。
    我们共同来了解一下“科学智能”究竟是什么。赛先生的新旅程,似乎可以告诉三体人:放弃吧,地球的科学之路依旧光明无限。
    科研之旅,为何浩瀚?
    对比20世纪上半叶一众基础科学取得惊人突破,我们或许会感觉今天的科学研究步履缓慢,缺乏进展。这是因为科学研究整体已经来到一定高度,向上攀爬的难度远高于以往。
    这种难度,直接体现在很多方面。比如实验数据过于庞大,难以处理;比如大量科研计算任务需要研究人员手动完成,效率受到限制;再比如科研本身是面向未知的探索,有大量的试错成本。这种种困境都体现在大量的科研工作中。比如一次天文观测的数据,可能需要专业团队花费几个月进行解析;一种新药有效开发,可能需要10年以上时间、数十亿美金的研发投入。
    这种情况下,科学研究急需要从人工化、手动化的方式,向智能化计算迁移。但这个过程中又会面临一系列挑战。科学计算要面临大量非结构化数据以及大量非线性计算任务。维数灾难、计算尺度受限、理论突破与工程方法创新缓慢等挑战制约着科学计算的发展。
    
    由此可见,科研之旅之所以看上去浩瀚无涯,并不是说科学已经没有创新目标,而是需要新范式、新工具、新平台来加速科研创新,提升科研效率。这种情况下,AI技术带来的非结构化数据解析、泛化理解能力、多样化计算表述等价值,可以有效应对科学计算中的难题。让浩瀚无涯的科研工作效率提升,步履加快。
    这就是由AI与科学计算结合,产生的科学智能新路径。
    赛先生的新发现:AI带来全新可能
    AI可以解决大量科学研究中的问题,这一点在今天已经得到了广泛证实。比如说,AI可以帮助智能体在虚拟环境中进行仿真计算,从而补充现实环境实验的不足。这在流体力学测算、自动驾驶等领域价值突出;AI还可以进行大量非结构数据解析,这在天文、气象预测、DNA与蛋白质解析当中十分重要。AI与蛋白质解析的结合,频频登上主流科学期刊封面。就是因为AI模型完成了人类难以企及的科研新高度。
    在中国,通过AI大模型等全新技术来助力科研与产业化,其成绩已经蔚为大观。
    比如东方.御风大模型,是将AI的优势与流体仿真相结合,基于昇腾AI开发的业界首个工业级流体仿真大模型,可实现大型客机翼型流场的高效、高精度智能化仿真预测。在飞机生产过程中,仿真测试是必不可少的一环,也是飞机安全性、经济性的关键保证。过去,进行飞机流体仿真测试一次仿真需要数十分钟,但运用“东方.御风”25秒就可以完成。这种效率积累起来是非常可观的。使用非AI方式,仿真万次要70天,而现在只需要3天。中国工程院院士吴光辉表示,有了“东方.御风”大模型的帮助,在精度一样的情况下,仿真时间只需要原来的二十四分之一。
    
    “东方.御风”大模型,是基于昇腾AI软硬件底座打造的面向大型客机翼型流场高效高精度AI仿真预测模型。尤其在昇思MindSpore流体仿真套件的支持下,有效提高了“东方.御风”大模型对复杂流场的仿真能力,实现了仿真时间大幅下降。
    而华为还携手产业界围绕“东方.御风”以及正在孵化的AI湍流大模型,成立了智能流体力学产业联合体,为大模型从科研创新走向产业落地铺设了新的道路。
    在大飞机项目受到全社会关注的今天,“东方.御风”大模型的出现和应用可谓恰逢其时。其不仅为大飞机国产化带来了关键助力,更在流体力学这一关键领域展现了AI大模型带来的无限可能。
    “戈登·贝尔奖”是国际高性能计算应用领域的最高奖,被誉为“超级计算应用领域的诺贝尔”。今年,鹏城实验室联合北京大学、山东大学,在“鹏程.神农”生物信息研究平台上完成的“领先于病毒的进化——通过人工智能模拟预测未来高风险新冠病毒变异株”研究项目成功入围了该奖最终名单。
    基于昇腾AI的“鹏程.神农”平台,以AI方式,在两天内实现了新冠病毒 Alpha、Beta、Gamma、Delta、Omicron BA.5 等主流毒株的变异模拟,且可以准确预测大多数的高风险监测变异株,包括 BF.7、BQ.1、BA.4.6 等。通过 6.3x10^22 次运算,“鹏程.神农”可以比病毒进化提前5 个月时间预测到病毒变异方向,从而提升突发疫情的预判与处置能力,其价值可谓难以估量。
    
    “鹏程.神农”平台之所以能够在科学计算领域获得如此显著的成就,离不开背后基于昇腾AI基础软硬件的鹏城云脑II为其研究提供了强大的算力支撑。
    预训练AI大模型,极大提升了科研工作的效率,在自动化、仿真化、智能化等方向,为科研工作提供了全新范式。这种范式也展现出了极大的产业成果。比如大飞机研究具有极高的经济价值;新冠病毒检测,对全社会的经济发展有着重要意义。这种由科研向产业的价值转化,让新的产学研协作路径已经出现,基础科学持续高速进步的曙光已经到来。
    而向更深层看这两个大模型项目,会发现他们都有效解决了同一个问题:科学计算需要庞大的AI算力开销,并且需要HPC计算与AI计算的有效融合。在昇腾AI基础软硬件的支持下,那些科学智能的“不可能”,已经转化为了“可能”。
    新底座,新旅程
    我们知道,全球有大量超算中心都是用来支持科研工作,尤其是基础科学的创新。而在目前阶段,AI技术的加入,让传统科学计算无法解决的问题带来了可能,也为科学计算的发展带来了新路径、新机会。将AI与HPC结合,从科研到产业都具备广泛的价值空间。
    比如说,在AI赋能机理计算当中,就需要将AI计算嵌入到机理计算中,通过AI实现计算加速。这一研究路径,以鄂维南院士提出的DeePMD方法实现分子动力学模拟为代表。
    再比如天文、气象预测等领域,都需要AI计算与HPC计算结合,从而提升整体研究的任务准确率与完成效率。
    这些方向都需要HPC与AI计算相互支持,甚至相互融合。那如何才能把HPC与AI计算两大计算体系融合起来呢?这就需要在硬件、软件、应用等多个方面,构筑科学智能的新底座。
    华为推出科学智能基础软硬件平台,就有效解决了这一问题。基于鲲鹏和昇腾两大算力体系,充分融合HPC和AI计算,实现围绕科学智能原生的多样性算力软硬件平台。
    
    在不同的层面,科学智能基础软硬件平台都有独特的技术来实现HPC与AI计算融合。
    在硬件层,业界首个科学智能全场景液冷整机柜硬件平台——天成,支持多样性算力的灵活弹性部署,实现科学智能全场景覆盖;
    在软件层,毕昇C++和毕昇融合编译器,结合欧拉操作系统,实现系统开发效率1倍以上的提升,系统性能提升30%-50%;
    在开发侧,全场景统一工具MindStudio可实现软件融合编程/编译/调优,使科学智能全场景开发效率提升50%,可以有效提升科学智能业务的开发效率;
    在应用使能侧,业界首个AI与HPC融合的开发框架昇思MindSpore以及多瑙融合调度器,可以实现科学智能应用高效开发、部署和调度,使应用性能提升10-20倍,系统资源利用率提升15%;此外昇思MindSpore还为科学智能的应用加速提供了多领域的科学智能套件,如进行蛋白质结构预测与抗体设计的分子模型套件MindSpore SPONGE、天线阵列仿真的电磁仿真套件MindSpore Elec、大飞机以及海洋洋流流场预测的流体仿真套件MindSpore Flow等等。
    新底座,意味着新的可能;新的动力,意味着新的目标。在有效支持流体力学、生命科学等领域之后,华为面向科学智能打造的基础软硬件平台,还在为科学智能孕育更多惊喜。
    下一站,电磁智能
    电磁学(electromagnetism)是研究电磁现象规律与应用的物理学分支。早在18世纪,电磁现象与电磁感应就为科学界所关注。今天我们无法离开的通信、计算、材料工程,都离不开电磁学作为支撑。
    面向这门非常重要的基础科学,科学智能持续触发。中国科学院院士崔铁军团队正基于昇腾AI基础软硬件平台打造的面向电磁领域的大模型:金陵.电磁脑。
    金陵.电磁脑,将在电磁波、电磁计算、超表面仿真等领域带来全新的价值,并将与通信天线、雷达、毫米波自动驾驶等领域进行广泛应用结合,加速行业的应用创新。
    
    由此可见,科学智能的前景非常广泛,在各个基础科学领域都具有发展潜力与发展必要性。来到中国百年的赛先生,今天依旧在AI大模型、科学智能等领域中驰骋着、翱翔着。我们没有一刻暂停过脚步,没有丝毫倦怠与气馁。
    科学依旧是人类文明之光,依旧是我们永不放弃的方向。科研之光,正在智能化中持续盛放,AI技术的发展也正在为其注入新动能。赛先生的旅程,还远远没有结束。