人工智能与高性能计算融合成大势,英特尔Ice Lake双箭齐发
等待已经结束,尘埃终于落定。近日,英特尔正式发布了10纳米数据中心CPU,即代号为Ice Lake的第三代英特尔至强可扩展处理器。英特尔称,Ice Lake-SP平台每个处理器最多包含40个“Sunny Cove”核心,其中内置加速功能和新指令,可显著提高人工智能、高性能计算、网络和云工作负载的性能。
除了把核心数从上一代Cascade Lake的28个增加到40个以外,Ice Lake还提供每插槽8个DDR4-3200内存通道,每个插槽最多64个第四代PCIe通道,而上一代产品只提供6个DDR4-2933通道、每个插槽最多支持48个第三代PCI通道。
英特尔透露,凭借这些增强功能以及用于计算加速的 AVX-512 和用于人工智能加速的深度学习加速,Ice Lake 与上一代相比使数据中心负载性能平均提高了46%,高性能计算的平均性能则提高了 53%。在早期进行的内部基准测试*中,英特尔Ice Lake处理器在运行主要高性能计算、人工智能和云应用时的性能也超过了近期发布的代号为Milan的AMD第三代霄龙处理器。
Intersect360 Research首席研究官Dan Olds表示:“英特尔相对于AMD的定位肯定比以前更好。从英特尔对比前一代产品的基准测试来看,WRF高出近60%,蒙特卡洛算法高出70%,Linpack高出38%,HPCG高出41%——HPCG是稳定性测试,对于客户而言意义重大。”此外Olds也表示,英特尔Ice Lake表现出的代际性能提升50%是一件大事,“这个成就相当巨大。”
在高性能计算市场,为什么说英特尔的代际性能提升意义重大?据外媒数据显示,目前英特尔是高性能计算领域的领先供应商,估计占有94%的市场份额。凭借其声誉卓著的x86指令集和服务器硬件,确保了其绝对的领导地位。因此,对于绝大多数高性能计算客户而言,英特尔最需要的其实是自我超越。
Supermicro公司负责现场应用工程的高级副总裁Vik Malyala告诉HPCwire,他们的客户渴望充分利用Ice Lake中的第四代PCIe和更高的核心密度。他说:“对于我们的客户来说,长期以来一直针对英特尔架构对许多工作负载进行优化。这就是为什么我们的许多客户愿意等待,而不是转而采用其他产品。”
与上一代产品(28个核心、ISO频率、ISO编译器)相比,Ice Lake的IPC提高了20%,并在一系列负载上提高了单核性能,如下图所示(对比8380 和8280)。
在地球系统建模、金融服务、制造以及生命和材料科学的行业标准基准测试应用中,我们可以观察到显著的性能提升。下图展示了运行12个高性能计算应用时的提升,其中包括:天气预报软件WRF的性能提高了58%,蒙特卡洛算法的性能提高了70%,OpenFoam的性能提高了51%,NAMD的性能提高了57%。
英特尔副总裁兼高性能计算部总经理Trish Damkroger表示,将NAMD(一种生命科学中使用的分子动力学软件)的性能提高57%只是一个开始。英特尔与伊利诺伊大学厄巴纳-香槟分校的NAMD团队合作,进一步优化了性能,实现了2.43倍(143%)的代际性能提升。Damkroger说:“这全都要归功于AVX-512优化。”
Hyperion Research高级顾问Steve Conway告诉HPCwire:“毋庸置疑,英特尔x86能够轻松主导全球高性能计算市场上的处理器类型。” Conway 表示:“从已公布的基准来看,Ice Lake代表着一个巨大的技术进步。Ice Lake最重要的优势是,它能够有效服务现有和新兴的高性能计算市场,特别是人工智能、云、企业和边缘计算。这是在未来数据中心市场获得成功的关键。”
针对这一趋势,英特尔副总裁兼人工智能、高性能计算、数据中心加速器解决方案与销售总经理Nash Palaniswamy在与HPCwire的书面交流中写道:“人工智能和高性能计算的融合正在成为现实,第三代至强可扩展处理器使支持多种应用的动态可重构数据中心成为可能,客户对此感到非常兴奋。我们最新的第三代至强可扩展处理器为人工智能负载提供强大动力支持,与我们竞争对手的64核处理器相比,使用我们的40核CPU可以将图像识别性能提高25倍。”
目前,第三代至强处理器现在可以通过诸多OEM、ODM、云提供商和渠道合作伙伴获取。思科、戴尔、技嘉、HPE、联想、Supermicro和Tyan等发布合作伙伴推出了搭载全新英特尔CPU的全新或升级版服务器,Oracle已经宣布了基于全新至强处理器的计算实例的优先预览版。预计未来也会有更多相关产品发布。