联想HPC技术总监:AI为超算领域带来不同思路


    “中国是投入HPC和AI力度最大的国家之一,我来到中国感到很自豪,中国很注重创新。”联想数据中心业务集团全球高性能计算与人工智能技术高级总监Scott Tease说。在美国总部工作的他,上周远赴中国参与2017全国高性能计算学术年会(HPC China 2017)。
    
    联想数据中心业务集团全球高性能计算与人工智能技术高级总监Scott Tease
    联想近年在超算领域的发展成绩斐然,在TOP 500超级计算机的排行榜上占据91席,相当于每5台超级计算机当中,就有一台是联想的。不仅部署地区包括中国与海外;行业应用从能源行业、石油、勘探领域、芯片设计公司、核能技术、通信领域、北京大学一系列高校等等,范围相当广泛。
    最近一次成果,联想携手中国科学院数学与系统科学研究院打造了全新高性能集群项目,该集群采用了联想HPC整体建设方案,拥有408个计算节点,实现远超客户预期三倍的每秒1081万亿次的运算速度。而两方的合作还有一个小故事,据透露指出,当初中科院选择合作伙伴时,出了一道非常复杂的数学题,结果联想拿到最高分。
    联想在超算的表现有目共赌,在人工智能的火热浪潮下,AI的影响力同时蔓延到超算领域,当然也包括联想内部。
    联想企业内部是如何做人工智能呢?其中一个例子是,它们开发了一款专门搜索社交媒体内容的软件,这个软件会抓取含有联想内容的图片、视频、文字,然后将信息综合分析,了解用户对于联想的评价与情绪是正面还是负面。换句话说,通过AI机器学习,将这些数据分析传送到产品部门,能成为产品精进的重要参考。Scott Tease表示,现在通过人工智能来提升工作产值,在联想内部是越来越多见的。
    人工智能也为超算领域带来不同思路,因为超算过去一直致力于寻找精准的答案。“我们有一些方法来确保获得百分之百的正确答案。像是数学题一定会有正确答案,如果您处在银行业,或者化学分析领域,精准的答案是必须的,”Scott Tease继续说,“但在AI领域,我们并不需要百分之百精准的答案,处理的速度比精确度更为重要。”
    Scott Tease指出,在AI领域,会看到低精确度的处理方式,只要答案近似就可以。因为永远不可能在AI获得百分之百的精准答案,AI的目标是尽可能快速地获得近似的答案。
    Scott Tease表示,AI学习的model需要一遍一遍地运行,运行次数越多,速度越快,就能获得越好的AI效果。对于AI而言,这种低精度、高速度的处理方式非常重要,它将改变编程的方式,以及改变数据中心的架构、模式。
    既然HPC与AI看重的有所不同,超算能如何应用在人工智能领域?对此,Scott Tease说明,AI需要海量数据,有了海量数据,首先要存储它们;接下来就是要培训这些机器来消化数据,通过海量数据分析来获得机器学习的能力,找到趋势。可想而知,高性能的网络、加速的计算性能、开源软件,这些都是HPC擅长的,很适用于AI,也能够转换成AI发展的坚实基础。
    AI技术非常依赖大数据,数据的部署决定了如何培训机器进行学习,如果数据在云端,这种机器培训也必须在云端发生,如果数据不在云端而是on site,很难有足够大的网络能力把海量数据全部传输到云端,所以机器学习也必须on site。总之,数据在哪里,就决定了机器学习在哪里发生,所以解决方案不是只有云端的解决方案。
    “我们预计会有很多不同类型的处理器进入市场,包括新的英特尔处理器,新的英伟达处理器,TPU、FPGA等创新技术都会应运而生,我们的编程模式也会发生很大变化。”Scott Tease预测。
    尽管人工智能似乎成为一个必然趋势,Scott Tease认为,目前阻碍企业迅速部署AI的三大障碍是:第一,如何把数据进行结构化处理;第二,好的AI顾问专家太少,了解如何把AI技术部署到不同行业的人才更是稀缺;第三,在AI领域,许多软件是开源的,但是客户对于从网上下载开源软件部署在他们的数据中心里,还心存疑虑。“有些商业客户也许不是HPC客户,仅仅是商业客户,他们习惯从SAP或者微软购买软件,买来就能用,但是在AI领域,许多软件是开源的,业界还需要有足够多的AI软件和硬件相结合的资源。”