英伟达公司在人工智能领域是否已经不可战胜?
在英伟达公司2019财年第一季度的财报当中,其表现再次超出预期——总收入增长66%,强劲的数据中心业务增长71%(本季度收入达到1.7亿美元)。对于英伟达公司而言,“数据中心”业务部分包括高性能计算(简称HPC)、数据中心托管图形以及人工智能加速几大组成部分。虽然这一增长率无疑令人印象深刻,但却仍然不及该过去几年当中实现的2到3倍同比增长水平。这就引出了我们今天将要讨论的有趣话题。这种增长速率只是种周期性的波动,还是说业务规模达到一定程度后的必然下降?谷歌张量处理单元(简称TPU)等定制化内部芯片的出现是否会威胁到英伟达公司在深度学习训练领域中的主导地位?英特尔、AMD以及该领域中的其它初创企业能否迎头赶上?带着这些问题,我们马上开始这一轮思考。
图一:按各业务部门划分,英伟达公司旗下几乎所有业务方向均实现增长。
英伟达公司发布了哪些财报结论?
如您所见,英伟达公司本季度的表现可以说爆炸来形容。尽管抛售了约2%的股票,但其今年以来股价仍然上涨33%左右,并在过去两年当中上涨近7倍。一部分分析师指出,数据中心收入未能达到预期——实际为7.01亿美元,略低于预期的7.03亿美元,不过二者之间的差距基本可以忽略不计。我认为一部分交易者只关注投资回报,但也有一些交易者越来越担心目前的竞争格局可能出现恶化。但就我个人而言,英伟达公司前四个季度的数据中心业务增速都在100%以上,因此对于一家可能在新的一年中营收超过20亿美元的企业而言,71%地增长速率仍然相当值得肯定。
同样需要强调的是,前几个季度英伟达公司还拿下了其它几份重要订单——包括为位于橡树岭国家实验室的Summit超级计算机提供2万7600块Volta GPU以支持大规模高性能计算业务。我不知道橡树岭实验室的单块Volta GPU采购单价,但如果按照5000美元到8000美元计算,则相当于给英伟达带来了1.3亿到2亿美元的收入。如果送去这部分数字并考虑到英伟达业务的潜在优势,那么70%左右的增长率已经相当符合市场发展情况,因此具备一定的可持续性。换言之,如果英伟达公司要保持目前的发展速度,只需要继续在其它竞争对手面前保持领先优势即可。在后文当中,我们将进一步介绍英伟达公司目前面临的具体竞争压力。
竞争压力来自何方?
英伟达公司在人工智能领域的惊人增长已经引起高度关注,亦吸引到众多潜在竞争对手。其中不少企业宣称其正在研发的芯片比英伟达产品速度更快,而且功耗更低。但实际情况是,在今年或明年当中,只有少数几家企业有可能实际发布相关芯片产品。事实证明,设计出一款比无数英伟达工程师精心打造的芯片好出十倍的解决方案可谓极为困难,而且需要投入大量时间与金钱。除了AMD公司的GPU之外,其它各厂商都认为为神经网络处理专门设计芯片才是最具可行性的发展路线。下面,我们将对这一领域展开探索。
英特尔:
英特尔公司收购了Nervana(以及Mobileye、Movidius以及Altera)以构建自己的加速产品组合。在2016年被英特尔收购之前,Nervana Engine的初代版本本来计划于去年正式发布,但截至目前仍然没有实际方案可供参考。相比之下,英伟达公司则决定重新对自家产品进行设计,而其引入Volta GPU的TensorCores确实带来了令世人震惊的效能——其性能比Pascal(英伟达的上一代GPU)高出6倍。从理论层面讲,Nervana芯片的性能应该是10倍于Pascal,所以可以想见TensorCores的出现可能会令英特尔决定放弃Nervana。毕竟如果V100 Volta在关键人工智能运算方面的性能真正达到Pascal的6倍,那么Nervana作出的“10倍”宣言在力度上将大打折扣——特别是考虑到Nervana的性能优势中还包含软件调整。在另一方面,英伟达公司也在定期通过软件优化工作提高应用性能。事实上,如果英特尔继续推动Nervana发展路线图,那么其批量生产最早也要到2018年年末才能实现——这将正好赶上英伟达公布Volta的下一代升级方案。至于公布平台,我猜很可能是在达拉斯的SC 2018大会上。
以上讨论主要围绕深层神经网络——简称DNN——的训练展开,而英伟达公司在正是在这一领域取得巨大成功。不过英特尔方面表示,通过将良好的软件设计方案同标准英特尔至强数据中心处理器相结合,其同样能够在推断工作方面实现出色的性能。芯片巨头表示,其目前拥有超过80%的推断处理市场份额——对这样的结论,我当然没有质疑的理由。在最近的一次宣传活动当中,英特尔公司的医疗卫生客户也谈到其在同一英特尔平台之上运行训练与推断处理所带来的优势。
除此之外,微软也在利用英特尔Altera FPGA方面取得了值得肯定的进展——FPGA能够不断重新编程以满足各种苛刻的应用加速需求。需要强调的是,Xilinx的表现同样出色,其利用Amazon AWS Market Place与F1加速实例成功简化了FPGA应用的入门门槛。不过出于某些数据类型与延迟需求的考量——例如无人机与自动驾驶汽车场景,FPGA有时需要配备专门的低功耗加速器(英特尔收购Mobileye与Movidius正是出于这一考虑)。
1 2 下一页>