美国高通公司刘学徽:Qualcomm骁龙移动平台加速终端侧AI
8月30-31日,由中国高科技行业门户OFweek维科网、高科会主办,OFweek人工智能网承办的2018中国(上海)国际人工智能展览会暨OFweek(第二届)人工智能产业大会在上海成功举办。本次大会用全新视角透析行业动态,解读人工智能领域本年度海内外最值得关注的学术与研发进展,与数千位人工智能领域的国际知名企业高层、行业资深专家、专家分析机构等数千位精英进行多方分析与探讨。
在30日AI技术专场主论坛上,美国高通公司刘学徽发表了《Qualcomm骁龙移动平台加速终端侧AI》主题演讲,他分析了端侧人工智能的四大需求、智能手机上人工智能的三个方向和基准测试的四个组成。不仅如此,刘学徽还强调人工智能向终端测的发展,需要依靠用户和设备使得人工智能受到训练、执行和推理。智能手机AI体验不能只依靠一个内核,在AI面向图像分类网络时,其准确率与运算次数的对比是基准测试最重要的指标,人工智能软件持续优化,是实现骁龙SoC产品组合性能能在一年内实现两倍提升的重要突破点。
美国高通公司产品经理刘学徽
以下是美国高通公司产品经理刘学徽的现场演讲内容,OFweek小编作了不改变原意的整理和编辑:
各位嘉宾,大家上午好,非常高兴有这个机会跟大家来分享一下高通在人工智能方面所做的一些成绩。今天我的演讲题目实际上没有咱们宣传的这么大,我的演讲因为时间原因只有20分钟,所以我们把主题锁定在高通的终端侧人工智能方面所做的一些事情。
高通实际上是做终端芯片,包括智能手机芯片、平板电脑芯片,还包括物联网芯片,我们公司有两大战略,一个是人工智能,也就是契合今天的主题,另外一个战略就是5G,未来几年是5G的时代,这两个技术实际上在“万物互联”物联网飞速发展的时代是可以非常好的契合在一起的。端侧人工智能的产生在这几年是非常的火,这个话题也非常的火,它的产生实际上是有它的需求的。
我们总结下来它主要有这么几大需求。
首先第一个端侧,因为大多数的终端都是人在使用,它的隐私性,用户的隐私保护是一个非常强的需求,在端测用人工智能处理而不是交给云来做,可以满足隐私性的需求。
第二个就是可靠性,大家可以想象一下,我们在自动驾驶汽车的时候,如果说AI的能力不是在车上来完成的,而是交由云来完成,万一通讯上出现问题,任何的延时性、可靠性,包括低延时都满足不了,那带来的后果是非常严重的。
另外就是高效,这里讲的高效,实际上除了运算对算力资源消耗的高效之外,还有一个非常重要的,就是对能耗的消耗,也就是咱们终端设备对电池的使用,这也是非常重要的一个因素。
最后一点就是个性化,因为咱们很多IOT的设备,不管是手表也好,可穿戴设备也好,尤其是我们的手机,虽然用的是同一款手机,但是不同的人用的时候都希望有符合自己使用习惯的一些AI的功能,这些需求就推动了端侧人工智能的快速发展。
虽然今天咱们主题是谈的机器人,物联网,但是不得不谈一下智能手机,因为智能手机是目前在咱们地球上唯一单品出货量最大的,我们有一个第三方的预测,就是2018年到2022年五年的时间,新出货的手机会达到86亿台,大家可以想象一下,这86亿台有相当大的比例会是搭载了人工智能的手机,咱们聚焦一下,以智能手机作为一个例子,人工智能的功能能够给用户带来哪些很好的体验?
人工智能在智能手机上有三个方向。
第一个是拍照。也就是跟视觉密切相关的一大方向,这个领域有很多功能已经都商用了,比如说采用人工智能技术的美拍自拍,然后包括背景虚化等等一些功能,这都是人工智能在拍照方面、视觉方面的一个应用。
第二个方向是语音。语音的UI包括语音的唤醒,甚至包括这种同声传译等等,这些都是语音方面一个大的应用领域,目前在手机方面语音还是刚刚起步。
第三个方向是增强现实,也就是大家常说的AR。也就是说用户可以拿着手机,对一些实景做拍摄的时候,在屏幕上叠加虚拟的图像或者虚拟的景象,给用户带来全新的一种体验,它后面的商机也是非常大的,可以产生新的游戏玩法,大家也都知道游戏产业是很大的一个产业。同时还有很多的商业的一些导入,比如说广告,包括一些互动的交流,可以带来很多的一线体验。
稍微回顾一下高通在端测人工智能的一个发展,实际上高通从2008年就开始在研究神经元处理单元在芯片上的一个落地,到了2015年我们第一代的人工智能产品问世,并且在我们当时的旗舰级芯片—骁龙820上落地,实际上当时做的是针对卡费这个网络模型的一个加速,让它在cpu上做加速。我们的第二代AI产品实际上是2016年—2017年这两个年度在旗舰机835芯片做的一个落地,我们是支持更多的框架,然后是让神经元网络可以通过我们的一个引擎,我们叫“SNPE”,通过这个引擎在CPU、 GPU 、DSP上做加速。
再看今天我们的第三代,也就是在现在很多高端旗舰机的845芯片上落地的,我们实际上做到了更多框架的支持,有很多流行的新的框架,甚至包括我们国内的百度的PAD PAD,还有商汤的power框架的支持,我们的引擎做了更多的扩展,支持了一些新的API,就是我们高通AI的一个产品,这个产品实际上融合了硬件,包括大家看到DSP、GPU、CPU三种核,包括了我们的一系列的软件工具,还包括了对多种框架、多种API的支持,所有的这些融合成我们的AI产品,所以我们的AI产品实际上是一种分布式运算的AI技术。当然除了我们这样的一个AI产品之外,如果没有算法厂家,没有一些系统集成商是最终落不到这个终端设备上来的,所以我们非常重视对这个生态系统的一个建设。所以我们就提出一个观点,我们的观点是在智能AI手机上,它的体验实际上靠一个核是不够的,也就是大家可能看到这个AI领域里有一些争论,比如有一种说法叫做你没有NPU、没有专门的AI的核,就不叫AI手机,我们是非常不同意这种观点的,我们的观点是只要是AI的功能在这个终端上实现了,那它就是一个AI手机,后面我会展开跟大家来谈谈这个问题,所以就谈到了另外一个话题,就是你怎么来评判这个设备的AI的能力,这就是一个AI的基准测试。
我们觉得基准测试实际上应该由四个方面组成。
第一个方面首先是准确率,不管是用AI的视觉来做照片的分类也好、物体的识别也好,它的准确率是第一位的,没有准确率就没有好的用户体验。
第二个是性能,就是所谓的跑分或者是速度,当然这个性能是非常重要的,有好的性能才能承载更多的更强的AI的算法。
第三个是能效,因为咱们谈的是端侧的AI,所以对电池的使用,尤其是怎么省电,这个是一个非常重要的指标,不得不考虑,因为如果在云端,你的电可以是无限的,但是在终端上这个能效是必须要考量的一个指标。
第四个也是最重要的就是用例,我们今天在端上做AI实际上最终的目的就是要在端上实现AI的功能,给用户带来不同的更好的体验,所以没有用例支撑的测试实际上是没有意义的。再展开来谈,就是实际上大家业内来做测试的时候,无非都是用一些最经典的流行的网络来做这个测试,哪些网络能够符合前面我们讲的这四种指标呢?我们列下来了一些常用的最流行的一些网络。
大家看到我们画了一条曲线,曲线上纵坐标是准确率,横坐标是对算力的一个需求。大家看到曲线左上角的这几个网络,这两个网络是我们觉得在手机这样的手持设备上最有用的、最经常会用到的网络,这两个网络目前可以达到高效以及能效各方面的满足。对比下来大家看到这个右边的VGG-16以及VGG-19,我们觉得这两个网络实际上对智能手机来讲是没有用的,在用例方面是没有用的,因为它的一个准确率,另外一个尤其是功耗的需求太高了,不适合在手机上,所以我们在做优化的时候,基本上是放弃这个VGG-16以及VGG-19的一个支持,然后在ResNet50以及inception-v3这两个网络上面做了很多的优化。这就是印证了我们前面提出的四个观点,同时也印证了为什么我们觉得分布式的运算不是靠一个单核的NPU来运算。另外除了核能力的一个提升之外,还有一点非常重要,就是整个在端测AI的软件方面的提升。有一个数据,就是一年的时间硬件没有任何的变动,但是软件做了提升之后,整个的性能翻了一倍。
所以到现在为止,前面讲过,我们非常重视生态系统的建设,以上所有这些性能已经在各位拿的手机上商用了,实际上这些算法都不是高通公司做的,是仰赖我们的合作伙伴,包括我们列下来这些合作伙伴,当然还有一些没有在列下来的合作伙伴,他们来完成的,当然他们的算法在我们的平台也上做了很好的优化。除了跟算法厂家合作之外,我们跟云合作伙伴,也就是大家俗称的互联网公司也有一些深度的合作。在国内我们跟腾讯做了一个非常接地气的一个应用,大家手机上的qq最新版本里,如果你的手机支持我们的AI产品用的这个芯片的话,你就可以找到一个叫做高能舞室的一个功能,如果不是的话这个功能出不来,它这个功能是什么?它就是出一些图标教你怎么去跳舞,然后给你打分,它用到了肢体识别的一个算法,这个已经商用,大家如果有兴趣的话可以在qq找到这个功能。我们跟百度在语音方面有一些深度的合作,当然在国际上跟Facebook在AR方面,跟谷歌在图相册的一些分类方面,包括跟微软开放的AI的API这个方面都有一些深度的合作。
最后总结一下,实际上高通的整个的AI的产品战略,就是我们以我们芯片为一个基点,以开放的心态支持多种框架,并且支持除了安卓之外,还有windows这样的一些操作系统,同时紧密的跟领先的算法厂家,包括今天旷世谢总这样的合作伙伴做紧密的合作,然后产生出一些很好用户体验的特性,创造出一些应用,最后落地到各种终端上,为产业为用户带来更好的一些体验和价值。我的演讲分享到这,谢谢大家。