北京旷视科技有限公司副总裁谢亿楠:中国人工智能的系统与准绳
8月30-31日,由中国高科技行业门户OFweek维科网、高科会主办,OFweek人工智能网承办的2018中国(上海)国际人工智能展览会暨OFweek(第二届)人工智能产业大会在上海成功举办。本次大会用全新视角透析行业动态,解读人工智能领域本年度海内外最值得关注的学术与研发进展,与数千位人工智能领域的国际知名企业高层、行业资深专家、专家分析机构等数千位精英进行多方分析与探讨。
在30日AI技术专场主论坛上,北京旷视科技有限公司副总裁谢亿楠为现场观众带来了《中国人工智能的系统与准绳》主题演讲,分享了AI企业核心资源如何与核心生态系统打通、AI技术、产业升级等方面的解决方法,另外副总裁谢亿楠从四个方面分析了人工智能的落地与应用,还表示在目前人工智能产业化领域,AI技术在一年、三年、五年可以实现爆发增长。
北京旷视科技有限公司副总裁谢亿楠
另外副总裁谢亿楠从四个方面分析了人工智能的落地与应用,还表示在目前人工智能产业化领域,AI技术在一年、三年、五年可以实现爆发增长。
以下为北京旷视科技有限公司副总裁谢亿楠的现场演讲内容,OFweek人工智能网作了不改变原意的整理和编辑:
先感谢一下主办方,我后面大概说一个点,就我们现在看着人工智能公司企业,我们到底应该用哪些标准和准绳去衡量一家公司对于AI的理解,AI和产业不是说我做AI那就是AI产业,而是有一定的要求。
第一点我们去年去录一个节目,当时导演提出来让我们做人脸识别,底下编导说人脸识别我也很厉害,我把你这个机器打败了怎么办?所以我上来第一点放了几组照片,当时一共是40个,没找太多,我说那这样咱们做一下试试,当时编导那个组花了大概十分钟左右做了一下,很简单两个照片,看是不是一个人,这个测试跟现在非常有名IFW很像。
试一下人和机器到底有多少差别?40道题,他们对了20道,有的上下两张照片都是一个人,只是做了一些美颜,这几张照片机器都给出了很肯定的答案,就是一个人,但人都会花了很长时间来去判断他到底是不是一个人,他们甚至当时问了旁边的中国最强大脑,他说看人脸不要看脸看耳朵,给了他们很多这种所谓的印记,给了很多提示,做到最后还是错了一半,所以我第一句话讲为什么中国这人工智能做产业是因为它的准确率和很多应用场景确实比人要高效,高效不仅仅是提升在准确度上,还提升在速度上面,当时机器做用了大概不到一秒,人大概做了半个小时,中间因为有些人自认为自己识别对了,他觉得要坚持,所以最后还出现内讧。
大家讲人工智能技术很厉害,那我们到底应该怎么样去判断一家人工智能企业它很厉害?我们现在可以看到中国人工智能产业公司会催生一个新的产业,叫数据标注行业。我给大家还原一下整个人工智能的工作原理,其实人工智能和我们人类的学习很像,都是通过经验值去学习的,机器对于经验的这件事叫数据。
那数据来讲的话是什么意思?比如说你给100万张照片,告诉它这里面这些人是男的,这些人是女的,这些人是小孩,给完之后,你把它标好了,机器自己学完之后,还可以举一反三,那人做这件事情的话会很快,一个小孩可能看了几个人脸,就大概知道男人长什么样,女人长什么样,孩子长什么样,老人长什么样,不用看到一件事情就教给他,机器不行,机器需要成千上万张不断的去训练它,它才能去做出来,所以中国这个圈里面有一句话叫有多少人工就有多少智能。
一个人工智能如果是想做产业的,要解决第一件事情的话就要去人力化。我们之前看到所有人工智能叫大规模监督性学习,但是一家人工智能公司想做到产业里面,它要解决的问题不仅仅是刚才所看到那件事,两个人是不是一个人这么简单的命题,而是在里面有很多很细小的问题。
我举个例子,比如说我们提供门口迎宾的简单的一个系统,就这么一个简单系统,有多少个场景需要被它识别,第一个叫逆光,就是说场景后面是个白光,是个门口,在门口情况下,大家拍照都会发现一个问题,在那个情况下拍照人脸上是发黑看不见的,这个时候人眼会自动会调节自己的进光量,会把焦点对在人上面,但是机器不会,因为你有的时候去做迎宾场景是在室外,有的时候在室内,你要给它一个很通用性的东西,所以在每一个小的产业应用里面都要去用这个东西,它要回到一个原点叫时间成本。意思就是人工智能如果想用到产业里面,你要解决很多很场景化的问题,就要去给很多很场景化的数据,收集一个场景话数据大概需要2到3周,再去训练可能需要一个月能解决,这一个月时间,机器可能只能解决一个小问题。我们如果能够把这件事情通过非常小的场景就会识别的话,那就可以去做。所以我们现在去看一个公司产生算法或者产生功能性算法,或者说它可以把一个算法定制性的放到各种端上,可以放到各种产品里的话,那这就能够告诉他,他的人工智能技术是去人力化的。
我举个例子,我们之前去公安做一个案子,当时警方给我们的所有的视频都是非常粗糙的,粗糙到像素化,那脸上不是说是一个人脸,是一个格一个格,让你识别这个东西,这个东西到人是无法识别的,那怎么办?正常情况下赶紧去采集所有样本的东西,采完之后回来改,当时给我们的时间是两天,所有企业都蒙了,我们当时花了大概一天左右时间把这个东西搞定了。在整个过程中,对于数据的处理,在现在所有的人工智能科学家里面,我们可以讲有五成以上的人,其实并没有跟做算法相关的本质性工作而做数据清理,包括那些大牛。如果我们能够把它们真正解放出来,让它的算法能够真正地跑起来,我觉得这个东西是对于我们来讲就不一样了,我们的整个研究人员平均年龄大概23岁,他们都是用很通用的方法,他们这种很聪明的孩子,不需要太多的经验性的东西去解决问题,我们就可以直接去做,他们这两天可能要去打一个比赛,现在给我的结果是表现还不错,那同样也是用这套东西,如果一家公司做人工智能产业型公司,且只会打比赛那是不行的, 人工智能技术问题是要解决的。
第一件是从0到1的话,你要去解决它本质问题。你要解决挣钱这件事情,怎么挣钱?人工智能只是一个工具,你得想这个东西能用在什么地方,所以旷世在2014年解决的第一个是人脸验证、线上实名验证这件事情。你在这里面的话,其实它并没有本质性的对一个行业进行改变,但是是一个最大的催化剂,风控最前端叫什么?叫用户的一个开户动作。
如果没有自己的网点,那它就会想怎么样能够通过手机在没有网点的情况下,保证我注册进来的每一个人都是和他身份证上一模一样的人。这个就是一个命题、一个场景,那你的技术能不能够解决这个场景的问题,就是一家人工智能产业公司所要去思考的问题,而不是说我只解决到一个人脸识别做到99.999%,跟千足金一样,这个其实是没有意义的。当时我们做第一个是支付宝,支付宝给我们第一个命题是20万样本,之前我们做FW里边样本多少?6000对,91.5%的东西和换到20万里面的话,你会发现你乘完之后还有很多是错误的,这样是不允许的。
所以要想到在真正产业及公司里面,要从0到1谈这件事情的话,想的东西、面对的东西、解决的问题就已经不再是几千对这样的事情了,而是要为全中国几亿人去做刷脸验证的时候都不能错。我们现在会看到肯德基上线了很多人脸识别的支付,那里面其实是旷世的face ID的算法,我们第一个场景或者说人工智能产业公司第一个解决就是看做的东西是不是解决了行业里面的本质痛点,还是说它只是解决了一个小工具,让你觉得好玩,旷世之前做的也是工具,比如旷世最早的产品是叫《乌鸦来了》,我用人脸控制一个人去左右摇摆,就这件事情来讲可以不用人脸,但开户这件事情,可不可以不用人脸?它也可以,但它的风控成本就会高很多,因为它连第一件事,连保证我本人注册的时候,是不是我本人都做不到。
第二件事情的话叫双闭环发展,其实我们看到faceID当时滴苹果提出来,但是faceID.com是旷世注册的一个域名,当时我们也得益于苹果的这次传播,让我们的流量大概提升了大概十倍左右。第一圈转的话,会发现你解决的问题是face,第二圈解决问题是ID,因为你如果只解决了face件事情的话,到了两年之后会有十个人跟你能做同样的事情,我举个例子,比如现在所有做语音识别里面企业之前做都是付费的,现在免费的进来了,如果你还是一个工具,你会发现你的模式基本就会被免费模式所取代,所以你要做第二圈是什么?你要解决这ID的问题,也就是说我们现在给很多企业做的东西,并不一定是说我要告诉你这人脸是不是一个人,更多的是要告诉你一个计划,这个人上个月已经在其他平台注册过四次了,我不关注你是谁,但是我告诉你这么一个信息,因为我们是一个平台,所以这个信息对他来讲就非常重要,虽然这个照片和身份证是一个人,但由于它多次验证,说明有很高的欺诈风险。
当你选择一个场景的时候,你要去想到这个场景是不是有壁垒,还是说之后你只能去解决一个工具性的问题,那如果是的话,你会发现未来一定会有很多大厂去做这件事情。比如说旷世在2012年做的face佳佳,那个产品16年的时候百度腾讯全部都做了,全部都开放了,如果我们还坚持那个场景的话,我们基本就被打趴下了,因为他们可以完全不要钱。一个产业级公司要去解决一个核心问题,并且在这个问题上能够找到一个足够高的门槛,或者说能够通过时间能够建筑的成本。
第三件事的话叫产业赋能,直接看到经常会讲的智慧城市。我先讲一个网红的故事,这是我们实际中在城市里面帮城市管理者提供的一个案例,当时红圈的这个人是一个在逃犯,我把在逃犯界里的这个网红拿出来给大家做一个对比,什么叫产业生态打通和生态没打通,这个网红是谁呢?是张学友,因为张学友演唱会现在已经抓了五个人了,所有感觉是有问题的人都爱去张学友演唱会上,但是张学友演唱会它并不是生态打通的一个场景,它其实还只是我刚才提到的第一点,它只从0到1了,为什么?我还原一下当时的场景,就是一个小桌子、一个笔记本、一个摄像头,然后一个工作人员坐在这边盯着桌子,一个人一个人进来看,他就会做比对,有报警,报警一分钟会报三四个,因为这系统不是很好,笔记本做这个实验,所以它就会挨个把照片发给当地的民警,说张队长,我发现了一个报警,您处理一下,这个队长一个演唱会下来可能会收到三四十个报警,他把三四十个发到指挥中心也叫研判室。
研判室告诉他这一个人是有问题的。这个时间大概过去多少,过去一个小时了。然后一个小时之后,张队长拿了一个消息给当地所有的公安,说之前在哪个口进来一个人穿着什么样,所有的民警注意了,我们要对这个人进行勘址,这些人就在场地里开始游荡,整个结束之后可能锁定了几个人,出来就摁倒,为什么演唱会能抓住?因为演唱会是在里面一蹲蹲两个小时的,这两个小时就足够的处理了。所以只有演唱会的场景是能够做这件事情,这就是生态没打通的,在这个过程中它并没有帮这个行业解决降本增效的问题,中间还需要大量人力去处理它,还需要大量时间去做这件事情,它做这些事情来讲的话,只解决了一件事情,就是提示我这有问题,然后解决问题的时候一帮人去做。
所以生态打通的环境是一个什么场景?我同样用那个方案去举个例子,当时是在地铁里面,也是在华东区,当时场景是什么样?地铁站两分钟时间,从进站第一秒开始到他走,当地的城市管理者告诉给我们的时间是两分钟,为什么是两分钟?因为他进站之后两分钟之内你不做处置就走了。所以两分钟之内的话是要从端到端的,也就是我们前端的摄像头,你要在那边就直接做视频处理了。要把算法先塞到那里面,不能做运算,只能做去检测,当地的一个笔记本就在做运算,做完运算之后自动传到研判中心,研判中心拿了结果之后直接就处置,之后直接给一个结果回到这个站点,这个站点之后直接给到这个地点,最近的那个站,它会给到一个什么信息?给的信息就是你现在去3号站台8号车厢门口去关注一个穿蓝色衬衫的男人,东亚男性,那这个过程中的话大概一分半左右,这就是一个生态打通的过程。
所以说算法从刚开始第一个摄像头开始到中间的计算端到指挥中心里面,研判室里面的解决方案,到最后警务站,最后的警示警务终端整个是连通的。数据流完之后,我们讲到一个产业级的AI公司并不解决一个问题,它不是一个工具,他要解决一个行业真正创新就是两个字,一个叫降本,一个叫增效。
去年旷世在全国为中国的城市管理者破了大概5000多个案子,一个案件的抓包成本大概30万左右,一个抓逃,对于整个的团队来讲是一个集体二等功,这是真正对一个行业有用的,或者说你在行业中能够生存下去的AI产业公司,就是你能够为它产生极致的降温和机制增效。
对于一个产业的东西,我们之前看到整个城市都在应用人脸识别技术,在十年之前就用了。为什么现在都没有去落地去铺开,是因为它没有解决增效的问题,我还需要同样警力去解决同样的事情,你只给我了一个报警,这个人在哪我不知道。电影里面最新的电影,叫《我不是药神》,其中有一段人家已经发现监控照片了,但是现场的刑警还是表示我需要一周才能抓到,且要动用全局的警力才能做到这一点。这就是我们看到的一个现状,你的AI产业级的产品是不是一个产级产品,就是说你能不能够通过用最小的人力,用最高的技术去解决这个问题。
第四个叫升级,我同样用一个比较火的事去讲这件事情,这叫什么?这是零售,这个例子就在杭州,我们在跟鲜生活做的一个产品实验店,在这里面的话,大家会看到一年之前叫无人店,刷脸进门刷脸支付,你只要做到这列就可以是无人店了,还有一个就是叫扫二维码买东西。这个过程中大家会看到,其实对于零售店里面没有做到本质性的改变,零售店的本质改变是什么?它评效、人效、选品是不是最优的一个状态?
我们举个例子,什么叫平效、人效最优?日本的三米莱文和中国的全家在毛利率这一个指标上大概差了一个数量级。差的是这个店长对于这个店到底该卖给什么样的人,我这个店来的是什么样的人,有没有很深刻的理解?如果你有很深刻的理解的话,会发现一个点,为什么有的店衣服卖得好?是因为店长知道进什么样的衣服,他知道应该摆在什么样的位置,他知道应该怎么给店员培训,我应该怎么去介绍。这个过程就是目前零售店最缺的一个过程,就是能够去把它真正的数据化,然后再智能化。卖什么东西?给谁卖东西?卖什么东西挣钱?这就是我们现在看到新零售所想解决的最大的问题,所以之前我们看到很多新零售解决说现在可以去测算人流,可以刷脸支付,可以刷脸进门,刷了进门之后甚至会跟你的信用账户绑定,我们看到这些东西很多,对产业有没有升级,我们就还是问一句话,你对一个单店的成本有没有改变?比如说你现在把它做一套升级改变,它不用你,只有一个原因,就是你对它的升级改变之后,它所带来的毛利提升在三年之内超不过所在这边花的成本,他就不会去做这件事情。
作为一个AI企业,如果真正要走到行业里面,我们经常会听到AI+XX行业,你走到这个行业里面,它用你,你必须解决问题,也就是我用了你之后,你能不能为我多赚钱或者极致性的赚钱。比如我们会看到为什么现在整个资本市场里零售企业和传统的物流企业没有上市企业,或者上市机会非常少,是因为他们本身都是毛利非常低的一个行业,而这里面的成本非常高。所以AI要进去这里面的话,真正要解决就是要去解决在这里面的成本和效率的问题。
所以我们真正看AI加到行业里面,真正要去想的,其实不光是技术能解决什么问题,还有一个就是场景接不接受,为什么?自动驾驶我们可能放到5年会成熟,是因为技术本身可能已经成熟,但是我们又问一个问题,当时这个问题是在一个采访上问马斯克,他们说马斯克先生您好,您已经这么笃定说您现在这个技术这么好了,那您敢不敢每天闭着眼睛坐上车,一睁眼就到公司,在这个过程中不睁开眼睛,就任凭汽车带你走,他想了两分钟说他不敢。所以我们就会想一个技术到场景里面适不适应被场景技术所改造,它是有一个时间度的。
假设说人工智能已经满足自动驾驶了,但是没有哪个公司老板说我敢天天就根本就不用管,也别给我坐人,我就坐我自己车里面,人工智能带我走,所以我们真正要讲的是一个技术,就是说真正要做产业化,要去看第一基础有没有解决问题,同样还要看这个场景是不是能够真正的去适应你的发展。
其实今天的这个主题也是以人工智能和产业很相关,最后我们安静在这个页纸,最后再次感谢这个主办方的邀请,谢谢大家!