旷视科技CTO唐文斌:我们是一家人工智能产品公司
聚合资讯日前,旷视科技Face++创始人兼CTO唐文斌接受了新智元专访,谈了旷视科技Face++的商业模式、公司定位以及人才和发展观。
唐文斌在旷视科技Face++北京办公室
“没有什么技术是不能被取代的。”唐文斌说:“算法也好,技术也好,都是手段,最后能够提供出去的是产品价值。”这位三十刚出头的旷视科技Face++联合创始人,对这家中国人脸识别独角兽有着很清晰的定位:“旷视不是一家技术公司,旷视是一家产品公司,是一家以人工智能技术为核心的产品公司。”他认为客户最终一定是为产品价值买单。旷视的团队人数从去年到现在翻了一番,增长到600多人,其中扩张速度最快、人数也最多的就是产品部门。
相比旷视更常出现在人们视野中的另一位联合创始人印奇,唐文斌说他们的搭配是“印奇仰望星空,我脚踏实地”,更加侧重工程的他关注如何选择场景结合技术,给用户带来最大增值,“不是nice to have,而是must have”。他认为旷视工程团队要做的事情是把算法边界内能够自动化的任务全部交给机器去完成。他在寻找的也是复合型AI产品经理,以及能够随时转变为researcher,时刻想着如何把research没有价值的工作砍掉的懂算法、懂编程、更懂体系结构的全栈AI工程师。
旷视不是技术公司,是产品公司
新智元:目前在人工智能领域尤其是深度学习技术落地,你认为真正的壁垒在哪里?
唐文斌:我认为深度学习技术的落地,核心的一个关键词是“结合”。我们有一些很好的算法,比以前的性能提高了很多,但一定要找到合适的场景,把算法用进去解决问题,给用户带来明确的价值,这些价值不是“nice to have”,而是“must have”。
我们内部有个说法,叫“用户价值增量”——当你把技术用在场景中后,给用户带来的价值和用他原来的方式相比增量有多大,如果很大,那么这就是一个非常好的场景,如果增量只有一点,说明这要么不重要,要么你没有看清本质。以人脸识别为例,就是要不断去思考,人脸识别到底是在哪些场景下,给谁、通过什么样的方式,带来了多大的价值。
卖技术的话,今天你能卖,明天他也能卖,所以一定要做深,深入行业,把产品做好,形成完整的一套业务服务,这并不是从用户价值的角度去思考,而是公司生存的角度。极端一点说,我认为没有哪家公司是无法取代的,客户为什么选择你而是不选择另一家,一定因为你给他带来的价值更大,他买单的是你产品的价值。
新智元:旷视如何找到这种技术跟场景价值增量高的结合点?
唐文斌:我们经历了好几个阶段。最早的时候,作为一家纯技术公司,我们做了一个面向开发者的开放平台,叫Face++,通过API的方式提供互联网服务,美图秀秀、快手等APP都用了我们的技术。第二个阶段,我们开始关注技术到底在哪些场景下能给客户带来重要的价值——去寻找那些用户需求感知非常强烈的场景。我们找了很多,最终决定在两个场景进行业务的深入。
第一个是互联网金融,通过人脸识别进行远程身份认证,把线下业务线上转化,让用户有更便捷的体验,银行这边也实现了安全,这个增量是非常大的。第二个场景是安防,现在有大量的安防数据,人根本看不过来,而用机器去看,可以识别里面每一个人是谁,还可以识别逃犯,根据观察到的人物行为模式进行预警,这是原本做不到的事情,这个业务价值增量也是巨大的。
同样一个技术,比如人脸搜索(或者叫图像搜索),你既可以用在搜索视频看哪个影星出现在哪些电影片段中,也可以检索监控摄像头视频,在后面一个场景你可以解决老人、小孩走失的问题。所以,我们在这两种场景下,一定选择后者,因为后者价值更大。
旷视科技Face++的人脸识别做到什么程度了?
新智元:旷视现在的人脸识别做到什么程度了?
唐文斌:这个要取决于具体的场景和数据库。在不同的场景下需求是不一样的,比如说用人脸识别来做开门,员工走过来门就开了,这种个场景下要求召回率非常高,每个人都得识别出来,并且速度要非常快。我们给阿里集团做刷脸门禁,阿里现在几万人,基本上一天可以识别几十万次,大概误报1~2次。
在安防场景下,数据库会大很多,公安识别嫌疑人的诉求,最重要的一点就是不能老喊“狼来了”,这就要求识别出的尽量都是对的,我们一般会控制一个误报率。现在我们在安防场景下识别嫌疑人,基本上路过的嫌疑人都能够识别出来,并且误报不会超过30%。目前业界还没有一个基准,但我们参加了很多楼宇、安防竞赛,都是业界的最高水平。
现在经常听到99.9%,这只是在某个数据集上的表现,真正现实的问题和场景要比测试数据集难太多太多。其实最早是我们引领了刷benchmark这个风潮,后来我们又不怎么刷了。我们最早刷LFW,已经基本刷到顶了,最后即使出错,感觉好像也不是本质问题,所以我们就没有去管这个事情了。但现在大家还很疯狂地在刷99.9%后面的位数,这没有任何意义,LFW只有6000对数据,那个数据集早就已经过拟合了。我认为大家要更关注的点,应该是更结合实际场景去解决问题。
新智元:旷视现在很多行业落地都跟政府有着很强的相关性,ToG是否是人工智能发展的一个重要方向?这是否是旷视发展的一个重要方向?
唐文斌:面向政府绝对会是人工智能发展落地的一个新方向。就像我刚才说的,我们要做什么,不做什么,选择的逻辑是用户价值,图像识别或者人脸识别对于城市治理和公共安全能够带来非常大的价值增量,我们是非常愿意去做的。政府现在是我们最大客户之一。当然,政府也非常支持现在的人工智能产业发展,在这种需求里面也给我们提供了很多的机会。
Research负责寻找算法之外的东西
边界里面的全部通过工程实现自动化
新智元:旷视的核心优势是什么?
唐文斌:深度学习有三个核心要素,算法、数据和系统,这三者是相乘关系——你有一个好的算法,用有很多数据去催它,当数据变多、算法变复杂后,还需要有一套很好的底层架构和引擎来支撑。
从算法的角度讲,我们请来了孙剑老师,希望孙剑老师带着同学们在现有算法基础上找到新的东西。算法就像人的智商,数据就像人的见识,见识决定了你能走到多高,而智商决定了你能走多远,两件事情都非常重要。我们的研究团队其实就在智商这个方向上探索。而数据是一个更产品或者更工程的事情,我们需要在产品中设计一个好的方式,形成数据的循环,让产品中的数据回来,不断加深算法的训练,让它变成更强的算法。
1 2 下一页>