“AI in AII”——CV场景争夺:天下武功,唯快不破
张康康AI in All,是目前全球人工智能公司的最大愿景。
在2018 Google I/O大会上,Google首席执行官Sundar Pichai向全世界阐述了Google从AI First向AI Only的转变,AI已经从泡沫变成了风向。
当目光转向国内,AI大战也毫不逊色。
仅从BAT生态而言,在几近砍掉百度钱包、百度外卖等产品线之后,百度火力全部投入AI建设,已推出DuerOS、Apollo两大开放平台,并宣称自己已是一家AI公司;
而腾讯AI开放平台也积极应战,包括AI Lab,优图实验室、微信AI在内的多项AI功能均已对外上线;
剩下的另一个巨头阿里则在大资本入股寒武纪、旷视、商汤等AI头部公司之后,成为目前实力最强、囊括AI独角兽最多的互联网公司。
对于所有上场选手来说,与其说他们在抢夺技术,不如说是在争夺场景。有了场景,就有了市场,有了市场,才能谈落地,以AI驱动的革新,目前已渗透在包括金融、安防、医疗、零售、翻译、文娱、物流等多个行业之中。
天下武功,唯快不破,在计算机视觉与图像领域的场景争夺战中,亦是如此。
“巨头盘点”
计算机视觉与图像领域,是人工智能中竞争最为激烈的战场。
根据IT桔子国内《人工智能创投数据库》的数据显示,国内人工智能产业中「计算机视觉与图像」领域的公司数量已达407家,稳坐人工智能领域的头把交椅,整个计算机视觉与图像总投资额为475亿人民币。
在大多数公司还讲不清楚人工智能是什么的时候,一些率先入场的公司估值已经高出天际。
商汤科技在近两月内接连进行了两轮融资,分别完成C轮的6亿美元与C+轮的6.2亿美元,再一次刷新全球人工智能领域融资记录,它以高达45亿美元的估值,在IT桔子最新公布的《人工智能创投数据库》中位列“计算机视觉与图像”领域总融资额第一,其他在此领域的融资巨头包括美图秀秀、旷视科技Face++、微鲸科技、Video++、云从科技等,其中都不乏有上市公司与超级独角兽。
“五大应用场景”
就目前的现状来看,在计算机视觉与图像领域有五大应用场景已率先突围,分别是人脸识别技术、静态图像识别、视频/监控识别、医疗影像诊断与字符识别。
1.人脸识别技术
人脸识别技术目前运用最为广泛,场景落地也最为成功,包括在门禁、身份认证、人脸检测、人脸搜索、人脸比对、人脸定位、人脸管理等独立服务模块均以实现大批规模商用,且市场需求还在不断剧增,具备大规模技术普及的潜力,已渗透在互联网、安防、司法、边检、政府、航天、教育等各个行业。目前该领域的代表企业包括商汤科技、旷视科技Face++、云从科技、依图科技等。
(Face++——人脸识别)
2.图片识别
图片识别目前在提供的主要独立服务包括图片分类、以图搜图、图片中特定物体识别、场景识别、场景分类、图片打标、图片安全监控(色情暴力监控)、智能图片管理等,该场景主要在对大量图片数据进行深度学习的基础上,完成图片理解并对接特定需求。目前该领域的代表企业包括商汤科技、美图秀秀、旷视科技Face++等。
(美图秀秀——图片识别)
3.视频/监控识别
视频/监控识别领域目前空间广阔,因而商业模式也多种多样。在批量结构化相应视频/监控内容后,能实现多种形式的检索、查询、识别、分析等,目前该领域提供的独立服务模块包括视频/监控中的物体识别、分析定位、智能匹配,视频/监控中的行为分析、内容跟踪,交通道路中的行人分析与跟踪,人群密度分析,道路情况分析,车辆行为分析等,代表企业包括视频识别领域的Video++,监控识别领域的商汤科技、依图科技等。
(Video++——视频识别)
4.医疗影像诊断
对于医疗数据来讲,其中很大部分来自于医疗影像。目前通过人工智能和计算机算法为医疗机构提供影像服务,包括医疗影像数据存储、医疗图像识别、临床影像分析、影像疾病的预筛查、针对医疗影像的辅助诊断与阅片服务等,在辅助医生预判、医疗影像云存储、提高诊断效率上具有重要作用,代表企业包括依图科技、推想科技、汇医慧影等。
(汇医慧影——医疗影像诊断)
5.光学字符识别
光学字符识别在深度学习的不断成熟中,已经能通过技术完成预处理与后处理工作,实现文字的快速识别和输出。在对光学字符识别的基础上,完成字符成像、字符识别、字符输出、自动增强等服务支持,应用在包括证件信息、自然场景中的文字、文档或宣传资料的识别与检测等,代表企业包括商汤科技、合合信息等。
(合合信息——光学字符识别)
除了这五大应用场景,三维视觉、工业视觉、生物识别技术等场景也潜力巨大,在未来也亟待大规模商业落地。
“AI in All”,不论是在线上或线下,AI都已全面入侵,而AI领域里目前应用最为广泛的CV领域已向深水区挺进,谁会颠覆最快,抢夺更多场景,实现AI+生态,一切大局未定。