计算机视觉展翅高飞 “大佬”“萌新”如何布局?
人工智能产业链主要分为三个层次:基础层、技术层和应用层,技术层面包括计算机视觉、语言识别、深度学习等。据清华大学数据显示,计算机视觉作为作为人工智能的三大应用领域之一,占比达34.9%,已在交通、医疗、金融、教育、安防等多个垂直领域得到应用,并成为各行业发展的重要支撑。
计算机视觉中,图像识别、人脸识别这两个分支颇为重要。而安防深度依托于图像处理,人脸识别技术也落地安防多年,C端商业应用成熟。在海量视频存储时代,人力无法完成对监控视频的有效处理。人们需要借助计算机视觉技术,让监控摄像机代替人眼对目标完成识别、分析和跟踪等工作。对智能安防来说,计算机视觉就是感知外界的“智眼”。通过计算机视觉技术的加持,监控摄像头具有实时识别人脸、车辆、物体的能力。因此,海康、大华、易华录等传统安防厂商均在积极布局,纵向打通计算机视觉框架、自主研发关键技术,即依托深厚行业基础和渠道资源开拓新市场,以高性能安防设备为基础,推出特定场所的视觉安防总体解决方案并快速落地应用。
尽管计算视觉领域充斥着大大小小的公司,但其发展主要力量还是AI创企。根据新思界产业研究中心发布的报告显示,得益于市场快速发展,计算机视觉领域创业潮兴起,成为人工智能行业中创业公司扎堆的领域。这些创业公司吸金屡创新高,取得的成绩较好,政府机关、金融机构、零售商、手机厂商等等都是AI创企客户,其中闻名遐迩的计算机视觉“四小龙”,市场份额合计占比达到69.4%。
具体来看,依图科技在人脸识别、语音识别领域表现不俗,其人脸识别算法在千万分之一误报下的识别准确率超过99%,短语音听写字错率仅为3.71%,并联合微软Azure推出依图语音开放平台,携手华为发布“智能语音联合解决方案”和“智能医疗云”,为医疗科学发展和生物识别技术水平提升带来更多可能;商汤科技进入安防监控、金融、手机、移动互联网和深度学习芯片等领域,核心技术包括人脸识别、视频监控识别算法、自动驾驶识别算法、医疗影像识别算法等;旷视科技则从互联网金融切入,然后拓展到安防、手机、新零售、机器人、行业物联等行业;云从科技主攻金融、安防,以及交通、新零售等行业,在3D结构光技术上持续发力,以打破苹果技术垄断,为身份识别再筑“防火墙”。
国内除AI创企和安防厂商外,互联网巨头如腾讯、百度、阿里、金山等也在加紧布局,使计算机视觉赛道更为火热。值得玩味的是,人工智能四小龙中,除了AI国家队云从,旷视、商汤、依图,或多或少与阿里巴巴发生了联系。细而言之,商汤与旷视均获得过阿里投资,旷视还是蚂蚁金服战略合作伙伴,而马云、虞锋共同发起设立的“云峰基金”已成依图重要股东,依图科技联合创始人林晨曦还曾任职阿里云技术总监。
放眼海外,苹果、亚马逊等科技巨头持续收购成熟的技术团队完善技术体系,陆续推出开源计算机视觉开发平台,吸引初创企业协作开发面向不同场景的解决方案,以平台为核心立体式地推进,打造全产业生态。例如,谷歌以TensorFlow及Google Cloud为核心,横向上,进军图像分析、文字识别等技术,推出Google Lens等视觉服务产品;纵向上,向下拓展基础硬件推出TPU芯片,向上拓展无人驾驶、医疗等垂直领域,逐渐打造包括计算机视觉在内的人工智能大生态。IC半导体公司英伟达在CVPR 2018大会上,开源数据增强和数据解码库,解决计算机视觉性能瓶颈,数月后其AI团队为GAN创造一种新的生成器,该结构不需要人类监督,可自动分离图像中的各种属性。
结语:金鳞岂是池中物,一遇风云便化龙。从监控摄像头到车牌识别,从人脸识别到出入境管理,从深度学习到人工智能,计算机视觉都担当着重要角色。相信随着AI落地生花,计算机视觉将扶摇直上,解锁更多场景,为行业应用带来更大的价值。