“AI in AII”——CV场景争夺：天下武功，唯快不破

2024.04.08 张康康

    AI in All，是目前全球人工智能公司的最大愿景。
    在2018 Google I/O大会上，Google首席执行官Sundar Pichai向全世界阐述了Google从AI First向AI Only的转变，AI已经从泡沫变成了风向。
    当目光转向国内，AI大战也毫不逊色。
    仅从BAT生态而言，在几近砍掉百度钱包、百度外卖等产品线之后，百度火力全部投入AI建设，已推出DuerOS、Apollo两大开放平台，并宣称自己已是一家AI公司；
    而腾讯AI开放平台也积极应战，包括AI Lab，优图实验室、微信AI在内的多项AI功能均已对外上线；
    剩下的另一个巨头阿里则在大资本入股寒武纪、旷视、商汤等AI头部公司之后，成为目前实力最强、囊括AI独角兽最多的互联网公司。
    对于所有上场选手来说，与其说他们在抢夺技术，不如说是在争夺场景。有了场景，就有了市场，有了市场，才能谈落地，以AI驱动的革新，目前已渗透在包括金融、安防、医疗、零售、翻译、文娱、物流等多个行业之中。
    天下武功，唯快不破，在计算机视觉与图像领域的场景争夺战中，亦是如此。
    “巨头盘点”
    计算机视觉与图像领域，是人工智能中竞争最为激烈的战场。
    根据IT桔子国内《人工智能创投数据库》的数据显示，国内人工智能产业中「计算机视觉与图像」领域的公司数量已达407家，稳坐人工智能领域的头把交椅，整个计算机视觉与图像总投资额为475亿人民币。
    在大多数公司还讲不清楚人工智能是什么的时候，一些率先入场的公司估值已经高出天际。
    商汤科技在近两月内接连进行了两轮融资，分别完成C轮的6亿美元与C+轮的6.2亿美元，再一次刷新全球人工智能领域融资记录，它以高达45亿美元的估值，在IT桔子最新公布的《人工智能创投数据库》中位列“计算机视觉与图像”领域总融资额第一，其他在此领域的融资巨头包括美图秀秀、旷视科技Face++、微鲸科技、Video++、云从科技等，其中都不乏有上市公司与超级独角兽。

    “五大应用场景”
    就目前的现状来看，在计算机视觉与图像领域有五大应用场景已率先突围，分别是人脸识别技术、静态图像识别、视频/监控识别、医疗影像诊断与字符识别。
    1.人脸识别技术
    人脸识别技术目前运用最为广泛，场景落地也最为成功，包括在门禁、身份认证、人脸检测、人脸搜索、人脸比对、人脸定位、人脸管理等独立服务模块均以实现大批规模商用，且市场需求还在不断剧增，具备大规模技术普及的潜力，已渗透在互联网、安防、司法、边检、政府、航天、教育等各个行业。目前该领域的代表企业包括商汤科技、旷视科技Face++、云从科技、依图科技等。

    （Face++——人脸识别）
    2.图片识别
    图片识别目前在提供的主要独立服务包括图片分类、以图搜图、图片中特定物体识别、场景识别、场景分类、图片打标、图片安全监控（色情暴力监控）、智能图片管理等，该场景主要在对大量图片数据进行深度学习的基础上，完成图片理解并对接特定需求。目前该领域的代表企业包括商汤科技、美图秀秀、旷视科技Face++等。

    （美图秀秀——图片识别）
    3.视频/监控识别
    视频/监控识别领域目前空间广阔，因而商业模式也多种多样。在批量结构化相应视频/监控内容后，能实现多种形式的检索、查询、识别、分析等，目前该领域提供的独立服务模块包括视频/监控中的物体识别、分析定位、智能匹配，视频/监控中的行为分析、内容跟踪，交通道路中的行人分析与跟踪，人群密度分析，道路情况分析，车辆行为分析等，代表企业包括视频识别领域的Video++，监控识别领域的商汤科技、依图科技等。

    （Video++——视频识别）
    4.医疗影像诊断
    对于医疗数据来讲，其中很大部分来自于医疗影像。目前通过人工智能和计算机算法为医疗机构提供影像服务，包括医疗影像数据存储、医疗图像识别、临床影像分析、影像疾病的预筛查、针对医疗影像的辅助诊断与阅片服务等，在辅助医生预判、医疗影像云存储、提高诊断效率上具有重要作用，代表企业包括依图科技、推想科技、汇医慧影等。

    （汇医慧影——医疗影像诊断）
    5.光学字符识别
    光学字符识别在深度学习的不断成熟中，已经能通过技术完成预处理与后处理工作，实现文字的快速识别和输出。在对光学字符识别的基础上，完成字符成像、字符识别、字符输出、自动增强等服务支持，应用在包括证件信息、自然场景中的文字、文档或宣传资料的识别与检测等，代表企业包括商汤科技、合合信息等。

    （合合信息——光学字符识别）
    除了这五大应用场景，三维视觉、工业视觉、生物识别技术等场景也潜力巨大，在未来也亟待大规模商业落地。
    “AI in All”，不论是在线上或线下，AI都已全面入侵，而AI领域里目前应用最为广泛的CV领域已向深水区挺进，谁会颠覆最快，抢夺更多场景，实现AI+生态，一切大局未定。