手机也可以训练视频识别模型?麻省理工给您答案!
AiChinaTech近日,麻省理工学院和IBM沃森人工智能实验室的研究人员开发了一种新技术,可以在处理能力非常有限的手机或其他设备上训练视频识别模型。用户可以上传任何照片,并编辑建筑物、植物群和固定装置外观的工具。视觉识别作为深度学习的最强技能,已经成为了计算机视觉算法可用来分析医学图像,使自动驾驶汽车成为可能,并驱动人脸识别的发展。
通常算法将视频分割成图像帧,并在每个帧上运行识别算法。然后通过观察对象在随后的帧中的变化,将视频中显示的动作拼接在一起。该方法要求算法“记住”它在每一帧中看到的内容,以及它看到这些内容的顺序。新方法中,算法提取每一帧对象的基本草图,并将它们叠加起来。算法可以观察草图中物体在空间中的移动,而不是记住什么时候发生了什么。在测试中,研究人员发现,这种新方法训练视频识别模型的速度是现有方法的三倍。它还能通过一台小型电脑和照相机来识别手势,这些设备的电量仅够给自行车灯照明用。
这项新技术有助于减少现有计算机视觉商业应用中的延迟和计算成本。它可以通过加速自动驾驶汽车对传入视觉信息的反应,让它们变得更安全。还可以解锁以前无法实现的新应用,比如让手机帮助诊断病人或分析医学图像。
麻省理工学院和IBM沃森人工智能实验室的研究是这一日益增长的趋势的一部分,这种趋势将最先进的模型缩小到更易于管理的规模,也为计算机视觉领域找到了更多的落地方向。
当前计算机视觉的应用场景主要有以下几个方向:
人脸识别
相关数据显示人脸识别是人工智能计算机视觉领域中最热门的应用。人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。
代表企业:旷视科技、依图科技、商汤科技、极链科技、云从科技等。
视频监控
视频监控分析是人工智能计算机视觉领域中第二大热门应用。 人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。
视频监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。
代表企业:商汤科技、旷视科技、依图科技等。
图片识别分析
静态图片识别应用热度在视觉与图像领域中排名第三。将人工智能技术单纯用于图片识别分析的应用企业数量并不如预想的多,可能有以下几个方面原因:
1、目前视频监控方向的盈利空间大,众多企业的注意力都放在了视频监控领域。
2、人脸识别属于图片识别的一个应用场景,做人脸识别的大多数企业同时也在提供图片识别服务,但是销售效果不佳,主要赢利点还在于人脸识别。
3、图片识别大多商用场景还属于蓝海,潜力有待开发。
4、图片数据大多被大型互联网企业所掌握,创业公司数据资源稀少。
代表企业:旷视科技、极链科技、码隆科技等。
无人驾驶
随着汽车的普及,汽车已经成为人工智能技术非常大的应用投放方向,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。不过利用人工智能技术,汽车的驾驶辅助的功能及应用越来越多,这些应用多半是基于计算机视觉和图像处理技术来实现。
代表企业:纵目科技、Waymo、图森科技、驭势科技、佑驾创新、中天安驰等。
工业视觉
机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。
代表企业:创想智控、凯视佳、拓视觉、帆声图像、华睿科技等。
随着越来越多的人工智能研究被转化为应用,对更小模型的需求将会增加。国内也在计算机视觉领域加大了技术投资力度,诞生了诸如商汤科技、旷视科技、依图科技、极链科技等优秀的人工智能初创企业。未来,这些优秀的人工智能企业也会寻找到更多的落地场景,继续推动计算机视觉这一技术在应用场景快速落地。