纪荣嵘教授:论视觉搜索与识别系统紧凑性
近日,一段9秒的监控视频刷爆了朋友圈。与以往监控不同的是,这段监控视频的画面准确识别出机动车和非机动车的种类,以及行人的年龄、性别、穿着等,视频中画面信息了然于目。据了解,该视频是我国最新研制的实时行人监测识别系统,是“中国天网”工程的重要组成部分。利用计算机视觉技术,判断图像或者视频序列中是否存在行人,并给予精确定位。将视觉定位、视觉识别等技术与人工智能技术相结合,在智能设备监控、人体行为分析、智能交通等多个方面得到了广泛应用。
纪荣嵘(厦门大学教授/媒体分析与计算实验室主任)
11月13至14日,由OFweek中国高科技行业门户主办,OFweek人工智能网承办的“OFweek2017中国人工智能大会”在深圳举办。来自厦门大学的纪荣嵘教授在《视觉搜索与识别系统紧凑性》主题演讲上,结合实际案例,分享了厦门大学媒体分析与计算研究组近两年来,在面向视觉应用的视觉特征紧凑表示以及深度网络压缩中所做的一些工作与成果。
在大会上,纪荣嵘教授首先介绍了其2015至2017年在ICCV、AAAI、IJCAI和CVPR上发表的一系列排序敏感特征哈希算法。这些算法旨在通过引入大规模无监督排序信息,学习排序敏感的哈希码,以保持原始高维特征空间中的检索信息。可以将一个50~60M大小的文件直接压缩至10M左右,这也是目前市面上最高效的压缩算法。
随后,纪荣嵘教授主要围绕以下两个方面话题进行了具体讲解,一是面向大规模视觉搜索的特征哈希,主要从视觉数据近年来的爆炸性增长,大规模视觉搜索技术的紧迫需求以及面向大规模视觉搜索的特征哈希原理等方面进行了概念介绍;二是提出了深度神经网络压缩,介绍了深度神经网络在视觉中的应用,以及如何压缩网络模型等问题。
纪荣嵘教授还以QQ音乐上了哼唱搜索为例,通过哈希算法,让哼唱搜索更加灵敏,能够直接根据用户简单的音节准确的搜索到相关的音乐。并且可以通过深度神经网络压缩,让这个系统依然维持在小体积之上,使得整个软件不会过于庞大。
最后,纪荣嵘教授为现场观众展示了他们团队在该领域的相关工作进展以及对未来工作的展望。
更多详细内容,敬请关注OFweek人工智能网后续专题报道!