武汉大学遥感信息工程学院姚剑教授:AI 助力3D技术与应用升级
科技眼11月12-13日,由OFweek中国高科技行业门户、高科会主办的“OFweek2018(第三届)中国高科技产业大会”在深圳成功举办。在12日的“人工智能产业大会”上,武汉大学遥感信息工程学院姚剑教授为现场观众带来了“AI 助力3D技术与应用升级”的主题演讲,重点剖析了AI在3D技术上的助力作用和最新升级方案。
武汉大学遥感信息工程学院姚剑教授
人工智能:颠覆世界,超乎想象
在会上,姚剑教授表示,从学术到工业再到生活,人工智能技术颠覆了认知、思维,正在改变着整个世界。目前AI在一维智能和二维智能上都有较为成熟的产品和应用,而3D智能属于计算机视觉(最主要的人工智能技术之一)的范畴,目前3D智能仍有很大的发展空间,在三维智能上的产品和应用是当前及未来研究的重点。通过分析计算机视觉的历史与现在所扮演的角色,姚剑教授提出,3D应用需求促进了3D传感器的发展,使3D视觉数据的获取更容易、成本更低,为AI技术提供了丰富的数据,而同时3D视觉的技术和应用升级借助于3D传感器、AI技术、3D应用三大动力互相促进。
3D传感器的工作原理与基本技术
姚剑教授简单快速介绍3D传感器的分类及其基本技术。关于3D感知技术,即一种可以通过传感器获取2D数据进行感知,也可以通过传感器直接获取3D数据进行感知。不论是通过2D数据还是3D数据感知,都可以分为主动式和被动式两种。但是通过传感器主动获得三维数据,不是像二维图象那么简单、方便,也不可能获得像二维图象那么完美的数据。
紧接着姚剑教授以LiDAR传感器为例,详细讲解了3D传感器的工作原理与基本技术。LiDAR分为单线和多线,单线最早是在机器人,尤其是现在最火的扫地机器人、AGV小车。另外一种新型的传感器,更多的是应用在教学、科研领域,但近几年有一些企业把这个传感器推向新的高潮,尤其是消费级领域。RGD的传感器是以结构光为主,以小型化为主,不断嵌入手机端。
3D中的AI技术
姚剑教授从讲述传统3D视觉方法的局限性开始,他讲道,因不同光照、不同纹理以及不同表面材质的影响,限制了三维模型重建的精度。那么AI怎么在这些领域上突破呢?首先3D数据不像那么2D数据那么好标注,AI很大程度上依赖于大数据,在2D数据里,有大量的标注数据,在3D怎么办?这里比较方便的方式是通过合成的方式来获得三维数据。深度学习以后,从2D扩展到3D,或者直接把2D的深度学习的神经网络转到3D领域。同时针对3D数据的真实性,做它自身特性的网络结构,主要分为两类,一类是和几何信息相结合,第二是可以实现端到端的学习任务。
姚剑教授认为,AI技术近年来最重要的发展就是深度学习,2010年至今,在计算机视觉三大顶会中,3D视觉相关论文占比一直不少,研究热潮数年不减,不断出现研究小热潮,不过,随着AI的发展,3D视觉研究从几何、优化的方法转向了深度学习+几何的方法。可以把3D AI分为几个类别:基于人工特征;基于多视角投影图象;基于三维体素;基于原始3D的数据。
AI如何助力技术升级呢?姚剑教授认为,第一要想办法获得数据集,有助于AI的训练。第二是充分利用深度学习的特性,尤其是在3D数据结构上的特性网络结构。
3D AI更依赖于3D应用
姚剑教授认为,3D AI更有赖于3D应用,来推动整个技术的发展。尤其是语义、机器人、图形、自然语言理解、虚拟现实等等。2D到3D的发展改变了传统行业的形态,而AI的助力进一步推动了3D技术在工业界的应用,并孵化了新兴的3D产业,娱乐、社交领域、身份认证都会看到3D的应用和背景。3D应该是未来AI里面的新秀,也是比较有潜力的方向。
3D视觉发展的趋势可以总结为四点,一是几何与学习融合,多视几何+深度学习提高三维视觉的鲁棒性;二是多传感器的融合,视觉传感器+廉价的激光+IMU性能和成本兼顾;三是与硬件结合,三维视觉的算法嵌入到硬件或芯片中;四是与具体应用结合,AGV、无人驾驶、服务机器人、AR教育、AR影音等。
“3D技术将无处不在,用颠覆性的技术,彻底改变人类的生活。尤其很重要的是5G,也许在2019年下半年会成为现实,3D借助5G的通讯,将会得到很广的应用场景。”他总结道。