FACEBOOK/谷歌/微美全息等AI深度学习+AR技术助力交互显示扩展应用场景
通过 AR 的方式,人们可以更好的理解数物互联带来的价值,这种价值有很多可以想象的空间,比如说预测性的维护,远程服务、远程诊断,包括基于云的众包产品研发体系等等。一旦把数字和物理世界打通,就会产生越来越新的应用场景。
尽管AR技术刚刚起步,但已有迹象表明其将成为主流,AR将深刻影响每个行业的企业,在未来几年,AR将改变我们学习、决策和与物理世界进行互动的方式。那么AR到底有什么用呢?说到这里就不得不提到,与AR一起近年来一起大火的人工智能。
所谓VR(虚拟现实),简单来讲就是身临其境,把自己置身到另外一个虚拟的三维空间内,看到的场景虽然可能真实存在于另外一个空间,但眼前所见的都是假的。而AR(增强现实)则是真真假假,将真实的环境和虚拟的物体实时地叠加到同一个画面或空间同时存在。
有数据显示,到2020年的时候整个AR和VR的整个市场将会达到1500亿,但是在整个市场里面AR,增强现实的市场是有1200亿,VR的市场是300亿,AR市场将是VR市场的4倍。
AR因其更强的实用性和广泛的应用性得到各领域用户的关注。事实上,AR技术正在逐渐渗入到智慧城市建设中的方方面面,在智慧城市的智能交通、智能教育、智能医疗、智能家居、智能旅游等诸多领域都实现着广泛的应用,对推动以人为本、智慧参与的智慧城市建设起着重要的作用。看AR技术如何助力智慧城市的发展。
深度学习是机器学习的一个子类,即软件试图模仿大脑中用于模式识别的部分,它已经对整个技术行业产生了巨大的影响,而这是推动AR行业向前发展的一个关键因素。计算机以人类无法模仿的速度执行任务,但计算机处理和排序信息的方式永远无法与人类相匹配。在AR领域,深度学习正被用于解决基于摄像机追踪的检测问题。这一点很重要,因为将来消费者会在智能手机以外的设备上追踪摄像头。由于增强对象是在不同的观看条件下呈现的,包括不同的方向、规模以及光线条件,因此需要深度学习工具包在多个制造商的传感器之间进行无缝整合。
深度学习是培养实时图像识别和追踪增强对象的关键,并为它们提供了真实的位置数据和特征。深度学习的潜在用途远远超过3D建模,后者是在智能手机屏幕上叠加虚拟数据,就像我们在Pokémon Go中所看到的场景。深度学习成为主流的原因在于SLAM(同步定位和绘图),它来自高层次的概述,被认为是为苹果ARKit提供动力的主要技术。具体来说,VIO(视觉惯性测量)就是个简单的SLAM系统,它让ARKit的功能更加精确。SLAM使用计算机视觉来创建一个空间的数字轮廓,并追踪与物体相关的手机位置。随着处理技术变得越来越便宜,摩尔定律将会继续生效,SLAM的能力也会随之提高。但秘诀在于软件开发。在这方面,领先的公司专注于加速性能。
要成为一个世界级的AI力量,需要具备三点:最先进的算法、专用的计算硬件,以及机器学习系统所依赖的原材料——数据的大量供应。人工智能、机器学习、深度学习、自然言处理等先进技术带来的产业革命和生产力的充分释放,经过多年的创新发展,人工智能让智能设备逐步实现从认识物理世界到个性化场景落地的跨越。
在构成人工智能行业主体的三类企业中,算法企业是推动核心底层技术发展的重要力量,其重要意义在于以算法突破工业界红线,推动其真正达到工业界应用的KPI。这类企业实际上是推动当前人工智能核心底层技术发展的根本力量。从国外的巨头微软、谷歌、FACEBOOK等无不一一深耕超算,国内的微美全息等科技企业也涌上潮头,将超算能力和场景落地结合前行。
Facebook的一项类似研究就在CVPR公布。据了解,该研究的特点是将对象(主要以人为主)叠加到现有的图片中,并且让他们通过更逼真的视角和方式融合,看上去更自然。
虽然目前各种基于神经网络模型的人像生成工具,一种是在给定条件下生成图像,另一种是让算法从零开始,自由发挥生成一个高清且逼真的人像。Facebook表示,在两者之中似乎还存在一个新的应用,那就是将给定图像中的人像嵌入到包含其它人像的图像中。
这个过程,需要生成一幅人像并嵌入到现有包含其它人像的照片中,而这个生成的人像在的质量和原有图像差别并不明显,无论是清晰度和细节。而其中的几个关键在于:人脸、衣服、头发。
据了解,Facebook通过三个GAN完成整个过程:
第一个GAN基于现有被嵌入图像中的人物之间以及人物与背景的上下文关系,并生成一副目标的人体姿势;第二个GAN呈现出新的人物细节,包括脸部细节;第三个GAN对生成图像的面部细节进行增强,保证人脸部分看上去足够逼真。经过测验,Facebook表示第一步生成的虚拟人物姿势和大多数自然的任务姿态几乎相同,但是人物与人物之间的互动仍然是一个挑战。
而该研究的应用,可以融入未来的AR/VR社交(远程社交),或者其他AR衍生应用等场景。
1 2 下一页>