DeepMind人工智能学会将平面图像转换为3D场景

2024.06.30 极智能

据外媒报道，谷歌母公司Alphabet旗下DeepMind最近开发了一种人工智能技术，它可以在观察2D平面图像之后以3D渲染整个场景。目前一些人工智能研究人员正在试图教机器学习像人类一样。我们不是以像素为单位看世界，而是环顾我们的环境并对其中的一切进行假设。

DeepMind团队则训练了一个人工智能如何从其未见的角度猜测事物的样子。 DeepMind的科学家提出了一个生成查询网络（Generative Query Network，GQN），这是一个神经网络，旨在教人工智能如何从不同的角度想象物体的场景会是什么样子。基本上，人工智能观察场景的2D平面图像，然后尝试重新创建它。在这种情况下，重要的是DeepMind的人工智能不使用任何人为标记的输入等。它只观察三幅图像，并开始预测场景的3D版本是什么样子。
研究人员正在努力实现“完全无监督的场景理解”。目前人工智能尚未接受真实世界的图像训练，因此下一步将从照片中渲染逼真的场景。未来，DeepMind基于GQN的人工智能可能只使用照片就可以生成与现实世界几乎完全相同的按需3D场景。