教AI玩《我的世界》,Facebook意图打造能自我学习的多任务AI系统
从玩游戏到人脸识别,机器智能在一系列任务上的表现都超过了人类。
但令人尴尬的事实是,AI系统仍然无法处理多项任务。AI研究人员的下一个大目标是开发一个能很好地完成很多任务的系统,而不是只擅长一项任务的超级人类。
Facebook Research的Arthur Szlam和同事们进入了这一领域,他们已经开始研究的AI助理能够和人类互动,然后根据请求执行各种任务。至关重要的是,这些助理可以从互动中学习,从而增加其执行任务的范围。
Szlam及其同事选择通过《我的世界》来实现这一目标。这是一款3D沙盒视频游戏,允许玩家在一个独特的、无限的在线世界中探索、构建、制作甚至战斗。
《我的世界》是有史以来最畅销的电子游戏,已售出超过1.7亿份。每月有超过9000万人在参与这个游戏。
但让它对AI研究有用的是,尽管《我的世界》提供了无限的多样性,但它的规则也很简单,在一定范围内是可预测的。AI研究人员已经开始使用它来训练和测试各种AI系统。
现在,Szlam和他的同事正在更进一步发展。他们表示:“我们感兴趣的不是在单个困难任务上的超人表现,而是在大量更简单任务上的能力,而这些任务是由人类指定的。”
《我的世界》是AI向人类学习的完美环境。他们说道:“由于我们是在游戏环境中工作的,玩家可能喜欢在开发过程中与助手进行互动,这为人类参与到的环形研究提供了丰富的资源。”
乍一看,《我的世界》中可能出现的行动数量是巨大的。Szlam和同事表示:“一个玩家在游戏中可能做的事情是非常多的;最天真的是,涉及所有区块的可行方法需要占据所有的内存。”
但《我的世界》中的绝大多数区块布置都是不太可能的。他们表示:“我们预计,助理玩家请求的布置将集中在游戏中实际可能的一小部分。”
这使得AI的任务变得简单得多。Facebook团队认为,即使他们的AI系统在很多任务上失败了,它仍然是有用的。他们表示:“我们相信,我们可以在成为一名有用的助理方面取得进展,而不必能够成功应对每一个可能的请求。”
但这仍然具有挑战性。困难之一是理解普通语言。Facebook团队设想了以下要求:
玩家:建造一座15个区块高的塔楼,然后在上面放上一个巨大的笑脸。
助理:好的。
这个相对简单的要求需要大量的知识。助理必须理解“塔”的概念和如何建造一座塔,知道“15个区块高”是测量塔的高度,知道“15”是什么。它还需要理解“笑脸”这个词,以及如何构建它,并知道将它放在“顶部”意味着什么。不难想象这些请求会变得多么复杂。
但AI学习的机会是巨大的。如果Facebook能够获得足够多的人类帮助,那么这个助理就可以要求人类帮助它学习。
而Facebook正在把设计AI的任务设定为自我完善。对AI系统最常见的批评之一是,它们除了接受过收集准备好的数据所提供的训练外,没有学到新的任务。但研究者认为,《我的世界》环境是发展这种学习的理想环境。
这是一项有趣的工作,为Facebook制定了一个雄心勃勃的目标。当然,现在还为时尚早。该团队将这项工作描述为“战斗的召唤”。
不过,该助理的早期版本已经可供普通用户开始试用,任何人都可以下载。