OpenAI推出强化学习项目Spinning Up,为通用人工智能铺路


    近日,OpenAI宣布推出Spinning Up,一个旨在提供深度强化学习的项目。OpenAI以在虚拟环境中制作外观时髦的代理而闻名,这些代理能够学习如何独自行走,例如与华盛顿大学合作的Humanoid v2或POLO。
    强化学习涉及到在激励环境中向代理提供奖励信号,通过奖励最大化来完成预期目标。
    强化学习在重大人工智能突破中发挥了作用,如谷歌DeepMind的AlphaGo和在Dota 2等环境中接受训练的代理。
    Spinning Up包括一系列重要的强化学习研究论文,理解强化学习所必需的术语表,以及一系列用于运行练习的算法。
    该项目的推出不仅是为了帮助人们了解强化学习是如何工作的,也是为了让更多来自计算机科学领域之外的人参与进来,从而朝着OpenAI安全创建通用人工智能(AGI)的总体目标迈进。
    “解决人工智能安全问题需要具有广泛专业知识和观点的人,许多相关专业与工程或计算机科学毫无关系。尽管如此,每个参与的人都需要充分了解这项技术,以便做出明智的决定,给出Spinning Up需要的解决方案,”Spinning Up的文档文本如是说道。
    通过与OpenAI学者和研究员合作,Spinning Up可以让对人工智能有兴趣,但在这一领域没有什么经验的普通人参与进来。
    除了在实现安全部署AGI方面取得进展之外,该计划的创建是因为目前没有一本教科书能够完全供给强化学习所需的知识;这些知识目前仅存在于前沿讲座和有影响力的研究论文之中。
    “因此,我们的软件包旨在为那些对深度强化学习感兴趣,且希望学习并使用,但不清楚如何将算法转化为代码的人,提供一个中间步骤。我们试图让这成为我们这一项目的起点。”
    Spinning Up项目是OpenAI大型教育服务中的一部分。2019年2月,该机构将举办一个Spinning Up讲习班,另一个讲习班将与加州大学伯克利分校的Center for Human-Compatible AI(CHAI)共同主办。