DeepMind公布星际争霸2结果:AlphaStar 以10:1战胜职业高手

AI锐见

    北京时间 1 月 25 日凌晨 2:00 ,DeepMind公布了其录制的 AI 在《星际争霸 2》中与2位职业选手的比赛过程:AlphaStar 5:0 战胜职业选手TLO ,5:0战胜 2018 年 WSC 奥斯汀站亚军 MaNa 。
    
    除了此前比赛录像的展示外,AlphaStar 还和MaNa 现场来了一局,不过,这局AlphaStar 输给了人类选手MaNa 。
    DeepMind的研究联合负责人David Silver在赛后表示,“人工智能的历史被打上了许多重大的标杆性胜利的印记。我希望,未来的人们可能会回顾今天,或许会认为这是人工智能系统所能做的又向前迈进了一步。”
    像星际争霸2这样的游戏比像国际象棋或围棋这样的棋盘游戏更难玩。在电子游戏中,人工智能无法通过观察每一块棋子的移动来计算下一步棋,它们必须实时做出反应。
    
    专业人士和AlphaStar使用稍微过时的星际争霸II版本在地图Catalyst上玩游戏,该版本旨在实现人工智能研究。虽然TLO在流媒体中表示他有信心能够成为AI代理人的首选,但AlphaStar却成功赢得了所有五场比赛,每次都发布了完全独特的策略。
    AlphaStar在对抗TLO方面有一些优势。首先,这场比赛使用了Protoss级别的单位,这不是TLO在游戏中的首选种族。此外,AlphaStar以与普通玩家不同的方式看待游戏。虽然它仍然受到战争迷雾的限制,但它基本上看到地图完全缩小了。这意味着它可以处理有关可见敌方单位及其自身基础的一些信息,而不必像人类玩家一样将时间分配到地图的不同部分。
    
    DeepMind决定让AlphaStar对抗Protoss专家,DeepMind选择了两次主要的星际争霸II锦标赛冠军MaNa。AlphaStar在比赛前获得了另一周的训练,包括在TLO中接受职业级别球员所获得的知识。评论员们指出,人工智能在比赛中发挥得更像人类,在调整决策和风格的同时放弃了一些更不稳定和意想不到的行动。
    就像他之前的TLO一样,MaNa表现出英勇的努力,但在每场比赛中都与AlphaStar特工不相上下。人工智能再次赢得所有五场比赛,对阵其人类对手,在与职业选手的前10场比赛中以10比0结束。
    虽然AlphaStar的直接专业水平和无与伦比的学习速度对于任何一个星际争霸专业人士来说都是坏消息,但游戏玩家可能从人工智能及其200年累积的游戏知识中获取一些有用的策略。