1:10！《星际争霸2》沦陷人类被AI血洗

2024.06.19

    1997年，“深蓝”在国际象棋上击败人类冠军卡斯帕罗夫的时候，人们说来一盘围棋啊，结果有了AlphaGo横扫人类顶尖高手李世石、柯洁。这时候，有人说来一盘“星际”啊……
    结果，还不到三年，《星际争霸2》又被AI拿下，而且人类输得几乎体无完肤！
    北京时间1月25日凌晨，Google DeepMind的最新AI人工智能程序“AlphaStar”以两个5：0连续血洗《星际争霸2》职业选手TLO、MaNa，只是在随后的一场表现赛中输给了MaNa。
    其中，TLO是Liquid战队的虫族选手，目前世界排名第68，MaNa则是2018年WSC大赛的奥斯汀站亚军，神族选手，世界排名第19。
    这次是AlphaStar首次公开亮相，比赛用的游戏版本是4．6．2，只进行神族内战，固定在Catalyst LE地图。
    尤其令人称奇的是，AlphaStar与两位人类对手的比赛相隔只有两周，就迅速自学成才，对战TLO时虽然完胜但表现还相当菜鸟，而对战MaNa的时候已经有了几乎的完美，非人类的操作让人猝不及防。
    DeepMind科学家Oriol Vinyals、David Silver介绍说，AlphaStar的训练首先是模仿学习，训练大量的比赛回放资料，让AI通过观察一个人所处的环境，尽可能地模仿某个特定的动作，从而理解游戏基本知识。
    然后使用“Alpha League”循环比赛方法，先对比从人类数据中训练出来的神经网络，然后逐次迭代，产生新的Agent和分支，使其发展壮大。
    接下来，这些Agent通过强化学习过程与Alpha League中的其他竞争对手进行比赛，尽可能有效地击败所有这些不同的策略，并调整个人学习目标，鼓励竞争对手朝特定方式演进，比如说获得特定奖励。
    最后在Alpha League中选择最不容易被利用的Agent，称之为“The nash of League”，去挑战人类。
    至于为何选择《星际争霸2》，主要是因为这款游戏具备策略性、竞争性的特性，需要即时做出大量决策，是非常有趣和复杂的游戏，在全球都很火爆，每年都有大量的比赛，有着海量的玩家基础。