谷歌新AI在《星际争霸2》首秀:10比1大胜职业选手

业界
2019
01/25
09:09
新浪科技
分享
评论

北京时间1月25日早间消息,今日凌晨,DeepMind与暴雪进行了联合直播,在直播中公布了谷歌最新AI程序AlphaStar与《星际争霸2》职业选手此前的比赛结果,名为“AlphaStar”的人工智能在与两位人类职业选手“TLO”和“MANA”的比赛中,均以5比0取胜。

最后直播的一场比赛中,DeepMind限制了AlphaStar的游戏视角,并在没有测试的前提下与MANA进行比赛,让人类终于赢了一场。最终总成绩定格在10-1。

这次比赛是在去年12月进行的。在与TLO的对决中,因为目前AlphaStar的训练只针对神族,所以它选择的是虫族,而TLO只能选择神族。TLO在5次对决中竭尽全力,可惜还是完败给AlphaStar。

AlphaStar 5-0 TLOAlphaStar 5-0 TLO

接下来,另一个AlphaStar代理挑战神族玩家MANA。在一些对决中,双方旗鼓相当,但是AlphaStar还是5战全胜,零封MANA。

AlphaStar 5-0 MANAAlphaStar 5-0 MANA

而在最后直播的一场比赛中,MANA再次与新的AlphaStar代理对决,这次MANA终于赢了一场。DeepMind限制了AlphaStar的游戏视角,并在没有测试的前提下与MANA进行比赛,因此让人类终于赢了一场。最终总成绩定格在10-1。

在对战中,AlphaStar展示了惊人的微操技艺。它可以让受伤单元快速后撤,让满血单元前移。不只如此,AlphaStar还通过前进来控制战斗节奏,只有在适当的时候才后退,避免造成过大伤害。美国科技网站ExtremeTech指出,AI之所以能做到这一点,靠的不是高APM(手速),事实上,与人类相比,AlphStar的APM低很多,只是AI的决策更明智。

AlphaStar和职业选手APM比较AlphaStar和职业选手APM比较

AI制定的一些战略决策相当有趣。例如,AI经常命令部队在坡道上冲锋,这样做很危险,因为向上冲时视野受限,不过AI的做法似乎很管用。还有,AlphaStar会用一堆建筑封住坡道,这种策略人类也经常使用,非常实用,AI会用这种方法保护自己的基地。

直到最后的直播比赛,人类才找到代理的一个缺陷。当时,AlphaStar代理调集几乎所有部队攻打MANA的基地,MANA将几个战斗单元传送到AlphaStar基地的后方,每次传送之后,AlphaStar都会让军队回头营救,这样MANA就有了足够的时间扩张部队,反击AI。

最终,AlphaStar赢了职业玩家10次,只输了1次。ExtremeTech认为,如果AlphaStar能从最后一局中汲取教训,下一次将会无敌。

AlphaGo的首席作者大卫席尔瓦(Dave Sliver)同时也是AlphaStar团队的核心人物,在直播中分享了AlphaStar技术上的一些细节。不过直播中并未公布AlphaStar后续的正式比赛计划。

AlphaStar是一种卷积神经网络。研发团队用职业玩家的录像训练网络,然后借助对战模式,研究人员训练AlphaStar,教它如何打败人类。

随着时间的推移,研究人员挑选出5个最好的“代理”,让它们与世界上了些最棒的《星际争霸2》玩家对决。这样训练出来的AlphaStar积累了相当于200多年的实践经验。

11月份,在Blizzcon大会上,DeepMind就曾表示,机器学习算法在游戏进行到大约一半时,就击败了疯狂难度的游戏内置AI工具。

ExtremeTech指出,人类一直认为,对于我们自己创造的游戏,人类才是真正的主宰,不过计算机一次又一次证明,它才是高手。谷歌DeepMind开发的算法已经在围棋上击败人类,现在又在《星际争霸2》获得成功。(星海)

【来源:新浪科技

THE END
广告、内容合作请点击这里 寻求合作
谷歌 《星际争霸2》 AI
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

最新文章

相关推荐

1
3
Baidu
map