谷歌姊妹公司机器人击败《星际争霸2》九成多人
2020-04-30 13:52

  在本周发表在《自然》杂志上的经同行评审的论文中,DeepMind的研究人员写道,“阿尔发星在《星际争霸2》中的成功,表明通用机器学习算法可能对复杂的现实世界问题非常有效。”

  新京报讯(记者 梁辰)北京时间10月31日,Alphabet旗下人工智能研究机构DeepMind宣布人工智能再度取得突破。其研发的“AlphaStar(以下简称‘阿尔发星’)”机器人达到了《星际争霸2》所有三个种族都达到了最高的“宗师”级别,排名高于99.8%的人类玩家。而且,阿尔发星的对手并没有感到自己在和机器对战。

  在本周发表在《自然》杂志上的经同行评审的论文中,DeepMind的研究人员写道,“阿尔发星在《星际争霸2》中的成功,表明通用机器学习算法可能对复杂的现实世界问题非常有效。”

  DeepMind和谷歌目前同属于Alphabet旗下,其总部位于英国伦敦。2014年,谷歌以4英镑收购了DeepMind,并在此后追加了超过十亿美元的投资。该公司首席研究科学家David Silver表示,这项突破意味着其通过了星际争霸的图灵测试。图灵测试是被广泛用于测试机器是否表现出类似人类智能的标准。

  继围棋等棋牌类运动之后,电子实时战略游戏《星际争霸》成为近年来人工智能的绝佳训练场。《星际争霸2》是暴雪在2012年推出的一款即时战略游戏,因丰富的多层次游戏机制长盛不衰。这个游戏的特点是需要玩家合理配置资源和排兵布阵,并对对手作战战术即时反应,以及制定较为长期的战略规划。

  一位专业玩家Dario “TLO” Wish表示,阿尔发星的游戏玩法令人印象深刻,非常擅长评估其战略地位,并确切知道何时与对手交战。不过,阿尔发星虽然具有出色且精准的控制,但并没有超越人类的认知水平。

  与围棋等项目的确定性不同,《星际争霸》的玩家对对手的操作信息并不完全掌握。也正因为此,这项突破令阿尔发星的成果将可应用于更广泛的场景。DeepMind研究科学家、前《星际争霸》冠军玩家Oriol Vinyals参与了这个项目,他认为,阿尔发星学到的经验可以用于天气预报、语言理解、私人助理或自动驾驶。

  事实上,阿尔发星在2019年初曾与人类职业玩家对决。为了进一步提高水平,DeepMind与暴雪合作,在战网天梯中开放了阿尔发星,玩家只需要申请通过就可以与人工智能在线对战。一方面,阿尔发星利用数据进行监督学习,另一方面为了加快计算速度,使用了谷歌专门用于人工智能的处理器TPU开发的一个分布式训练系统。

  除了进行游戏比赛外,DeepMind正在参与Alphabet内部数十个项目,包括自动驾驶部门Waymo以及提高数据中心效率。根据其提交的文件显示,2018年税前亏损进一步扩大,从2017年的3.41亿美元增长至5.7亿美元,而亏损的原因是其继续聘用数百名昂贵的研究人员和数据科学家,但没有产生任何重大收入。

  不过,由于出售部分软件给谷歌,DeepMind在2018年的营业额翻了一番,从2017年的5800万美元增长至1.25亿美元。该公司发言人曾对媒体表示,其长期任务是推进人工智能研究,其将继续投资基础研究和跨学科团队。