水水团队
广告



它说,《星际争霸2》比国际象棋和其他棋盘游戏提出了更严峻的AI挑战,部分原因是对手的棋子经常被隐藏起来。 在同行评议的《自然》杂志上发表的文章使总部位于伦敦的实验室宣称拥有一个新的里程碑。 但是一些职业玩家对它声称拥有大师级身份感到status贬不一。 谷歌母公司Alphabet旗下的DeepMind表示,AlphaStar的开发将帮助其开发其他最终将使人类受益的人工智能工具。 实验室强化学习研究小组的负责人戴夫·西尔弗(Dave Silver)表示:“令我们真正兴奋的关键因素之一是,《星际争霸》提出了许多您在现实世界中实际遇到的挑战p3试机号今天晚上上p3试机号今天晚上上。” “我们将Starcraft视为了解AI科学的基准领域,并在我们寻求建立更好AI系统的过程中不断前进。” DeepMind说,有一天可能会从其新见解中受益的技术实例包括机器人,自动驾驶汽车和虚拟助手,这些都需要根据“不完全观察到的信息”做出决策。 在一对一游戏中,两名玩家在选择哪种外星人种族之后会互相竞争p3试机号今天晚上上。虫族,神族和人族这三个选项中的每个都有不同的能力p3试机号今天晚上上。 玩家只有几块棋子,必须收集各种资源-矿产和天然气-可用于建造新建筑物和创造技术。他们还可以投入时间增加工人单位的数量p3试机号今天晚上上。 玩家一次只能看到地图的一小部分,并且他们只能将游戏中的“相机”指向某个区域,如果他们的某些单位位于该区域或已经去过该区域p3试机号今天晚上上。 准备就绪后,玩家可以派出侦察队来揭示敌人的准备,或者直接前进并发起攻击p3试机号今天晚上上。 所有这些都是实时发生的,并且玩家不会轮流采取行动p3试机号今天晚上上。 随着游戏节奏的加快,游戏者通常不得不摆弄数百个单位和结构,并做出可能在几分钟后才还清的选择。 挑战的一部分是提供的大量选择。 在任何时候,都有多达100万亿亿个可能的举动,在显而易见谁压倒了别人的建筑物并获胜之前,必须做出数千种这样的选择。 DeepMind训练了三个独立的神经网络-每个用于它扮演的外星人种族p3试机号今天晚上上。 首先,它利用了星际争霸的开发商暴雪提供的大量过去游戏的数据库p3试机号今天晚上上。这被用来训练其特工模仿最强球员的举动p3试机号今天晚上上。 然后,通过称为强化学习的技术使这些特工的副本相互抵制,以磨练其技能。 他们还创建了“探索者代理人”,其作用是揭露主要代理人策略中的弱点,以便他们找到纠正它们的方法p3试机号今天晚上上。 希尔弗教授将这些附属代理人比作“散布合伙人”,并说他们迫使主要代理人采取了比其他情况更为有效的策略。 这一切历时44天p3试机号今天晚上上。但是由于该过程是高速进行的,因此代表了大约200年的人类玩法p3试机号今天晚上上。 然后将由此产生的三个神经网络与暴雪的Battle.net平台上的人类玩家进行对抗,直到每次游戏之后他们的身份都不会被透露出来,以查看他们是否会胜利p3试机号今天晚上上。 实验室说,它的神经网络在三个外星种族中都获得了大师级的地位-这是世界上每个地区的顶级选手的排名。 但它承认仍有50到100人仍然在Battle.net上胜过AlphaStarp3试机号今天晚上上。 DeepMind承诺永远不开发致命的自动武器技术。希尔弗教授说,《星际争霸2》的工作并没有改变。 他说:“说这有任何军事用途,无非是说可以使用国际象棋的AI来进行军事应用。” “我们的目标是尝试建立通用情报[但是]社区必须回答更深层次的道德问题。” 值得注意的是,在DeepMind在2016年击败韩国顶级围棋选手之后,中国军方发表了一份文件,称这项成就突出了“人工智能在战斗指挥中的巨大潜力”。 北京随后宣布了其到2030年超越美国并成为人工智能领域世界领导者的意图。 Raza“ RazerBlader” Sekha是英国前三名《星际争霸2》职业玩家之一。他在与AlphaStar的比赛中担任人族,还与其他人一起观看了比赛p3试机号今天晚上上。 他说,神经网络“令人印象深刻”,但暗示它仍然存在怪癖。 他回忆说:“曾经有一场比赛,有人去了一个非常奇怪的(军)组成,完全由空中部队组成,而AlphaStar并不真正知道该如何应对。” “它没有适应比赛,最终输了。 “这很有趣,因为优秀的球员往往会打出更多的标准风格,而较弱的球员往往会打怪p3试机号今天晚上上。” 约书亚“ RiSky”海沃德是英国的顶级球员。 他没有参加AlphaStar比赛,但研究过以Zerg身份参加的比赛p3试机号今天晚上上。他认为对于大师而言,它的行为是非典型的p3试机号今天晚上上。 他评论说:“它通常没有做出最有效的战略决策,但是它很好地执行了战略并一次完成了很多事情,因此仍然达到了一个不错的水平。 “当人工智能比国际象棋更好时,它会做出异常的动作,最终比人类的动作更强大。我觉得DeepMind需要更多的时间来进行自己的创新,如果该项目能够使人失望,不会继续。” 当他们仅依靠强化学习时,实验室的国际象棋,围棋和将棋游戏代理商的“零”版本确实表现更好p3试机号今天晚上上。 但DeepMind表示,至少在这一点上,《星际争霸2》太复杂了,无法实现p3试机号今天晚上上。 希尔弗教授说,在没有任何指导的情况下发现新策略将是“大海捞针的针脚”,代理商需要偶然采取一系列步骤以取得有益的结果p3试机号今天晚上上。 他解释说:“您必须做很多不可能的事情,而从您所在的位置来看,每一项反过来都看起来真的很糟糕。” “我们称这是勘探问题。 “关于如何做像AlphaStar Zero这样的事情,仍然存在一个开放的研究问题,而无需借助人工数据就可以完全自学p3试机号今天晚上上。” DeepMind表示,希望用于开发AlphaStar的技术将最终帮助其“推动我们在现实世界中的研究”。 但是希尔弗教授说,实验室“可能会在这一点上休息”,而不是试图使AlphaStar达到非常精英的水平p3试机号今天晚上上p3试机号今天晚上上。

发布日期:2019-10-31 05:45:16

Currys PC World客户通过eBay诈骗

Netflix以提速功能激怒电影制片人

乔治亚州受到大规模网络攻击的打击

'进行或中断' 5G的时刻

为什么密码不起作用,什么会取代它们

建造飞行电动出租车的竞赛

为什么中国主导印度的智能手机市场

解决沉默的海洋杀手

' Instagramable' 南瓜片越来越受欢迎

社交媒体选举广告的前24小时