DeepMind 为 AI 打造出一个「元宇宙」,XLand 到底有多牛?

人工智能
2021
08/07
00:25
锌财经
分享
评论

文丨锌财经,作者丨陈伊婷,编辑丨大风

DeepMind 推出最新泛用型游戏 XLand,冷不丁丢出一个重磅炸弹。这意味着,在零样本且不需要事先知道规则的情况下,就可以打造出一个全新的、堪比 AlphaGo 的人工智能。

一直以来,AI 强化学习苦于泛化能力差,只能针对单个任务来从头开始学习。

5 年前,AlphaGo 打败世界围棋冠军李世石,举世惊呼。自 AlphaGo 之后,Deepmind 又推出能通学西洋棋、将棋、围棋的 AlphaZero。

AlphaZero 非常强大,在三大棋领域中「打遍天下无敌手」。但问题在于,AlphaZero 若想能够在不同游戏中「称霸天下」,还得在每个游戏「从零训练」后才能够实现。

XLand 的出现则弥补了这个缺陷。如果说 AlphaZero 是「下棋的手」,那么 XLand 则创造出了「一个人」。

它的强大之处,在于它高度泛化的能力。简单的说就是触类旁通,好比人类学会用筷子夹米饭,就能学会用筷子夹菜。而 DeepMind 打造 XLand 的目的,则是为了让自家通过强化学习训练的 AI,能够玩遍「全宇宙的游戏」。

这个世界的任务由游戏、世界、玩家构成。根据三要素的不同关系,来决定任务的复杂度。复杂度则由竞争性,平衡性,可选项,探索难度这 4 个维度评判。

从简单到复杂的游戏,AI 智能体通过第一人称视角去感知游戏中环境,并且不断尝试、碰撞游戏规则,从中累积庞大数据来训练自己完成游戏目标。

简单的比如「靠近紫色立方体」,复杂一点的比如「靠近紫色立方体或将黄色球体放在红色地板上」。长此以往,AI 智能体从新手小白成长为屠龙勇士,吃鸡、捉迷藏都难不倒它们。

基于此,一个由任务空间组成的、超大规模的「元宇宙」XLand 就诞生了,几何地球只是其中的一个小角落。我们或许可以提出这样一个设想,人类是外星人创造的 AI,而地球是外星人创造的 XLand。

经过 5 代训练,AI 智能体在 XLand 的 4000 个独立世界中玩大约 70 万个独立游戏,涉及 340 万个独立任务的结果,最后一代的每个智能体都经历了 2000 亿次训练步骤。

目前,AI 智能体已经能够顺利参与几乎每个评估任务,除了少数连人类也无法完成的任务。

从 AlphaGo 走到现在 XLand,DeepMind 展示了无监督式机器学习的高度潜力,也向世界证明未来训练 AI 的成本跟门槛将会越来越低,直至普及全球。

未来的某一天,当 AI 也能够在「元宇宙」中自己学习演化,赛博朋克的世界是否会真的到来?

THE END
广告、内容合作请点击这里 寻求合作
AI
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

1月12日消息,据国外媒体报道,三星公司正在研发一种机器人,它可以取洗好的衣服、放洗碗机、摆桌子、倒酒,甚至还可以给你拿饮料。这个机器人叫做Bot Handy,三星表示它能够通过摄像头和人工智能识别物体...
业界
12月10日,当地时间周三,谷歌首席执行官桑德尔·皮查伊(Sundar Pichai)就公司人工智能研究员蒂姆尼特·格布鲁(Timnit Gebru)的离职风波一事公开向员工道歉,并对公司如何处理格布鲁的离职展开全面调查...
业界
人工智能机器学习领域里的科学家们表示将拒绝帮谷歌审核论文,直到谷歌改变对前AI伦理团队联合负责人Timnit Gebru的立场。
业界
9月25日,华为在全联接大会上发布了一站式AI开发平台ModelArts3.0和多样性计算系列开发套件,云与计算开发者已达180万。
业界
8月11日消息,在中国内地,智能电话营销机器人(或称人工智能电话助理)正给电话营销领域注入新的活力。
业界

相关推荐

1
3
Baidu
map