《我的世界》视频游戏非常受儿童欢迎,现在它的一个版本被用于验证人工智能项目。
图片来源:Matthew Tostevin/Reuters
在开始用视频游戏《我的世界》做研究之前,José Hernández-Orallo就对它非常熟悉。这位来自西班牙瓦伦西亚理工大学的计算机学家曾设计了机器智能的基准,他第一次看到自己的孩子在三维虚拟世界里玩游戏,该游戏聚焦解决问题,而非打怪兽。
2014年,微软收购了《我的世界》,其科学部门微软研究让科学家可以获取该游戏的新版本,从而让计算机软件以及人们可以探索和定制三维环境。随后,微软邀请了包括Hernández-Orallo在内的一些外部研究人员下载这个游戏世界的机器识别版本。2015年7月,微软将游戏向所有人免费开放,目标是加速人工智能的进展。
现在,其他的公司也在跟着做。2016年12月5日,美国谷歌公司位于英国伦敦的深层思维开辟了自己的三维虚拟世界——深层思维实验室,供外部开发商下载和定制。该公司最初设计的这个虚拟世界旨在训练其人工智能程序。两天后,旧金山一家科研公司OpenAI也公布了一个“元平台”,使人工智能软件可以更容易地与数十个三维游戏互动,这些游戏最初的使用对象是公众以及一些网页浏览器和智能手机应用程序,企业家Elon Musk是该公司联合创始人之一。
三家公司均以前所未有的方式向研究人员和软件开发商提供更方便的程序测试方法,并通过教授他们在类似真实世界的新情况下驾驶使程序获得新技能。“类似这样的环境在未来的人工智能中有着极为重要的作用。”西雅图华盛顿大学机器学习研究专家Pedro Domingos说。
数十年来,游戏一直是人工智能的试验台,但其典型特征是,相关算式跟随预先设定的策略在运算。近年来,注意焦点转向让机器根据其自身经验来学习。2015年初,深度思维揭示了一种算法,该算法可以自学如何将经典的雅达利街机游戏玩得比人类更好,其方法是通过试错,而不是被告之游戏的目标。
不过,类似的游戏是简单的二维世界。而类似“第一人称”《我的世界》的三维视频游戏可以将玩家嵌入一个虚拟环境中,从而与真实世界更加接近,并形成更加复杂的试验台。
除了操纵以及与预先设定的结构进行交互之外,《我的世界》的用户可以使用虚拟砖块建造特定的结构。现在,软件开发商可以获得的版本叫作Malmo,它可以让算式做同样的事情。例如,Hernández-Orallo正在用它探索环境是否可以用来创建机器智能的基准。算式可以排列砖块使其看起来像一个特定的物体,或者可以在迷宫中导航,从而可以比图灵机验证更广泛的技能。图灵机是机器智能最著名的测试,聚焦人工智能像人类一样的聊天能力。
《我的世界》对人工智能试验台产生如此大吸引力的一个因素是,它已经能够让玩家用输入信息的方式交流。这有助于人工智能学习在真实世界中与人合作,英国剑桥微软研究计算机学家Katja Hofmann说,正是他带领的团队建立了Malmo。
虚拟世界对于开发旨在最终像物理机器人一样操作的人工智能尤其有用,Hofmann说,因为定制这样的环境价格更加低廉,而且在真实世界中也更快、更安全。它们还能让机器研究者单纯地关注这个方程式中的智能部分,而物理机器人的机械挑战可能会分散注意力。
除了Hernández-Orallo之外,微软还与一系列正在使用Malmo的研究实验室合作。但Hofmann推测,还有FC碰碰胡老虎机法典-提高赢钱机率的下注技巧用户在使用它,用户可能在100家左右。
深度思维实验室同样让研究人员创建类似迷宫的结构,它们的算式可以学习收集奖励以及驾驶。深度思维还在尝试整合“FC碰碰胡老虎机法典-提高赢钱机率的下注技巧的自然元素”,如将地形和植物融入平台,该机构一名女发言人称。现在,这个环境是开放的,该公司希望其他研究人员可以让环境对算式产生更大挑战。“通过开源,我们让更广泛的研究界参与到环境塑造中来。”她说。
OpenAI的变化平台被命名为“宇宙”,它将相关实验进一步向前推进。通过为同样的人工智能提供多种完全不同的环境并进行抽样,它有助攻克该领域最艰巨的一个问题:面临新情况时创建能够使用早先经验的算式。例如,深部神经网络模仿了视觉皮层中的脑细胞层,可以很快地学习三维迷宫导航,但它却不能将知识转而用于导航其他迷宫。“如果改变了迷宫的颜色,这个系统就会迷失。”Hernández-Orallo说,“最先进的技术就会完全失败。”
微软正在让Malmo可在“宇宙”上获得。“如果有一个社区平台,将会加速每个成员的发展。”OpenAI创始人之一和首席技术官Greg Brockman说。(晋楠编译)
《中国科学报》 (2017-01-04 第3版 国际)