游戏中需要AI来操控角色与玩家配合、交互,而AI的智能程度也对游戏体验有很大影响。为了研究AI的行为以及学习能力,国外OpenAI小组利用捉迷藏游戏对AI进行了训练,一起来看看吧~
这是个很简单的捉迷藏游戏,其中蓝色小人儿负责躲藏,而红色小人儿则负责捉捕。所有小人儿都由AI操控,不过他们一开始并没有任何既定的行为程序,而是要靠反复游玩来学习如何捉迷藏。
起初,所有小人儿除了四处随机走动什么都不会,因此蓝队很快就会全部被捉;之后他们渐渐学会了逃跑、利用工具阻挡通道;而红队在被方块堵在门外后,渐渐学会了挪用斜坡翻墙;之后蓝队又学会了先把斜坡搬到屋内再堵门,甚至还能互相配合。这些行为都是AI通过实践自主学会的,完全没有人为干涉。
蓝色小人儿学会了利用方块堵门
红色小人儿学会了利用斜坡翻墙
蓝色小人儿将斜坡提前拉到屋内
除了上述封闭式场景外,OpenAI也尝试了更大的更开放空间下的捉迷藏,结果发生了令人意想不到的事:虽然蓝队提前将斜坡方块锁死了无法移动,但红队却能将其它方块推到斜坡旁、爬到方块上去,再通过摩擦直接移动脚下的方块,这样就能捉到蓝队了。
红方通过摩擦移动脚下方块
虽然演示中的这些行为都比较简单,不过确实很有意思。而OpenAI官方表示:所有这些小人儿都是独立的,只能通过自己的观察来认识世界,视野外的物体对他们来说都是不可见的,这很好地模拟了现实场景。所有复杂的策略都需要小人儿自行学习。
小人儿学会了搭建小屋躲避追踪
除了捉迷藏游戏,OpenAI官方还进行了另一种模式的训练,该模式没有目的可自由探索,不过系统会鼓励小人儿与物体交互。这种模式下小人儿的行为则无迹可寻,根本看不出小人儿要做什么。因此OpenAI认为像捉迷藏那样的多角色竞争模式更利于训练人工智能形成类人行为。
小人儿需进行成千上万次训练,不断进化、学习
最后OpenAI表示,这种多角色互动、不断适应型训练模式可能在未来打造出更加复杂、更加聪明的人工智能。