数十年的Ascii冒险Nethack可能会在AI的未来提示

2021-06-10 04:21:47

“我们希望通过这场比赛构建我们认为最可达的”大挑战“。它不会解决AI,但它将解锁更好的AI的途径,“Facebook AI Research的Edward Grefenstette说。 “游戏是一个很好的域名,找到我们对制作机器智能和打破它们的原因的假设。”

您可能不熟悉内人,但它是有史以来最具影响力的游戏之一。你是一个幻想世界的冒险家,通过每次不同的地牢的日益危险的深处。你必须战斗怪物,导航陷阱和其他危险,同时与你的上帝保持良好的术语。这是第一个“Roguekike”(在流氓,即时和更简单的前任之后),可以说是最好的 - 几乎是最难的。

(顺便说一句,您可以在几乎任何平台上下载并播放它。)

它的简单ASCII图形,使用g for goblin,@播放器,线条和点为级别的架构,等等,Belie它令人难以置信的复杂性。由于Nethack在1987年首次亮相,因此有史以来一直在积极发展,自成交开发人员队伍扩大了其对象和生物,规则和无数,无数的互动的名单。

这是为艾迪难以为期难点和有趣的挑战是什么的一部分:它是如此开放的。世界不仅每次都不同,而且每个对象和生物都可以以新的方式互动,大多数人手法编码几十年来覆盖每个可能的玩家选择。

“Atari,Dota 2,星际争霸2 ...我们必须进行进步的解决方案非常有趣。内人们只是呈现出不同的挑战。你必须依靠人类知识来玩游戏作为人类,“格雷芬斯特德特斯说。

在这些其他游戏中,赢得了更多或更少的明显策略。当然它在像Dota 2这样的游戏中比在Atari 800游戏中更复杂,但这个想法是相同的 - 玩家控制,环境比赛和赢得追求条件的碎片。那种案子在内人身上,但它比这更令人震惊。对于一件事,游戏每次都不同,而不仅仅是细节。

“新的地牢,新世界,新怪物和物品,你没有节省点。如果你犯了一个错误,那么你没有第二次射门。这有点像现实生活,“格雷芬斯特塞说。 “你必须从错误中吸取教训并来到那种知识的新情况。”

喝腐蚀性药水是一个坏主意,当然,但在怪物扔扔东西怎么样?用它涂抹你的武器吗?把它倒在宝箱的锁上?用水稀释它?我们对这些行动有直观的想法,但是玩游戏的游戏并不认为我们的方式。

根据Grefenstette的说法,Nethack中的系统中系统的深度和复杂性很难解释,但多样性和难度使游戏成为竞争的完美候选人。 “你必须依靠人类知识来玩游戏,”他说。

人们一直在设计机器人,多年来依靠神经网络,但决定树是复杂的游戏本身。 Facebook研究的团队希望通过建立人们可以测试基于机器学习的游戏算法的培训环境来开办一种新的方法。

Nethack学习环境实际上是去年的汇集在一起​​,但终点挑战才刚刚开始。 NLE基本上是嵌入在专用计算环境中的游戏版本,让AI通过文本命令(方向,攻击等攻击等行为)进行交互

这是雄心勃勃的AI设计师的诱人目标。虽然像星际争霸2这样的游戏可以在某种程度上享受更高的形象,但是Nethack是传奇的,并且在完全不同的线上建立模型的想法是一个用于主导其他游戏的人是一个有趣的挑战。

这也是如此,正如GrefenStette解释的那样,过去一个比许多人更容易获得。如果您想为星际争霸2构建AI,则需要大量的计算能力可用于从游戏的图像上运行可视识别引擎。但在这种情况下,整个游戏通过文本传输,使其非常有效地使用。它可以比任何人类的甚至最基本的计算设置效果速度速度快。这使得挑战广泛对自己的个人和团体开放,他们无法获得电源其他机器学习方法所需的高功率设置。

“我们希望创建一个对AI社区有很多挑战的研究环境,但并没有将其限制在大型学术实验室中,”他说。

在接下来的几个月里,NLE将可供人们进行测试,并且竞争对手可以通过他们选择的任何方式构建他们的机器人或AI。但是当竞争本身于10月15日开始认真时,他们将通过标准命令在其受控环境中与游戏进行互动 - 没有特殊访问,没有检查RAM等。

竞争的目标是完成游戏,Facebook团队将跟踪代理人“上升”的次数,因为它在一定程度的时间内被称为inthack。但“我们假设每个人都会为每个人为零”,“Grefenstette承认。毕竟,这是有史以来最艰难的游戏之一,甚至人类甚至曾经玩过的人甚至在一生中赢得了一次,更不用说连续几次。将有其他评分指标在许多类别中判断获奖者。

希望在于,这一挑战为AI的新方法提供了一种新方法,更从根本上类似于实际的人类思维。捷径,试验和错误,得分 - 黑客和Zerging在这里将无法工作 - 代理需要了解逻辑系统,并灵活且智能地应用它们,或者在愤怒的半人马或owlbear的手中死亡。

您可以在此查看Nethack挑战的规则和其他细节。结果将于今年晚些时候在Neurips会议上公布。