在水手游戏上训练的类人神经网络国际象棋引擎

2021-01-17 22:06:57

阅读有关Maia的完整研究论文,该论文发表在2020 ACM SIGKDD知识发现和数据挖掘国际会议(KDD 2020)上。

您可以从计算社会科学实验室或Microsoft Research阅读有关Maia的博客文章。

我们将发布基于Maia(游戏分析,个性化拼图,图灵测试等)的学习工具,教具和实验的Beta版。如果您想成为第一个知道的人,可以在这里注册我们的电子邮件列表。

如果您想查看Maia预测的更多示例,我们在这里提供了一个工具,可以查看不同模型在哪些地方存在分歧。

可以在我们的Github Repo上找到培训Maia的代码。随着人工智能变得越来越智能-在某些情况下达到超人的性能-人类从算法中学习和协作的潜力越来越大。但是,人工智能系统处理问题的方式通常与人们的处理方式不同,因此可能难以解释且难以学习。弥合人类与人工智能之间的鸿沟的关键步骤是对构成人类行为的细粒度动作进行建模,而不是简单地匹配人类的总体表现。我们在具有悠久的人工智能历史的模型系统(国际象棋)中追求这一目标。国际象棋棋手在游戏过程中做出决策时,其综合表现会不断提高。各种技能水平的玩家在线玩的亿万游戏构成了丰富的数据源,这些决策及其确切的上下文都记录在细节中。将现有的象棋引擎应用于这些数据,包括AlphaZero的开源实现,我们发现它们不能很好地预测人类的动作。我们开发并推出了Maia,这是经过人工下棋训练的Alpha-Zero的定制版本,可预测人类动作的准确性比现有引擎高得多,并且在预测玩家在特定技能水平下做出的决策时可以达到最大准确性。可调的方式。对于预测人类在下一步行动中是否会犯重大错误的双重任务,我们开发了一种深度神经网络,其性能大大优于竞争基准。综上所述,我们的结果表明,通过首先对粒状人类决策进行精确建模,在设计具有人类协作意识的人工智能系统方面具有巨大希望。