ACME-一种分布式强化学习框架

2020-06-02 22:34:44

ACME是一个强化学习(RL)代理和代理构建块的库。Acme努力公开简单、高效和可读的代理,这些代理既可以作为流行算法的参考实现,也可以作为强基线,同时仍然提供足够的灵活性来进行新的研究。Acme的设计还试图在不同的复杂程度上为RR问题提供多个入口点。

在最高级别,Acme公开了许多可以简单使用的代理,如下所示:

import acme#创建环境和参与者。环境=.。参与者=.#运行环境循环。LOOP=acme。Environment Loop(环境,执行元)循环。运行()。

Acme还试图在深入研究代理算法或在更复杂的设置中使用它们的同时保持这种级别的简单性。参考文档可以找到Acme的一个新视图,以及对其底层组件的更详细描述。

为了快速入门,请看一下Examples子目录中的更详细的工作代码示例,其中还包括一个教程笔记本,可以帮助您入门。最后,有关各种可用的代理实现的更多信息,请查看Agents子目录以及与每个代理相关联的readme.md。

@文章{hoffman2020acme,title={Acme:分布式强化学习的研究框架},作者={Matt Hoffman,Bobak Shahriari,John Aslanides,Gabriel Barth-Maron,FerYal Behbahani,Tamara Norman,Abbas Abdolmaleki,Albin Cassirer,Fan Yang,Kate Baumli,Sarah Henderson,Alex Novikov,Sergio Gómez Colmenarejo,Serkan Cabi