新的深度学习模式:更少的神经元,更多的智能

2020-10-14 06:46:21

一个国际研究团队开发了一种新的人工智能系统,该系统基于线虫等微小动物的大脑。这个新颖的人工智能系统只需几个人工神经元就可以控制一辆车。它能更好地处理有噪声的输入,并且由于其简单性,其操作模式可以被详细地解释。

人工智能已经进入我们的日常生活--从搜索引擎到自动驾驶汽车。这与近年来出现的巨大计算能力有关。但人工智能研究的新结果现在表明,更简单、更小的神经网络可以用来比以往更好、更高效、更可靠地解决某些任务。

来自维也纳的TU Wien、奥地利IST和美国麻省理工学院的一个国际研究小组开发了一种新的人工智能系统,该系统基于线虫等微小动物的大脑。这个新颖的人工智能系统只需几个人工神经元就可以控制一辆车。该团队表示,与以前的深度学习模型相比,该系统具有决定性的优势:它能更好地应对噪音输入,而且由于其简单性,其操作模式可以被详细解释。它不一定要被认为是一个复杂的黑匣子,但它是可以被人类理解的。这一新的深度学习模型现已发表在《自然·机器智能》杂志上。

与活着的大脑相似,人工神经网络由许多单个细胞组成。当一个单元格处于活动状态时,它会向其他单元格发送信号。组合由下一个小区接收的所有信号,以确定该小区是否也将变为活动的。一个细胞影响下一个细胞活动的方式决定了系统的行为--这些参数在自动学习过程中进行调整,直到神经网络能够解决特定的任务。

多年来,我们一直在研究我们可以从大自然中学到什么来提高深度学习能力,TU Wien的网络物理系统研究组负责人拉杜·格罗苏(Radu Grosu)教授说。例如,线虫线虫靠数量少得惊人的神经元生活,并且仍然显示出有趣的行为模式。这要归功于线虫神经系统处理信息的高效而和谐的方式。

自然告诉我们还有很大的改进空间,麻省理工学院计算机科学和人工智能实验室(CSAIL)主任丹妮拉·罗斯(Daniela Rus)教授说。因此,我们的目标是大幅降低神经网络模型的复杂性并增强其可解释性。

受自然的启发,我们开发了神经元和突触的新数学模型,奥地利IST主席托马斯·亨辛格教授说。

TU Wien和麻省理工学院CSAIL计算机工程研究所博士后助理Ramin Hasani博士说,单个细胞内信号的处理遵循不同的数学原理,而不是以前的深度学习模型。此外,我们的网络是高度稀疏的--这意味着并不是每个细胞都与其他细胞相连。这也让网络变得更简单。

为了测试新想法,团队选择了一项特别重要的测试任务:自动驾驶汽车留在自己的车道上。神经网络接收道路的摄像机图像作为输入,并自动决定向右还是向左转向。

如今,拥有数百万个参数的深度学习模型经常被用来学习复杂的任务,比如自动驾驶,TU Wien校友、奥地利IST博士生马蒂亚斯·莱克纳(Mathias Lechner)说。然而,我们的新方法使我们能够将网络的规模减少两个数量级。我们的系统只使用75,000个可训练参数。

麻省理工学院CSAIL的博士生亚历山大·阿米尼(Alexander Amini)解释说,新系统由两部分组成:相机输入首先由所谓的卷积神经网络处理,该网络只感知视觉数据,从传入像素中提取结构特征。这个网络决定摄像机图像的哪些部分是有趣的和重要的,然后将信号传递到网络的关键部分--控制系统,然后控制车辆。

两个子系统堆叠在一起,并同时进行训练。收集了大波士顿地区长达数小时的人类驾驶的交通视频,并将其与如何在任何给定情况下驾驶汽车的信息一起输入网络-直到系统学会了自动将图像与适当的转向方向联系起来,并能够独立处理新的情况。

系统的控制部分(称为神经电路策略,或NCP),将来自感知模块的数据转换为转向命令,只由19个神经元组成。马蒂亚斯·莱克纳解释说,NCP比以前最先进的型号要小3个数量级。

新的深度学习模型在一辆真实的自动驾驶汽车上进行了测试。我们的模型允许我们调查网络在开车时关注的是什么。我们的网络聚焦于摄像机画面中非常具体的部分:路边和地平线。Ramin Hasani说,这种行为非常令人向往,在人工智能系统中也是独一无二的。此外,我们看到每一个细胞在任何驱动决策中的作用都是可以确定的。我们可以了解单个细胞的功能和它们的行为。对于更大的深度学习模型来说,实现这种程度的可解释性是不可能的。

Mathias Lechner说,为了测试NCP与之前的深度模型相比有多健壮,我们扰动了输入图像,并评估了这些代理处理噪音的能力。虽然这成为了其他深度神经网络无法克服的问题,但我们的NCP对输入伪像表现出了很强的抵抗力。这个属性是新的神经模型和结构的直接结果。

Ramin Hasani说,易读性和健壮性是我们新模型的两大优势。但还有更多:使用我们的新方法,我们还可以减少训练时间,并有可能在相对简单的系统中实现人工智能。我们的NCP可以在广泛的可能应用中实现模仿学习,从仓库的自动化工作到机器人移动。新的发现为人工智能社区开辟了重要的新视角:生物神经系统中的计算原理可以成为创建高性能可解释人工智能的伟大资源--作为我们迄今使用的黑匣子机器学习系统的替代方案。

材料由奥地利科学技术研究所提供。注意:内容可以根据样式和长度进行编辑。

马蒂亚斯·莱克纳,拉明·哈萨尼,亚历山大·阿米尼,托马斯·A·亨辛格,丹妮拉·罗斯,拉杜·格罗苏。神经回路策略,可实现可审计的自主性。自然机器智能,2020年;2(10):642DOI:10.1038/s42256-020-00237-3。

科学日报与TrendMD网络中的网站共享链接,并根据指示从第三方广告商那里赚取收入。