人类水平的智力还是类似动物的能力?

2020-06-08 21:55:25

美国医学会的Adnan Darwiche Communications著,2018年10月,第61卷第10期,第56-67页,10.1145/3271625评论。鹰和蛇的视觉系统比我们在实验室里能制造的任何东西都要好,但是蛇和鹰不能制造眼镜、望远镜或显微镜。

神经网络最近在语音识别、视觉和自主导航等应用中取得的成功,引起了人工智能(AI)社区成员和普通公众的极大兴奋。在相对较短的时间内,在科学时钟之前,我们成功地自动化了一些几十年来一直困扰我们的任务,使用了人工智能研究中更经典的技术之一。

这些成就的胜利导致一些人将这些任务的自动化描述为已经达到了人类水平的智能。这种最初在学术界暗示的看法,已经获得了更广泛的势头,并正在产生一些影响。例如,一些关于人工智能在公共舞台上的报道,特别是几位著名人物的评论,导致了这种兴奋与对人工智能未来可能给我们所有人带来的恐惧(世界末日情景)的混合。B此外,正在出现一种趋势,即机器学习研究正在简化为神经网络研究,新收购的标签是深度学习。这种看法也让一些人质疑继续投资于其他机器学习方法,甚至其他人工智能主流领域(如知识表示、符号推理和规划)是否明智。

人工智能历史上的这一转折给更广泛的人工智能社区的研究人员带来了两难境地。一方面,人们不能不对我们用神经网络所取得的成就印象深刻,并乐此不疲。另一方面,主流的科学直觉阻碍了人们接受这样一种观点,即一种不需要明确建模或复杂推理的方法就足以重现人类水平的智能。进一步放大了这一困境的是,有观察到,最近的事态发展并没有导致明确而深刻的科学发现(例如新的思维理论),而这通常会要求对人工智能课程进行大规模更新。来自人工智能和计算机科学之外的学者经常感觉到这种两难境地,因为他们抱怨说,对于这个问题,他们没有得到一个在智力上令人满意的答案:人工智能刚刚发生了什么?

答案在于仔细评估我们通过深度学习取得的成就,以及确定和欣赏这一研究领域最新发展的关键科学成果。不幸的是,这在很大程度上是缺乏的。我在这里的目的是引发这样的讨论,受到我收到的关于本文表达的想法的积极而好奇的反馈的鼓舞。

为了为讨论奠定基础,我首先标记了两种不同的方法来解决人工智能感兴趣的问题。我称第一个为基于模型的,第二个为基于函数的。考虑图1中的对象识别和本地化任务。要解决这个问题,基于模型的方法需要表示关于狗和帽子等的知识,并且需要用这些知识进行推理。如今,该方法的主要工具是逻辑和概率(更一般的数学建模),可以被认为是人工智能创始人最初设想的表示和推理方法。在某种程度上,这也是科学界知情成员通常期望的方法。另一方面,基于函数的方法将这一任务描述为函数拟合问题,函数输入直接来自图像像素,输出与我们所寻求的高级识别相对应。函数必须具有可以有效求值的形式,因此不需要推理就可以根据其输入计算函数输出。这种方法的主要工具是神经网络。许多大学生在物理或化学实验室里练习过它的一个版本,在那里,他们将简单的函数与从各种实验收集的数据进行拟合,如图2所示。这里的主要区别是,我们现在使用的是具有多个输入和输出的函数;这些函数的结构可能相当复杂;正在解决的问题往往与感知或认知有关,而不是估计密封容器中体积和压力之间的关系。D。

在我自己寻求充分欣赏深度学习带来的进步的过程中,我得出的结论是,最近的发展告诉我们更多的是关于解决的问题和我们世界的结构,而不是神经网络本身。

最近在人工智能领域的主要观察是,基于函数的方法在ce中可以相当有效。

积极的一面是,越来越多的任务和应用程序现在触手可及,使用的工具对于只有广泛工程背景的人来说可能非常熟悉,特别是那些习惯于估计函数并使用它们进行预测的人。然而,令人担忧的是,目前开发、享受和为这个工具欢呼与思考之间的不平衡。这种思维不仅对于实现该工具的全部潜力很重要,而且对于科学地描述其潜在的影响范围也很重要。缺乏这样的描述是目前对人工智能进展及其未来可能导致我们何去何从的误解的罪魁祸首。

在我自己寻求充分欣赏深度学习带来的进步的过程中,我得出的结论是,最近的发展告诉我们更多的是关于解决的问题和我们世界的结构,而不是神经网络本身。这些网络是具有足够表达能力的参数化函数,可以捕获输入和输出之间的任何关系,并且具有可以有效评估的形式。这一点早在几十年前就已为人所知,并在教科书中进行了详细描述。是什么导致了目前的事件转折?

为了阐明这个问题,让我再说一遍我们最近的发现。也就是说,一些通常与感知或认知相关的看似复杂的能力,可以通过简单地将函数与数据相匹配来捕捉和复制到合理的程度,而不必显式地对环境进行建模或对其进行象征性推理。虽然这是一个不同寻常的发现,但它更多地突出了问题和门槛,而不是强调了技术,这一点我将在下面解释。

每种行为,无论智能与否,都可以通过将输入(环境感知)映射到输出(思想或行动)的功能来捕获。但是,假设可以有效地计算该函数,则对于某些任务,该函数的大小可能会相当大。事实上,该函数通常可能有一个无限大小,因为它可能需要根据生活历史进行映射。因此,两个关键问题如下:对于感兴趣的任务,相应的函数是否足够简单,可以接受一个紧凑的表示,允许像神经网络那样有效地将输入映射到输出(不需要推理)?如果答案是肯定的,那么我们目前是否能够根据输入-输出对(标记为数据)来估计这些函数呢?

人工智能最近发生的事情是与这些问题直接相关的三个发展:第一个是我们改进了将函数与数据拟合的能力,这是由于大量标签数据的可用性;我们现在手中的计算能力增加;以及用于拟合函数的日益复杂的统计和优化技术(包括新的激活函数和新的/更深的网络结构)。第二,我们已经确定了一类实际应用程序,这些应用程序与我们现在知道的函数相对应,这些函数足够简单,可以有效地计算(同样,不需要推理)的紧凑表示,并且其估计在当前收集数据、计算速度和估计技术的阈值范围内。这包括识别和定位某些类别图像中的对象,以及与自然语言和语音相关的某些任务。第三个发展很大程度上没有引起注意,那就是我们逐渐改变了我们的成功目标和衡量标准,大大减少了技术挑战,至少像早期人工智能研究人员所享受的那样,同时保持了我们将所获得的结果商业化利用的能力,这一点我将在后面关于目标和成功的一节中进一步讨论。

有趣的是,这些发展都没有达到人工智能本身的重大技术突破(例如在20世纪80年代末建立了概率作为常识推理的基础,以及在50多年前引入了神经网络)。然而,这些因素的结合创造了人工智能历史上的一个里程碑,因为它对现实世界的应用和各种人工智能技术的成功部署产生了深远的影响,这些技术已经酝酿了很长一段时间,特别是神经网络。G。

在准备这篇文章的过程中,我在不同的上下文中分享了这些评论。观众范围从人工智能和计算机科学到对人工智能感兴趣的法律和公共政策研究人员。我发现令人震惊的是对这次讨论的极大兴趣,以及对我所说的话的安慰(如果不是普遍同意的话)。不过,我确实得到了一些不同的回复,所有这些回复都围绕着与优化函数相关的最新进展,这些都是成功训练神经网络的关键(例如关于随机梯度下降、辍学和新激活函数的结果)。反对意见引起了极大的反感

这并不是说,只有新的思维理论或如此规模的进步才能证明围绕人工智能的一些合理担忧是合理的。事实上,即使是有限的人工智能技术也可能导致可能构成各种风险的自主系统。然而,这些担忧对我们的工业化社会并不新鲜;回想一下自动驾驶系统被引入航空航天行业时的安全担忧,以及自动取款机被引入银行业时的失业担忧。因此,这里的标题应该是自动化,而不仅仅是人工智能,因为后者只是一种碰巧改善和加快自动化的技术。h为了解决这些担忧,应该将重点转移到政策和监管方面的考虑,以应对我们社会正在着手的新水平的自动化,而不是害怕人工智能。

现在让我谈谈目前事态发展的第三个原因,这与目标的变化以及我们作为一个广泛的人工智能社区如何衡量成功有关。这一原因相当重要,但在很大程度上没有被注意到,特别是年轻的研究人员。我在这里指的是人工智能历史上逐渐但持续的转变,从试图开发本来应该是智能的、作为集成人工智能系统一部分的技术,转向开发性能良好并与消费产品集成的技术;这种区别可以比作所谓的强人工智能与弱人工智能。

与这一转变并行的是性能指标的锐化和针对这些指标的进展,特别是通过深度学习,导致人工智能系统的部署增加。然而,这些指标和相应的进展并不一定与提高智能一致,也不一定像早期人工智能研究人员所寻求的那样,加深我们对智能的理解。因此,我们必须小心,不要根据目前的进展得出某些结论,只有在朝着较早的目标取得进展的情况下,这才是合理的。这种谨慎尤其指的是目前的一种看法,即我们在实现全面人工智能方面可能已经取得了相当大的进展。

以机器翻译为例,它在人工智能的早期受到了极大的关注。表征-推理方法的目的是在翻译之前理解文本,被认为在这项任务上失败了,基于功能的方法是当今最先进的方法。在人工智能的早期,衡量成功的标准是系统的准确率与人类相比有多大的差距,而成功的翻译则取决于理解文本的能力。政府情报是主要的驱动应用程序;如果翻译不正确,可能会导致政治危机。今天,机器翻译的主要应用是网页和社交媒体内容,导致了一种新的操作模式和不同的成功衡量标准。在新的语境下,翻译系统不需要明确地理解文本,只需要根据所采用的度量标准来很好地执行就可以了。从消费者的角度来看,成功是根据系统的准确率离0%有多远来有效衡量的。如果我看的是用法语写的页面,这是我不会说的语言,我对任何能让我感觉到页面内容的翻译都很满意。事实上,机器翻译界正确地将其称为主旨翻译。它可以很好地处理经常出现在数据(如社交媒体)中的典型句子,但在新文本(如诗歌)上可能会严重失败。它仍然非常有价值,但它对应的任务与早期人工智能研究人员解决的任务有很大不同。我们最近确实在基于功能的翻译方面取得了重大进展,这要归功于深度学习。但这一进展并不是针对理解文本的经典挑战,它的目的是从文本中获取知识,以便能够对其内容进行推理,而不仅仅是翻译它。K。

对语音识别系统也可以进行类似的观察。也许今天这些系统最广泛的应用之一是在用户界面(例如自动化技术支持和软件系统的指挥,如在车辆的电话和导航系统中)。这些系统经常失败;试着说一些不太典型的话,或者如果你有口音的话,不要隐藏你的口音。但当这些系统出现故障时,它们会将用户送回人工操作员那里,或者迫使用户通过传统的方式来命令软件;一些用户甚至调整了自己的语音,以使系统正常工作。同样,根据采用的衡量标准,虽然这些系统的性能有所提高,但它们今天嵌入了新的环境,并由可以容忍缺乏健壮性或智能性的新操作模式来管理。此外,就像在文本中一样,相对于当前的指标改进他们的性能不一定是为了,也不是为了

我们通过绕过某些技术挑战而不是直接解决它们,从而在这些应用程序中取得了成功。

总而言之,人工智能领域刚刚发生的事情远远谈不上突破,以至于有理由担心世界末日的情景。刚刚发生的是人工智能技术在一些广泛的应用中的成功应用,这在很大程度上得益于相关领域的发展,以及可以容忍健壮性或智能性不足的新操作模式。换句话说,作为对我今天看到的头条新闻的回应,比如人工智能已经到来,以及我没有看到人工智能即将到来,按照捕获智能行为的早期目标,人工智能还没有到来。真正到来的是许多可以从改进的人工智能技术中受益的应用程序,这些技术仍然没有达到人工智能的雄心,但足够好,可以进行商业投资。这本身就是积极的,直到我们讨论。

..