测谎仪一直是可疑的。 人工智能使问题变得更糟

2021-02-25 21:02:41

在测谎仪宣布他有罪之前,伊曼纽尔·默维卢斯(Emmanuel Mervilus)在新泽西州纽瓦克(Newark)的一家食用油公司工作。他搬箱子每小时可以赚12美元,但这还不够。他的弟弟和妹妹还太年轻,无法上班,而他的母亲正在与癌症作斗争。不过,他在港口的老板告诉他,他是下一个晋升为技术员职位的人,该职位的时薪将提高到25美元。

Mervilus于2006年10月19日仍在等待这次促销,当时他和一个朋友在新泽西州伊丽莎白附近的Dunkin’Donuts停留。几分钟后,当他们走在街上时,两名警察走近他们,指责他们几分钟前在附近火车站附近用刀子抢劫了一个人。

受害人已从远处认出了Mervilus和他的朋友。为了证明自己的天真,默维卢斯不顾一切地提出要接受测谎仪测试。警察同意了,但是在测试前几天,梅维鲁斯的母亲去世了。当警察将他绑在装置上时,他感到心烦意乱和焦虑。他考试不及格,要求再次参加考试,并被拒绝。

在Mervilus维持无罪请求之后,他的案子受到审判。管理测谎仪的中尉在法庭上作证说,该装置是可靠的“真相指示器”。他说,他从没有从事过职业生涯,从未见过“有人显示出欺骗的迹象,[后来]证明他们是真实的。”陪审团裁定Mervilus罪名成立-上诉法院后来因对测谎仪的错误信念而摇摆不定。法官判他入狱11年。

通过分析人体可以检测到欺骗的观念已在现代生活中根深蒂固。尽管有许多研究质疑测谎仪的有效性,但每年使用该设备进行的筛查超过250万次,测谎仪测试行业的产值达20亿美元。包括司法部,国防部和中情局在内的美国联邦政府机构在筛选潜在员工时都使用该设备。根据美国司法部(Department of Justice)2007年的数据,超过四分之三的城市警察和警长部门还使用测谎仪对雇用人员进行筛查。

但是测谎仪机器仍然太慢且笨重,无法在过境点,机场或大批人群中使用。结果,在过去的十年中出现了基于人工智能的新一代测谎仪。他们的支持者声称,它们比测谎仪更快,更准确。

实际上,支撑这些新的AI系统的心理学工作甚至比测谎仪背后的研究更加脆弱。几乎没有证据表明它们产生的结果是可信的。尽管如此,人工智能赋予他们的现代感正在将这些系统带入测谎仪无法渗透的环境:过境,私人工作面试,贷款审查和保险欺诈索赔。公司和政府开始依赖它们来做出有关客户,员工,公民,移民和国际访客的可信赖性的决策。但是,如果撒谎太复杂而无法可靠地识别任何机器,而无论其算法多么先进,该怎么办?

中国古代的调查人员请怀疑的撒谎者在他们的嘴里放米饭,看看他们是否在流涎。 《中世纪寓言寓言选集》(Gesta Romanorum)讲述了一个士兵的故事,该士兵的职员对妻子的脉搏进行测量,以弄清自己是否不忠。

当美国参加第一次世界大战时,哈佛大学的研究人员威廉·马斯顿率先使用测量血压的机器来试图确定欺骗。几年后,受马斯顿工作的启发,刚刚在加州大学伯克利分校获得生理学博士学位的警官约翰·奥古斯都·拉尔森(John Augustus Larson)开发了一种被称为“心肺心电图”的机器,该机器可以提供连续的读数。受试者的血压,脉搏和呼吸频率。拉森声称,这些读数比单独的血压更好地代表了欺骗。

拉尔森首先使用这台机器调查了伯克利一家女性宿舍的盗窃案,一年之内,它就被用来定罪旧金山的一名男子,该男子被指控谋杀了一名牧师。到1930年代,Larson的门生之一正在向全国各地的警察局出售便携式版本,并增加了一个传感器,该传感器可测量皮肤电反应的变化-出汗越多,皮肤的导电性就越强。到1970年代,数百万私营部门工人应其雇主的要求定期进行测谎仪测试。

如今,大多数测谎仪测试的基本结构与Larson相同:检查者问一系列问题以测量受试者的正常生理状态,同时看着机器将这些测量结果转录为页面或屏幕上的波形线。然后,当受试者回答有关可疑犯罪或感情的问题时,检查者会寻找这些水平的突然尖峰或下降。

但是自从拉森向公众公开他的发明那一刻起,心理学家和神经科学家就批评了测谎仪。尽管有些说谎者可能会经历心率或血压的变化,但几乎没有证据表明这种变化与欺骗行为始终相关。许多无辜的人在受到质疑时会变得紧张起来,有经验的说谎者会压制或诱使他们的身体发生变化,从而使测试变得愚蠢。测谎仪也可以通过咬人的舌头,踩大头钉或考虑自己最担心的事情来殴打。即使在受控实验室实验中,这些设备也总是冒着混淆变量的风险,而且在现实生活中,它们仍然不那么可靠:由于打败该测试的罪犯几乎从不告诉警察他们有罪,并且由于无辜的嫌疑人往往在失败后做出虚假的供述。测试,无法说明它们的实际效果。

由于这些限制,除非美国和美国双方都同意将测谎仪测试包含在内,否则长期以来大多数国家的法院都不接受测谎仪测试。自1988年以来,联邦法律禁止私人雇主对雇员进行测谎(武装敏感人员或药品分销商等敏感工作人员,以及某些涉嫌偷窃或欺诈的雇员除外)。美国心理学会警告说:“大多数心理学家都认为,测谎仪测试无法准确检测谎言的证据很少。”美国国家科学院2003年的一份报告呼应先前的政府研究,著名地发现该设备能够以较高的比率检测到说谎者。远高于机会,但远低于完美”;该报告的主要作者当时说:“国家安全太重要了,不能任由如此钝器。”

但是也许乐器不必这么钝。这就是越来越多渴望将测谎技术出售给政府和商业行业的公司的承诺。他们说,也许某些行为抽动的复杂模式可能比仅仅增加脉搏或血压更可靠地表明说谎。也许复杂的算法可以发现这些模式。

从1969年到1981年,一个绰号为“约克郡开膛手”的连环杀手以英格兰北部的年轻女性为食,杀死了至少13个人,并试图杀死至少7个人。随着他的杀戮狂潮继续,警察采访了他九次,并释放了他。他的最后一名受害者是利兹大学20岁的学生杰奎琳·希尔(Jacqueline Hill),他于1980年11月被杀。几个月后,警察终于逮捕了他,当时他准备在附近的谢菲尔德杀死一名妓女。

珍妮特·罗斯威尔(Janet Rothwell)于1980年秋天到达利兹大学时,她住在希尔隔壁的宿舍里。她发现自己被希尔的谋杀缠身。

罗斯威尔说:“她和我大约在同一时间从大学图书馆上车,而下车后她就被谋杀了。”罗斯威尔后来了解了逮捕凶手的时间。她回忆说:“我想知道,计算机是否可以举报某种行为上的不一致以警告警察?”

罗斯威尔最终于1990年代后期进入曼彻斯特城市大学(MMU)的研究生院。她遇到了在计算机科学系工作的伊拉克裔英国讲师Zuhair Bandar。班达(Bandar)最近遇到了一个“尤里卡时刻”,当时一家营销公司要求他创建一个基本的设备,用于测量消费者对他们在屏幕上看到的产品的兴趣。

班达说:“他们会给客户一个手持设备,如果批准,他们会按1;如果他们不喜欢,请按2。我想,如果他们的脸上已经有表情,为什么我们需要手持设备?”班达(Bandar)要求罗斯伍德(Rothwell)在硕士毕业后留在MMU攻读博士学位,并帮助他设计可以分析人脸以提取信息的软件。他们认为,欺骗性至少比喜悦或愤怒更容易被发现。所有人都会创造某种形式的“不一致”,即计算机可以辨别的言语或非言语行为模式。

罗斯威尔(Rothwell)在2000年代初期训练了一个神经网络,以追踪眨眼和脸红之类的面部动作,然后向计算机提供了数十个片段,诚实地和不诚实地回答了同一组问题。为了确定说谎者的共同点,计算机检查了一个人的面部动作,这些动作之间的关系以及这些关系之间的关系,并提出了一个过于复杂而无法用普通语言表达的“理论”。一旦以这种方式进行“训练”,系统就可以通过分析其表达的逐帧变化,利用其知识将新主题分类为欺骗性或真实性。

在2006年的一项研究中,该系统名为Silent Talker,用于猜测受试者是在说谎还是在讲真话。在Rothwell进行研究时,它从未达到超过80%的准确性-在此研究小组此后发表的任何文章中,它也没有做得更好。罗斯威尔还告诉我,如果参与者戴着眼镜,这将完全崩溃,她指出:“您必须记住照明条件是相同的,并且采访是基于上演的盗窃行为。”罗斯威尔回忆说,但是即使在早期阶段,班达也“热衷于拥有商业产品”。他和一位同事曾经向她展示了一个涉嫌欺骗丈夫的女人的录像带,并要求她让《寂静的谈话者》对其进行分析,就像《 Gesta Romanorum》中一样。

罗斯韦尔有她的保留。她说:“我认为,如果该软件有效,则可能具有侵入性。” “我认为任何系统都不可能是100%,如果[系统]错误,对人际关系和生命的危险将是灾难性的。”她于2006年离开大学。在接受了听力学家的培训后,她在泽西岛的一家医院找到了一份工作,她现在仍然住在那里。

MMU在2003年发布了一份新闻稿,称该技术是一项使测谎仪过时的新发明。罗斯威尔说:“我有点震惊,因为我觉得为时过早。”

9/11之后的第一年,美国政府就在欺骗检测技术方面进行了无数次尝试,国土安全部(DHS),国防部(DoD)和国家科学基金会都在此类研究上花费了数百万美元。这些机构资助了亚利桑那大学创建称为AVATAR的信息亭。 AVATAR在美国机场进行了测试,该产品分析了面部表情,肢体语言和人们的声音,为受试者分配了“信誉分数”。同时,在以色列,国土安全部(DHS)为一家名为WeCU(我们见到您)的初创公司提供了资金,该公司出售了一个筛选亭,该亭将“触发那些隐瞒事物的人的生理反应”,据Fast Company 2010年的一篇文章所述。 (该公司此后关闭了。)

班达开始尝试将该技术商业化。他与两个学生Jim O’Shea和Keeley Crockett一起成立了Silent Talker公司,并开始寻求包括“警察”和“私人公司”在内的“心理特征”技术的客户。 Silent Talker是首批投放市场的AI测谎仪之一。据该公司称,去年“源自沉默的谈话者”的技术被用作iBorderCtrl的一部分,iBorderCtrl是一项欧盟资助的研究计划,该计划在希腊,匈牙利和拉脱维亚的边界对志愿者进行了测试。班达说,该公司目前正在商讨将该技术出售给律师事务所,银行和保险公司,并将测试纳入工作场所面试和欺诈筛查中。

班达(Bandar)和奥谢(O'Shea)花费了数年的时间来调整核心算法,以用于各种场合。他们尝试将其销售给曼彻斯特和利物浦市区的警察局。该公司在2003年告诉英国的《工程师》杂志,他说:“我们正在非正式地与非常高级的人交谈。”他们指出,他们的目标是“在真实的采访中对此进行试验。” O'Shea在其网站上发布的2013年白皮书建议,Silent Talker“可以用来保护我们在海外部署的部队免受蓝绿(内线)攻击。” (“绿蓝”一词通常是指穿着制服的阿富汗士兵对过去的盟友的攻击。)

该小组还发布了实验结果,展示了Silent Talker如何用于检测理解和检测。在2012年的一项研究中,该团队首次展示了在该领域使用的Silent Talker系统,该团队与坦桑尼亚的一家医疗保健非政府组织合作,记录了80名女性的面部表情,这些女性参加了有关HIV治疗和使用避孕套的在线课程。其想法是确定患者是否理解他们将要接受的治疗-正如研究的引言所述,“在知情同意过程中评估参与者的理解力仍然是一个关键的关注领域。”当团队交叉引用AI关于女性是否通过简短的课后考试成绩理解课程的猜测时,他们发现预测谁会及格和失败的准确率达到80%。

坦桑尼亚的实验导致了Silent Talker被纳入iBorderCtrl。 2015年,新生财团的组织者之一Athos Antoniades向O'Shea发送了电子邮件,询问Silent Talker团队是否想加入一组公司和警察部队,以争取欧盟的资助。在过去的几年中,进入欧盟的车辆运输量增加,使联盟边境国家的代理商不堪重负,因此,欧盟向任何能够“提供更高效,更安全的陆路过境点的机构”提供450万欧元(500万美元)。 ……因此有助于预防犯罪和恐怖主义。” Antoniades认为Silent Talker可能扮演关键角色。

当该项目最终于2018年10月宣布公开试点时,欧盟委员会在新闻稿中迅速宣称该系统采用“独特方法”进行欺骗检测的“成功故事”,并解释说该技术“分析了微型手势。旅行者找出受访者是否在撒谎。”新闻稿继续说,在曼彻斯特接受训练的算法将“提供更有效和安全的陆路过境点”,并“有助于预防犯罪和恐怖主义”。

O’Shea告诉我,该程序的基本算法可用于多种其他设置-广告,保险索赔分析,求职者筛选和员工评估。我难以分享他对智慧的压倒性信念,但是即使他和我通电话,Silent Talker也已经在欧盟过境点筛选志愿者。该公司最近于2019年1月正式开业。所以我决定去曼彻斯特亲自看看。

Silent Talker的办公室距离曼彻斯特城市大学约一英里,那里是O'Shea的高级讲师。他接管了Bandar的日常技术开发工作。该公司的基础是居民区一处眨眼之间您会错过的砖砌办公园区,在烤肉串餐厅的街对面以及足球场对面。在内部,Silent Talker的办公室是一个单间,里面放着几台电脑,桌子上放着公文包以及2000年代初期有关该技术的说明性海报。

当我9月份访问公司办公室时,我在大厅下方的会议室与O'Shea和Bandar坐了下来。奥谢(O’Shea)严厉,但略微皱巴,秃顶,除了几簇头发和Van Dyke胡子。他坚持要求我们不要谈论iBorderCtrl项目,从而开始了对话,后来称其批评者为“错误消息”。他在漫长的切线切线中谈到了系统AI框架的功能,偶尔引用计算机先驱Alan Turing或语言哲学家John Searle的话。

他说:“机器和人类都有意图,即对世界事物和状态的信念,欲望和意图,”他捍卫了系统对算法的依赖。 “因此,复杂的应用程序需要您共同权衡两者的想法和意图。”

O’Shea对该系统进行了演示,分析了一个男人的视频,回答一个人是否从盒子里偷了50美元的问题。该程序在该人的脸周围叠加了一个黄色方框,在他的眼睛周围叠加了两个较小的方框。他说话时,屏幕角落的针头在给出错误答案时从绿色变为红色,而当他不讲话时则变为中等橙色。采访结束后,该软件会生成一个图表,描绘出受骗概率随时间变化的情况。从理论上讲,这表明了他何时开始和停止撒谎。

O’Shea说,该系统可以在传统的笔记本电脑上运行,用户每分钟需要支付约10美元的视频分析费用。 O'Shea告诉我,该软件会对视频进行一些初步的本地处理,然后将加密的数据发送到服务器,在服务器上进行进一步的分析,然后再将结果发送回去:用户看到覆盖在底部的欺骗概率图视频。

根据O'Shea的说法,该系统监视参与者身体上约40个物理“通道”,从人眨眼的速度到人头的角度,一切都在进行。它通过查看撒谎者和真相讲述者的训练数据集,为每张新面孔带来了有关欺骗的“理论”,该理论已得到发展。该系统每秒测量对象的面部运动和姿势变化多次,该系统会寻找与训练数据中说谎者共享的运动模式相匹配的运动模式。这些图案并不像眼睛朝天花板轻拂或头部向左倾斜那样简单。它们更像是模式的模式,不同动作之间的多面性关系,太复杂以至于人类无法跟踪-这是机器学习系统的典型特征。

AI的工作是确定与欺骗有关的运动方式。 O'Shea告诉我:“心理学家经常说,您应该为系统的运行建立某种模型,但我们没有一个运行的模型,也不需要模型。我们让AI来解决。”但是,他还说,面部“通道”的合理性来自有关欺骗心理学的学术文献。在《沉默的谈话者》(Silent Talker)的2018年论文中,其创建者称其软件“假设与欺骗行为相关的某些心理状态在欺骗时会驱动受访者的[非语言行为]。”在这些行为中,有“认知负担”或应该撒谎的额外精神能量,以及“使人高兴”,或

......