哥伦比亚新闻评论

2020-11-02 20:38:16

Facebook首席执行官马克·扎克伯格本周回到国会,讨论改革社交媒体平台如何管理内容的必要性-Facebook正试图在这个领域内建立“同类最佳”的声誉。TOW中心的最新研究表明,该平台正在走下坡路。

为了了解脸书对其同名平台和Instagram进行事实核查的持续和迅速程度,TOW中心审查了该公司在10月1日至5日期间为帖子分配的事实核查标签-这段时间从唐纳德·特朗普总统被诊断出新冠肺炎,到他在沃尔特里德军事医院经过三晚的观察和治疗后出院。在此期间,对特朗普病情的猜测主导了一个新闻周期,这个周期已经因为对正在进行的大流行、即将到来的总统选举的报道以及特朗普政府推动的选民欺诈指控而变得紧张。在缺乏可靠信息的情况下,谣言和阴谋论充斥着社交媒体;其中包括声称“世界末日飞机”是为了抵御地缘政治敌人而发射的,特朗普的诊断实际上是一场“骗局”。

在这五天的时间里,我们对Facebook上的事实核查标签进行了审查,发现该公司未能始终如一地为自己的第三方合作伙伴标记的内容贴上标签。脸书的十个美国事实核查合作伙伴揭穿了70多个说法。我们在Facebook和Instagram上发现了1100多条包含被揭穿的虚假信息的帖子;只有不到50%的帖子贴上了事实核查的标签,即使在与最初审查的帖子有轻微偏差的情况下也是如此。

事实核查并不是解决Facebook上大规模错误信息问题的灵丹妙药。然而,这家社交媒体巨头自2016年启动第三方事实核查计划以来,一直在吹嘘其与事实核查合作伙伴的努力。当时,批评人士认为这一举措是一种公关努力,目的是打击这样一种说法,即政纲上猖獗的错误信息帮助左右了特朗普的选举。Snope的前执行主编布鲁克·宾科夫斯基(Brooke Binkowski)表示:“我不认为他们的事实核查工作比非常廉价、非常廉价的公关更重要。”布鲁克·宾科夫斯基参与了该网站与Facebook的事实核查合作关系的启动。(宾科夫斯基目前是事实核查网站TruthorFiction.com的执行主编。)。今年2月,“大众信息”(Popular Information)一篇关于该项目范围和影响的文章发现,“大多数事实核查进行得太慢,不能起到作用”,因为信息可以在几个小时内到达数百万人手中。

Facebook继续吹捧其使用人工智能对散布同一条信息的“数千份或数百万份”类似帖子进行事实核查的自动化,从而使他们的事实核查人员能够专注于“错误信息的新实例,而不是他们已经看到的内容的近乎相同的变体”。

我们的分析发现,Facebook仍然难以识别大规模的类似内容。例如,我们发现了23个将芝加哥黑人少年被谋杀归因于“其他黑人孩子”的迷因。尽管美联社(The Associated Press)10月2日的事实核查发现,这起谋杀案的调查仍在进行中,但Facebook无法使用依赖自然语言处理和计算机视觉的相似性匹配算法识别其他重复的迷因。

作为最近一项关于Facebook审查系统的长达一年的研究的一部分,总部位于美国的非营利组织Avaaz在网上推广国际维权运动,强调了错误信息小贩如何可以做出微小的调整,以逃避Facebook的算法。Avaaz是一家总部位于美国的非营利组织,致力于在网上推广国际维权运动。这使得恶意页面可以在Facebook的雷达下溜走,或者避免达到“惯犯”状态。

对于Facebook这样规模的平台来说,自动化的经济性至关重要。目前,在算法上识别和标记类似的错误信息的方式不一致,仍然有很多需要改进的地方。

Facebook新的投票信息中心(Voting Information Center)的自动化也是如此,该公司承诺,用户在讨论该平台上的投票时,将被引导到该中心。根据我们的数据集,我们发现该公司大约90%的时间没有做到这一点。

当记者联系到Facebook请其置评时,一位发言人表示,“如果我们的一个独立事实核查合作伙伴确定一条内容包含错误信息,我们将使用技术在Facebook和Instagram上识别几乎相同的版本。”然而,他们没有对提供给他们的多个不一致的情况提供额外的解释。

2018年,南加州大学安纳伯格传播学教授迈克·阿纳尼(Mike Ananny)报告了Facebook为TOW中心进行事实核查合作的状况。当时,Facebook只专注于识别虚假声明的链接,尚未将事实核查计划扩展到个人帖子、模因和视频。Facebook向伙伴组织的事实核查人员提供了进入可疑链接和可疑帖子的途径;该队列中的帖子是通过用户标记和一系列算法输入确定的,Facebook甚至没有向其自己的事实核查人员披露这些信息。安尼发现,事实核查人员对Facebook在事实核查过程双方对类似内容的笨拙处理感到沮丧。“(事实核查人员)没有能力说,‘这是一类东西;这些东西看起来很相似,’”Ananny在最近的一次采访中说,这意味着他们必须逐一为每个被揭穿的个别项目的索赔添加一个链接。在队列的另一边,事实检查应该通过算法传播到相同和相似的内容。根据我们与多个事实核查合作伙伴的对话,今天,这一过程大致相似,但事实核查的范围现在包括所有内容:链接、帖子、模因和视频。

在我们观察的五天时间里,我们发现事实核查人员已经揭穿了10项与总统诊断有关的指控,15项与新冠肺炎和疫苗有关的指控,16项与选举和投票有关的指控(包括关于前副总统乔·拜登的指控)。“其他”--包罗万象的桶--包括无数的声明,从错误的地震警报到乔治·索罗斯被禁止进入六个国家。图2说明了我们的分析涵盖的索赔分类。我们在下面提供关于所有索赔、我们运行的搜索以及我们的总体方法的详细信息。

我们数据集中排名前三的声明包括“辛普森一家”据称播出了总统躺在棺材里的一幕(51条帖子),特朗普用便携式氧气浓缩器登上海军陆战队1号(41条帖子),以及9月份的一条病毒式推文“预测”特朗普10月的惊喜将宣布感染并迅速康复(32条帖子)。

在这三种情况下,我们都发现Facebook仍然在努力识别重复和接近重复的帖子,无论它们是来自Facebook和Instagram的同一用户的相同帖子(图3.1),包含相同图片的帖子,还是包含指向被确认为声明来源的推文的链接或屏幕截图的帖子。总体而言,我们发现,在支持“特朗普带着便携式氧气浓缩器登上海军陆战队一号”的41个帖子中,有65%在10月10日,也就是我们第一次查看这篇帖子时没有任何标签,尽管第一次揭穿发生在10月4日。所有帖子要么包含相同的注释图片,要么包含原始推文的屏幕截图,要么包含最初经过事实核查的推文的文本。一周后,我们数据集中的3个帖子不可用(这意味着它们要么已被删除,要么其隐私设置已更改),但仍有27个帖子没有标签。在这27条推文中,有3条最初进行了事实检查,但是当它们所链接的tweet被删除时,tweet的缓存版本继续显示相同的文本(图3.2)。Facebook的“虚假信息”覆盖被移除,但事实核查人员的相关文章仍然可见。在本例中,Facebook建议的三篇相关文章中有两篇与该声明无关(参见图3.2)。

Facebook的缓存问题不仅限于推文。在另一个例子中,华盛顿时报的一篇由主要报道(Facebook美国官方事实核查合作伙伴)对拜登的报道进行了事实核查,并进行了更正,原始报道的标题也发生了变化。然而,Facebook上继续流传着多个带有旧的虚假标题的帖子(图3.3)。

在我们找到的关于“辛普森一家”这一不存在场景的51个帖子中,超过60%没有事实核查标签;这些帖子中的大多数要么是图片,要么是同一个原始帖子的截图。今年5月,Facebook吹嘘他们的新人工智能系统SimSearchNet,该系统是专门为检测近乎精确的重复图像而构建的。在本例中,我们发现添加了贴纸的图像

在6月份的Facebook帖子中,扎克伯格宣布成立投票信息中心,这是美国选民获取选举信息的中心。所有关于投票的帖子都会贴上标签,将用户引导到新的中心。扎克伯格澄清说,“他并不是在判断这些帖子本身是否准确,但我们希望人们能够以任何一种方式接触到权威信息。”

在我们发现的105个帖子中,有6个帖子揭露了关于邮寄选票和选举舞弊的说法,其中只有12个帖子与选民信息中心有联系(图4)。

在我们分析的这段时间里,关于选举的虚假声明是最常见的事实核查。我们收集了255个帖子,支持16个独特的错误。关于宾夕法尼亚州卢泽恩县丢弃的九张军事选票的两个独特的说法,得到了调度、头条新闻和路透社的事实核查。我们确定了64个帖子,这些帖子对选票处置的情况做出了误导性的说法。这两组帖子都将这一事件描述为恶意试图丢弃特朗普的选票。23人毫无根据地指责反共和党的邮政工人。另有41人暗示,卢泽恩县选举委员会的官员故意丢弃选票,其中至少有7张投给了特朗普。一项调查显示,一名临时工工作了三天,似乎在不知道选票投给了谁的情况下意外地把他们扔了出去。所有选票都将计入最终的选举计票。

一些著名的保守派媒体和人物,包括戴蒙德·希尔克、布莱巴特和莎拉·佩林的主页,重复了反共和党邮政工作人员对这一事件负有责任的说法。在许多情况下,不同的媒体使用相同或几乎相同的标题,而且经常有相同的副本。不仅大多数帖子没有经过事实检查(即使其他帖子包含具有相同标题和副本的故事链接,如图5所示),而且只有两个帖子链接到投票信息中心。

Facebook曾多次表示,它使用机器学习和自然语言处理技术来审查文章标题,并识别相关故事,以便找出不同标题之间的错误信息,做出同样的虚假声明。在2018年的一次采访中,当时在Facebook担任产品经理、现在是Instagram产品管理总监的泰莎·莱昂斯(Tessa Lyons)称赞了该公司的算法,特别指出了它们在处理链接和头条时的效率。莱昂斯说:“我们通过链接来做这件事已经有一段时间了;例如,法国的一名事实核查人员驳斥了这样的说法,即你可以通过使用针头刺穿中风患者的手指并抽血来拯救他。”“这使我们能够识别20多个域名和1400多个传播同样说法的链接。”然而,如图5所示,对于“宾夕法尼亚州卢泽恩县,投票事件与反共和党的邮政工人无关”的说法,自动化过程似乎在很大程度上未能交付。

NBC在8月份的一项调查中发现,包括布莱巴特(Breitbart)和钻石丝绸(Diamond&;Silk)在内的几个网站被发现,Facebook让保守的媒体得以避免被列为“惯犯”。通常,一个在90天内分享虚假信息超过两次的页面,其帖子在用户的新闻馈送中会被降级。据NBC报道,Facebook的高级员工正在监督一个过程,允许这些和其他保守网站取消针对他们的罢工。

另一项被揭穿的相关说法是,卢泽恩县选举官员故意丢弃了特朗普的声明选票。这篇报道被几家著名的保守派媒体转载,尽管围绕这一主张的实际事件尚不清楚。随着新的细节陆续传来,故事也不断更新。但到投票信息中心的链接在所有帖子中的应用并不均匀。而在第三方合作伙伴的事实核查进来后,“部分虚假”的标签也被贴得不均匀。Instagram上布莱巴特和PJ Media头条的截图在用户分享时被贴上了“部分错误”的标签,但这些文章本身并未贴上标签。(PJ Media后来更新了标题,澄清九张选票中的大部分(但不是全部)是给特朗普的。)。“每日来电”(Daily Caller)、“每日电讯报”(Daily Wire)和萨拉·佩林(Sarah Palin)发布的类似帖子。

今年3月,脸书宣布将特别重视遏制与新冠肺炎疫情有关的错误信息,包括向合作的事实核查人员发放100万美元的赠款,并在脸书的平台上推出一个集中中心,以存储世卫组织认证的有关病毒的数据。今年4月,脸书宣布将积极删除被健康专家揭穿的有害说法,比如喝漂白剂有助于治愈新冠肺炎的说法。尽管如此,该公司的努力仍未能压制许多虚假信息专家所称的“信息者”和阴谋者

在我们调查的这段时间里,对新冠肺炎和疫苗的揭穿占到了事实核查的20%。10月1日至10月5日期间,共有275条帖子与15条被揭穿的声明相对应。根据我们的数据集,两个被揭穿的声明是事实核查最彻底的,一个是关于“面膜上的细菌生长”的图片,另一个是关于“强制接种计划”的。在前者的44个帖子中,截至10月6日,当我们第一次调查这一说法时,有29个事实核查标签。在后一种情况下,我们收集了37条帖子,其中26条截至10月10日有事实核查标签。尽管数字更好,但相似图像匹配的不一致与我们的其他发现是一致的。

即使对索赔的具体实例进行了事实核查,那些传播得更猖獗的实例也从未被贴上标签。一个模因将乌干达的假低死亡人数归因于羟基氯喹的广泛使用。虽然最终我们发现的所有关于这个迷因的例子都被贴上了“假”的标签,或者被删除了,但一篇题为“羟氯喹是拥有4300万人口的乌干达只有15人死于新冠肺炎”的文章肆无忌惮地传播开来。这篇文章是由澳大利亚一家基金会发表的,该基金会的创始人、澳大利亚前国会议员、矿业大亨克莱夫·帕尔默(Clive Palmer)声称,他在4月份购买了近3300万剂未经证实的药物。根据CrowdTangle的数据,该链接在Facebook上有超过5万次互动,其中8000次是在公共群组或页面中。

虽然声明的版本完全不同,特别是在不同类型的帖子(图片、链接、视频)上,可能很难在算法上检测到,但即使是微小的语言调整有时也会导致没有标签。在一系列迷因中,一系列州被宣布为无面具状态。虽然原始帖子是根据事实核查人员的裁决进行标记的,但Facebook的算法并不会自动标记对文本的细微改动。其中包括向列表中添加州或更改列表中州的顺序。在一个特殊的例子中,区别只是把“wy”改成了“怀俄明”。

哥伦比亚大学数据科学与工程研究所的创始主任凯西·麦基恩(Kathy McKeown)研究自然语言处理,她说:“我认为这些情况不会那么难。”“我猜,可能与销量有关,以及他们是否穷尽了所有的考虑。”识别不同媒体类型之间的相似性有其自身的挑战:自然语言处理的语义;视频的资源密集型;以及屏幕截图、裁剪图像和嵌入图像之间图像的细微差异。结合各种机器学习技术本身并不是一件容易的事,特别是在Facebook所有平台的用户基础都比任何一个民族国家的人口都多的情况下。

然而,该公司已经成功地扩大了其平台的几乎所有其他方面,并继续在其平台套件中创建和集成新产品。但是,他们现有平台上的错误信息、仇恨言论和激进主义的问题继续恶化。

该平台的规模给Facebook上的事实核查标签自动化带来了严峻的挑战。去年,扎克伯格对事实核查计划的可扩展性提出了更广泛的质疑,提出了用众包取代专业事实核查人员的想法。“这里的问题是他们的数量不够,”他说。“事实核查人员并不多。”然而,扎克伯格指出,该平台的规模是一项净收益。“我们已经建立了复杂的系统来发现和删除有害内容。”扎克伯格在7月29日国会山举行的反垄断听证会上的开场白中说。“在这些努力中,Facebook的规模是一项资产。”

Facebook未能在整个平台上自动传播类似内容的事实核查标签,这违背了它对用户和事实核查合作伙伴的承诺。在这方面缺乏进展引发了人们对该公司解决这一问题的认真程度的质疑。事实核查人员最终填补了空白,给进入Facebook提供给他们的事实核查馈送的多个类似帖子贴上了标签。Snope(Facebook事实核查合作伙伴的创始合伙人)的首席运营官Vinny Green在一次采访中告诉我们,队列的笨重使得他们的工作“就是无法扩展”。(Facebook)在他们自己的组织中不会容忍这种情况。“。Snope于2019年2月退出合作伙伴关系。

今天,事实核查人员有不同的方法来处理通过不同帖子提出的类似主张。例如,一个合作伙伴有一名员工,专门将其现有存储库中的事实检查标签应用于带有相同被揭穿的声明的新帖子。另一个事实核查合作伙伴通常在每个周末专门安排一天的时间,使用关键字搜索将旧的事实核查应用于

如果您是事实核查合作伙伴或曾与Facebook合作进行事实核查,请在此处和此处联系。

在过去的四年里,Facebook的事实核查计划已经扩展到全球50个第三方合作伙伴,其中10个合作伙伴覆盖了美国。事实核查过程相对简单:事实核查人员可以访问由Facebook填充的索赔的“队列”或“数据库”,并且它们是独立的。

.