未来的历史学家将依赖于维基百科对新冠肺炎的报道

2020-06-02 12:15:26

本文是自由言论项目的一部分,该项目是未来时态与美国大学华盛顿法学院的技术、法律和安全项目的合作项目,旨在研究科技如何影响我们对演讲的看法。

欢迎来到来源笔记,这是一个关于互联网知识生态系统的未来时态专栏。

今年3月,Facebook上充斥着声称让人生病的是5G网络,而不是一种新型冠状病毒的帖子。然而,今天搜索这些相同的帖子会得到一条错误消息:“对不起,此内容目前不可用。”这是因为Facebook和其他社交媒体公司已经从他们的平台上删除了许多阴谋型帖子,包括彻底揭穿的5G连接。但一些互联网积极分子担心,这些与流行病相关的内容不仅会被删除,而且会被抹去,给未来的研究人员留下一个空白的历史记录。

进入维基百科。今年4月,75个签署组织发出了一封信,要求社交媒体公司和内容共享平台保存他们在新冠肺炎大流行期间屏蔽或删除的所有数据,并将其提供给未来的研究。这封信的收件人包括Facebook、Twitter、谷歌和维基百科的母公司维基媒体基金会(Wikimedia Foundation)。当维基百科的编辑们在像“维基百科周刊”这样的论坛上讨论这封信时,最普遍的反应是,我们不是已经这么做了吗?

在过去的几个月里,维基百科对新冠肺炎疫情的报道因其广度和相对可信度而广受好评。到目前为止,维基百科关于这场流行病的主要英文文章已经被浏览了6700多万次,新冠肺炎的文章有175种语言的版本。与新冠肺炎有关的5,000篇文章涵盖了从安东尼·福奇(Anthony Fuci)在世界各地的同行,到由此引发的全球经济危机(例如,德国的Wirtschaftskrose和它的阿拉伯同行),再到维基百科(Wikipedia)关于维基百科自身应对疫情的一篇有点环状的文章。

但今天丰富的维基百科内容对未来的各方也将是有价值的。正如学者和维基媒体项目协调员利亚姆·怀亚特(Liam Wyatt)所写的那样,“维基百科档案中的文本将会引起4000年度语言学家、历史学家或社会学家的兴趣。”在一次采访中,维基媒体基金会(Wikimedia Foundation)首席执行官兼执行董事凯瑟琳·马赫(Katherine Maher)告诉我,“历史学家会发现有价值的一件事是维基百科记录下了解病毒本身的加速速度的方式。”

例如,未来的历史学家回顾维基百科今年对新冠肺炎大流行的报道,很可能会审查相关的“不同之处”。维基百科的每一篇文章和每一次修订都会被保存,即使编辑相对较小或时间较短也是如此。这种差异显示了维基百科页面的一个版本和另一个版本之间的差异,使任何人都可以准确地看到两个精确带有时间戳的时刻之间发生了什么变化。维基百科关于新冠肺炎大流行的文章的不同之处在于,1月7日的这篇文章首次怀疑病毒是由动物感染的,而这篇文章是在1月8日首次使用“新型冠状病毒”的。最近,这一不同之处显示,在唐纳德·特朗普(Donald Trump)总统发表评论后,4月29日首次插入了漂白剂一词。历史学家可以利用维基百科的差异来构建一个案例,说明关于新冠肺炎的知识在整个2020年是如何演变的。

未来的研究人员也可以从编辑之间的辩论中学习。每一篇维基百科文章都有一个讨论页,编辑们可以在那里参与关于建立百科全书的对话。在整个4月和5月初,维基百科的志愿者编辑们进行了长时间的讨论,讨论将这篇文章从2019年至2020年的冠状病毒大流行重新命名为现在的名字“新冠肺炎大流行”。请注意新名称是如何明确标识病毒并删除时间范围的。这个更名对未来的历史学家可能意味着什么?当然,这是不可能知道的,但有一种解释是,这是对这场大流行可能持续到2021年甚至更久的早期认识。

未来的研究人员将更多地努力处理来自社交媒体公司的历史数据。今年3月,脸书、推特和YouTube从他们的平台上删除了巴西总统贾尔·博尔索纳罗(Jair Bolsonaro)在视频中表示,羟氯喹是治疗新冠肺炎的有效药物。虽然这有助于阻止医疗错误信息在这些平台上的传播,但帖子(以及所有相关评论和元数据)的删除让研究人员更难理解公众在这些误导性内容被删除之前是如何参与的。过去,这些公司没有披露被删除帖子的数据,即使是在事后,因为他们认为这些信息是专有的。

而且,不仅是大型科技公司正在清除未来的历史记录。伍迪·哈雷森(Woody Harrelson)和约翰·库萨克(John Cusack)在自愿删除Twitter和Instagram上的这些帖子之前,发布了对5G冠状病毒阴谋论的支持。一些记者已经开始例行公事地删除他们的旧推文,以减少网络骚扰的风险,“哥伦比亚新闻评论”(Columbia News Review)将这种做法描述为“抹去了历史的初稿”。但维基百科不太可能因为这种历史擦除而受到指责,因为该软件几乎没有例外地保存了该项目的整个编辑历史。

保存维基百科是维基百科的强项,但该项目面临的长期挑战是系统性偏见问题。在百科全书的传记文章(80%以上是男性)和关于科幻和技术主题的不成比例的文章(反映了网站最早贡献者的偏好)中,可以看到很大程度上无意的偏见。我们知道,当原始素材有偏见时,这就限制了未来研究人员的理解,他们会在几千年后提出这样的问题,比如“古代哲学中的女性都到哪里去了?”

但今天的维基百科超级贡献者热衷于确保未来的历史学家能够获得更好的档案。在本月由纽约维基媒体组织的关于维基百科和新冠肺炎的虚拟研讨会上,全面报道是一个反复出现的主题,会上有像杰森·摩尔这样的多产志愿者。摩尔一直在从多个角度实时记录这场大流行,开始撰写关于大流行对美国各州、LGBTQ社区和大麻行业等独立行业影响的文章。研讨会的另一位演讲者,弗吉尼亚大学的Lane Rasberry,展示了Wikidata如何在世界地图上直观地表示病毒的爆发。因为这种语言是机器可读的,所以它可以立即从维基数据的中心过滤出来,进入维基百科的各种语言版本。但Rasberry警告说,这一维基爆发数据高估了北美和欧洲,而低估了维基编辑较少的地方。“现在就是这样,”他说。

话又说回来,只要原始记录仍然是可以访问的,未来的研究人员也许能够解释一些地理扭曲的原因。研讨会结束后,主持人内莎·侯赛因(Netha Hussain)描述了她在英文维基百科(Wikipedia)上开始撰写的一篇文章,名为“与2020年印度冠状病毒大流行有关的错误信息”。但是如果你今天在维基百科上搜索这篇文章,你将找不到它。这是因为维基百科的其他编辑在5月6日投票决定删除该页面。(支持删除的团体认为,在其他国家没有错误信息的情况下,印度单独撰写一篇关于错误信息的文章是不合适的。)。然而,这篇关于印度错误信息的文章并没有完全被后代遗忘,而且与社交媒体公司不同的是,维基百科并没有声称它保留被删除内容的所有权。这些被删除的文章可以被维基百科的志愿者管理员查看,侯赛因还保存了一份关于印度的被删除文章和关于它被删除的编辑讨论的副本。也许有一天,未来的历史学家会梳理这场讨论,以便更好地理解编辑们是如何回应“日冕圣战”的指控的,“日冕圣战”是一种虚假的叙述,导致了印度穆斯林少数民族的迫害。

有趣的是(至少对我来说),这些假想的未来研究人员将使用维基百科作为主要来源。考虑到图书馆员和教育工作者近20年来一直在提醒我们,维基百科不是第一来源,不是第二来源,而是第三来源,这听起来可能是异端邪说。这就是为什么维基百科有一个方便的帮助页面来提醒读者“你可能不应该引用维基百科”。但引用维基百科作为主要来源在未来的州是有意义的,因为经过了足够长的时间,今天的维基百科修订已经成为历史文物。想象这个遥远的未来不仅对维基百科的人,而且对其他在线内容的创作者来说都是一个有趣的思考练习:这种数字媒体有朝一日会如何被解读为