当Tiktok视频出现在2021,似乎显示“汤姆克鲁斯”使硬币消失,享受棒棒糖,帐户名是唯一明显的线索,这不是真正的交易。社交媒体平台上“deeptomcruise”账户的创建者使用“deepfake”技术展示了一个机器生成的版本,该版本的著名演员表演魔术,并进行了独舞表演。
深假的一个例子是“神秘谷”效应,人造人眼中空洞的表情会引发一种不安的感觉。但越来越有说服力的图像正在把观众从山谷中拉出来,带进由深度假货传播的欺骗世界。
这种惊人的现实主义意味着这项技术的恶意使用:它可能被用于政治或其他利益的虚假信息宣传,为勒索而制作虚假色情作品,以及为新形式的虐待和欺诈进行各种复杂的操纵。制定识别假货的对策已经演变成了一场“军备竞赛”,一方是安全侦探,另一方是网络罪犯和网络战特工。
发表在《美国国家科学院院刊》上的一项新研究提供了一个衡量技术进步程度的指标。研究结果表明,真实的人类很容易爱上机器生成的人脸,甚至认为它们比真品更可信。“我们发现,合成面孔不仅仅是真实的,它们被认为比真实面孔更值得信赖,”研究合著者伯克利加利福尼亚大学的教授Hany Farid说。这一结果引发了人们的担忧,即“这些面孔在用于邪恶目的时可能会非常有效。”
“我们确实进入了危险的深水炸弹世界,”卢加诺瑞士义大利大学的副教授Piotr Didyk说,他没有参与这篇论文。用于生成研究静态图像的工具已经普遍可用。迪迪克认为,尽管制作同样复杂的视频更具挑战性,但它的工具可能很快就会普及。
这项研究的合成面孔是在两个神经网络之间来回交互中开发的,这是一种被称为生成性对抗网络的例子。其中一个名为生成器的网络生成了一系列不断演化的合成人脸,就像一名学生在粗略的草稿中循序渐进地工作一样。另一个网络称为鉴别器,对真实图像进行训练,然后将生成的输出与实际人脸上的数据进行比较,对其进行分级。
生成器以随机像素开始练习。在鉴别器的反馈下,它逐渐生成越来越逼真的人形面孔。最终,鉴别器无法区分真假脸。
这些网络根据一系列真实图像进行训练,这些图像代表了男性和女性的黑人、东亚人、南亚人和白人面孔,与早期研究中更常见的白人男性面孔形成对比。
在编辑了400张与400张合成版相匹配的真实面孔后,研究人员要求315人在128张图片中区分真假。另一组219名参与者接受了一些培训和反馈,学习如何在辨别人脸时识别假货。最后,由223名参与者组成的第三组对128张图片的可信度进行了评分,评分范围为1(非常不可信)到7(非常可信)。
第一组在辨别真假脸方面的表现并不比掷硬币好,平均准确率为48.2%。第二组没有表现出显著的改善,仅收到约59%的反馈,即使有关于参与者选择的反馈。群体信任度给合成面孔的平均评分为4.82,略高于真实面孔的4.48。
研究人员没有预料到这些结果。研究合著者索菲·南丁格尔(Sophie Nightingale)说:“我们最初认为合成人脸不如真实人脸可信。”。
神秘谷的想法并没有完全消失。研究参与者确实以压倒性优势确认了一些赝品是赝品。南丁格尔说:“我们并不是说生成的每一张图像都与真实的人脸无法区分,但其中有相当一部分是可以区分的。”。
这一发现增加了人们对技术可及性的担忧,因为技术使几乎任何人都有可能创造出虚假的静态图像。“任何人都可以在没有Photoshop或CGI专门知识的情况下创建合成内容,”南丁格尔说。南加州大学的视觉智能与多媒体分析实验室的创始主任Wael Abd Almageed没有参与这项研究,他说,另一个问题是,这样的发现会给人留下深刻的印象,即“深龋”将变得完全不可察觉。他担心科学家可能会放弃尝试开发针对深度假货的对策,尽管他认为让他们的检测与日益增长的现实主义保持同步“只是另一个法医学问题”
“在这个研究群体中,还没有足够的对话是如何开始积极主动地改进这些检测工具,”人权组织WITNESS的项目战略和创新总监山姆·格雷戈里说。WITNESS的部分重点是如何识别假货。他说,制造检测工具很重要,因为人们往往高估了自己识别假货的能力,而且“公众总是必须理解它们何时被恶意使用。”
格雷戈里没有参与这项研究,他指出,该研究的作者直接解决了这些问题。他们强调了三种可能的解决方案,包括为这些生成的图像创建持久的水印,“比如嵌入指纹,这样你就可以看到它来自一个生成过程,”他说。
这项研究的作者在强调“深水炸弹”的欺骗性使用将继续构成威胁:“因此,我们鼓励那些开发这些技术来考虑相关风险是否大于它们的利益”,他们写道:“这是一个鲜明的结论。”“如果是这样的话,那么我们仅仅因为技术是可能的,就不鼓励技术的发展。”