Twitter 提供高达 3,500 美元的漏洞赏金,以发现其照片裁剪算法中的偏见,该算法被证明偏爱白人而不是黑人

2021-07-31 01:31:18

Twitter 有一种摆脱人工智能偏见的新方法:花钱请局外人找问题。周五,这家短信应用程序制造商详细介绍了一项新的赏金竞赛,该竞赛提供高达 3,500 美元的奖金,用于向 Twitter 展示其技术如何错误地处理照片。今年早些时候,Twitter 确认了其自动照片裁剪机制存在问题,得出结论认为该软件偏爱白人而不是黑人。 Twitter 称之为“显着性算法”的裁剪机制应该在您滚动推文时呈现图像中最重要的部分。 Twitter 解决算法偏见的方法——请外部专家和观察员研究其代码和结果——对漏洞赏金进行了创新,历史上一直用于报告安全漏洞。 Twitter 表示其偏见赏金是行业首创,希望其他公司也能效仿。 “它激发了更多可能没有资源和空闲时间的人参与进来,”推特机器学习道德、透明度和问责计划主管拉曼乔杜里说。 “我们希望开始培养和创建一个有道德的 AI 黑客社区。”解决算法偏见已成为越来越重要的技术问题。如果软件没有得到有效培训,人工智能可能会导致问题,包括贬低特定人群或强化刻板印象。 Twitter 的项目旨在巩固围绕代表性伤害等想法的标准。人工智能通过教设备如何根据现实世界的数据而不是严格的编程规则做出决策,彻底改变了计算。这有助于处理杂乱的任务,例如理解语音、筛选垃圾邮件和识别您的面孔以解锁手机。然而,为人工智能提供动力的算法可能是不透明的,并反映了训练数据中的问题。这导致了诸如谷歌在照片中错误地将黑人标记为大猩猩等问题。解决人工智能问题很重要,因为我们依靠技术来运行越来越多的数字生活。这在公司内部也很重要:谷歌承认其对人工智能道德问题的处理损害了其计划的声誉。

Twitter 的算法偏见赏金类似于许多科技公司现在提供的用于发现其产品中的安全问题的程序。例如,在过去十年中,谷歌为在 Android、Chrome 和其他谷歌产品中发现的 11,055 个漏洞支付了 2900 万美元。初创公司 HackerOne 正在帮助运行 Twitter 的算法偏见赏金竞赛、共享规则和接受提交。报名截止日期为太平洋时间 8 月 6 日晚上 11:59,Twitter 将于 8 月 9 日宣布获奖者。人工智能的缺点可以通过多种方式加以利用,包括特制的图像,可以将 Twitter 的显着性软件变成不知情的外部帮凶攻击。研究人员可能想要检查其他算法是否存在偏见——例如,Twitter 选择突出显示或从您的提要中省略的推文。目前,Twitter 的偏见赏金仅限于其裁剪算法。