平台教非专家使用机器学习

2021-07-31 01:27:11

机器学习算法用于在数据中发现人类不会注意到的模式,并被部署用于帮助为大大小小的决策提供信息——从 COVID-19 疫苗接种开发到 Netflix 建议。康奈尔 Ann S. Bowers 计算与信息科学学院的新获奖研究探索了如何帮助非专家有效、高效和合乎道德地使用机器学习算法,以更好地使计算领域以外的行业能够利用 AI 的力量。 “我们对机器学习领域的非专家如何学习算法工具知之甚少,”Swati Mishra 博士说。信息科学领域的学生。 “原因是,有一种炒作表明机器学习是为受戒者准备的。” Mishra 是“为 ML 非专家设计交互式迁移学习工具”的主要作者,该书在 5 月举行的年度 ACM CHI 计算系统中的人为因素虚拟会议上获得了最佳论文奖。 Mishra 说,随着机器学习进入传统计算之外的领域和行业,对研究和有效、可访问的工具使新用户能够利用人工智能的需求是前所未有的。对这些交互式机器学习系统的现有研究主要集中在了解用户以及他们在使用工具时面临的挑战。 Mishra 的最新研究——包括她自己的交互式机器学习平台的开发——通过研究逆向开辟了新天地:如何更好地设计系统,以便算法专业知识有限但领域专业知识丰富的用户可以学习将预先存在的模型集成到他们自己的模型中工作。 “当你完成一项任务时,你就会知道哪些部分需要手动修复,哪些部分需要自动化,”2021-2022 年彭博数据科学博士 Mishra 说。伙计。 “如果我们正确设计机器学习工具,并为人们提供足够的使用它们的代理权,我们就可以确保他们的知识融入机器学习模型中。”

Mishra 在这项研究中采用了一种非常规的方法,将一个称为“迁移学习”的复杂过程作为启动非专家进入机器学习的起点。迁移学习是一种高级且功能强大的机器学习技术,通常专供专家使用,用户可以在其中重新利用和调整现有的、经过预训练的机器学习模型来处理新任务。该技术减轻了从头开始构建模型的需要,这需要大量的训练数据,允许用户将训练用于识别狗的图像的模型重新用于识别猫的模型,或者,具有正确的专业知识,甚至皮肤癌。 “通过有意将现有模型应用于新任务,Swati 的工作不仅可以帮助新手使用机器学习来解决复杂的任务,还可以利用机器学习专家的持续发展,”该系助理教授 Jeff Rzeszotarski 说。信息科学和论文的资深作者。 “虽然我们的最终目标是帮助新手成为高级机器学习用户,但通过迁移学习提供一些‘训练轮’可以帮助新手立即将机器学习用于他们自己的任务。” Mishra 的研究通过交互式平台揭示了迁移学习的内部计算工作,因此非专家可以更好地了解机器如何处理数据集并做出决策。通过对没有机器学习开发背景的人进行的相应实验室研究,Mishra 能够准确地确定初学者在哪里迷路,他们对模型进行某些调整的理由是什么,以及哪些方法最成功或最不成功。最后,两人发现参与的非专家能够成功地使用迁移学习并为自己的目的改变现有模型。然而,研究人员发现,对机器智能的不准确认知经常会减慢非专家的学习速度。 Mishra 说,机器不像人类那样学习。 “我们习惯了类似人类的学习方式,直觉上我们倾向于采用我们熟悉的策略,”她说。 “如果工具没有明确传达这种差异,机器可能永远不会真正学习。作为研究人员和设计师,我们必须减轻用户对机器学习是什么的看法。任何交互式工具都必须帮助我们管理我们的期望。”