我们在大流行期间的奇怪行为正在扰乱人工智能模型

2020-05-15 22:58:51

在4月12日至18日这一周,Amazon.com上的前10个搜索词是:卫生纸、面膜、洗手液、纸巾、莱索尔喷雾、高乐氏湿巾、面膜、莱索尔、细菌防护口罩和N95口罩。人们不仅在寻找,他们也在购买-而且是批量购买。大多数寻找面膜的人最终购买了亚马逊最畅销的新款面膜,“面膜,50件装”(Face Mask,Pack of 50)。

当冠状病毒来袭时,我们开始购买以前从未买过的东西。这一转变是突然的:亚马逊前十名的支柱产品-手机壳、手机充电器、乐高-在短短几天内就从排行榜上被一扫而空。伦敦一家专门为亚马逊卖家提供算法广告的咨询公司Injet在这张简单的图表中捕捉到了快速的变化。

2月底,亚马逊在多个国家的前十大搜索词仅用了不到一周的时间就填满了与冠状病毒相关的产品。你可以根据我们购买的商品来追踪大流行的传播情况:这些商品首先在意大利达到顶峰,然后是西班牙、法国、加拿大和美国。英国和德国则略微落后。“在五天的时间里,这是一个令人难以置信的过渡,”喷嘴公司首席执行官雷尔·克莱恩(Rael Cline)说。整个零售供应链都看到了连锁反应。

但它们也影响了人工智能,导致在库存管理、欺诈检测、营销等幕后运行的算法出现故障。对正常人类行为进行训练的机器学习模型现在发现,正常行为已经改变,一些模型不再像它们应该的那样工作。

情况有多糟糕取决于你和谁谈话。根据全球人工智能咨询公司文思海辉的说法,“自动化正处于混乱状态。”其他人说,他们正在谨慎地关注自动化系统,这些系统几乎没有问题,在需要时会进行手动纠正。

很明显,这场大流行揭示了我们的生活与人工智能是如何交织在一起的,暴露了一种微妙的相互依赖,我们行为的变化改变了人工智能的工作方式,人工智能工作方式的变化也改变了我们的行为。这也提醒人们,人类参与自动化系统仍然是关键。克莱恩说:“当你处在如此特殊的环境中时,你永远不会坐着忘记。”

机器学习模型是为应对变化而设计的。但大多数也是脆弱的;当输入数据与他们接受培训的数据相差太大时,他们的表现很差。文思海辉全球副总裁拉吉夫·夏尔马(Rajeev Sharma)表示,认为你可以建立一个人工智能系统就可以离开的想法是错误的:“人工智能是一个活的、呼吸的引擎。”

夏尔马一直在与几家与任性的人工智能作斗争的公司进行谈判。一家向印度零售商供应调味汁和调味品的公司,在批量订单违反其预测算法时,需要帮助修复其自动库存管理系统。该公司重新订购库存所依赖的系统的销售预测不再与实际销量相匹配。夏尔马说:“它从来没有在这样的尖峰上训练过,所以系统出了问题。”

另一家公司使用人工智能来评估新闻文章的情绪,并根据结果提供每日投资建议。但夏尔马说,由于目前的新闻比往常更加悲观,建议将非常不公正。他说,一家突然涌入渴望内容的订户的大型流媒体公司,其推荐算法也存在问题。该公司使用机器学习向观众推荐相关和个性化的内容,以便他们不断回访。但订户数据的突然变化使其系统的推荐变得不那么准确。

许多这些模型问题的出现是因为越来越多的企业购买了机器学习系统,但缺乏维护这些系统所需的内部技术。对模型进行再培训可能需要专业的人工干预。

目前的危机也表明,情况可能会比培训集中包括的相当普通的最坏情况变得更糟。夏尔马认为,应该培训更多的人工智能,不仅是针对过去几年的起伏,还应该针对20世纪30年代的大萧条、1987年的黑色星期一股市崩盘和2007-2008年金融危机等反常事件。“像这样的大流行是建立更好的机器学习模型的完美触发器,”他说。

即便如此,你也不能做好一切准备。使用人工智能检测信用卡欺诈的行为分析公司Featuspace的创始人大卫·埃克塞尔(David Excell)表示,一般来说,如果机器学习系统没有看到它期望看到的东西,那么你就会有问题。也许令人惊讶的是,Featuspace并没有看到它的人工智能受到太严重的打击。人们仍然像以前一样在亚马逊上购物和订阅Netflix,但他们不会购买大件商品或在新的地方消费,这些行为可能会引起怀疑。“人们的消费行为是他们旧习惯的收缩,”埃克塞尔说。

Excell说,该公司的工程师只需介入调整,以适应购买园艺设备和电动工具的人数激增。这些都是欺诈检测算法可能会发现的中等价格异常购买类型。“我认为肯定有更多的监督,”埃克塞尔说。“世界变了,数据也变了.”

总部位于伦敦的Phrasee是另一家亲力亲为的人工智能公司。它使用自然语言处理和机器学习来代表客户生成电子邮件、营销文案或Facebook广告。确保语气正确是其工作的一部分。它的人工智能的工作原理是生成大量可能的短语,然后通过神经网络来挑选最好的短语。但由于自然语言生成可能会非常错误,Phrasee总是让人类检查它的人工智能进出什么。

当冠状病毒来袭时,Phrasee意识到可能需要比往常更敏感的语言,并开始过滤掉额外的语言。该公司已经禁止了“病毒式传播”等特定短语,也不允许使用“派对着装”等表示不鼓励活动的语言。它甚至剔除了可能会被解读为太快乐或太令人担忧的表情符号。它还去掉了可能引发焦虑的词汇,如“天哪”、“做好准备”、“囤积”和“振作起来”。该公司首席执行官帕里·马尔姆(Parry Malm)表示:“人们不想让市场营销让他们感到焦虑和恐惧--你知道,就像这笔交易即将到期一样,压力、压力、压力。”

然而,作为整个零售业的一个缩影,你无法击败亚马逊。这也是一些最微妙的幕后调整正在进行的地方。由于亚马逊及其支持的250万第三方卖家难以满足需求,它正在对其算法进行微小调整,以帮助分散负载。

大多数亚马逊卖家都依赖亚马逊来完成订单。卖家将他们的商品储存在亚马逊的仓库中,亚马逊负责所有的物流,送货上门和处理退货。然后,它会提升那些自己履行订单的卖家。例如,如果你搜索任天堂交换机等特定商品,出现在顶部突出的“添加到购物篮”按钮旁边的结果更有可能来自使用亚马逊物流的供应商,而不是不使用亚马逊物流的供应商。

但克莱恩说,在过去的几周里,亚马逊已经扭转了这一局面。为了缓解对自己仓库的需求,它的算法现在似乎更有可能促进处理自己送货的卖家。

如果没有人工干预,这种调整是很难做到的。“形势如此不稳定,”克莱恩说。“你上周正在努力优化厕纸,而这周每个人都想买拼图或健身器材。”

亚马逊对其算法的调整会对卖家用来决定在线广告支出的算法产生连锁反应。每次加载一个带有广告的网页时,都会进行一次超快的拍卖,自动投标人在他们之间决定谁来填充每个广告框。这些算法决定为一个广告花费多少取决于无数的变量,但最终的决定是基于对你(页面上的眼球)对它们的价值的估计。有很多方法可以预测顾客的行为,不仅包括你过去购买的数据,还包括广告公司根据你的在线活动将你放入的归类。

但克莱恩说,现在预测点击广告的人是否会购买你的产品的最好指标之一是你说需要多长时间才能交付。因此,喷嘴正在与客户商谈调整他们的算法以考虑到这一点。例如,如果你认为你不能比竞争对手更快地交付,那么在广告拍卖中出价高于他们可能就不值得了。另一方面,如果你知道你的竞争对手已经脱销,那么你可以低价进场,赌他们不会出价。

克莱恩说,所有这一切都只有在一个专门的团队密切关注事情的情况下才有可能。他认为,目前的情况让许多人大开眼界,他们认为所有的自动化系统都可以自己运行。“你需要一个数据科学团队,能够将世界上正在发生的事情与算法上正在发生的事情联系起来,”他说。“算法永远不会提取其中的一些东西。”

由于一切都是联系在一起的,大流行的影响已经被广泛地感受到了,在更典型的时期仍然隐藏着的触动机制。如果我们正在寻找一线希望,那么现在是时候对那些新暴露的系统进行评估,并询问如何才能将它们设计得更好,使其更具弹性。如果机器值得信任,我们就需要照看它们。