苹果,谷歌和亚马逊正在培训他们的语音助手,以更好地了解患有口吃等言语障碍的人

2021-02-27 07:26:45

达格·玛恩(Dagmar Munn)和她的丈夫于2017年从亚马逊公司在亚利桑那州绿谷的家中购买了一款智能扬声器,这是在穆恩被诊断出患有肌萎缩性侧索硬化症后的七年。运动神经元病通常被称为ALS。

起初,演讲者的语音助手Alexa可以理解Munn女士在说什么。但是随着病情的恶化和言语的发展变得越来越缓慢和含糊不清,她发现自己无法与语音技术进行交流。

芒恩女士说:“我还不够快。” “如果我想说'Alexa,告诉我这个消息,'它会在我问完之前关闭。”

Munn女士无法与Alexa之类的语音助手互动,因为该技术尚未经过培训以了解患有构音障碍的人,构音障碍是由言语肌肉减弱引起的言语障碍。由于听力下降或口腔癌而导致口吃或口音不佳的人也很难被语音助手理解。

根据美国国家耳聋与其他交流障碍研究所的数据,美国大约有750万人在使用语音时遇到了麻烦。 Google人工智能团队的产品经理Julie Cattiau表示,语音识别技术可能会给这个小组留下落后的危险。

Google是众多试图培训语音助手以了解所有人的技术公司之一。

在意识到构音障碍的人(通常是脑瘫,帕金森氏病或脑瘤等病症的副作用)可能成为受益于语音识别技术的人群后,一些人投资了语音访问功能。

卡蒂奥女士说:“对于患有脑瘫且坐在轮椅上的人来说,能够用声音控制周围环境可能对他们非常有用。” Google正在收集非典型语音数据,作为训练其语音识别工具计划的一部分。

亚马逊Alexa Trust部门主管Anne Toth表示,培训语音助理以应对语音障碍者,可以为越来越多的潜在用户改善语音识别工具的体验:老年人更容易发生退行性疾病。监督语音助手的隐私和安全策略和功能,以及其辅助功能。

亚马逊在12月宣布将与以色列初创公司Voiceitt集成Alexa,后者由亚马逊的Alexa基金支持,该技术可以使有语音障碍的人训练一种算法,以识别自己独特的人声模式。该集成预计将在未来几个月内投入使用,它将使具有非典型语音的人能够通过对Voiceitt应用程序进行语音操作来操作Alexa设备。

苹果表示,其2015年在手持设备上推出的``保持通话''功能已经使用户可以控制语音助手Siri收听的时间,从而防止助手在说话结束之前打断口吃的用户。

根据苹果员工本周将发表的一份研究论文,该公司现在正在研究如何自动检测某人是否说话时口吃,并且已经从带有口吃功能的播客中构建了28,000个音频剪辑库。由《华尔街日报》看到。

苹果发言人说,这些数据旨在帮助改善具有非典型语音模式的人的语音识别系统。他拒绝评论苹果如何详细使用数据中的发现。

Google的Project Euphonia计划正在测试一个原型应用程序,该应用程序可以通过训练软件来理解非典型语音的人与Google Assistant和智能Google Home产品的通信,从而了解他们独特的语音模式。但它也正在汇编非典型语音音频库,其中包括Munn女士在内的志愿者都为之做出了贡献。

Google希望这些片段有助于在整个语音范围内训练人工智能,并使语音助手更接近完全可访问性,但这并不是一件容易的事。语音助理可以识别大多数标准语音,因为尽管口音不同,但用户的语音和声和模式相似。 Google的Cattiau女士说,非典型的语音模式千差万别,这使它们更难以被人工智能理解。

她说:“截至今天,我们甚至都不知道是否有可能。”

批评人士说,技术公司在解决语音助手的可访问性问题方面进展太慢,该问题大约在10年前就出现了。

行动不便的倡导者和患有脑瘫的励志演说家格伦达·沃森·凯悦(Glenda Watson Hyatt)表示,一些残障调查并未报告言语障碍的患病率,因此,如果科技公司“依靠此类数据来帮助确定市场规模和需求,这是显而易见的”为什么他们忽略或排斥我们。”

从事语音无障碍工作的人们说,该技术直到最近才变得足够复杂,足以尝试处理非标准语音的复杂性。他们还说,在建造第一个语音助手时,许多技术公司并没有过多地强调包容性设计。

对于非典型演讲者来说,为诸如Euphonia项目之类的项目做出贡献也可能很困难。 Munn女士说,她有时候会觉得自己的身体有些疲惫,但如果能帮助教语音助手了解她,她很乐意做出贡献。