亚马逊的语音互操作性计划允许多个助理在一台设备上工作,增加了38个新成员,包括Facebook、杜比和小米

2020-09-13 03:15:04

去年9月,亚马逊推出了语音互操作性倡议(Voice Inter操作性Initiative),该计划旨在确保智能扬声器和显示器等支持语音的产品允许用户在多个语音助理中进行选择。今天,该公司宣布该倡议增加了38个新成员,包括杜比、Facebook、Garmin和小米,使成员公司总数达到77家。(谷歌仍然明显不在名单中。)。为了纪念这一里程碑,亚马逊发布了它所称的多代理设计指南,这是一份白皮书,概述了语音互操作性倡议成员在构建多助手产品时应该使用的设计建议。

语音互操作性倡议围绕四个核心原则进行组织,第一个原则是开发与他人“无缝”工作的语音服务,同时表面上保护隐私。(亚马逊在语音隐私方面的记录尤其参差不齐,但该公司声称近几个月来取得了很大进展。)。成员们寻求制造配备多个助手的设备,因为他们致力于加速对话式AI研究,目标是使用户能够在单个平台上利用Alexa、Cortana和其他服务提供的功能。

新出版的多代理设计指南涵盖三个关键主题领域,特别是(1)客户选择和代理调用,(2)多代理体验,以及(3)隐私和安全。它建议多助手产品帮助客户探索助手的功能,并为座席转移和通用设备命令(UDC)提供建议,这些建议解决了一个助手在不召唤另一个助手的情况下无法完成的用户请求。(UDC是任何助手都能识别的命令,即使助手不是用来开始体验的,比如音量和计时器控制。)。

在具有代理转接和UDC的设备中,要求Alexa使用Google Duplex(Alexa无法访问的服务)预订餐厅可能会自动调用Google Assistant,而要求Google Assistant停止计时器可能会影响Alexa启动的计时器。“在座席转移期间,[用户]向无法直接满足其请求的座席(座席1)发出请求(例如。“我不能那样做”),“设计指南解释说。“但是,如果代理1知道设备上的另一个代理(代理2)可能会满足该请求,则代理1可以召唤另一个代理协助客户。在传输过程中,代理之间不传递任何数据或上下文,[用户]直接将其请求重复到代理2,而无需说唤醒字。“。

除此之外,多智能体设计指南建议共存的智能体至少通过视觉和声音提示传达三种核心注意力状态-倾听、思考或说话。它说,这种模式将使用户更容易看到哪些助理在监听,以及他们的状态何时改变。

一年前,微软和亚马逊将Alexa和Cortana带给了美国所有Echo扬声器和Windows 10用户,一年前,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)和亚马逊首席执行官杰夫·贝佐斯(Jeff Bezos)首次公布了合作伙伴关系。每一位助手都为餐桌带来了鲜明的特色。例如,Cortana可以用Outlook安排一次会议,或者利用LinkedIn告诉你下一次会议中的人的情况。亚马逊还开发了10万多个语音应用程序,以解决广泛的使用案例。