微软使Azure的沉浸式阅读器全面可用,允许开发人员将具有朗读等功能的阅读可访问性视图嵌入到应用程序中

2020-08-26 12:30:18

微软今天宣布全面推出沉浸式阅读器,这是一款Azure认知服务产品,允许开发者将文本阅读和理解功能嵌入到应用程序中,使其更具包容性。沉浸式阅读器旨在帮助用户-包括那些阅读困难、书写困难和注意力缺陷多动障碍(ADHD)的用户-提高他们在任何设备上的阅读技能。

根据2009年美国国家教育统计中心(U.S.National Center For Education Statistics)的一项调查,大约有3000万美国青少年和成年人认为阅读和写作具有挑战性。令人不安的是,低识字水平与较高的犯罪率、医疗保健系统导航问题和金融文盲相关。虽然收入、教育和语言背景等因素起到了作用,但在上述3000万人中,有35%的人有学习、视力或听力障碍。

这一现实促使微软在三年多前推出了沉浸式阅读器,在2月至5月期间,它的使用量上升了560%。根据微软的说法,随着学校为应对大流行而过渡到远程学习,越来越多的学校转向了这一工具。

沉浸式阅读器是学习工具的一部分,这是微软的套件,旨在帮助提高阅读和写作能力,特别是为残疾人服务。截至2018年6月,超过1300万人在40多种语言的应用和平台上使用学习工具,高于2017年6月的10万人。2020年6月,微软报告称,每月使用沉浸式阅读器的人数超过2300万。

学习工具是由Windows辅助功能项目负责人杰夫·佩蒂在2015年牵头的一个项目中诞生的。佩蒂联系了微软的高级阅读技术团队,并咨询了该部门的研究人员,了解哪些功能可能对苦苦挣扎的读者最有帮助。

Azure AI公司副总裁埃里克·博伊德告诉VentureBeat:“佩蒂研究了如何将所有最好的科学和研究都围绕着会议和包容性设计原则,以赋予所有能力的学生以能力,”Azure AI公司副总裁埃里克·博伊德(Eric Boyd)告诉VentureBeat。“(团队)看到这很有价值,特别是在教育领域。”

在微软教育首席产品经理迈克·索尔夫森的帮助下,佩蒂召集了十几个人,为微软2015年全公司范围的黑客马拉松开发了一个以诵读困难为重点的工具包,其中包括微软温哥华办公室的工程师,他们在OneNote中开发了一个诵读困难模式的原型。该团队为OneNote创建了一个扩展,提供了文本格式工具,使阅读、写作和记笔记变得更容易,以微弱优势击败了3300个其他项目,赢得了黑客马拉松比赛。

当时,Tholfsen正在与美国各地的教师和学校领导联系,讨论一种名为OneNote Class Notebook的相关产品,该产品可以让教师在个性化的工作空间内进行协作。沉浸式阅读器的设计只有黑白背景,但在老师告诉Tholfsen,一些患有艾伦氏综合症(一种影响大脑处理视觉信息能力的障碍)的学生更喜欢在特定颜色的背景下阅读后,设计团队加入了这些颜色。

沉浸式阅读器于2016年1月首次亮相。不久之后,在负责教育产品的微软公司副总裁埃兰·梅吉多(Eran Megiddo)的支持下,Tholfsen推动将该功能整合到更多的应用程序、平台和语言中。

沉浸式阅读器的核心是视听技术的应用,旨在帮助人们更有效地阅读。朗读功能将文本大声朗读,并突出显示,旨在提高解码、流利度和口述能力。另一个功能优化了窄列视图中的字体间距,以增强有视觉拥挤问题的人的阅读流畅性。(视觉拥挤指的是当单词或字母聚集在一起时无法区分它们。)。

博伊德解释说:“沉浸式阅读器将Azure中的多项服务整合为一项服务。”它是像翻译和文本到语音的…这样的东西。我们真的很想带来一些尽可能多的与我们的开发人员相关的东西。“。

沉浸式阅读器还显示音节之间的中断,以增强单词识别和解码;通过识别动词、名词和形容词来支持写作指导和语法理解;并可与Microsoft翻译配合使用,将文档和网站翻译成70多种语言。它的一个较新的模块是一个字典,它可以显示单词的图片表示以提高理解-当启用时,选择一个单词会显示一张最能描述该单词的图片。

微软表示,有证据表明,沉浸式阅读器的工具有益于广大读者--而不仅仅是有学习障碍的人。2017年RTI International对华盛顿州贝尔维尤不同年级的学生进行的一项研究发现,在使用沉浸式阅读器的人中,在全国标准化的评估中,阅读理解能力提高了10个百分点。

2017年,沉浸式阅读器进入Outlook网络版、Word Online版、OneNote Online版和OneNote for Windows 10应用程序,扩展了语言(例如盖尔语、毛利语和阿拉伯语)和区域支持。2019年,与Microsoft表单、白板和团队任务的测试版集成到来,紧随其后的是显示粗体、下划线、斜体和表情符号等格式的功能。最近,沉浸式阅读器获得了听起来自然的英语、西班牙语、德语、中文和意大利语的神经文本到语音转换语音,并在iOS和Android版的Office Lens中推出,恰逢它在“我的世界:教育版”中发布。在“我的世界”中,沉浸式阅读器可以阅读和翻译文本,包括菜单和字符对话框中的文本。

2020年5月标志着沉浸式阅读器跃升到Microsoft Edge,在此之前宣布沉浸式阅读器将作为Azure AI服务提供,让合作伙伴在他们的产品中利用它。从Code.org、Safari Monage、牛津大学出版社、Waklet、Follet、Pear Deck和Firefly等合作伙伴开始,微软已经与学生和学校合作,测试并征求对新扩展的沉浸式阅读器的反馈。

沉浸式阅读器的最新版本1.1支持自动预译和朗读页面。它还增加了15种新的神经文语转换语音和新语言,包括奥迪亚语、库尔德语北部和中部、普什图语和达里语。

微软表示,随着沉浸式图书馆在今年秋天晚些时候进入Outlook桌面,Windows 10上的邮件应用程序将于2020年第四季度推出,以及Outlook.com和移动设备上的表单,微软将在图片字典中推出超过1万张新图片。

截至目前,沉浸式阅读器以Azure API的形式提供,并附带一个软件开发工具包,以促进应用程序集成过程。(使用它需要免费或付费的Azure帐户。)。博伊德预计,随着大流行推动进一步增长,该工具将进入其他第三方产品。

博伊德说:“我们将与该领域的研究人员密切合作,同时(寻找)客户和教师的反馈,特别是我们与人们有合作伙伴关系的地方。”“我们将就对客户影响最大的事情征求意见--这才是真正指导我们所有思维过程的事情。”