苹果公司的克雷格·费德里吉详细介绍了iPad上手写识别背后的ML是如何工作的,这是通过在人们写作时直接从他们那里获得的数据进行训练的

2020-09-26 12:42:02

一般来说,人类的任务越直观,人工智能的难度就越大。想想当Alexa听不到您的命令时,或者当您的垃圾邮件过滤器捕获了一封重要的电子邮件时。几十年前,计算机识别手写文字,然后将其翻译成它能理解的字母和数字的能力一直是一个挑战。想想21世纪初Windows转录器或90年代末PalmPilot的随机功能。笔迹如此微妙,仅仅分析静态字母的形状是行不通的。

苹果似乎找到了解决方案。在iPadOS的最新更新中,当你用苹果铅笔(129美元)书写时,iPad可以识别你的涂鸦,并通过Scribble将其转换为键入的文本。它的工作原理和大多数机器学习一样-示例提供有助于预测和解释全新请求的规则-但它利用更智能的数据集和更强大的计算能力来执行之前几代机器都遇到的困难。Alexa和Siri依赖于与遥远的数据中心的连接来处理它们的处理,而iPad需要能够在设备上完成所有的工作,才能跟上手写(例如,绘图机学习也可以帮助Notes应用程序理顺一个不完美的多边形涂鸦)。这比你想象的要费力得多。

“当涉及到理解(手写)笔画时,我们会收集数据。苹果负责软件工程的高级副总裁克雷格·费德里吉(Craig Federighi)说:“我们在世界各地寻找人才,让他们写东西。”“我们给他们一支铅笔,我们让他们写得快,我们让他们写得慢,写得倾斜。所有这些变化。“。这种方法有别于相对简单的扫描和分析现有笔迹的方法。费德里吉说,对于苹果的技术来说,静态的例子是不够的。他们需要看到构成每个字母的笔画。“如果你了解笔划以及笔划是如何落下的,就可以用它来消除所写内容的歧义。”

这种对人们书写方式的动态理解意味着,苹果的软件可以可靠地知道你在写什么,但结合一种语言的语法数据,iPad还可以预测你下一步要写什么笔划、字符或单词。这样做所需的大量统计计算是在iPad本身进行的,而不是在数据中心。费德里吉说:“它必须在你现在手持的设备上实时发生。”“这意味着该设备的计算能力必须能够在本地完成该级别的处理。”

所有这些处理的使用案例:你在开会时用铅笔在iPad(329美元以上)上手写笔记,你想看桑给巴尔的地图。你现在可以刷到地图应用程序,在搜索栏里写上“桑给巴尔”,而不是轻敲屏幕的键盘。或者,你想通过电子邮件发送几行手写笔记。您可以选择该部分,复制,然后粘贴到电子邮件中,在电子邮件中显示的内容就像您输入的内容一样。或者你写下一个电话号码,你可以点击拨打。

如果你买了一支苹果铅笔,iPadOS 14除了语音和键盘外,还提供了一种额外的输入方法,可以与iPad进行交流。这个用例很窄,但它是手写顽固分子的数字桥梁,比在平板电脑上随身携带键盘更容易。它的效果如此之好,以至于把你的文字翻译成功能文本感觉像是一种自然的行为。这是苹果经常推出的一种新奇玩意儿,感觉非常有机,你会找借口使用它。

此内容由第三方创建和维护,并导入到此页面以帮助用户提供其电子邮件地址。您可以在piano.io上找到有关此内容和类似内容的更多信息