谷歌详细介绍了它是如何使用人工智能来改进搜索的,包括对网页中的单个段落进行索引,允许通过哼唱来搜索歌曲,等等

2020-10-16 04:03:10

在今天下午的直播活动中,谷歌详细介绍了它正在应用人工智能和机器学习来改善谷歌搜索体验的方法。

很快,谷歌表示,用户将能够直接在谷歌地图中看到繁忙地点的繁忙程度,而不必搜索特定的业务,这是对现有繁忙程度指标的扩展。该公司还表示,正在将新冠肺炎的安全信息添加到搜索和地图的业务简介中,以揭示他们是否使用了温度检测等安全预防措施。

对谷歌搜索的拼写检查功能“你的意思是不是”进行了算法改进,这将使拼写建议更加准确和精确。谷歌表示,新模型包含6.8亿个参数,运行时间不到3毫秒。谷歌搜索主管普拉巴卡尔·拉格哈万(Prabhakar Raghavan)在一篇博客文章中表示:“这一次改变对拼写的改进,比我们过去五年的所有改进都要大。”

除此之外,谷歌表示,它现在可以对网页中的个别段落进行索引,而不是整个页面。该公司声称,当这一功能全面铺开时,它将改善所有语言的大约7%的搜索查询。一个互补的人工智能组件也将帮助搜索捕捉网页内容的细微差别,从而为特定的搜索查询带来更广泛的结果。

谷歌还将数据共享(Data Commons)引入网络搜索结果,这是一家开放的知识库,将来自公共数据集(例如,美国疾病控制和预防中心新冠肺炎的统计数据)的数据结合在一起,使用映射的共同实体。在不久的将来,用户将能够在搜索中搜索“芝加哥就业”等主题,以查看上下文中的信息。

在电子商务和购物方面,谷歌表示,它已经建立了云流技术,使用户能够在增强现实(AR)中看到产品。例如,对于一辆汽车,他们将能够在车道上放大查看方向盘和其他细节,进行缩放,或者在手机上进行放大。另外,谷歌镜头(Google Lens)和谷歌图片(Google Images)将让购物者通过点击针织、褶皱袖子等元素来发现类似的产品。

除了搜索之外,谷歌表示,它将部署一项功能,自动突出视频中的要点,例如,比较不同的产品或显示食谱中的步骤。而地图中的Live View,一个点击AR提供逐个转弯步行方向的工具,将使用户能够快速查看有关餐厅的信息,包括他们倾向于变得有多忙以及他们的星级评级。

最后,谷歌表示,它将允许用户通过简单地哼唱或吹口哨来搜索歌曲,在iOS上最初是用英语搜索,在Android上是用20多种语言搜索。在智能手机上,打开最新版本的谷歌应用程序或搜索小工具,点击麦克风图标,然后问“这首歌是什么?”或者选择“搜索歌曲”按钮将启动该功能,这需要至少10到15秒的哼唱或口哨。

谷歌在一篇博客文章中写道:“在你完成哼唱之后,我们的机器学习算法可以帮助识别潜在的歌曲匹配。”“我们将根据曲调向您展示最有可能的选项。然后,你可以选择最匹配的,浏览歌曲和艺人的信息,在你最喜欢的音乐应用上查看任何伴随的音乐视频或收听这首歌,查找歌词,阅读分析,甚至在有这首歌的其他录音时查看。

谷歌表示,机器学习算法会将哼唱到搜索中的旋律转换为代表歌曲旋律的基于数字的序列。这些模型经过训练,可以根据各种来源识别歌曲,包括人类唱歌、吹口哨或哼唱,以及录音棚的录音。他们还去掉了所有其他细节,比如伴奏乐器和声音的音色和语调。这就留下了一个指纹,谷歌将其与来自世界各地的数千首歌曲进行比较,并实时识别潜在的匹配对象,这与Pixel的新播放功能非常相似。

谷歌搜索主管普拉巴卡尔·拉格哈万(Prabhakar Raghavan)表示:“从新技术到新机遇,我真的对搜索的未来以及它能帮助我们理解世界的所有方式感到兴奋。”

上个月,谷歌宣布将在人工智能的支持下,开始在谷歌图片中显示与照片相关的快速事实。从本周开始,在美国用英文搜索图片的用户可能会看到谷歌知识图谱(Google‘s Knowledge Graph)--谷歌数十亿事实的数据库--中的信息,包括与特定图片相关的人物、地点或事物。这一新功能出现在谷歌图片中的一些照片上,旨在提供围绕图片和托管这些图片的网页的上下文。

谷歌最近还透露,它正在使用人工智能和机器学习技术来更快地检测围绕自然灾害等危机的突发新闻。在一个相关的发展中,谷歌表示,它推出了一项使用语言模型的更新,以改善新闻故事和可用的事实核查之间的匹配。

去年,谷歌类似地开始使用一种名为Transformers的双向编码器表示法(简称BERT)的人工智能技术来解决查询歧义。BERT是从这家科技巨头对变形金刚的研究中出现的,它迫使模型通过查看单词前后的单词来考虑单词的上下文。根据谷歌的说法,伯特帮助谷歌搜索更好地理解了美国10%的英文查询-特别是更长的、更具对话性的搜索,在这些搜索中,“for”和“to”这样的介词对意义非常重要。

谷歌表示,现在每个英文搜索都使用Bert。此外,它被部署在各种语言中,包括西班牙语、葡萄牙语、印地语、阿拉伯语和德语。

例如,谷歌之前的搜索算法不会理解“2019年巴西游客到美国需要签证”是关于一名巴西人去美国旅行,而不是反过来。有了Bert,它意识到单词“to”在上下文中的重要性,Google搜索为查询提供了更相关的结果。