Ava将AI字幕扩展到桌面和Web应用程序,并筹集450万美元用于扩展

2020-12-10 19:09:17

Ava以前在聋人社区中起名,是一种用于现实生活对话的有用的实时转录工具。启动该应用程序,它将立即听到并转录您周围的语音,并用颜色编码给每个扬声器(并在他们激活QR码时进行命名)。当然,这非常有用,但是当会议停止在房间里而开始在Zooms中时,事情就变得有些困难了。

联合创始人兼首席执行官Thibault Duchemin告诉TechCrunch:“用例已经发生了巨大变化,人们发现这些工具中的大多数都无法访问这一事实。”

而且,尽管某些工具内置的字幕有限(例如Skype和Google Meet),但它可能会或可能不会保存,可编辑,准确或便于查看。例如,Meet的临时字幕虽然有用,但仅持续一会儿就消失了,并且不特定于讲话者,这使得它们在尝试跟多人通话时充耳不闻或听不清的人使用有限。并且它们可用的语言也受到限制。

正如Duchemin所解释的那样,似乎具有一种不特定于任何一种服务的单独的转录层似乎已变得更加实用。

因此,Ava的新产品是一款名为“隐藏式字幕”的桌面和网络应用程序,可与所有主要会议服务和在线内容配合使用,并以相同的屏幕显示为字幕,并通过同一帐户访问该内容。其中包括超过15种语言的YouTube视频(不带字幕),实时网络广播,甚至纯音频内容(如Podcast)。

如果某个应用程序支持缩放,则单个扬声器会自动标记,例如“缩放”,或者让人们在会议中单击将其身份附加到语音声音的链接。 (这里存在隐私和机密性问题,但是它们会因情况而异,并且仅次于个人参与的基本能力。)

笔录全部都转到该人的Ava应用程序,让他们有空检查或与会议的其余部分共享。 Duchemin指出,这本身很难找到。

他说:“实际上确实很复杂。” “今天,如果您要与四个人开会,Ava是唯一一种可以准确标注谁说什么的技术,这在您考虑企业时非常有价值。”他说,否则,除非有人记下详细的笔记(不太可能,昂贵且耗时),否则会议往往以黑匣子告终。

他承认,对于如此高质量的转录,语音到文本AI还不够好。进行对话就足够了,但是“我们正在谈论的是聋哑或听障人士的专业人士和学生,” Duchemin说。 “他们需要会议,课堂和面对面的解决方案,他们还没有准备好使用完整的AI。他们需要有人来清理笔录,因此我们提供了这项服务。”

Ava Scribe很快带来了一个受过训练的人员,他们不仅接受直接转录方面的培训,而且还接受语音到文本算法产品校正方面的培训。这样,参加会议或课堂的聋哑人可以实时跟进,但也要相信,当他们在一小时后检查成绩单时,它将是准确的,而不是近似的。

他说,现在,转录工具正被用作现有产品和套件的增值产品,从而吸引或留住客户。他们不是从聋哑人社区开始的,他们是听觉很专业的人,并且围绕他们的需求进行设计,而这正是Ava努力做到的。

他们平台的知名度和实用性的爆炸式增长也导致了这笔450万美元的种子轮融资,由Initialized Capital和Khosla Ventures领投。

Duchemin表示,他们希望用这笔钱将他们的团队规模扩大一倍,并开始真正的营销和寻找大客户。他说:“我们非常专业,因此我们需要强大的业务模式来发展。”但是,强大而独特的产品是一个不错的起点。