Facebook和Instagram的AI生成的图像标题现在提供了更多细节

2021-01-20 06:32:06

替代文字是图像元数据中的一个字段,用于描述其内容:“一个人站在马场上”或“一条狗在船上”。这样一来,看不到图像的人就可以理解它。

这些描述通常是由摄影师或出版物手动添加的,但是将照片上传到社交媒体的人通常不会打扰,即使他们可以选择。因此,相对较新的自动生成功能-该技术在最近几年才刚刚变得足够好-极大地有助于使社交媒体更易于访问。

Facebook于2016年创建了其自动Alt Text系统,该系统在机器学习领域是无与伦比的。此后,团队对它进行了许多改进,使其变得更快,更详细,并且最新更新添加了一个选项,可以根据需要生成更详细的描述。

改进后的系统可以识别的项目和概念比开始时多了10倍,现在大约是1200。并且描述包括更多细节。曾经的“两个人在建筑物旁”现在可能是“两个人在埃菲尔铁塔旁的自拍照”。 (实际描述中使用“可能是……”进行套期保值,将避免包括大胆的猜测。)

但是,即使它并不总是相关的,也有比这更多的细节。例如,在此图像中,AI记录了人和物体的相对位置:

显然,人们在鼓之上,而帽子在人们之上,对于要获得要旨的人来说,确实不需要说什么。但是考虑一下描述为“一所房屋,一些树木和一座山”的图像。房子在山上还是在山的前面?树木是在房子的前面还是后面,还是在远处的山上?

为了充分描述图像,即使可以用较少的字眼理解一般想法,也应填写这些细节。如果有视力的人想要更多细节,则可以更仔细地查看或单击图像以获取更大的版本-无法执行此操作的人现在可以通过“生成详细图像描述”命令使用类似的选项。 (通过长按Android应用程序或在iOS中执行自定义操作来激活它。)

也许新的描述可能是“山上有雪的房子和树木”。 那画得更好,对吗? (很明显,这些示例是虚构的,但这是可以预期的改进。) 新的详细描述功能将首先在Facebook上进行测试,尽管改进后的词汇将很快出现在Instagram上。 说明也保持简单,因此可以轻松将其翻译为应用程序已支持的其他语言,尽管该功能可能不会同时在其他国家/地区推出。