选择用词清楚地描述数据

2020-07-31 02:26:37

人们经常问我,NLG系统应该用什么词来描述数字。举例来说,如果盈利上升3%,这应该被形容为“微升”还是“温和上升”呢?使用文字来传达数字可以使叙述更容易阅读和理解,特别是对于那些“口头”思考者的读者来说。

不幸的是,很难给出明确的规则来说明何时应该使用“适度”这样的词,因为不同的人对这些词的解释不同。很多年前,雅吉·斯里帕达和我建造了一个NLG天气预报生成器(作为一个大学研究项目,而不是一个Arria项目),我们对作者和读者如何使用表达数据的词语做了大量的调查,特别是像“按傍晚”这样的时间短语。我们发现:

有人认为“到傍晚”是1800,有人认为是2100,还有人认为是0000。

少数人认为“到傍晚”的意义取决于日落时间或用餐时间;大多数人认为意义不受这些因素的影响。

如果天气预报要被很多人阅读,而这些人用不同的方式解读“傍晚”,那么NLG系统显然是有问题的!例如,亚吉和我看的预报是海上石油钻井平台,我们担心,如果预报说预计“到傍晚”会有大风,即1800,但钻井工作人员认为“到傍晚”意味着0000,钻井工作人员可能计划在2100卸货补给船,这并不好。

我们还发现,有些短语没有其他短语那么模棱两可,例如,几乎每个人都同意“午夜前”的意思是0000。因此,我们最终建议NLG系统的建造者寻找大多数人都以相同方式解释的单词,并尽可能地使用这些单词。这一策略效果很好,事实上,在许多情况下,人类读者更喜欢我们的电脑书写的预测,而不是人类书写的预测,部分原因是(如上所述)措辞更一致,更不容易混淆。如果有人想了解更多关于这项工作的信息,可以阅读我们的研究论文《在计算机生成的天气预报中选择词语》。

我见过许多不同的人对单词有不同解释的情况;我在另一篇论文“人类变异和词汇选择”中讨论了其中的一些情况。其他人也观察到了这一点;例如,心理学家黛安·贝瑞(Dianne Berry)观察到,在沟通药物副作用风险的背景下,不同的人对“常见”一词的解释非常不同。贝瑞还指出,如果“共同”这个词被用来表示有1-10%的可能性出现严重的副作用(这是欧盟推荐使用的药物传单),但患者认为“共同”意味着50%的可能性(这是贝瑞的许多受试者对这个词的解读),那么患者可能会因为这种误解而拒绝服药。

我怀疑,密切合作的人可能会倾向于在词义上达成一致,这是因为一种被称为“对齐”的心理语言现象。但是,如果一篇叙述是面向广大受众的,那么选择读者一致解读的词语可能并不是一件直截了当的事情。

我的建议是做一个仔细的分析,以便了解不同的用户将如何解释不同的单词。不要只依赖你的直觉,因为你的直觉会告诉你如何解释单词,而不是别人如何解释单词。我会从一份问卷开始,询问人们对具体单词的理解。理想情况下,您还应该进行“语料库分析”,即分析现有文本中单词的使用情况;Yaji和我在分析天气预报中的单词使用情况时就这样做了。然而,虽然语料库分析提供了很好的单词使用数据,但做好语料库分析是一项相当大量的工作,还需要一些专业技能。

关于作者:Arria首席科学家Ehud Reiter教授是自然语言生成(NLG)科学的先驱,也是NLG领域世界上最重要的权威之一。他负责Arria核心技术开发的总体方向,以及对NLG具体项目的监督。他是阿伯丁大学自然与计算科学学院的计算科学教授。点击此处访问他的博客。