受折磨的短语:科学中出现的一种可疑的写作风格

2021-08-09 01:52:17

下载 PDF 摘要:十多年来,概率文本生成器一直被用于制作假科学论文。这种无意义的论文很容易被人和机器检测到。现在,更复杂的人工智能生成技术可以生成与人类无法区分的文本,并且已经记录了从几个关键字生成科学文本的过程。我们的研究引入了折磨短语的概念:用意想不到的奇怪短语代替既定短语,例如“假冒意识”而不是“人工智能”。我们梳理了文献中的折磨词组,并研究了这些集中在一起的知名期刊。假设使用高级语言模型,我们在该期刊最近文章的摘要和几个控制集上运行了一个检测器。成对比较揭示了期刊中标记为“合成”的摘要集中。我们还强调了其操作中的违规行为,例如编辑时间表的突然变化。我们通过分析几篇可疑的文章来证实我们的调查呼吁,强调有问题的特征:折磨人的写作风格,引用不存在的文献,以及未经承认的图像重用。令人惊讶的是,一些网站提供免费重写文本,生成充满折磨短语的gobbledegook。我们相信一些作者使用重写的文本来填充他们的手稿。我们希望提高对包含此类通过(差)同行评审的可疑 AI 生成或重写文本的出版物的认识。合成文本的欺骗威胁着科学文献的完整性。