受折磨的短语：科学中出现的一种可疑的写作风格

2021-08-09 01:52:17

下载 PDF 摘要：十多年来，概率文本生成器一直被用于制作假科学论文。这种无意义的论文很容易被人和机器检测到。现在，更复杂的人工智能生成技术可以生成与人类无法区分的文本，并且已经记录了从几个关键字生成科学文本的过程。我们的研究引入了折磨短语的概念：用意想不到的奇怪短语代替既定短语，例如“假冒意识”而不是“人工智能”。我们梳理了文献中的折磨词组，并研究了这些集中在一起的知名期刊。假设使用高级语言模型，我们在该期刊最近文章的摘要和几个控制集上运行了一个检测器。成对比较揭示了期刊中标记为“合成”的摘要集中。我们还强调了其操作中的违规行为，例如编辑时间表的突然变化。我们通过分析几篇可疑的文章来证实我们的调查呼吁，强调有问题的特征：折磨人的写作风格，引用不存在的文献，以及未经承认的图像重用。令人惊讶的是，一些网站提供免费重写文本，生成充满折磨短语的gobbledegook。我们相信一些作者使用重写的文本来填充他们的手稿。我们希望提高对包含此类通过（差）同行评审的可疑 AI 生成或重写文本的出版物的认识。合成文本的欺骗威胁着科学文献的完整性。

https://arxiv.org/abs/2107.06751