叙事弧线：通过文本分析揭示核心叙事结构

2020-08-11 23:00:17

不同学科的学者长期以来一直在争论叙事背后是否存在共同的结构。使用基于计算机的语言分析方法，对约40,000个传统叙事(如小说和电影剧本)和约20,000个非传统叙事(报纸文章、TED演讲和最高法院意见中的科学报道)的几种结构和心理语言类别进行了测量。纵观传统叙事，出现了一致的潜在故事结构，揭示了三个主要过程：舞台、情节发展和认知紧张。没有证据表明遵守规范的故事结构与故事的受欢迎程度有关。最后，对事实驱动文本的分析揭示了与基于故事的叙述不同的结构。

叙事渗透到人类生活的方方面面。我们讲故事是为了教授文化规范，娱乐，并帮助创造共同的观点。我们编造故事是为了从过去的事件中获得意义，为我们自己和他人创造新的世界和可能性。叙述的创造是跨越有记录的历史的基本人类行为。

长期以来，叙事理论家、哲学家、文学学者、语言学家和无数其他学科都试图确定叙事的精髓属性(1-3)。其中，有一个普遍的共识，那就是叙事通常遵循一条预定义的路径，包括开头、中间和结尾。这样的理论框架主要引用了这样的概念，即故事的概括性特征提供了一种叙事结构，同时允许围绕这一结构的具体内容有无限变化的可能性。换句话说，大多数叙事框架假设故事的结构和内容是独立的-例如，两部悬疑小说不需要有相同的人物或背景就有相似的情节动态。

寻找客观的、可量化的叙事结构标记是一项艰巨的任务。早期的实证研究依赖于使用人类编码员的少量文本。研究已经为共同的情节结构、反复出现的文化符号和人物原型提供了混合的证据(4-6)。然而，近年来，自动化的文本分析方法，加上越来越多的文本，已经产生了很有希望的新方法来量化故事的潜在和普遍属性(7-11)。例如，利用文本的连贯性和内聚力的方法，如coh-Metrix(12)，可以在数学上计算句子与句子之间以及文本不同部分之间的词义相似度。因此，衔接分数可以推断出一篇文章在展开时在多大程度上停留在相同的一般主题上。

其他最近与内容相关的方法试图追踪情感的语言标记在故事过程中是如何展开的。最近的一项研究报告了对1700多部数字化小说和其他文本的分析，在这些文本中，共同的情感高峰和低谷被系统地量化和聚类(13)。总体而言，研究人员确定了从故事中出现的六种常见的情感轨迹(即“情感弧线”)，每一种都对应于不同的情节原型。例如，在一个故事的过程中，积极情绪词汇的持续增加表明了一个“从贫穷到富有”的故事情节，而积极情绪词汇的下降则表明了悲剧。

对情感弧线的研究提出了更广泛的叙事结构问题。叙事不仅仅是情感体验-它们的呈现方式支持关于人物、冲突和解决方案的信息，以及各种其他特定于故事的特征。19世纪学者古斯塔夫·弗莱塔格(Gustav Freytag)著名地将几个叙事元素描绘为广义叙事弧线上的点[通常被称为“戏剧性弧线”(14)]。弗莱塔格认为，阐述，或者说故事场景的构建，为叙事的结构奠定了基础。随着故事的发展，人物之间的动作增加，最终在叙事弧线的顶端达到顶峰：故事的高潮。随后，冲突的减少促使人物向结局或解决方案过渡。弗莱塔格将这些叙事元素描述为类似于故事中特定事件的东西-在叙事中出现在固定点的相对离散的目的地。

从本质上讲，弗莱塔格的框架提出了故事展开的三个主要过程。首先是叙述者为故事设置舞台和建立语境。一旦故事元素确立，随着角色之间互动的增加，故事情节的发展就开始于角色跨越时间和空间的移动。此外，故事的焦点是人物必须努力解决并最终解决的中心冲突或认知紧张。弗莱塔格，当然是

虽然英语中常用的虚词不到200个，但它们占我们说、写、听、读所有单词的50%到60%(16)。过去二十年进行的多项研究表明，虚词需要社交技能和意识才能使用和解释。想象一下，在街上发现一张纸条：

这些词很常见，笔记在句法上是连贯的，但信息背后的最终含义是难以捉摸的。注释仅使用虚词，指的是只有作者和目标读者共享知识的人、地点和时间。我们可以比偶然性更高的概率推断出作者与意向读者的关系(他们可能很亲密)以及作者的其他社会心理属性。多项研究已经证明，虚词可以用来识别社会心理因素，包括人们的年龄、性别、交往中的相对地位、诚实、礼仪、智力和情绪状态(17)。

因此，在叙事研究中，虚词应该是故事发展的有价值的标志。当故事开始时，作者和读者都是陌生人。为了设置故事情节，读者需要大量的上下文信息：人物是谁？它们之间是什么关系呢？故事发生在何时何地？因此，一开始，作者必须为故事中的人物、地点和物体发出具体的标签、名字和其他识别线索的信号；重要的是，作者还必须通过阐述它们的相互关系来将这些点联系起来。在提供必要的背景时，作者必须使用高比例的介词和冠词(豪宅位于湖边、悬崖下、路旁)-这些词本质上是信息结构的(18)。一旦读者熟悉了上下文，作者可以稍后将这座豪宅称为“它”或“她的家”，也可能根本不称其为“她的家”。一旦情节发生变化，代词、助动词等虚词就会大量增加，冠词、介词就会相应减少。

从心理计量学角度看，介词和冠词的表现与其他虚词不同。在对25000多名学生的大学招生作文分析中，冠词和介词呈正相关+0.25，其他虚词类呈正相关+0.21。更值得注意的是冠词和介词与其他虚词的总体平均相关性为−0.30(19)。检查文章/介词较多的文章发现，它们在信息呈现方式上是分析性的、正式的和层次化的结构。那些在代词、助动词等方面得分较高的文章被发现更多地以性格和行动为导向，也更非正式。然而，这种区别并不是类型学的--所有的文章都包含了两者的一些元素，而且发现的不同之处在于任何给定的作者使用信息结构语言与故事驱动语言的连续体。从某种意义上说，故事既有分析的成分，也有叙事的成分。一开始，作者必须把舞台布置得有条不紊、有条不紊。一旦建立了总的景观，情节就可以通过人物的行动和调解事件来推进(20)。

弗莱塔格模型的第三个维度涉及到一个故事的认知张力或高潮。传统上，叙事围绕着一个令人烦恼的、悬而未决的问题展开。一旦舞台搭建好，叙事开始展开，主人公在实现目标或挑战世界观方面就面临着中心障碍或挫折。正是在这些挑战中，叙事中形成了认知张力-人物必须积极处理他们的场景，解决冲突，并形成理解他们世界的新方式。以同样的方式，舞台和情节发展在一定程度上都存在于整个叙事中，从理论上说，冲突引起的认知紧张在整个故事中都存在，甚至在某种程度上是在故事的开头或接近开头(21)。多年来，几位研究人员发现，一组认知加工词汇(例如，“思考”、“相信”、“理解”和“原因”)反映了人们在处理生活中的冲突或挑战时所从事的意义形成过程(22，23)。此外，当人们不确定复杂问题的答案时，认知过程词的使用率要高于绝对确定答案的人(24)。

在大量文献的基础上，论证了虚词、认知词和语言中涉及的心理过程之间的关系，我们着手更好地理解这些被广泛理解的言语行为心理标记物之间的交集及其与传统语言的一致性

1)舞台：叙述者在故事开始时通过确定名字、地点以及人物和地点之间的关系来建立基本背景或设置舞台。要做到这一点，他们必须以很高的语速引用介词和冠词，这些介词和冠词被用来构建读者可以理解的情景(25)。在介绍了基本的背景信息之后，作者需要更少明确的概念参考，在整个故事过程中，介词和冠词的使用应该减少它们的相对频率。

2)情节回归：背景信息一旦确定，观众就会与叙述者对上下文有共同的理解，从而让说书人将情节向前推进。故事的气势应该可以通过代词、助动词和其他常见的虚词来检测。像代词和连接词这样的词不仅对于故事进展过程中的叙述衔接和连贯至关重要(26，27)，而且对于推动情节通过重要的经验过程也是必不可少的，这些过程被暗示给观众(28)。

3)认知张力：当故事达到高潮时，人物和叙述者在认知上以一种越来越积极的方式解决他们面临的问题。认知紧张或“贯通”的相对量将反映在认知过程词中(29，30)。与弗莱塔格的模型一致，故事的认知紧张阶段通常应该在故事的中后期达到顶峰。

如下文更详细描述的，本项目最初集中于传统叙事的三个主要语料库：长篇小说、短篇小说，甚至是由大量互联网用户自发撰写的更短的故事。如果叙事确实有标准的、规范的结构，我们预计这三个非常不同的语料库中的每一个都将显示出平行展开的结构模式。

叙事的本质是它所讲述的故事。我们都有过喜欢一些朋友讨厌的电影或小说的经历。直觉上，意见的分歧往往围绕着潜在的主题，而不是在舞台或情节进展上。如果是真的，人们可能会认为流行和不受欢迎的电影或书籍的叙事结构可能是相似的。或者，不太受欢迎的电影和书籍可能不太受欢迎，因为它们的结构非传统(或过于传统)。第二个研究问题试图分析电影和言情小说的对白转录，这两个问题都得到了大量观众的评分。

RQ3：不同类型的叙事-比如流行的科学报道甚至TED演讲中的叙事-与传统叙事有相同的结构吗？

叙事和故事的定义是高度不稳定的。最传统的假设是，叙事包含一系列具有开头、中间和结尾的相关事件。一般来说，叙事被认为是由一系列故事或事件组成的上位结构，这些故事或事件可以是虚构的，也可以是事实的。小说和短篇小说是叙事性的，而对科学发现的事实描述可能不那么像故事，但仍然是叙事性的。第三个研究问题试图建立一些叙事弧的边界条件，以确定科学故事在多大程度上可以坚持与更传统的讲故事形式相同的叙事结构。

一开始，并不清楚叙事信号的弧线可能有多强。鉴于之前没有学者成功地识别出表明规范叙事结构的语言模式，我们试图使用相对保守的字数统计策略来分析相当大的故事样本。有关这些方法的更详细说明，请参阅补充资料。另请参阅随附的网站(https://arcofnarrative.com))，了解选定小说和用户提供的故事的叙述弧线方法的演示；使用此工具，用户可以创建数据的可视化，在自己的文本中测量叙述过程，并查看有关方法和这项研究的更多信息。

对于RQ1，收集了三个初始语料库，这些语料库跨越了体裁、作者属性和几个世纪。传统故事包括来自古腾堡语料库的2523部小说，来自各种在线来源的2092个短篇小说，以及来自第三作者维护的网站的标准化主题统觉测试[TAT；(31)]的14,419个由互联网用户撰写的简短故事。

为随后的研究问题收集了其他语料库，包括由OpenSubtitles.org提供的电影对白(N=19970)的大型语料库，并补充了每部电影的IMDb评分。分析了从Smashwords.com上收集的自我出版的浪漫小说(N=639)，包括每个文本的社区评分。最后，两个与科学相关的语料库包括1989年至2017年发表的18312篇《纽约时报》科学文章和2226篇TED演讲的文字记录。最后，一个由1580名最高法院多数派、赞成意见和反对意见组成的非科学语料库也被包括在内。有关文本纳入标准和数据清理程序的完整详细信息，请参阅补充材料。

分析策略包括量化每个文本中的功能词和认知词的比率。与阶段性相关的虚词率(冠词和介词)与与情节推进相关的虚词率(代词、助动词、否定词、连词和非指代副词)分开计算。每个文本的两个虚词类别的总和除以文本中的总字数，得到总字数的百分比。认知紧张词基于文本分析程序“语言查询和字数”中的认知过程词典[LIWC2015；(32)]。叙述过程词典的发展和心理测量学在补充材料中进行了描述，以及我们为确保词典的稳健性而测试的具体变体。词干、词干和词条的总数在三本词典中差别很大：阶段性，75个词；情节推进，448个词；认知紧张性，393个词。

为了捕捉三个理论化过程在叙述过程中的展开，每个文本被分成五个大小相等的片段。最初选择的五段法大致对应于叙事的五个传统“阶段”(即阐述、上升动作、高潮、下降动作和结局)。如补充材料(C部分)所述，无论文本是否被分成不同数量的片段(从3到10个不等)，我们都获得了概念上一致的结果。每个片段内的语言维度被单独分析，每个故事产生15个叙事度量(3个叙事过程×5个文本片段)，这使得能够对每个故事中叙事过程的动态进行建模。

三本词典的基本比率因体裁的不同而有很大不同；在每个文本中，每个叙事维度的所有分数都是单独标准化的，以关注文本中每个叙事维度的相对、故事内部的形状。例如，记住Staging是所有冠词和介词的总和，以占总字数的百分比表示。如果在特定文本中，五个语段的分段率(即冠词和介词的百分比)从7.4%变化到3.3%，则该文本的文本内标准化分数如下：

非常宽泛地说，数据分析有两种方式：传统的假设检验方法和预测建模方法。对于大多数研究问题，我们使用简单的混合设计方差分析(ANO。

https://advances.sciencemag.org/content/6/32/eaba2196.full

tags users