[ 3 ]对于我们来说,情感和感觉是这些故事的关键因素,这一点很有意义。如果情感被视为叙事情节的驱动力,[6]那么它们应该在文本层面上被视为一种情感潜力,而不仅仅是在读者对文本的反应中产生。[7]到目前为止,只有少数研究系统地研究了“文本”情绪的范围和多样性,据我们所知,在明确划分的CHT语料库中进行的研究就更少了。[8]因此,情绪在这个核心语料库中是如何分布的,这仍是一个悬而未决的问题——总体而言,消极情绪更多,还是积极情绪更多?这些情绪在情节中是如何转换的?童话故事中哪些特定的离散情感特别常见?在整个语料库中是否存在很大的可变性?因此,我们从认知心理学和计算文学研究的交叉领域来探讨这个问题,我们要问,从格林CHT中选择出的核心语料库( ChildTale-A )是如何对情感进行文本编码的。
[ 4 ]为了提出有关文本编码情感的系统性问题,数字人文(DH)学者可以访问计算情感分类和情绪分析(SA)的各种资源 。然而,对历史和文学文本中的情感进行研究,在处理特定类型、特定时期和英语以外的语言的文本时,必须面临语义语境敏感性和领域适应性等问题。[9]在本研究中,我们选择不使用“开箱即用的”情感分析,例如syuzhet包[10]或现有的情感词典。[11]为了对格林童话及德语类似文本进行领域适应性研究铺平道路,我们在句子级别应用人工注释,以确定格林童话CHT中选定子语料库( N = 80)中文本的情感潜力。我们的注释程序实现了童话类型的特定叙事模式和情绪心理学的两种主要理论方法。
[ 5 ]为此,我们旨在通过三种方式为 CLS 做出贡献:首先,引入 文本编码情感的黄金标准( ChildTale-A语料库,见下文第 3 节),该标准在未来可用于改进基于监督机器学习的情绪和情感分析。其次,利用数据集回答关于童话情感设置的研究问题。第三,作为对 CLS 方法论的贡献,我们引入了四个指标:平均效价、情绪潜力、 情绪弧和情绪概况,它们可以成为对文本编码情绪潜力进行深入定性和定量分析及其可视化的有用工具。
2.童话中的情感
2.1 童话
[ 6 ]《格林儿童与家庭故事集》是继《路德圣经》之后德国文化史最广为人知的书籍。作为文学民间故事,它们于 2005 年被 联合国教科文组织世界记忆名录收录,代表着“人类想象的诗歌以一种普遍有效的形式呈现”。格林兄弟的《儿童故事集》是经典的儿童文学,除其他外,它被视为一种与人类学相关的通过文化适应和社会化进行进化适应的体裁,被认为有助于促进儿童的情感发展和情绪调节。[12]从跨学科情感研究的角度来看,CHT很有趣,因为它们既“代表”了审美历史情感,又有可能塑造(年轻)读者对情感的理解,[13]鉴于阅读习惯的不断变化,这一点需要定期重新审视。
[ 7 ]童话作为民间故事[14]属于安德烈·若勒斯 (André Jolles) [15]所分类的“简单形式”之一,是一种在形态学和类型学上被描述为非复杂的叙事体裁,可能与许多文化中经过漫长历史演变而来的人类学基本图式相对应。从这个意义上讲,童话具有一种简化的、简单的风格,是一种“具有刺耳、升华的风格形式的世俗冒险故事”。[16]因此,从形式上讲,童话是由重复、语义对比和公式化创造出来的。在叙事结构上,尽管有大量的奇幻元素,但它们都是情节驱动、现实主义叙述的(马克斯·吕蒂的“世界观”)。从动机和内容上看,童话被定义为有关“缺乏与补救”、“问题与解决方案”、“寻找与发现”的故事,这些故事的大纲是固定的,叙述方式也是“平面的”,也就是说,它们具有单一的、刻板的情节,刻板的背景,单维的(即非心理化的)人物和简单的世界观。[17]这些结局通常都很美好。[18]
[ 8 ]就其类型特征而言,值得注意的是,CHT故事集中所谓的“口头性”和“纯粹性”呈现方式早已被揭穿:这些故事是由收藏家在不同类型的口头甚至书面资料基础上共同创作的,[19]这就形成了格林兄弟独特的风格和结构,在动物故事集和魔法故事集中最为典型。这组故事不同于类似的体裁,例如“童话”、传说和寓言,也不同于作者更明确的“艺术童话”,可以在芬兰系统实证民间故事研究学派首次引入的动机目录中找到。[20]下面我们将重点关注这组约 110 个核心故事。
[ 9 ]在动物故事和魔法故事的情节中,文本编码的情感是特别清晰可辨的行动驱动力。[21]典型人物的善恶形象清晰可辨,情感和情绪也根据角色而变化,[22] 缺乏心理化,但往往可以观察到道德视角。[23]魔法(“奇妙的”)的元素,特别是以“超自然的助手”形式出现的元素,可以是动物、植物、拟人化的东西,也可以是神奇的礼物。[24]在虚构的世界中,这些魔法元素被呈现为“事实”;它们是情节发展的关键要素,因为它们通常会引起变化。尽管童话有着广泛的潜在解读,但其简短性、风格显著性、象征不确定性、奇妙维度和图式叙述构成了清晰可辨的基本结构。
2.2 情绪研究的理论视角
[ 10 ]情绪早已成为不同学科的核心话题。在心理学理论中,标准观点将人类观察到的情绪概念化为对刺激或由表明个人意义的不同评价引发的情况的反应。人类的情感涉及主观体验、生理、思想和行为。[25]基本情绪观点认为,情绪事件可以分为离散的情绪类型,即不同的基本形式,这些形式是生物适应,以面部和身体表情以及生理反应为特征。[26]因此,情绪体验可以用愤怒、厌恶、恐惧、悲伤、惊讶和快乐等标签进行分类,但对于类别的确切数量尚无一致意见。尽管这种方法贴近我们的日常经验,并有心理学[27]、民族志[28]甚至神经科学[29]研究的实证结果支持,但仍然存在一些缺点。[30] 例如,即使基本情绪被理解为创建用于描述我们的情绪体验及其语言描述的语义空间的类别,这些类别也没有明确的界限。因此,艾伦·考恩 (Alan Cowen) 及其同事认为,情感体验最好用梯度而不是离散的类别来描述。[31]
[ 11 ]根据情绪心理学的另一个主要理论观点, 维度方法,我们的情绪体验的变化可以沿着主要维度进行研究。最常讨论和探索的两个是效价和唤醒,效价从正到负,唤醒代表激活和强度。[32]按照詹姆斯·A·罗素的圆形模型[33] ,每一种特定的情绪都反映了一种核心情感的特定组合,可以用效价和唤醒维度上的特定位置来描述。[34]描绘情感内容的文字和图片也可以用这两个维度来表征。[35]为自动识别和分类文学文本中的情感内容而开发的情感分析系统[36]既实现了 基本情感方法,也实现了维度方法。[37]
[ 12 ]另外,关注情绪发展的方法,包括层次模型等功能主义观点[38],整合了上述两种一般观点的各个方面。例如,菲舍尔 (Fischer) 及其同事的层次模型结合了一个类似于价维度的上级层次(但将积极和消极两方面进行分类)、一个基本情绪类别层次,此外还有一个更为复杂且其发展取决于社会背景中的具体经验的下级类别层次。 Gerlind Grosse 和同事[39]最近对情绪词汇的发展进行了一项研究表明,德国儿童首先使用一般的“情绪”术语,如“好”或“坏”。直到后来,他们才获得基本情绪的标签,甚至更晚才获得复杂情绪的标签。
2.3 虚构叙事和童话中的情感
[ 13 ]尽管情感在文学文本的内容、结构和效果中发挥着核心作用,但情感研究长期以来一直被文学研究忽视;直到 20 世纪 90 年代情感转折点期间,这种趋势才开始回升。[40] 文学作品中的情感研究通常可以通过以下方式来区分:(a)主要关注读者,特别强调可能在观众中引起的情感,[41](b)文化历史背景,通过流派和文学时期追踪特定情感(如嫉妒或喜悦)的不同化身 ,[42]或(c)作为文本现象的情感,基于对情感的象征、文本编码和文化特征的理解。[43]
[ 14 ]文学对情感的研究通常集中于“离散”情感,例如愤怒、 仇恨、嫉妒、羡慕、爱、渴望或欲望。这种趋势与心理学甚至心理语言学形成了鲜明对比,因为心理学和心理语言学的实证研究通常也基于上述维度方法。[44] 文学情感研究采用语境学、解释学或符号学的方法,其分析针对特定的文本、作者,或者(较少见)流派[45]或文学时期,如浪漫主义。[46]
[ 15 ]在以文本为导向的情感研究中(比如目前的研究),情感内容被视为由词素、词素、句子或文体单位(比如隐喻和寓言)编码。这类研究最为突出的代表人物是西蒙娜·温科 (Simone Winko) [47] ,她认为文本的情感潜力由“所有具有形式和实质性质的情感和评价性文本元素的总和”构成。[48] 心理学和心理语言学研究也持有这种观点,其基础是可以通过使用组成文本的词语的情感意义来接近或估计文本的情感内容。[49]情感潜力可以通过文本分析和语言学方法来确定,甚至可能“不受时代、流派和制作因素的影响”。[50]我们对后者持怀疑态度,因为历史和文化差异,包括历史语言变化,限制了识别文学作品中“情感”的能力。[51]然而,我们从根本上假设精确的文本分析可以记录和描述各个文本结构和内容的情感和评价方面,从而可以识别文本的情感潜力。[52]
并不直接陈述读者的接受程度,而是将情感视为一种文化背景下的专属代码。[54] 因此,与以读者为中心的研究相比,我们关注的是文本本身的内容。随着文本挖掘实践引入人文学科,大量的计算情绪分类和情绪分析资源[55]已经变得可用。同样在德语计算文学研究中,方法越来越多地应用上述情绪效价和唤醒的心理维度以及离散的基本情绪来模拟文学文本中的情绪。[56]在DH和自然语言处理(NLP)中,童话故事一直是一个热门话题,[57]这可以通过其结构相对简单(与其他类型相比,这给自动分析带来的问题更少)以及关于其黑暗和负面内容的持续讨论来解释。[58]
[ 17 ]情绪分析的一个重大发现是,文本编码的情绪可以作为情节结构的代理,其中情绪轨迹描述叙述过程中的情绪状态,[59]或者可以识别是否存在幸福结局。[60] Andrew J. Reagan 和他的同事[61]提出了情绪轨迹的 新西兰电报数据 六种基本形状,而 Evgeny Kim 和他的同事[62]分析了不同类型的离散情绪的情绪轨迹。
[ 18 ]然而,尽管进行了动态研究,但广泛应用的情感分析方法仍然相当粗糙,通常使用词级情感和固定词典,无法解释否定、强化或例如比喻性语言。[63]对于德语离散情绪的自动分析,目前可用的资源很少,有的还处于原型阶段,而且它们的问题主要集中在情绪类别的分配上(核心词汇的标注者间可靠性低、缺乏独特值、情绪词汇是从英语翻译来的)。[64]作为基于词典的资源,这些资源仍然存在上述弱点,语义语境敏感性和词汇覆盖率较低。
度来注释,范围从-3(标记为负面)到+3(标记为正面),以›中性‹(0)为中心。唤醒程度 采用 5 分量表进行注释,1 为锚点›平静/放松‹,5 为›兴奋/激动‹。此外,在注释效价和 唤醒程度时,注释者还会在每个句子中指出情绪归因于哪个角色和哪个叙述实例(例如,角色本身或另一个角色;详情见表 1)。
[ 27 ]第二种模式(“离散”)实现了基本的情感理论。[83]由于对于基本情绪的确切数量和性质尚无研究共识,[84]我们遵循了 Grosse 及其同事的观点。[85]并使用了基本情绪:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。注释者不需要注释每个句子中每种基本情绪的程度或强度,而是需要指出一种或多种基本情绪是否是文本编码的。对于每个句子,可以注释零个、一个或者任意数量的六种基本情绪。此外,如果注释了情绪的存在,注释者还会指出情绪是否被明确表达,即使用情绪词(例如名词如›恐惧‹,形容词如›悲伤‹或动词如›悲痛‹)或隐喻,例如身体动作、隐喻或释义。如果检测到的情绪内容无法识别为属于六种基本情绪之一,则注释者可以添加注释,使用自己的语言描述所识别的情绪。