提前确定哪些形式的

A comprehensive collection of phone data for research analysis.
Post Reply
Bappy11
Posts: 350
Joined: Sun Dec 22, 2024 6:02 am

提前确定哪些形式的

Post by Bappy11 »

2.1 通用性和量化
[ 6 ]使用通用语句,可以同时描述一类事物或个体,既可以通过指代这一种类或属的名词短语 (NPs) (如示例 (2) 所示),也可以在句子层面 - 在这种情况下,我们称之为特征句子或通用句子。[9]这些陈述可分为关于事实的词汇特征陈述(参见 (3)),或关于重复事件的习惯特征陈述(参见 (4))。这两种形式也可以出现在同一个句子中(参见(3))。
(2)狮子吃肉。 (NP ›Löwen‹ 指属)
(3)狮子有鬃毛。[10](词汇表征,与一般使用的 NP 结合)
(4)约翰晚饭后喝了一杯啤酒。 (习惯用语)

所有这些通用陈述的共同点是,句子表面缺少明确的指标来表明它们的概括性。因此,所列陈述通常具有歧义: (2) 中的不定复数 NP Löwen是一种经常引发泛泛读音的形式,但也可以具体使用:
(5) 动物园的锁定系统损坏。狮子逃走了。 (具体用途)

这同样适用于单数物质名词。仅在 (6) 中,而非 (7) 中,黄金被 泛指使用:
(6)金子是发光的。
(7)银行被抢劫,黄金被盗。

单数定名词和不定名词短语也可以做一般性解释或特殊性解释。通常,上下文是判断是否存在类比解读的决定性因素,参见 (8)–(10):
(8)狮子有鬃毛。 (不定式名词短语,默认触发泛化读音)
(9)狮子有鬃毛。 (明确的名词短语,根据上下文可以进行概括解读)
(10) 一位父亲向他的孩子解释野生动物的特征。他说:大象有鼻子。狮子有鬃毛。 (上下文引发泛化阅读)
(11)一位父亲和他的孩子站在动物园的狮子笼前。父亲问孩子哪种动物有鬃毛。小孩指着成年雄性狮子说:“狮子有鬃毛。” (上下文触发特定阅读)

这些例子说明了通用解释具有很高的语境依赖性;仅基于 NP 的语言形式,还无法确定地判断该 NP 是否被一般性地解释。根据广义量词理论,我们假设表征句子和量化句子具有相同的三部分结构,由量词(Q)、限制词(R)和核心范围(S)组成,[11]每个组成部分都发挥其自身的特定意义贡献。然而,量词不一定必须从自然语言句子的表面上可读。对于通用句子尤其如此。我们用一个例子来解释这个结构:
(12)每个科学家都很聪明。

量词可以理解为两个集合之间的关系。因此, (12)中的每一个都表达了女科学家集合和聪明人集合之间的关系。他明确指出,女科学家集合完全包含在聪明人集合中,即她们构成了聪明人的一个子集。 NP科学家代表量词each的限制器 ,并描述某事所针对的子集:所有科学家的集合。谓词巧妙地形成了量词的(核)范围,它捕获了归因于该集合的属性。在诸如 (12) 的例子中,Q、R 和 S 在表面上仍然相当容易识别,但在叙述文本的句子材料中,它变得复杂得多,正如第 2.3 节所示。

[ 7 ]概括可以用量化和通用的语句来表达。在计算语言学研究中,有时人们更感兴趣的是通用语句,因为这些语句没有在句子表面用指示符标记,因此更难以正式描述和自动识别。另一方面,在叙事学中,尚不清楚哪些形式的概括在小说文本中更为突出,或哪些形式更有可能与文本中的哪些功能相关。因此,目前限制某一语言研究重点是没有意义的。

2.2 通用性和量化的操作化方法概述
[ 8 ]有相当数量的注释方案旨在标记量化或通用表达。这些提案中的大部分都只涉及通用 NP [12],因此可使用的标签数量有限。Friedrich 等人对此进行了注释。 2015,句子的主语是否统称某一种类或类别,如果是,周围的句子是否对这一类别作出特征性或具体的陈述。根据这种划分,他们使用由三部分组成的标签集:

[ 9 ]Friedrich 等人设置的标签:

基因; gen:具有一般主语的一般句子
非GEN; non gen:非属类句子,带有非属类主语
非Gen; gen:具有通用主语的非通用句子
[ 10 ]通过关注通用主语,具有通用宾语但非通用主语的句子被 巴基斯坦电报数据 排除在调查之外,尽管这些句子中也可能存在概括,如示例(13)所示:
(13)约翰喜欢咖啡。

Friedrich / Pinkal 致力于基于主动词的词汇方面自动识别习惯句。[13]这种方法完全是出于语言学动机:句子主动词的体貌(动态或静态)决定了句子的体貌。如果句子的主动词具有动态体,则这可以表示习惯句或情节句。另一方面,静态动词通常导致静态句子。根据不同的方面,句子在(叙述)话语中的功能会发生变化;例如,普通句子通常与叙述停顿有关。[14]

[ 11 ]最后,Friedrich 等人。 2016 年还提出了一种集成方法,同时注释和自动识别通用 NP 和习惯表达。[15]他们的方法的目标是自动识别所谓的情境实体类型(SE 类型)。除了事件和事实之外,这些还包括所谓的生成状态,一方面可以是一般性陈述,另一方面可以是习惯性陈述。在句子级注释中,主要指称物(通常是主语)被分类为通用或非通用。此外,还根据主动词的词汇方面(动态或静态)对其进行了注释。根据结果​​,分配标签普通句子、概括句子、状态或事件 。[16]注释中排除具有非类属主语但具有类属宾语的句子(参见(13))的问题在这里仍然存在,但可以通过类状态来解决。

[ 12 ]总体而言,概括的自动识别不仅与通用名词短语或习惯性的自动识别相关,还与通过(词汇)体识别来识别叙述文本中的时间结构相关。据我们所知,尚未有人尝试专门在德语小说叙事文本中识别概括。如本节所示,现有方法大多以计算为导向,且大多涉及事实文本类型,如报纸文本、(在线)百科全书条目等。此外,我们主要处理英语文本。将这些方法直接转移到德语小说文本并不容易,其原因将在下一节中讨论。
Post Reply