2.1.2 连字符作为零点注释
连字符对中世纪手稿的注释来说是一个挑战;虽然编辑者希望记录连字符的位置,但不建议将连字符散布在纯文本中,因为这会混淆文字文本搜索。Codex 中的连字符注释通过用 零维注释表示连字符来避免这个问题。零维注释是隔离属性的一种特例,它有起始索引值但没有结束索引值;这样,注释实际上指的是文本中字符之间的位置。连字符本身并不存储在文本中(单词不带连字符),但注释指示了原文中连字符的位置。零点注释是隔离属性的一个通用特征,也可用于其他情况。
2.2 语义
在继续之前,我们应该注意到,对于每个语义注释系统中有一个相应的语义实体。Codex 中可用的注释和实体类型由应用程序代码定义,而不是由现有标准定义,这意味着程序员可以根据需要为系统配置更多注释和实体。 [10]每个实体都被建模为图形数据库中的节点和边的组合,有时以超节点结构表示(换句话说,一个实体在节点集群上建模)。[11]为文本创建语义注释相当于选择预先存在的实体,或在模式窗口界面中创建一个新的对应实体。相反,也可以在 Codex 编辑器之外的 Codex 界面中特定于该实体类型的部分中创 阿联酋电报数据 建和管理实体。因此,实体可以被视为独立于文本的数据集,但能够通过语义注释与文本集成。这意味着可以导出或导入实体,而不管它们在哪些文本中可能被提及或可能没有被提及:实体不必在文本中被提及(或从文本中推断出来)才能存在于系统中。