正在加载图片...
第5期 崔铁军,等:SFEP文本因果关系提取及其与SFN转化研究 ·1001· 系组转化为SFN基本结构后,可根据因果关系组 献21-33]和SFEP的特点,制定如下定义。 之间的相同事件叠加形成完整的SFN网络,最终 定义4关键词(key words,,KW)。用于代表 完成SFEP到SFN转化。 SFEP文本描述中,可进行形式化抽取和同类词汇 确定因果关系组后,对组内各部分进行分析, 表示,关键词是由表示相同含义的词汇组成的集 主要包括原因事件、结果事件及逻辑关系。可将 合,由关键词组成的集合称为关键词组(key words 文本抽象为连接词、原因词、结果词、原因部分、 set,KWS) 结果部分、标点符号、其他类型短语等,称为关键 KW是一类文本词汇的统一标识。用于在 词。在SFEP描述中这些词都有具体的词汇,可 SFEP中因果关系组的抽象和形式化。将因果关 在模型学习过程中累计。逐渐形成这些关键词对 系组代表的文本转化为因果关系组模式的符号序 应的词汇集合,以便丰富文本因果关系分析能力。 列。KW包括多种类型,连接词1、连接词2、原因 根据因果关系组和得到的关键词集合,研究 词、结果词、原因部分、结果部分、其他关于符号 因果关系组的基本模式。由于已事先获得关键 部分。这些KW组成了KWS。 字,将因果关系组中的文本描述进行替换,可得 定义5连接词1 link word1,LW1)。用于表 到为数不多的因果关系组模式。每种模式都代表 示SFEP中,归一和分支结构的与关系,即多个原 了一类因果关系描述类型的语句。该过程在模型 因事件同时发生导致结果事件,一个原因事件同 学习阶段得到补充和丰富。 时导致多个结果事件。LW1={并且,且,而且,切, 将组模式转化为SFN的基本结构。在第1节 以及,加之,…},这些词汇表示两事件并列及同时 已提到SN表示SFEP使用6种结构,而分析过 的与关系。 程只需其中3种结构。根据组模式转化为SFN 定义6连接词2 link word2,LW2)。用于表 的对应结构。 示SFEP中,归一和分支结构的或关系,即多个原 因此,关键词中的原因词和结果词引导的原 因事件之一发生导致结果事件,一个原因事件导 因部分和结果部分将成为SFN的节点对应事 致其一或多个结果事件。LW2={或者,或,要不, 件。连接词代表了原因部分或结果部分之间的逻 之一,都,…},这些词汇表示两事件之一发生导致 辑与或关系,将成为SFN的连接和逻辑关系。其 结果发生的关系,或导致可能的两个结果事件 他类型短语一般成为原因和结果事件的一部分。 最后得到的所有SFN基本结构都只传递了一次, 之一。 那么之中必定有事件即作为原因又作为结果,因 定义7原因词(cause words,,CW)。用于表示 此根据等事件规则将所有SFN基本结构叠加,形 SFEP中引导原因事件的词汇。CW={由于,因为, 成SFEP文本描述转化的完整SFN结构。 当,…},这些词汇用于引导原因事件,是原因事 模型学习阶段主要是关键词和因果关系模式 件的标志。 的补充和丰富。在已分析的SFEP文本中,可获 定义8结果词(result words,RW)。用于表示 得一些关键词对应的词汇,也可确定因果关系模 SFEP中引导结果事件的词汇。RW={所以,因此, 式。但关键词在语言中千变万化,一个关键词可 因而,于是,…},这些词汇用于引导结果事件,是 以有很多词汇表示,需要实践中学习丰富。同理 结果事件的标志。 因果关系模式代表了一句完整的因果关系描述, 定义9原因部分(cause part,,CP)。用于表示 这些描述的结构千变万化,也需不断补充。 SFEP中原因事件的描述。CP用于表示原因事 对于一个实例SFEP分析,如果它的关键词 件,可以是复杂的句式或短语等。 和关系模式都是已知的,那么将会顺利完成 定义I0结果部分(result part,.RP)。用于表 SFEP到SFN的转化。如果关键词或因果关系模 示SFEP中结果事件的描述。RP用于表示结果事 式不在集合中,非已知,那么对模型而言是个学 件,可以是复杂的句式或短语等。 习过程,以丰富关键词和关系模式。在经过大量 其他关键词(other KW)包括动词性短语(verb 实例的学习后方法将达到成熟。 phrase,VP)、名词性偏正短语(nominal partial 3关键词提取及规则确定 phrases,NPP)、主语词(subject word,.SW)。也可能 存在其他类型的关键词,但这些关键词在因果关 为说明方便形成形式化表示结构,结合文 系组模式分析时不是必要的,或者出现几率很系组转化为 SFN 基本结构后,可根据因果关系组 之间的相同事件叠加形成完整的 SFN 网络,最终 完成 SFEP 到 SFN 转化。 确定因果关系组后,对组内各部分进行分析, 主要包括原因事件、结果事件及逻辑关系。可将 文本抽象为连接词、原因词、结果词、原因部分、 结果部分、标点符号、其他类型短语等,称为关键 词。在 SFEP 描述中这些词都有具体的词汇,可 在模型学习过程中累计。逐渐形成这些关键词对 应的词汇集合,以便丰富文本因果关系分析能力。 根据因果关系组和得到的关键词集合,研究 因果关系组的基本模式。由于已事先获得关键 字,将因果关系组中的文本描述进行替换,可得 到为数不多的因果关系组模式。每种模式都代表 了一类因果关系描述类型的语句。该过程在模型 学习阶段得到补充和丰富。 将组模式转化为 SFN 的基本结构。在第 1 节 已提到 SFN 表示 SFEP 使用 6 种结构,而分析过 程只需其中 3 种结构。根据组模式转化为 SFN 的对应结构。 因此,关键词中的原因词和结果词引导的原 因部分和结果部分将成为 SFN 的节点对应事 件。连接词代表了原因部分或结果部分之间的逻 辑与或关系,将成为 SFN 的连接和逻辑关系。其 他类型短语一般成为原因和结果事件的一部分。 最后得到的所有 SFN 基本结构都只传递了一次, 那么之中必定有事件即作为原因又作为结果,因 此根据等事件规则将所有 SFN 基本结构叠加,形 成 SFEP 文本描述转化的完整 SFN 结构。 模型学习阶段主要是关键词和因果关系模式 的补充和丰富。在已分析的 SFEP 文本中,可获 得一些关键词对应的词汇,也可确定因果关系模 式。但关键词在语言中千变万化,一个关键词可 以有很多词汇表示,需要实践中学习丰富。同理 因果关系模式代表了一句完整的因果关系描述, 这些描述的结构千变万化,也需不断补充。 对于一个实例 SFEP 分析,如果它的关键词 和关系模式都是已知的,那么将会顺利完 成 SFEP 到 SFN 的转化。如果关键词或因果关系模 式不在集合中,非已知,那么对模型而言是个学 习过程,以丰富关键词和关系模式。在经过大量 实例的学习后方法将达到成熟。 3 关键词提取及规则确定 为说明方便形成形式化表示结构,结合文 献 [21-33] 和 SFEP 的特点,制定如下定义。 定义 4 关键词 (key words, KW)。用于代表 SFEP 文本描述中,可进行形式化抽取和同类词汇 表示,关键词是由表示相同含义的词汇组成的集 合,由关键词组成的集合称为关键词组 (key words set, KWS)。 KW 是一类文本词汇的统一标识。用于在 SFEP 中因果关系组的抽象和形式化。将因果关 系组代表的文本转化为因果关系组模式的符号序 列。KW 包括多种类型,连接词 1、连接词 2、原因 词、结果词、原因部分、结果部分、其他关于符号 部分。这些 KW 组成了 KWS。 定义 5 连接词 1(link word 1, LW1)。用于表 示 SFEP 中,归一和分支结构的与关系,即多个原 因事件同时发生导致结果事件,一个原因事件同 时导致多个结果事件。LW1={并且, 且, 而且, 切, 以及, 加之,…},这些词汇表示两事件并列及同时 的与关系。 定义 6 连接词 2(link word 2, LW2)。用于表 示 SFEP 中,归一和分支结构的或关系,即多个原 因事件之一发生导致结果事件,一个原因事件导 致其一或多个结果事件。LW2={或者, 或, 要不, 之一, 都,… },这些词汇表示两事件之一发生导致 结果发生的关系,或导致可能的两个结果事件 之一。 定义 7 原因词 (cause words, CW)。用于表示 SFEP 中引导原因事件的词汇。CW={由于, 因为, 当,… },这些词汇用于引导原因事件,是原因事 件的标志。 定义 8 结果词 (result words, RW)。用于表示 SFEP 中引导结果事件的词汇。RW={所以, 因此, 因而, 于是,… },这些词汇用于引导结果事件,是 结果事件的标志。 定义 9 原因部分 (cause part, CP)。用于表示 SFEP 中原因事件的描述。CP 用于表示原因事 件,可以是复杂的句式或短语等。 定义 10 结果部分 (result part, RP)。用于表 示 SFEP 中结果事件的描述。RP 用于表示结果事 件,可以是复杂的句式或短语等。 其他关键词 (other KW) 包括动词性短语 (verb phrase, VP)、名词性偏正短语 (nominal partial phrases, NPP)、主语词 (subject word, SW)。也可能 存在其他类型的关键词,但这些关键词在因果关 系组模式分析时不是必要的,或者出现几率很 第 5 期 崔铁军,等:SFEP 文本因果关系提取及其与 SFN 转化研究 ·1001·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有