为此，Guo 等 [10] 提出了一种基于软修剪的关系提取模型，用以实现

正在加载图片...

第3期张勇，等：用于关系抽取的注意力图长短时记忆神经网络 ·519· 为此，Guo等o提出了一种基于软修剪的关系提 CNN)提取词汇级和句子级特征，进而完成关系取模型，用以实现模型自主学习句法结构，而无抽取；Zhang等l6利用长短时记忆神经网络学习需对句法结构进行硬性修剪。虽然所提模型可以实体对之间的长期依赖性；Zhang等u例在词嵌入很好地学习句法结构，但是，由于图卷积模型本的基础上考虑单词的位置和词性、句子结构依赖身的无向性，其对上下文中时序特征的学习能力等信息，设计了一种新型的长短时记忆神经网络较弱。进行关系抽取。马语丹等2通过引入注意力机目前，已有学者以句法依存树为基础，提出了制提取实体的网络环境信息，生成全局的上下文多种图神经网络模型，但是所提模型大多是基于特征。鉴于LSTM对文本信息建模的优越性，以图卷积神经网络。图卷积神经网络可以很好地及句子结构信息对文本关系抽取任务的重要性，学习图结构数据的信息，却难以有效处理时序数学者们还提出了结合句子结构信息建模的SDP 据。这就意味着，面向具备时序特性的文本数 LSTM和Tree-LSTM等改进模型。据，只依赖图卷积神经网络并不能很好地抽取文远程监督关系提取方法借助知识库，利用知本中时序信息。相对图卷积神经网络，长短时记识库中包含的知识来对非结构化文本进行标注。忆神经网络(long short term memory neural network. 这种方法可以自动构建大量训练数据，不仅解决 LSTM)可以有效提取上下文的时序信息。目前，了现有方法数据量不足的缺点，而且增强了模型部分学者开始尝试将其用于跨句关系的抽取问的跨领域适应能力。Mintz等2u最早提出了远程题，并提出了多种图长短时记忆神经网络21)。监督的基本假设，定义了远程监督任务。然而，但是，这些方法都是基于修剪后句子结构树的信远程监督在解决数据量不足的同时，容易带来较息来构建图神经网络，依然存在误删有用信息的大的噪声。为此，越来越多的学者开始关注对远不足。另外，传统方法对句子结构信息的使用完程监督方法的改进研究。Zeng等22融合分段卷全依赖于句子结构树。如果句子结构树中蕴含错积神经网络和多实例学习(multiple instance learn- 误信息，很容易累加错误信息。 ing,ML),提出了一种混合关系提取模型。该模鉴于此，本文提出一种注意力图长短时记忆型通过PCNN提取句子特征，利用ML消除错误神经网络(attention graph long short term memory 样本噪声，进而实现远程监督关系抽取。 neural network,.AGLSTM)。采用注意力机制与句子结构树相结合的方式建立句子的全局结构信 2所提关系抽取模型息，生成全局注意力权重矩阵，并将其用于构造 2.1模型框架 AGLSTM模型。所提方法不仅可以充分利用为同时学习句法图中句子的结构特征和句 LSTM学习句子的时序结构特征，而且可以根据子之间的时序结构特征，提出一种新的图神经句法图信息自行学习句子的结构特征。相对于完网络结构，即注意力图长短时记忆神经网络全依赖句子结构树的传统方法，本文方法是在原 (AGLSTM)。图I给出了融合AGLSTM模型的关始句子结构树的基础上，利用注意力机制使得模系抽取框架。型自行学习句子结构中的信息，不仅可以得到更 2.2 Embedding层加有效的关系抽取模型，而且鲁棒性更好。关系抽取方法需要考虑语料中的实体语义特 1相关工作征和实体位置特征。在自然语言处理领域中，词向量表示常用于表示词的语义信息。本文通过词关系抽取是自然语言处理中的一项重要分支嵌入方法对整个语料库进行训练，得到语料库的任务，在从非结构化文本中抽取结构性信息时起词向量矩阵，其中每个词表示为一个dd维的向着重要作用。现有主流关系抽取技术可分为量wd。另外，为了更好地表示实体的语义特 2种：远程监督关系抽取4均和有监督关系抽取。征，利用stanfordparser工具对语料库进行命名实有监督关系抽取法把关系抽取看作一种多分体识别NER)分析，将生成的NER标签映射成一类任务进行处理。早期的研究成果主要是使用核个daer维的向量waer。将wuod和waer连接即为词函数等机器学习方法设计分类器叨，并进行关系的实体表示向量。提取任务。随着深度学习的兴起，深度神经网络本文采用Zeng等1提出的实体位置嵌入方已在关系抽取中得到了广泛应用。Zeng等u1采法引入实体位置信息。将句中每一个单词与实体用深度卷积神经网络(convolutional neural network, 对(e1,e2)的相对位置(p1,P2)映射成d维的距离为此，Guo 等 [10] 提出了一种基于软修剪的关系提取模型，用以实现模型自主学习句法结构，而无需对句法结构进行硬性修剪。虽然所提模型可以很好地学习句法结构，但是，由于图卷积模型本身的无向性，其对上下文中时序特征的学习能力较弱。目前，已有学者以句法依存树为基础，提出了多种图神经网络模型，但是所提模型大多是基于图卷积神经网络[11]。图卷积神经网络可以很好地学习图结构数据的信息，却难以有效处理时序数据。这就意味着，面向具备时序特性的文本数据,只依赖图卷积神经网络并不能很好地抽取文本中时序信息。相对图卷积神经网络，长短时记忆神经网络 (long short term memory neural network, LSTM) 可以有效提取上下文的时序信息。目前，部分学者开始尝试将其用于跨句关系的抽取问题，并提出了多种图长短时记忆神经网络[12-13]。但是，这些方法都是基于修剪后句子结构树的信息来构建图神经网络，依然存在误删有用信息的不足。另外，传统方法对句子结构信息的使用完全依赖于句子结构树。如果句子结构树中蕴含错误信息，很容易累加错误信息。鉴于此，本文提出一种注意力图长短时记忆神经网络 (attention graph long short term memory neural network, AGLSTM)。采用注意力机制与句子结构树相结合的方式建立句子的全局结构信息，生成全局注意力权重矩阵，并将其用于构造 AGLSTM 模型。所提方法不仅可以充分利用 LSTM 学习句子的时序结构特征，而且可以根据句法图信息自行学习句子的结构特征。相对于完全依赖句子结构树的传统方法，本文方法是在原始句子结构树的基础上，利用注意力机制使得模型自行学习句子结构中的信息，不仅可以得到更加有效的关系抽取模型，而且鲁棒性更好。 1 相关工作关系抽取是自然语言处理中的一项重要分支任务，在从非结构化文本中抽取结构性信息时起着重要作用。现有主流关系抽取技术可分为 2 种：远程监督关系抽取[14-15] 和有监督关系抽取[5, 16]。有监督关系抽取法把关系抽取看作一种多分类任务进行处理。早期的研究成果主要是使用核函数等机器学习方法设计分类器[17] ，并进行关系提取任务。随着深度学习的兴起，深度神经网络已在关系抽取中得到了广泛应用。Zeng 等 [18] 采用深度卷积神经网络 (convolutional neural network, CNN) 提取词汇级和句子级特征，进而完成关系抽取；Zhang 等 [16] 利用长短时记忆神经网络学习实体对之间的长期依赖性；Zhang 等 [19] 在词嵌入的基础上考虑单词的位置和词性、句子结构依赖等信息，设计了一种新型的长短时记忆神经网络进行关系抽取。马语丹等[20] 通过引入注意力机制提取实体的网络环境信息，生成全局的上下文特征。鉴于 LSTM 对文本信息建模的优越性，以及句子结构信息对文本关系抽取任务的重要性，学者们还提出了结合句子结构信息建模的 SDPLSTM[6] 和 Tree-LSTM[7] 等改进模型。远程监督关系提取方法借助知识库，利用知识库中包含的知识来对非结构化文本进行标注。这种方法可以自动构建大量训练数据，不仅解决了现有方法数据量不足的缺点，而且增强了模型的跨领域适应能力。Mintz 等 [21] 最早提出了远程监督的基本假设，定义了远程监督任务。然而，远程监督在解决数据量不足的同时，容易带来较大的噪声。为此，越来越多的学者开始关注对远程监督方法的改进研究。Zeng 等 [22] 融合分段卷积神经网络和多实例学习 (multiple instance learning,MIL)，提出了一种混合关系提取模型。该模型通过 PCNN 提取句子特征，利用 MIL 消除错误样本噪声，进而实现远程监督关系抽取。 2 所提关系抽取模型 2.1 模型框架为同时学习句法图中句子的结构特征和句子之间的时序结构特征，提出一种新的图神经网络结构，即注意力图长短时记忆神经网络 (AGLSTM)。图 1 给出了融合 AGLSTM 模型的关系抽取框架。 2.2 Embedding 层 dword wword dner wner wword wner 关系抽取方法需要考虑语料中的实体语义特征和实体位置特征。在自然语言处理领域中，词向量表示常用于表示词的语义信息。本文通过词嵌入方法对整个语料库进行训练，得到语料库的词向量矩阵，其中每个词表示为一个维的向量。另外，为了更好地表示实体的语义特征，利用 stanfordparser 工具对语料库进行命名实体识别 (NER) 分析，将生成的 NER 标签映射成一个维的向量。将和连接即为词的实体表示向量。 (e1, e2) (p1, p2) dpos 本文采用 Zeng 等 [18] 提出的实体位置嵌入方法引入实体位置信息。将句中每一个单词与实体对的相对位置映射成维的距离第 3 期张勇，等：用于关系抽取的注意力图长短时记忆神经网络 ·519·

<<向上翻页向下翻页>>

点击下载：【知识工程】用于关系抽取的注意力图长短时记忆神经网络