正在加载图片...
·1258 工程科学学报,第42卷,第10期 全局最优目标来标记可能的对齐,并在迭代中将 3知识推理与质量评估 其加人到训练数据中,不断训练嵌入表示模型 知识推理技术可以提升知识图谱的完整性和 Guan等so发现基于监督学习的实体对齐方法,普 准确性,传统的知识推理方法拥有极高的准确率, 遍在取得标签数据上需要花费大量时间,无监督 学习方法的表现则很大程度地依赖于验证集上复 但无法适配大规模知识图谱.针对知识图谱数据 量大、关系复杂的特点,提出了面向大规模知识图 杂的相似度衡量方式.Zhang等su从实体的多视 谱的知识推理方法,并归纳为以下4类4s刃:(1)基 角出发,利用实体的名称、实体间的关系、实体的 于图结构和统计规则挖掘的推理:(2)基于知识图 属性的组合策略来学习实体的嵌入,并根据实体 谱表示学习的推理:(3)基于神经网络的推理;(4)混 的表示来完成实体对齐任务, 合推理 2.3知识合并 3.1基于图结构和统计规则挖掘的推理 实体消歧和实体对齐更多的是关注知识图谱 受传统推理地启发,基于知识图谱的图结构 中的实体,从实体层面上通过各种方法来提升知 以及挖掘蕴藏在知识图谱中的规则进行推理的方 识图谱的知识质量.知识合并则是从知识图谱整 法得以提出,并在知识推理任务上取得一定效果 体层面上进行知识的融合,基于现存的知识库和 Lao与Cohen!s81提出了路径排序算法(Path ranking 知识图谱来扩大知识图谱的规模,丰富其中蕴含 algorithm,PRA),将实体间的路径作为特征,通过 的知识.然而现存的知识库或者知识图谱都是各 随机行走算法来计算实体间是否存在潜在的关 种机构或者组织根据自己的需求设计创建,其中 系.Wang等s网设计了耦合路径排序算法(Coupled 的知识也存在着多样性和异构性,并且存在很多 path ranking algorithm,CPRA),并提出一种全新的 知识上的重复和错误,因而需要使用知识合并技 逐次聚合的策略,通过这一策略使得具有强相关 术来解决这些问题网,知识图谱的合并需要解决 度的关系聚合在一起.使用多任务学习策略预测 2个层面的问题:数据层的合并和模式层的合并5] 聚合后的关系.Xiong等6o针对多跳关系路径的 知识合并过程中可能出现的来自两个数据源的同 学习提出使用强化学习的框架,设计了一个具有 一实体的属性值却不相同的现象,我们称这种知 连续基于知识图谱嵌入状态的策略Agent,通过 识合并过程中出现的现象为知识冲突.针对知识 Agent在知识图谱的向量空间中寻找最有潜力的 冲突问题,可以采用冲突检测与消解以及真值发 关系加入路径完成推理 现等技术进行消除,再将各个来源的知识关联合 Cohent61针对如何将知识整合到梯度学习的系 并为一个知识图谱 统的问题,描述了一个概率演绎的数据库Tensorlog, 冲突消解目前的研究方向是利用图谱自身存 通过可微分的过程来进行推理.Yang等I研究了 在的特征,Trisedya等Is利用属性元组生成属性特 基于学习一阶概率逻辑规则进行知识库推理的问 征嵌入向量.使用成分函数来表示属性.将多个属 题.受到Tensorlog的启发,提出了名为神经逻辑 性值都转化为单一向量,并将相似的属性映射为 规划的框架,将一阶逻辑规则的参数和结构整合 相似的向量表示.利用这些属性特征嵌入向量将 到一个端到端的可微分模型中.设计了一个带 两个图谱中的实体嵌入转化到同一个空间中,计 Attention机制和存储功能的神经控制系统来学习 算实体的相似性.Chen等5针对多语言知识图谱 组合那些用于完成推理的规则.Kampffmeyer等s) 的合并,提出了利用实体描述的基于嵌入的半监 提出深度图传播模型,在利用图结构的便利的同 督跨语言学习方法,在一个大规模数据集上通过 时解决知识过于稀疏的问题 迭代的方式联合训练一个多语言知识图谱嵌入模 3.2基于知识图谱表示学习的推理 型和一个文字描述嵌入模型,训练模型完成图谱 表示模型将知识图谱中相应的实体和关系用 的合并.Cao等5提出多通道图神经网络模型,通 向量、矩阵或者张量的形式表示,表示后进行运算 过多个通道将两个知识图谱进行鲁棒编码.在每 完成知识推理任务,因其简单高效且适应于大规 个通道中通过不同的关系加权方案来编码知识图 模知识图谱推理的特点而不断发展 谱,使用知识图谱补全和跨知识图谱注意力策略 3.2.1基于距离的推理模型 来分别修剪每个图谱中的独有实体,通过池化技 Bordes等6提出了TransE模型,将所有的实 术组合这些通道 体和关系表示为同一个空间下的向量,假设事实元全局最优目标来标记可能的对齐,并在迭代中将 其加入到训练数据中,不断训练嵌入表示模型. Guan 等[50] 发现基于监督学习的实体对齐方法,普 遍在取得标签数据上需要花费大量时间,无监督 学习方法的表现则很大程度地依赖于验证集上复 杂的相似度衡量方式. Zhang 等[51] 从实体的多视 角出发,利用实体的名称、实体间的关系、实体的 属性的组合策略来学习实体的嵌入,并根据实体 的表示来完成实体对齐任务. 2.3    知识合并 实体消歧和实体对齐更多的是关注知识图谱 中的实体,从实体层面上通过各种方法来提升知 识图谱的知识质量. 知识合并则是从知识图谱整 体层面上进行知识的融合,基于现存的知识库和 知识图谱来扩大知识图谱的规模,丰富其中蕴含 的知识. 然而现存的知识库或者知识图谱都是各 种机构或者组织根据自己的需求设计创建,其中 的知识也存在着多样性和异构性,并且存在很多 知识上的重复和错误,因而需要使用知识合并技 术来解决这些问题[52] . 知识图谱的合并需要解决 2 个层面的问题:数据层的合并和模式层的合并[53] . 知识合并过程中可能出现的来自两个数据源的同 一实体的属性值却不相同的现象,我们称这种知 识合并过程中出现的现象为知识冲突. 针对知识 冲突问题,可以采用冲突检测与消解以及真值发 现等技术进行消除,再将各个来源的知识关联合 并为一个知识图谱. 冲突消解目前的研究方向是利用图谱自身存 在的特征,Trisedya 等[54] 利用属性元组生成属性特 征嵌入向量. 使用成分函数来表示属性. 将多个属 性值都转化为单一向量,并将相似的属性映射为 相似的向量表示. 利用这些属性特征嵌入向量将 两个图谱中的实体嵌入转化到同一个空间中,计 算实体的相似性. Chen 等[55] 针对多语言知识图谱 的合并,提出了利用实体描述的基于嵌入的半监 督跨语言学习方法,在一个大规模数据集上通过 迭代的方式联合训练一个多语言知识图谱嵌入模 型和一个文字描述嵌入模型,训练模型完成图谱 的合并. Cao 等[56] 提出多通道图神经网络模型,通 过多个通道将两个知识图谱进行鲁棒编码. 在每 个通道中通过不同的关系加权方案来编码知识图 谱,使用知识图谱补全和跨知识图谱注意力策略 来分别修剪每个图谱中的独有实体,通过池化技 术组合这些通道. 3    知识推理与质量评估 知识推理技术可以提升知识图谱的完整性和 准确性. 传统的知识推理方法拥有极高的准确率, 但无法适配大规模知识图谱. 针对知识图谱数据 量大、关系复杂的特点,提出了面向大规模知识图 谱的知识推理方法,并归纳为以下 4 类[14, 57] :(1)基 于图结构和统计规则挖掘的推理;(2)基于知识图 谱表示学习的推理;(3)基于神经网络的推理;(4)混 合推理. 3.1    基于图结构和统计规则挖掘的推理 受传统推理地启发,基于知识图谱的图结构 以及挖掘蕴藏在知识图谱中的规则进行推理的方 法得以提出,并在知识推理任务上取得一定效果. Lao 与 Cohen[58] 提出了路径排序算法(Path ranking algorithm,PRA),将实体间的路径作为特征,通过 随机行走算法来计算实体间是否存在潜在的关 系. Wang 等[59] 设计了耦合路径排序算法(Coupled path ranking algorithm,CPRA),并提出一种全新的 逐次聚合的策略,通过这一策略使得具有强相关 度的关系聚合在一起. 使用多任务学习策略预测 聚合后的关系. Xiong 等[60] 针对多跳关系路径的 学习提出使用强化学习的框架,设计了一个具有 连续基于知识图谱嵌入状态的策略 Agent,通过 Agent 在知识图谱的向量空间中寻找最有潜力的 关系加入路径完成推理. Cohen[61] 针对如何将知识整合到梯度学习的系 统的问题,描述了一个概率演绎的数据库 Tensorlog, 通过可微分的过程来进行推理. Yang 等[62] 研究了 基于学习一阶概率逻辑规则进行知识库推理的问 题. 受到 Tensorlog 的启发,提出了名为神经逻辑 规划的框架,将一阶逻辑规则的参数和结构整合 到一个端到端的可微分模型中. 设计了一个带 Attention 机制和存储功能的神经控制系统来学习 组合那些用于完成推理的规则. Kampffmeyer 等[63] 提出深度图传播模型,在利用图结构的便利的同 时解决知识过于稀疏的问题. 3.2    基于知识图谱表示学习的推理 表示模型将知识图谱中相应的实体和关系用 向量、矩阵或者张量的形式表示,表示后进行运算 完成知识推理任务. 因其简单高效且适应于大规 模知识图谱推理的特点而不断发展. 3.2.1 基于距离的推理模型 Bordes 等[64] 提出了 TransE 模型,将所有的实 体和关系表示为同一个空间下的向量,假设事实元 · 1258 · 工程科学学报,第 42 卷,第 10 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有