正在加载图片...
第14卷第3期 智能系统学报 Vol.14 No.3 2019年5月 CAAI Transactions on Intelligent Systems May 2019 D0:10.11992/tis.201805006 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20181223.1553.006html 面向中文开放领域的多元实体关系抽取研究 姚贤明,甘健侯2,徐坚1 (1.曲靖师范学院信息工程学院,云南曲靖655011;2.云南师范大学民族教有信息化教有部重点实验室,云 南昆明650500) 摘要:针对当前中文开放领域多元实体关系抽取研究较少的情况,借鉴国外已有的研究成果,结合中文自身 的特点,提出了中文领域多元实体关系抽取的方法。该方法以句法分析结果的根节点作为入口,迭代地获取所 有谓语的主语、宾语及其定语成分,再利用句法分析结果对这些成分进行完善,最终获取句子中的多个实体之 间的语义关系。该方法被应用在不同的领域并进行了对比分析,实验结果表明:其具有一定的参考价值。另 外,对实验数据进行了详细的分析,归纳了错误的主要情形,为今后的研究工作指明了方向。 关键词:中文、开放域:多元实体关系;依存句法分析:句法结构:关系抽取:语义关系:主谓宾 中图分类号:TP311文献标志码:A文章编号:1673-4785(2019)03-0597-08 中文引用格式:姚贤明,甘健侯,徐坚.面向中文开放领域的多元实体关系抽取研究J.智能系统学报,2019,14(3): 597-604. 英文引用格式:YAO Xianming,GAN Jianhou,XU Jian.Chinese open domain oriented n-ary entity relation extractionJ.CAAI transactions on intelligent systems,2019,14(3):597-604. Chinese open domain oriented n-ary entity relation extraction YAO Xianming',GAN Jianhou',XU Jian (1.School of Information Engineering,Qujing Normal University,Qujing 655011,China;2.Key Laboratory of Educational In- formatization for Nationalities(YNNU),Ministry of Education,Kunming 650500,China) Abstract:In view of the scant research conducted regarding n-ary entity relation extraction in the Chinese open domain, in this paper,we propose a method for performing n-ary entity relation extraction in the Chinese domain based on exist- ing research conducted abroad and Chinese characteristics.Starting with the root node of syntactic analysis,we obtain the subject,object,and attributive components of all the predicates.Then,we use the syntactic analysis result to perfect these elements and,finally,obtain the semantic relations of the n-ary entity.For comparative analysis,we applied the proposed method to different domains.The experimental results demonstrate its reference value.In addition,we ana- lyzed the experimental data in detail and have summarized the main errors,which indicate the direction for future re- search. Keywords:Chinese open domain;n-ary entity relation;dependency syntax analysis;semantic structure;relation extrac- tion;semantic relation;subject predicate object 实体关系抽取是指从文本中抽取实体与实体 实体关系抽取任务最早在1989年的MUC评 之间,实体与数值表达式之间的语义关系,这种 测会议中被提出,在ACE、TAC等一系列评测会 语义关系体现了二者之间的相互作用山。例如 议的推动下,获得了长足的发展,陆续提出了基 “邓兆祥游览庐山”,其中“邓兆祥”与“庐山”之间 于规则的B、基于支持向量机等有监督的-和基 存在“游览”关系回。 于聚类等无监督-实体关系获取方法,本文称 收稿日期:2018-05-07.网络出版日期:2018-12-25. 这些方法为传统方法。传统方法主要是面向特定 基金项目:国家自然科学基金项目(61562093):云南省应用基 础研究计划重点项目(2016FA024). 领域,预先定义了实体类型和关系类型,通过人 通信作者:徐坚.E-mail:qjncxj@126.com. 工标注训练数据提交给机器学习算法自动学习分DOI: 10.11992/tis.201805006 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20181223.1553.006.html 面向中文开放领域的多元实体关系抽取研究 姚贤明1 ,甘健侯2 ,徐坚1 (1. 曲靖师范学院 信息工程学院,云南 曲靖 655011; 2. 云南师范大学 民族教育信息化教育部重点实验室,云 南 昆明 650500) 摘 要:针对当前中文开放领域多元实体关系抽取研究较少的情况,借鉴国外已有的研究成果,结合中文自身 的特点,提出了中文领域多元实体关系抽取的方法。该方法以句法分析结果的根节点作为入口,迭代地获取所 有谓语的主语、宾语及其定语成分,再利用句法分析结果对这些成分进行完善,最终获取句子中的多个实体之 间的语义关系。该方法被应用在不同的领域并进行了对比分析,实验结果表明:其具有一定的参考价值。另 外,对实验数据进行了详细的分析,归纳了错误的主要情形,为今后的研究工作指明了方向。 关键词:中文、开放域;多元实体关系;依存句法分析;句法结构;关系抽取;语义关系;主谓宾 中图分类号:TP311 文献标志码:A 文章编号:1673−4785(2019)03−0597−08 中文引用格式:姚贤明, 甘健侯, 徐坚. 面向中文开放领域的多元实体关系抽取研究[J]. 智能系统学报, 2019, 14(3): 597–604. 英文引用格式:YAO Xianming, GAN Jianhou, XU Jian. Chinese open domain oriented n-ary entity relation extraction[J]. CAAI transactions on intelligent systems, 2019, 14(3): 597–604. Chinese open domain oriented n-ary entity relation extraction YAO Xianming1 ,GAN Jianhou2 ,XU Jian1 (1. School of Information Engineering, Qujing Normal University, Qujing 655011, China; 2. Key Laboratory of Educational In￾formatization for Nationalities (YNNU), Ministry of Education, Kunming 650500, China) Abstract: In view of the scant research conducted regarding n-ary entity relation extraction in the Chinese open domain, in this paper, we propose a method for performing n-ary entity relation extraction in the Chinese domain based on exist￾ing research conducted abroad and Chinese characteristics. Starting with the root node of syntactic analysis, we obtain the subject, object, and attributive components of all the predicates. Then, we use the syntactic analysis result to perfect these elements and, finally, obtain the semantic relations of the n-ary entity. For comparative analysis, we applied the proposed method to different domains. The experimental results demonstrate its reference value. In addition, we ana￾lyzed the experimental data in detail and have summarized the main errors, which indicate the direction for future re￾search. Keywords: Chinese open domain; n-ary entity relation; dependency syntax analysis; semantic structure; relation extrac￾tion; semantic relation; subject predicate object 实体关系抽取是指从文本中抽取实体与实体 之间,实体与数值表达式之间的语义关系,这种 语义关系体现了二者之间的相互作用[1]。例如 “邓兆祥游览庐山”,其中“邓兆祥”与“庐山”之间 存在“游览”关系[2]。 实体关系抽取任务最早在 1989 年的 MUC 评 测会议中被提出,在 ACE、TAC 等一系列评测会 议的推动下,获得了长足的发展,陆续提出了基 于规则的[3-4] 、基于支持向量机等有监督的[5-6]和基 于聚类等无监督[7-8]实体关系获取方法[9] ,本文称 这些方法为传统方法。传统方法主要是面向特定 领域,预先定义了实体类型和关系类型,通过人 工标注训练数据提交给机器学习算法自动学习分 收稿日期:2018−05−07. 网络出版日期:2018−12−25. 基金项目:国家自然科学基金项目 (61562093);云南省应用基 础研究计划重点项目 (2016FA024). 通信作者:徐坚. E-mail:qjncxj@126.com. 第 14 卷第 3 期 智 能 系 统 学 报 Vol.14 No.3 2019 年 5 月 CAAI Transactions on Intelligent Systems May 2019
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有