第10卷第5期 智能系统学报 Vol.10 No.5 2015年10月 CAAI Transactions on Intelligent Systems 0ct.2015 D0I:10.11992/is.201412006 网s络出版t地址:htp:/ww.cmki.net/kcms/detail/23.1538.TP.20150827.1024.008.html 基于知网的可拓领域信息元库的构建方法 陶星,李卫华,汪中飞 (广东工业大学计算机学院,广东广州510006) 摘要:为了解决某个领域的矛盾问题,须构建领域信息元库以提高计算机语义理解能力。结合知网的表达知识的 形式化特点,提出了对基元进行改造,增强语义互操作性的方法。在知网2000版中,以教育领域为案例,提取出教育 领域的概念及其属性,并在此基础上改造与更新,构造可拓学的教育领域基础库。在实验过程中采用关系型数据库 实现了信息元的存储,表明了可以提高语义互操作能力,验证了该方法的可行性。 关键词:可拓学:知网:信息元:矛盾问题:语义 中图分类号:TP39文献标志码:A文章编号:1673-4785(2015)05-0790-07 中文引用格式:陶星,李卫华,汪中飞.基于知网的可拓领域信息元库的构建方法[J].智能系统学报,2015,10(5):790796. 英文引用格式:TAO Xing,LI Weihua,WANG Zhongfei..Construction of HowNet-based extendable domain information element base[J].CAAI Transactions on Intelligent Systems,2015,10(5):790-796. Construction of HowNet-based extendable domain information element base TAO Xing,LI Weihua,WANG Zhongfei College of Computer,Guangdong University of Technology,Guangzhou 510006,China) Abstract:To solve contradictory problems in a domain,it is necessary to construct the domain information element base and to improve the semantic recognition ability of computer software.Combined with the characteristics of for- malized expression of knowledge in HowNet,this paper proposes an approach to redefine the construction of basic- element which is the logic cell of Extenics to enhance semantic interoperability.Taking the domain of education as an example,the concepts and their properties of education are extracted in HowNet 2000,and further reconstructed and updated.Thereby the basic-element base of Extenics in the domain of education is built.A relational database (SQL Express)has been used to store the information element in the experiment,showing that the new basic-ele- ment can improve semantic interoperability,and proving the feasibility of the method. Keywords:Extenics;HowNet;information element;contradictory problem;semantic 可拓学是由中国学者于1983年提出的一门原 文献[3]提出“可拓信息-知识-智能形式化体 创性横断学科,它以形式化的模型,探讨事物拓展的 系结构”这一构想,指出研究以物元、事元和关系元 可能性以及开拓创新的规律与方法,并用于解决矛 为基本元的信息表示体系,以建立信息元库。 盾问题。所谓矛盾问题,是指在现有条件下无法 知网(HowNet)是一套知识描述规范体系,一个 实现人们要达到的目标的问题。要解决某个领域的 通用的常识知识库,描述了世间万物所有的概念、概 矛盾问题,使计算机自动生成可拓策略,必须有该领 念的属性及属性之间的关系[。但是知网并不能 域的知识库做为支持。这是可拓策略生成系统亟需 解决矛盾问题。以知网的知识资源为基础,借助可 解决的一个关键且基础的问题冈。 拓学基元表达体系,将有望让其计算机自动生成 (或人机结合引导生成)解决矛盾问题的策略。 收稿日期:2014-12-08.网络出版日期:2015-08-27. 基金项目:国家自然科学基金资助项目(61273306). 本文提出一种基于知网来建立领域可拓信息元 通信作者:陶星.E-mail:xingtao0724@163.com. 库的方法,并以教育领域为研究案例,探讨改进后的
第 10 卷第 5 期 智 能 系 统 学 报 Vol.10 №.5 2015 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2015 DOI:10.11992 / tis.201412006 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20150827.1024.008.html 基于知网的可拓领域信息元库的构建方法 陶星,李卫华,汪中飞 (广东工业大学 计算机学院, 广东 广州 510006) 摘 要:为了解决某个领域的矛盾问题,须构建领域信息元库以提高计算机语义理解能力。 结合知网的表达知识的 形式化特点,提出了对基元进行改造,增强语义互操作性的方法。 在知网 2000 版中,以教育领域为案例,提取出教育 领域的概念及其属性,并在此基础上改造与更新,构造可拓学的教育领域基础库。 在实验过程中采用关系型数据库 实现了信息元的存储,表明了可以提高语义互操作能力,验证了该方法的可行性。 关键词:可拓学;知网;信息元;矛盾问题; 语义 中图分类号:TP39 文献标志码:A 文章编号:1673⁃4785(2015)05⁃0790⁃07 中文引用格式:陶星,李卫华,汪中飞. 基于知网的可拓领域信息元库的构建方法[J]. 智能系统学报, 2015, 10(5): 790⁃796. 英文引用格式:TAO Xing,LI Weihua,WANG Zhongfei. Construction of HowNet⁃based extendable domain information element base[J]. CAAI Transactions on Intelligent Systems, 2015, 10(5): 790⁃796. Construction of HowNet⁃based extendable domain information element base TAO Xing, LI Weihua, WANG Zhongfei (College of Computer, Guangdong University of Technology, Guangzhou 510006, China) Abstract:To solve contradictory problems in a domain, it is necessary to construct the domain information element base and to improve the semantic recognition ability of computer software. Combined with the characteristics of for⁃ malized expression of knowledge in HowNet, this paper proposes an approach to redefine the construction of basic⁃ element which is the logic cell of Extenics to enhance semantic interoperability. Taking the domain of education as an example, the concepts and their properties of education are extracted in HowNet 2000, and further reconstructed and updated. Thereby the basic⁃element base of Extenics in the domain of education is built. A relational database (SQL Express) has been used to store the information element in the experiment, showing that the new basic⁃ele⁃ ment can improve semantic interoperability, and proving the feasibility of the method. Keywords:Extenics; HowNet; information element; contradictory problem; semantic 收稿日期:2014⁃12⁃08. 网络出版日期:2015⁃08⁃27. 基金项目:国家自然科学基金资助项目(61273306). 通信作者:陶星. E⁃mail:xingtao0724@ 163.com. 可拓学是由中国学者于 1983 年提出的一门原 创性横断学科,它以形式化的模型,探讨事物拓展的 可能性以及开拓创新的规律与方法,并用于解决矛 盾问题[1] 。 所谓矛盾问题,是指在现有条件下无法 实现人们要达到的目标的问题。 要解决某个领域的 矛盾问题,使计算机自动生成可拓策略,必须有该领 域的知识库做为支持。 这是可拓策略生成系统亟需 解决的一个关键且基础的问题[2] 。 文献[3]提出“可拓信息-知识-智能形式化体 系结构”这一构想,指出研究以物元、事元和关系元 为基本元的信息表示体系,以建立信息元库。 知网(HowNet)是一套知识描述规范体系,一个 通用的常识知识库,描述了世间万物所有的概念、概 念的属性及属性之间的关系[4] 。 但是知网并不能 解决矛盾问题。 以知网的知识资源为基础,借助可 拓学基元表达体系,将有望让其计算机自动生成 (或人机结合引导生成 )解决矛盾问题的策略。 本文提出一种基于知网来建立领域可拓信息元 库的方法,并以教育领域为研究案例,探讨改进后的
第5期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·791. 基元如何表达可拓知识和解决语义二义性问题,是 表1KDML符号及其含义 未来解决某一领域的矛盾问题的基础研究。 Table 1 Symbols and meanings of KDML 符号 属性关系 1可拓信息元库 “受事/内容/领属物等一事件”关系 在“可拓信息-知识-智能形式化”体系[)研究 “施事/经验者/关系主体一事件、工具一事件”关系 中提出了该体系的主要功能模块:信息元库、知识表 “部件一整体”关系 @ 示库、可拓策略库。为了实现该体系,信息元库的建 “场所一事件、时间一事件”关系 “属性一宿主”关系 立是首要工作。 & “材料一成品”关系 信息元库集成了领域的基础知识,是支持策略 相关关系 生成系统的基础库。由于信息元库容量庞大,且其 表示不存在的关系 中涉及领域繁杂,又有非结构化组织,对于许多的复 例如: 杂情况根本不存在查询结果,必要时,仍需要查询整 W_C=大学生 个信息元库,查询效率极低。本文将分别建立信息 G_C=N 物元、信息事元、信息关系元模型,并将其存储在信 E_C= 息元库中,每次查询时先在信息元库中查询:若不能 W E college student 得出查询结果,再进行可拓变换,这样可提高查询 G_E=N 效率。 E_E= 2知网的理论概述 DEF=humanI人,*studyI学,educationI教育 这个概念的含义是:大学生是N范畴。是“人” 2.1知网的知识网络体系 类别的一员,是施行“学”行为的,属于教育领域类 知网是一个以英、汉双语所代表的概念以及概 概念。 念的特征为基础,以揭示概念与概念之间以及概念 所具有的特性之间的关系为基本内容的常识知识 3基于知网的信息元的构造方法 库[。知网知识库中的概念是通过义原与义原之 知网的哲学思想:世界上一切事物(物质的,精 间的关系来描述的。 神的或事情)都在一定的时间和空间内不停地运动 知网所描述的概念之间的关系有:上下位关系、 和变化。它们通常是从一种状态变化到另一种状 同义关系、反义关系、对义关系、部件一整体关系、属 态,并通常由其属性值的改变来体现。这一思想 性一宿主关系、材料一成品关系、施事/经验者/关系 与可拓学的思想有异曲同工之妙。初步的研究显 主体一事件关系、受事/内容/领属物、属性关系、实 示,将可拓学与知网这2个中国原创的理论和应用 体一值关系、事件一角色关系、相关关系。这些关系 工具相结合,研究解决矛盾问题的策略生成问题,可 形成了一个网状的知识系统,进而使计算机对其可 为策略生成研究提供一种新的思路。 由于知网本身就是一个具有语义的通识知识 进行操作。 库,可以借助知网中义原及其语义关系的表达方式, 2.2知网知识库描述语言 对信息元的结构进行重新构造。 知网知识库描述语言是一种面向计算机的结构 3.1信息物元的构造 化描述语言)。为了实现计算这一设计目标,知网 信息物元,是指具体对象、其特征和量值构成的 的创立者进行了2个工作:1)将概念分解为义原, 有序三元组,而知网中的义原均为概念,并非具体的 并形成一套完整的分类体系;2)将义原通过各种关 对象,所以,对信息物元并不需要基于知网进行重新 系的组织表达一个概念。因为知网中的每个义原都 改造,仍然使用可拓学中对于物元的定义。例如: 表示一个唯一的特定的意义,这样就能解决自然语 「学生A, name, 张三 言处理的语义的歧义性问题。 M= sex, 18 在知网知识库描述语言(KDML)2000版中,通 sourcePlace, 广东广州 过一些特定的符号来描述义原之间的关系的。如表 3.2信息关系元的构造 1所示。 信息关系元主要描述的是信息物元和信息事元
基元如何表达可拓知识和解决语义二义性问题,是 未来解决某一领域的矛盾问题的基础研究。 1 可拓信息元库 在“可拓信息-知识-智能形式化”体系[3] 研究 中提出了该体系的主要功能模块:信息元库、知识表 示库、可拓策略库。 为了实现该体系,信息元库的建 立是首要工作。 信息元库集成了领域的基础知识,是支持策略 生成系统的基础库。 由于信息元库容量庞大,且其 中涉及领域繁杂,又有非结构化组织,对于许多的复 杂情况根本不存在查询结果,必要时,仍需要查询整 个信息元库,查询效率极低。 本文将分别建立信息 物元、信息事元、信息关系元模型,并将其存储在信 息元库中,每次查询时先在信息元库中查询;若不能 得出查询结果,再进行可拓变换,这样可提高查询 效率。 2 知网的理论概述 2.1 知网的知识网络体系 知网是一个以英、汉双语所代表的概念以及概 念的特征为基础,以揭示概念与概念之间以及概念 所具有的特性之间的关系为基本内容的常识知识 库[4] 。 知网知识库中的概念是通过义原与义原之 间的关系来描述的。 知网所描述的概念之间的关系有:上下位关系、 同义关系、反义关系、对义关系、部件—整体关系、属 性—宿主关系、材料—成品关系、施事/ 经验者/ 关系 主体—事件关系、受事/ 内容/ 领属物、属性关系、实 体—值关系、事件—角色关系、相关关系。 这些关系 形成了一个网状的知识系统,进而使计算机对其可 进行操作。 2.2 知网知识库描述语言 知网知识库描述语言是一种面向计算机的结构 化描述语言[5] 。 为了实现计算这一设计目标,知网 的创立者进行了 2 个工作:1) 将概念分解为义原, 并形成一套完整的分类体系;2)将义原通过各种关 系的组织表达一个概念。 因为知网中的每个义原都 表示一个唯一的特定的意义,这样就能解决自然语 言处理的语义的歧义性问题。 在知网知识库描述语言(KDML)2000 版中,通 过一些特定的符号来描述义原之间的关系的。 如表 1 所示。 表 1 KDML 符号及其含义 Table 1 Symbols and meanings of KDML 符号 属性关系 $ “受事/ 内容/ 领属物等—事件”关系 ∗ “施事/ 经验者/ 关系主体—事件、工具—事件”关系 % “部件—整体”关系 @ “场所—事件、时间—事件”关系 & “属性—宿主”关系 ? “材料—成品”关系 # 相关关系 ^ 表示不存在的关系 例如: W_C = 大学生 G_C = N E_C = W_E = college student G_E = N E_E = DEF = human | 人,∗study | 学,education | 教育 这个概念的含义是:大学生是 N 范畴。 是“人” 类别的一员,是施行“学”行为的,属于教育领域类 概念。 3 基于知网的信息元的构造方法 知网的哲学思想:世界上一切事物(物质的,精 神的或事情)都在一定的时间和空间内不停地运动 和变化。 它们通常是从一种状态变化到另一种状 态,并通常由其属性值的改变来体现[2] 。 这一思想 与可拓学的思想有异曲同工之妙。 初步的研究显 示,将可拓学与知网这 2 个中国原创的理论和应用 工具相结合,研究解决矛盾问题的策略生成问题,可 为策略生成研究提供一种新的思路。 由于知网本身就是一个具有语义的通识知识 库,可以借助知网中义原及其语义关系的表达方式, 对信息元的结构进行重新构造。 3.1 信息物元的构造 信息物元,是指具体对象、其特征和量值构成的 有序三元组,而知网中的义原均为概念,并非具体的 对象,所以,对信息物元并不需要基于知网进行重新 改造,仍然使用可拓学中对于物元的定义。 例如: M = 学生 A, name, 张三 sex, 18 sourcePlace, 广东广州 é ë ê ê ê ù û ú ú ú 3.2 信息关系元的构造 信息关系元主要描述的是信息物元和信息事元 第 5 期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·791·
·792 智能系统学报 第10卷 之间的关系。通过对知网的描述,可以知道知网在 对于属性和数量的概念,因为其含有的“&”关 描述概念及概念之间的关系上,已经有完备且有效 系,可不对第1义原进行处理,将在之后的“&”关系 的关系,只是知网不具备解决矛盾问题的能力。基 的处理中详细介绍。 于此,本文提出信息关系元模型如表2所示。 2)“&”关系 表2信息关系元的结构 在知网中,“&”表示“属性-宿主”关系。对此 Table 2 Structure of relation-element 类概念,不提取第1义原,改为提取该概念和第2义 关系名 关系含义 原之间为上下位关系。因为第2义原描述了具体的 isKindOf 继承或上下位关系 数量/属性类,可以更加准确地对概念的语义范围进 isPartOf 组成/整体与部分关系 行界定。例如: hasAttributeOf 某个概念是另一个概念的属性关系 N0.=060421 hasInstanceOf 概念实例和概念关系 W_C=模式 在此信息关系元结构中,定义了4种关系属性。 DEF=attributel属性,patternI样式, I)isKindOf,即具有继承关系或者上下位的信息元, &physical I物质 譬如:“笔-钢笔”、“白-雪白”等:2)isPart0f,表示具 按照上述转换规则,可以得到上下位信息关系 有整体与部分关系或者包含关系的信息元,又可细 元(isKindOf):“模式”-“样式”,其对应的信息关系 分为组合和聚合,譬如:“中国-上海”、“森林-树” 元为 等;3)hasAttributeOf,表示与该具有属性关系的信息 isKindOf, antecedent, 模式 元;4)hasInstanceOf,表示概念及其概念实例关系。 consequent, 样式 譬如:“学校”的上位属性是“场所”,其属性有很多: M M 名称、地点、级别等。“学校”又可分为:“小学”、“中 其表示的意义为:“模式”是属于物质的样式 学”、“高中”、“大学”、“研究院”等。通过这样的关 类别。 系定义,希望其不仅可以支持基本的可拓变换:置换 3)“%”关系 变换、增(减)变换、扩(缩)变换、分解变换和复制变 在知网中,“%”表示“整体-部分”关系,与属 换,并能具有一定的智能,帮助对矛盾问题的理解。 性/数量关系类似,不再提取第1义原作为其上下位 本文规定,每种信息关系元,都有某些固定的特 关系,而是直接提取“%”关系作为isPartOf属性。 征,譬如:关系前项(antecedent)、关系后项(conse- 例如: quent),其余特征需根据知网中的知识表达,进行相 N0.=068228 应的改造。详细的改造方法如下。 W_C=琴键 基于知网中的关系符,本文分别进行如下处理。 DEF=partl部件,%MusicTool I乐器 1)空符号 从中,可以提取2个信息关系元,上下文关系元 在知网中,空符号义原主要存在于概念词典中, (isKindOf):“琴键”-“部件”、整体部分信息关系元 般有3种含义。 (isPartOf):“琴键”-“乐器”。其对应的信息关系 在知网中,实体、事件、属性/属性值、数量/数量 元为 值定义的第1项均为空符号义原,用来表示其主要 [isKindOf, antecedent, 琴键7 特征。对于实体和事件概念来说,该第1项表示上 R1= consequent, 部件 下位关系。在信息物元中,将定义为isKindOf属性。 例如: isPartOf. antecedent, 琴键 N0.=018854 R2= consequent, 乐器 W_C=大学 DEF=InstitudePlaceI场所,@teach I教, 4)“$”、“*”、“@”、“#”等关系 @study l学,education I教育 在知网中,对于这些关系的提取,都可以直接进 其对应的信息关系元为 行,不再赘述。 TisKindOf,antecedent, 大学 3.3信息事元的构造 consequent, 场所 对于信息事元的改造,一方面要保证其语义的 M M 完整性,另一方面,更要规定其模型,针对不同类型
之间的关系。 通过对知网的描述,可以知道知网在 描述概念及概念之间的关系上,已经有完备且有效 的关系,只是知网不具备解决矛盾问题的能力。 基 于此,本文提出信息关系元模型如表 2 所示。 表 2 信息关系元的结构 Table 2 Structure of relation-element 关系名 关系含义 isKindOf 继承或上下位关系 isPartOf 组成/ 整体与部分关系 hasAttributeOf 某个概念是另一个概念的属性关系 hasInstanceOf 概念实例和概念关系 在此信息关系元结构中,定义了 4 种关系属性。 1)isKindOf,即具有继承关系或者上下位的信息元, 譬如:“笔-钢笔”、“白-雪白”等;2)isPartOf,表示具 有整体与部分关系或者包含关系的信息元,又可细 分为组合和聚合,譬如:“中国-上海”、“森林-树” 等;3)hasAttributeOf,表示与该具有属性关系的信息 元;4) hasInstanceOf,表示概念及其概念实例关系。 譬如:“学校”的上位属性是“场所”,其属性有很多: 名称、地点、级别等。 “学校”又可分为:“小学”、“中 学”、“高中”、“大学”、“研究院”等。 通过这样的关 系定义,希望其不仅可以支持基本的可拓变换:置换 变换、增(减)变换、扩(缩)变换、分解变换和复制变 换,并能具有一定的智能,帮助对矛盾问题的理解。 本文规定,每种信息关系元,都有某些固定的特 征,譬如:关系前项( antecedent)、关系后项( conse⁃ quent),其余特征需根据知网中的知识表达,进行相 应的改造。 详细的改造方法如下。 基于知网中的关系符,本文分别进行如下处理。 1)空符号 在知网中,空符号义原主要存在于概念词典中, 一般有 3 种含义。 在知网中,实体、事件、属性/ 属性值、数量/ 数量 值定义的第 1 项均为空符号义原,用来表示其主要 特征。 对于实体和事件概念来说,该第 1 项表示上 下位关系。 在信息物元中,将定义为 isKindOf 属性。 例如: NO. = 018854 W_C = 大学 DEF = InstitudePlace | 场所,@ teach | 教, @ study | 学,education | 教育 其对应的信息关系元为 R = isKindOf , antecedent, 大学 consequent, 场所 M M é ë ê ê ê ù û ú ú ú 对于属性和数量的概念,因为其含有的“&”关 系,可不对第 1 义原进行处理,将在之后的“&”关系 的处理中详细介绍。 2) “&”关系 在知网中,“&”表示“属性-宿主” 关系。 对此 类概念,不提取第 1 义原,改为提取该概念和第 2 义 原之间为上下位关系。 因为第 2 义原描述了具体的 数量/ 属性类,可以更加准确地对概念的语义范围进 行界定。 例如: NO. = 060421 W_C = 模式 DEF = attribute | 属性,pattern | 样式, &physical | 物质 按照上述转换规则,可以得到上下位信息关系 元(isKindOf):“模式”-“样式”,其对应的信息关系 元为 R = isKindOf, antecedent, 模式 consequent, 样式 M M é ë ê ê ê ù û ú ú ú 其表示的意义为:“模式” 是属于物质的样式 类别。 3)“%”关系 在知网中,“%” 表示“整体-部分” 关系,与属 性/ 数量关系类似,不再提取第 1 义原作为其上下位 关系,而是直接提取“%” 关系作为 isPartOf 属性。 例如: NO. = 068228 W_C = 琴键 DEF = part | 部件,%MusicTool | 乐器 从中,可以提取 2 个信息关系元,上下文关系元 (isKindOf):“琴键”-“部件”、整体部分信息关系元 (isPartOf):“琴键” -“乐器”。 其对应的信息关系 元为 R1 = isKindOf, antecedent, 琴键 consequent, 部件 ︙ ︙ é ë ê ê ê ù û ú ú ú R2 = isPartOf, antecedent, 琴键 consequent, 乐器 ︙ ︙ é ë ê ê ê ù û ú ú ú 4)“ $ ”、“∗”、“@ ”、“#”等关系 在知网中,对于这些关系的提取,都可以直接进 行,不再赘述。 3.3 信息事元的构造 对于信息事元的改造,一方面要保证其语义的 完整性,另一方面,更要规定其模型,针对不同类型 ·792· 智 能 系 统 学 报 第 10 卷
第5期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·793. 的事件,事件模型不一样。对于某一领域内的知识, 元的复合中,信息关系元将做为其他信息元的特征。 应该进行分类,并建立相应的事件模式。譬如:“报 例如:“张三要报考广东工业大学”这一事件,可以 考”这一事件一定有考生(actingObject)和学校(re 建立如下信息复合元: ceivingObject)的参与,所以在建立这类事元时,施动 报考,上位关系, R 对象(actingObject)和接受对象(receivingObject)特 ResultEvent, 考试 A= 征是固定的必不可少的。 actingObject, M 知网2000中使用到约70个动态角色是指概念 receivingObject, M, 在实际的语言中所构成的各种关系,如施事、受事、 isKindOf. antecedent, 报考1 经验者、时间、处所等6。有了这些动态角色的注 R1= consequent, 要求 释,通过形式化的表示,计算机就能更好地理解其 考生, hasAtrributeOf,name 含义。 hasAtrributeOf, sex 本文针对信息事元的构造,采用的方法为:提取 hasAtrributeOf, sourcePlace 第1义原为信息事元的上位属性,提取动态角色为 M,= hasAtrributeOf,score 信息事元的第2属性。譬如“报考”这一事元,在知 hasAtrributeOf, subject 网中对其的定义为: hasInstanceOf,M3 N0.=003701 「学校, isKindOf, 场所 W_C=报考 hasAtrributeOf.schoolID G_E=V hasAtrributeOf,collegeLocation, E_E= hasAtrributeOf,collegeLevel, DEF=requestI要求,ResultEvent=exam|考试, M2= hasAtrributeOf, scienceScore, education|教育 hasAtrributeOf.artScore. 其对应的信息事元为 hasAtrributeOf, year 报考,isKindOf,, 要求 hasInstanceOf. M. actingObject, 考生 「考生,name, 张三1 receivingObject,.学校 sex, 男 resultEvent, 考试 M3= sourcePlace, 广东 score. 567 对于没有动态角色的义原,例如: subject, N0.=026730 「广东工业大学, schoollD. 11911 W_C=放学 collegeLevel, 1 G_E=V M4= scienceScore, 560 EE= artScore, 579 DEF=finishl完毕,educationI教育 year, 2014 直接取第1义原为该事元的上位属性,即 subject=l,即表示理科;subject=2,表示文科。 [放学,isKindOf, 完毕7 collegeLevel=0,表示国家重点“985”院校,col actingObject, 学生 legeLevel=l,表示国家重点“211”或者一本院校,二 dominatingObject,学校 本院校、三本院校等其他类院校,以此类推。 综上,分别确定了信息物元、信息关系元、信息 3.4信息复合元的构造 事元和信息复合元的结构,并举例说明该结构是可 对于现实世界中的复杂事件的描述,需要使用 以反映一个无语义二义性的客观世界,同时也具有 复合元。复合元包括多种形式,包括:物元和事元的 表达可拓知识并支持可拓变换的能力。 复合,物元和关系元的复合等。 4 案例分析—可拓教育领域信息元 前面已经详细讨论了信息物元、信息关系元和 信息事元的构造,那么至于信息复合元的构成,即它 库的建立方法 们的复合,唯一不同的是在信息关系元与其他信息 在之前文献的研究中,利用可拓学很好地解决
的事件,事件模型不一样。 对于某一领域内的知识, 应该进行分类,并建立相应的事件模式。 譬如:“报 考”这一事件一定有考生( actingObject)和学校( re⁃ ceivingObject)的参与,所以在建立这类事元时,施动 对象( actingObject) 和接受对象( receivingObject) 特 征是固定的必不可少的。 知网 2000 中使用到约 70 个动态角色是指概念 在实际的语言中所构成的各种关系,如施事、受事、 经验者、时间、处所等[6] 。 有了这些动态角色的注 释,通过形式化的表示,计算机就能更好地理解其 含义。 本文针对信息事元的构造,采用的方法为:提取 第 1 义原为信息事元的上位属性,提取动态角色为 信息事元的第 2 属性。 譬如“报考”这一事元,在知 网中对其的定义为: NO. = 003701 W_C = 报考 G_E = V E_E = DEF = request | 要求,ResultEvent = exam | 考试, education | 教育 其对应的信息事元为 A = 报考, isKindOf, 要求 actingObject, 考生 receivingObject, 学校 resultEvent, 考试 ︙ ︙ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 对于没有动态角色的义原,例如: NO. = 026730 W_C = 放学 G_E = V E_E = DEF = finish | 完毕,education | 教育 直接取第 1 义原为该事元的上位属性,即 A = 放学, isKindOf, 完毕 actingObject, 学生 dominatingObject, 学校 ︙ ︙ é ë ê ê ê ê ê ù û ú ú ú ú ú 3.4 信息复合元的构造 对于现实世界中的复杂事件的描述,需要使用 复合元。 复合元包括多种形式,包括:物元和事元的 复合,物元和关系元的复合等。 前面已经详细讨论了信息物元、信息关系元和 信息事元的构造,那么至于信息复合元的构成,即它 们的复合,唯一不同的是在信息关系元与其他信息 元的复合中,信息关系元将做为其他信息元的特征。 例如:“张三要报考广东工业大学” 这一事件,可以 建立如下信息复合元: A = 报考, 上位关系, R1 ResultEvent, 考试 actingObject, M1 receivingObject, M2 é ë ê ê ê ê ê ù û ú ú ú ú ú R1 = isKindOf, antecedent, 报考 consequent, 要求 é ë ê ê ù û ú ú M1 = 考生, hasAtrributeOf, name hasAtrributeOf, sex hasAtrributeOf, sourcePlace hasAtrributeOf, score hasAtrributeOf, subject hasInstanceOf, M3 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú M2 = 学校, isKindOf, 场所 hasAtrributeOf, schoolID hasAtrributeOf, collegeLocation, hasAtrributeOf, collegeLevel, hasAtrributeOf, scienceScore, hasAtrributeOf, artScore, hasAtrributeOf, year hasInstanceOf, M4 é ë ê ê ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú ú ú M3 = 考生, name, 张三 sex, 男 sourcePlace, 广东 score, 567 subject, 1 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú M4 = c广ol东leg广eL州ocation, 广东工业大学, schoolID, 11911 collegeLevel, 1 scienceScore, 560 artScore, 579 year, 2014 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú subject = 1,即表示理科;subject = 2,表示文科。 collegeLevel = 0, 表 示 国 家 重 点 “ 985 ” 院 校, col⁃ legeLevel = 1,表示国家重点“211”或者一本院校,二 本院校、三本院校等其他类院校,以此类推。 综上,分别确定了信息物元、信息关系元、信息 事元和信息复合元的结构,并举例说明该结构是可 以反映一个无语义二义性的客观世界,同时也具有 表达可拓知识并支持可拓变换的能力。 4 案例分析———可拓教育领域信息元 库的建立方法 在之前文献的研究中,利用可拓学很好地解决 第 5 期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·793·
·794 智能系统学报 第10卷 了某个矛盾问题,譬如:租房可拓策略生成系统、自 面。这种由于咨询用户自身对高考填报志愿咨 助游可拓策略生成系统[),而并未涉及到某个领域 询领域语义信息理解一致的惯性及咨询目标十分明 的矛盾问题的求解。也有文献讨论了基于本可拓模 确的特点,大大降低了专家的参与度,在确定类、属 型的复合元),基于可拓模型的本体进化研究, 性和关系的处理上很容易达成共识。因此,本文采 为本文的研究提供了很好的基础。本文以教育领域 用自底向上建模方法,先行确定核心概念和关系,保 为案例,说明如何用改进语义能力的信息元解决领 障语义的正确性和完整性。 域矛盾问题。譬如,高考填报志愿,理想中的学校分 在知网知识库2000中,分别查询“学校”、“专 熟线和自己高考分数存在矛盾:学习中,学习能力方 业”、“指标”等义原。发现: 法和预期成绩存在矛盾等。为此,建立一个教育领 N0.=018854 域的概念体系是研究的关键基础步骤。 W_C=大学 4.1教育领域概念结构 DEF=InstitutePlace|场所,@teach I教, 教育概念体系反映了教育体系概念和及其属 @studyI学,education I教育 性0。本文总体上将教育客体分为3类:自然类教 N0.=111321 育客体,如学科,专业等:社会类教育客体,如学校的 W_C=专业 各类管理组织机构、教学设备等:精神类教育客体, DEF=affairs事务,education I教育 如教育理论、教育思想等山。教育领域的概念结构 N0.=108770 如图1所示。 W_C=指标 DEF=quantity|数量,amount I多少, 教育领域概念体系 &result I结果 建立对应的信息复合元为 自然概念 社会概念 精神概念 M,=[大学,上位关系,R] isKindOf. R1= antecedent,大学 consequent, 场所」 几构 设备 理论思想 M2=[专业 上位关系,R,] 图1教育领域概念体系 「isKindOf, antecedent, 专业 R2= Fig.1 Education concept system consequent, 事务」 M3=[招生指标, 上位关系,R] 4.2教育领域信息元的构建 isKindOf, antecedent, 招生指标 以高考填报志愿为例说明可拓领域信息元库的 R3= consequent, 数量 建立方法。实践证明,多年来,考生在报考时的关注 再具体到某一个事件的表述:“张三要报考广 重点在于:高校名称、高校地点、高校声誉、专业设 东工业大学”这一事件,可以建立语义关系如图2 置、学科排名、分数线、招生人数和就业前景几个方 所示。 要求 场所 姓名 isKindOf isKindOf isKindOf 学校D 性别 学校名称 考生 actingObject 报考 ReceivingObject 学校 hasAttributeOf hasAttributeOf 生源地 学校批次 hasInstanceOf ResultEvent haslnstanceOf 高考分数 考试 张三 东工 学校所 业大学 在省市 图2报考事件的语义关系图 Fig.2 Semantic relations of"register for examination register for examination
了某个矛盾问题,譬如:租房可拓策略生成系统、自 助游可拓策略生成系统[7] ,而并未涉及到某个领域 的矛盾问题的求解。 也有文献讨论了基于本可拓模 型的复合元[8] ,基于可拓模型的本体进化研究[9] , 为本文的研究提供了很好的基础。 本文以教育领域 为案例,说明如何用改进语义能力的信息元解决领 域矛盾问题。 譬如,高考填报志愿,理想中的学校分 熟线和自己高考分数存在矛盾;学习中,学习能力方 法和预期成绩存在矛盾等。 为此,建立一个教育领 域的概念体系是研究的关键基础步骤。 4.1 教育领域概念结构 教育概念体系反映了教育体系概念和及其属 性[10] 。 本文总体上将教育客体分为 3 类:自然类教 育客体,如学科,专业等;社会类教育客体,如学校的 各类管理组织机构、教学设备等;精神类教育客体, 如教育理论、教育思想等[11] 。 教育领域的概念结构 如图 1 所示。 图 1 教育领域概念体系 Fig.1 Education concept system 4.2 教育领域信息元的构建 以高考填报志愿为例说明可拓领域信息元库的 建立方法。 实践证明,多年来,考生在报考时的关注 重点在于:高校名称、高校地点、高校声誉、专业设 置、学科排名、分数线、招生人数和就业前景几个方 面[10] 。 这种由于咨询用户自身对高考填报志愿咨 询领域语义信息理解一致的惯性及咨询目标十分明 确的特点,大大降低了专家的参与度,在确定类、属 性和关系的处理上很容易达成共识。 因此,本文采 用自底向上建模方法,先行确定核心概念和关系,保 障语义的正确性和完整性。 在知网知识库 2000 中,分别查询“学校”、“专 业”、“指标”等义原。 发现: NO. = 018854 W_C = 大学 DEF = InstitutePlace | 场所,@ teach | 教, @ study | 学,education | 教育 NO. = 111321 W_C = 专业 DEF = affairs | 事务,education | 教育 NO. = 108770 W_C = 指标 DEF = quantity | 数量,amount | 多少, &result | 结果 建立对应的信息复合元为 M1 = 大学, 上位关系, R1 [ ] R1 = isKindOf, antecedent, 大学 consequent, 场所 é ë ê ê ù û ú ú M2 = 专业 上位关系, R2 [ ] R2 = isKindOf, antecedent, 专业 consequent, 事务 é ë ê ê ù û ú ú M3 = 招生指标, 上位关系, R3 [ ] R3 = isKindOf, antecedent, 招生指标 consequent, 数量 é ë ê ê ù û ú ú 再具体到某一个事件的表述:“张三要报考广 东工业大学” 这一事件,可以建立语义关系如图 2 所示。 图 2 报考事件的语义关系图 Fig.2 Semantic relations of “register for examination register for examination” ·794· 智 能 系 统 学 报 第 10 卷
第5期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·795. 这样清楚直观的表示后,可以方便计算机理解 现并未存放“华师”这一信息物元的具体信息。通 并处理此语义关系,即可清晰的表达出具有清晰的 过与知识库中的基元比较,得出结果如下: 语义互操作性的信息元。 华中师范大学,collegeID, 10511 4.3实验结果 collegeLevel, 应用前面所讨论的理论知识,考虑到关系型数 collegeLocation, 据库具有查询、插入、修改和删除操作的简洁性,从 M1= scienceScore, 湖北武汉 执行效率和成本角度考虑,本文使用关系型数据库 artScore, 533 建立教育领域的概念体系。本文使用的是SQL year, 2014 Server Express关系型数据库。 华南师范大学, collegelD 10574 知网是一个较为完整的知识系统,且具有语义 collegeLevel, 1 可操作性。所以,将知网2000知识库存入SQL collegeLocation, 广东广州 Server2012 Express数据库中,数据库名为: M2= scienceScore, 560 Extenics_HowNet,.并提取其中关于“教育”的所有词 artScore, 579 汇,共6O6条记录,建立表:Edu_HowNet。.再按照 year, 2014 G_C属性值的不同,分别建立Edu_HowNet_N, T华东师范大学,collegelD, 10269 Edu_HowNet_V,Edu_HowNet._ADJ3张表,如图3 collegeLevel. 1 所示。 collegeLocation, 上海 M3= a▣dbo.Edu_Extenics scienceScore, 423 日口列 artScore, 444 objID(PK,nchar(10).not null) year, 2014 objName(nvarchar(50),null) 数据库中查询结果如图4所示。 synonymobj(nvarchar(50),null) 口结果白消息 isKindOfobj(nvarchar(50),null) 6 bjID ob调t symonymobj isKindofobj isPartofobj isPartOfObj(nvarchar(50),null) 00001华南师范大学华师 场所 大学 2 00002华中师范大学华师 场所 大学 田□键 3 00003华东师范大学华师 场所 大学 田□约束 图4查询结果 田☐触发器 Fig.4 Result of query 田白素引 田□统计信息 于是,可以将计算结果:“华中师范大学”,“华 南师范大学”,“华东师范大学”推送给用户。再通 图3信息元表结构 过与用户的交互与反馈,确定哪所“华师”,从而消 Fig.3 Table of information element 除语义模糊,以达到理解用户意图的目的。 如何才能证明计算机是否能理解我们的语义关 系呢?本文主要通过基元语义相似度算法来判断。 5结束语 如果算法的输入结果在可接受范围内,就可以判定 本文基于知网这个通用的语义知识库,借助知 该领域信息元库具有语义互操作性。 网义原表达方式,解决概念语义二义性问题并提出 在可拓信息-知识-策略形式化体系研究过程 了一种建立可拓领域信息元库的创建方法,并以教 中,一个待求解问题最初可能是用自然语言表达的 育领域的高考信息咨询问题为例,用计算机实现了 信息,如果自然语言存在二义性,计算机无法识别, 该建库方法,验证了该方法可行性,得到了可接受的 就无法对该问题建立正确的可拓模型,更无法进一 结论。这个基础工作的完成对今后可拓策略生成系 步处理。假设一个考生想要报考华师,但是在知识 统解决教育领域矛盾问题有重要意义。 库中并没有“华师”这个基元,所以,利用文献[12] 的词汇相关度算法,找出所有与其相关的词语。 参考文献: 首先,建立“华师”信息物元, [1]杨春燕,蔡文.可拓工程[M].北京:科学出版社, [学校,isKindOf, 场所 M= 2007:1-10. hasInstanceOf, 华师」 YANG Chunyan,CAI Wen.Extension engineering[M]. 然后,在信息元库中查询相应信息物元信息,发 Beijing:Science Press,2007:1-10
这样清楚直观的表示后,可以方便计算机理解 并处理此语义关系,即可清晰的表达出具有清晰的 语义互操作性的信息元。 4.3 实验结果 应用前面所讨论的理论知识,考虑到关系型数 据库具有查询、插入、修改和删除操作的简洁性,从 执行效率和成本角度考虑,本文使用关系型数据库 建立教育领域的概念体系[11] 。 本文使用的是 SQL Server Express 关系型数据库。 知网是一个较为完整的知识系统,且具有语义 可操作 性。 所 以, 将 知 网 2000 知 识 库 存 入 SQL Server 2012 Express 数 据 库 中, 数 据 库 名 为: Extenics_HowNet,并提取其中关于“教育”的所有词 汇,共 606 条记录,建立表:Edu _HowNet。 再按照 G_C 属 性 值 的 不 同, 分 别 建 立 Edu _ HowNet _ N, Edu_HowNet_V,Edu _HowNet _ADJ 3 张表,如图 3 所示。 图 3 信息元表结构 Fig.3 Table of information element 如何才能证明计算机是否能理解我们的语义关 系呢? 本文主要通过基元语义相似度算法来判断。 如果算法的输入结果在可接受范围内,就可以判定 该领域信息元库具有语义互操作性。 在可拓信息-知识-策略形式化体系研究过程 中,一个待求解问题最初可能是用自然语言表达的 信息,如果自然语言存在二义性,计算机无法识别, 就无法对该问题建立正确的可拓模型,更无法进一 步处理。 假设一个考生想要报考华师,但是在知识 库中并没有“华师”这个基元,所以,利用文献[12] 的词汇相关度算法,找出所有与其相关的词语。 首先,建立“华师”信息物元, M = 学校, isKindOf, 场所 hasInstanceOf, 华师 é ë ê ê ù û ú ú 然后,在信息元库中查询相应信息物元信息,发 现并未存放“华师”这一信息物元的具体信息。 通 过与知识库中的基元比较,得出结果如下: M1 = 华中师范大学, collegeID, 10511 collegeLevel, 1 collegeLocation, scienceScore, 湖北武汉 artScore, 533 year, 2014 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú M2 = 华南师范大学, collegeID, 10574 collegeLevel, 1 collegeLocation, 广东广州 scienceScore, 560 artScore, 579 year, 2014 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú M3 = 华东师范大学, collegeID, 10269 collegeLevel, 1 collegeLocation, 上海 scienceScore, 423 artScore, 444 year, 2014 é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú 数据库中查询结果如图 4 所示。 图 4 查询结果 Fig.4 Result of query 于是,可以将计算结果:“华中师范大学”,“华 南师范大学”,“华东师范大学” 推送给用户。 再通 过与用户的交互与反馈,确定哪所“华师”,从而消 除语义模糊,以达到理解用户意图的目的。 5 结束语 本文基于知网这个通用的语义知识库,借助知 网义原表达方式,解决概念语义二义性问题并提出 了一种建立可拓领域信息元库的创建方法,并以教 育领域的高考信息咨询问题为例,用计算机实现了 该建库方法,验证了该方法可行性,得到了可接受的 结论。 这个基础工作的完成对今后可拓策略生成系 统解决教育领域矛盾问题有重要意义。 参考文献: [1] 杨春燕, 蔡文. 可拓工程 [ M]. 北京: 科学出版社, 2007: 1⁃10. YANG Chunyan, CAI Wen. Extension engineering [ M]. Beijing: Science Press, 2007: 1⁃10. 第 5 期 陶星,等:基于知网的可拓领域信息元库的构建方法 ·795·
·796 智能系统学报 第10卷 [2]李立希,杨春燕,李铧汶.可拓策略生成系统[M].北 HE Ping.Study of the ontology evolution based on extension 京:科学出版社,2006:1-23. model[D].Guangzhou,China:Guangdong University of LI Lixi,YANG Chunyan,LI Huawen.The extension strategy Technology,2011,89. generating system[M].Beijing:Science Press,2006:1-23. [10]马捷,刘小乐,黄岚,等.教育领域本体构建研究[J] [3]杨春燕,蔡文.可拓信息-知识-智能形式化体系研究 情报理论与实践,2012,35(7):104-108. [J].智能系统学报,2007,2(3):8-11. MA Jie,LIU Xiaole,HUANG Lan,et al.Research on the YANG Chunyan,CAI Wen.A formalized system of exten- ontology construction in educational domain[].Information sion information-knowledge-intelligence[J].CAAI Transac- Studies:Theory Application,2012,35(7):104-108. tions on Intelligent System,2007,2(3):8-11 [11]刘小乐.教育领域顶层本体构建及其应用研究[D].吉 [4]董振东.HowNet[EB/0L].[2013-10-09].htp:/www. 林:吉林大学,2012,64. keenage.com. LIU Xiaole.The construction and application research of [5]郝长伶,董强.知网知识库描述语言[C]/全国第七届计 the top-level ontology of educational domain [D].Jilin, China:Jilin University,2012,64. 算语言学联合学术会议.哈尔滨,中国,2003:371-377. [12]刘群,李素建.基于《知网》的词汇语义相似度计算 HAO Changling,DONG Qiang.Knowledge database mark- up language of HowNet[C]//The 7th National Conference [].计算语言学及中文信息处理,2002,(7):5976. LIU Qun,LI Sujian.Word similarity computing on how-net on Computer Linguistics.Harbin,China:2003:371-377. [J].Computational Linguistics and Chinese Information [6]滕岩.基于领域知识的智能信息检索研究[D].济南:山 Processing,2002,(7):59-76. 东大学,2006,61 作者简介: TENG Yan.The research of intelligent information retrieval 陶星,女,1989年生,硕士研究生, system based on domain knowledge[D].Jinan,China: 主要研究方向为智能软件。 Shandong University,2006,61. [7]方卓君,李卫华,李承晓.自助游可拓策略生成系统的 研究与实现[J].广东工业大学学报,2009,26(2):83- 89. FANG Zhuojun,LI Weihua,LI Chengxiao.Research and realization of extension strategy generating system for inde- 李卫华,女,1957年生,教授,主要 pendent travel [J].Journal of Guangdong University of 研究方向为面向Agent计算、网络信息 Technolog,2009,26(2):83-89. 系统、智能软件。发表学术论文40余 [8]刘宗妹.本体可拓模型的复合元实现及应用研究[D] 篇。 广州:广东工业大学,2010:1.48. LIU Zongmei.Research on ontology extension model imple- mented with complex elements and its application D]. Guangzhou,China:Guangdong University of Technology, 汪中飞,男,1988年生,硕士研究 2010:1-48. 生,主要研究方向为智能软件。 [9]何平.基于可拓模型的本体进化研究[D].广州:广东工 业大学,2011,89
[2]李立希, 杨春燕, 李铧汶. 可拓策略生成系统[M]. 北 京: 科学出版社, 2006: 1⁃23. LI Lixi, YANG Chunyan, LI Huawen. The extension strategy generating system[M]. Beijing: Science Press, 2006: 1⁃23. [3]杨春燕, 蔡文. 可拓信息-知识-智能形式化体系研究 [J]. 智能系统学报, 2007, 2(3): 8⁃11. YANG Chunyan, CAI Wen. A formalized system of exten⁃ sion information⁃knowledge⁃intelligence[ J]. CAAI Transac⁃ tions on Intelligent System, 2007, 2(3): 8⁃11. [4] 董 振 东. HowNet [ EB/ OL]. [ 2013⁃10⁃09]. http: / / www. keenage.com. [5]郝长伶, 董强. 知网知识库描述语言[C] / / 全国第七届计 算语言学联合学术会议. 哈尔滨, 中国, 2003: 371⁃377. HAO Changling, DONG Qiang. Knowledge database mark⁃ up language of HowNet[C] / / The 7th National Conference on Computer Linguistics. Harbin, China: 2003: 371⁃377. [6]滕岩. 基于领域知识的智能信息检索研究[D]. 济南: 山 东大学,2006,61. TENG Yan. The research of intelligent information retrieval system based on domain knowledge [ D]. Jinan, China: Shandong University, 2006, 61. [7]方卓君, 李卫华, 李承晓. 自助游可拓策略生成系统的 研究与实现[J]. 广东工业大学学报, 2009, 26(2): 83⁃ 89. FANG Zhuojun, LI Weihua, LI Chengxiao. Research and realization of extension strategy generating system for inde⁃ pendent travel [ J ]. Journal of Guangdong University of Technology, 2009, 26(2): 83⁃89. [8]刘宗妹. 本体可拓模型的复合元实现及应用研究[D]. 广州: 广东工业大学, 2010: 1⁃48. LIU Zongmei. Research on ontology extension model imple⁃ mented with complex elements and its application [ D]. Guangzhou, China: Guangdong University of Technology, 2010: 1⁃48. [9]何平. 基于可拓模型的本体进化研究[D]. 广州: 广东工 业大学, 2011, 89. HE Ping. Study of the ontology evolution based on extension model[ D]. Guangzhou, China: Guangdong University of Technology, 2011, 89. [10]马捷, 刘小乐, 黄岚, 等. 教育领域本体构建研究[ J]. 情报理论与实践, 2012, 35(7): 104⁃108. MA Jie, LIU Xiaole, HUANG Lan, et al. Research on the ontology construction in educational domain[J].Information Studies: Theory & Application, 2012, 35(7): 104⁃108. [11]刘小乐. 教育领域顶层本体构建及其应用研究[D]. 吉 林: 吉林大学, 2012, 64. LIU Xiaole. The construction and application research of the top⁃level ontology of educational domain [ D]. Jilin, China: Jilin University, 2012, 64. [12]刘群, 李素建. 基于《知网》 的词汇语义相似度计算 [J]. 计算语言学及中文信息处理, 2002, (7): 59⁃76. LIU Qun, LI Sujian. Word similarity computing on how⁃net [J]. Computational Linguistics and Chinese Information Processing, 2002, (7): 59⁃76. 作者简介: 陶星,女,1989 年生,硕士研究生, 主要研究方向为智能软件。 李卫华,女,1957 年生,教授,主要 研究方向为面向 Agent 计算、网络信息 系统、智能软件。 发表学术论文 40 余 篇。 汪中飞,男,1988 年生,硕士研究 生,主要研究方向为智能软件。 ·796· 智 能 系 统 学 报 第 10 卷