知识工程：基于基元和知网的问题相关度计算

团购合买资源类别：文库，文档格式：PDF，文档页数：6，文件大小：464.09KB

第10卷第2期智能系统学报 Vol.10 No.2 2015年4月 CAAI Transactions on Intelligent Systems Apr.2015 D0l:10.3969/j.issn.1673-4785. 网络出版地址：http://www.cnki.net/kcms/detail/23.1538.TP.20150326.1014.002.html 基于基元和知网的问题相关度计算曹礼园，李卫华 (广东工业大学计算机学院，广东广州510006) 摘要：通过对可拓学的基元和复合元与知网的研究，利用Howt中的词语相似度的计算方法改进词语相关度的计算方法，建立基元相关度计算方法，进而建立目标相关度和条件相关度的计算机方法，形成问题相关度的计算。改进了相关度算法，传统方法只通过上下位关系计算词语相关度，将知网描述的其他15个关系也考虑进来，并提出了负相关的概念，将相关度的取值范围定在[-1,1]，对应了关联函数的值域。通过对基元中特征与特征的对应关系，计算出基元的相关度，进而计算问题的相关度。通过对数据库里的上千个矛盾问题进行测试，证实了这种方法可有效增加策略生成途径，使矛盾问题解决的概率大大提高。关键词：可拓学：知网：相关度：基元：关联函数中图分类号：TP311文献标志码：A文章编号：1673-4785(2015)02-0234-06 中文引用格式：曹礼园，李卫华.基于基元和知网的问题相关度计算[J].智能系统学报，2015,10(2)：234-239. 英文引用格式：CAO Liyuan,.LI Weihua.Calculation of correlation problem based on basic element and HowNet[J].CAAI Trans- actions on Intelligent Systems,2015,10(2):234-239. Calculation of correlation problem based on basic element and HowNet CAO Liyuan,LI Weihua (College of Computer,Guangdong University of Technology,Guangzhou 510006,China) Abstract:Based on the basic-element and composite elements of extenics and HowNet research,the words similari- ty computing method in HowNet is used to improve the calculation method for the relationship of words.The basic- element correlation calculation method is built to establish a method for basic-element target correlation and basic- element conditions correlation.This is used to derive the method to calculate correlation of problem.There is im- provement with the correlation algorithm,but the traditional method calculates the correlation of words only by hy- ponymy.In this paper,an additional fifteen relationships described in HowNet is taken into account.The concept of negative correlation is put forward and the range of correlation is in set [-1,1],which corresponds to the range of the correlation function.Through the corresponding relationship between the features in the basic element,the cor- relation between basic elements is calculated and the correlation of problems can be calculated.Based on the test of thousands of contradictory problems in the database,the results showed that this method can effectively increase the amount of strategy generating approaches and the probability of contradictory problems to be solved is greatly promo- ted. Keywords:extenics;HowNet;correlation;basicelement;dependent function 可拓学山是一门中国原创的新学科，它以形式化的模型，探讨事物拓展的可能性以及开拓创新的规律与方法，并用于解决矛盾问题。知网(How- 收稿日期：2013-10-06.网络出版日期：2015-03-26 基金项目：国家自然科学基金资助项目(61273306) Nt)是一个以汉语和英语的词语所代表的概念为描通信作者：曹礼园.E-mail:369206663@qq.com. 述对象，以揭示概念与概念之间以及概念所具有的

第１０卷第２期智能系统学报Ｖｏｌ．１０ №．２２０１５年４月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｐｒ．２０１５ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１５０３２６．１０１４．００２．ｈｔｍｌ基于基元和知网的问题相关度计算曹礼园，李卫华（广东工业大学计算机学院，广东广州５１０００６）摘要：通过对可拓学的基元和复合元与知网的研究，利用Ｈｏｗｎｅｔ中的词语相似度的计算方法改进词语相关度的计算方法，建立基元相关度计算方法，进而建立目标相关度和条件相关度的计算机方法，形成问题相关度的计算。改进了相关度算法，传统方法只通过上下位关系计算词语相关度，将知网描述的其他１５个关系也考虑进来，并提出了负相关的概念，将相关度的取值范围定在［－１，１］，对应了关联函数的值域。通过对基元中特征与特征的对应关系，计算出基元的相关度，进而计算问题的相关度。通过对数据库里的上千个矛盾问题进行测试，证实了这种方法可有效增加策略生成途径，使矛盾问题解决的概率大大提高。关键词：可拓学；知网；相关度；基元；关联函数中图分类号：ＴＰ３１１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１５）０２⁃０２３４⁃０６中文引用格式：曹礼园，李卫华．基于基元和知网的问题相关度计算［Ｊ］．智能系统学报，２０１５，１０（２）：２３４⁃２３９．英文引用格式：ＣＡＯＬｉｙｕａｎ，ＬＩＷｅｉｈｕａ．ＣａｌｃｕｌａｔｉｏｎｏｆｃｏｒｒｅｌａｔｉｏｎｐｒｏｂｌｅｍｂａｓｅｄｏｎｂａｓｉｃｅｌｅｍｅｎｔａｎｄＨｏｗＮｅｔ［Ｊ］．ＣＡＡＩＴｒａｎｓ⁃ ａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１５，１０（２）：２３４⁃２３９．ＣａｌｃｕｌａｔｉｏｎｏｆｃｏｒｒｅｌａｔｉｏｎｐｒｏｂｌｅｍｂａｓｅｄｏｎｂａｓｉｃｅｌｅｍｅｎｔａｎｄＨｏｗＮｅｔＣＡＯＬｉｙｕａｎ，ＬＩＷｅｉｈｕａ（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒ，ＧｕａｎｇｄｏｎｇＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｇｕａｎｇｚｈｏｕ５１０００６，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｂａｓｅｄｏｎｔｈｅｂａｓｉｃ⁃ｅｌｅｍｅｎｔａｎｄｃｏｍｐｏｓｉｔｅｅｌｅｍｅｎｔｓｏｆｅｘｔｅｎｉｃｓａｎｄＨｏｗＮｅｔｒｅｓｅａｒｃｈ，ｔｈｅｗｏｒｄｓｓｉｍｉｌａｒｉ⁃ ｔｙｃｏｍｐｕｔｉｎｇｍｅｔｈｏｄｉｎＨｏｗＮｅｔｉｓｕｓｅｄｔｏｉｍｐｒｏｖｅｔｈｅｃａｌｃｕｌａｔｉｏｎｍｅｔｈｏｄｆｏｒｔｈｅｒｅｌａｔｉｏｎｓｈｉｐｏｆｗｏｒｄｓ．Ｔｈｅｂａｓｉｃ⁃ ｅｌｅｍｅｎｔｃｏｒｒｅｌａｔｉｏｎｃａｌｃｕｌａｔｉｏｎｍｅｔｈｏｄｉｓｂｕｉｌｔｔｏｅｓｔａｂｌｉｓｈａｍｅｔｈｏｄｆｏｒｂａｓｉｃ⁃ｅｌｅｍｅｎｔｔａｒｇｅｔｃｏｒｒｅｌａｔｉｏｎａｎｄｂａｓｉｃ⁃ ｅｌｅｍｅｎｔｃｏｎｄｉｔｉｏｎｓｃｏｒｒｅｌａｔｉｏｎ．Ｔｈｉｓｉｓｕｓｅｄｔｏｄｅｒｉｖｅｔｈｅｍｅｔｈｏｄｔｏｃａｌｃｕｌａｔｅｃｏｒｒｅｌａｔｉｏｎｏｆｐｒｏｂｌｅｍ．Ｔｈｅｒｅｉｓｉｍ⁃ ｐｒｏｖｅｍｅｎｔｗｉｔｈｔｈｅｃｏｒｒｅｌａｔｉｏｎａｌｇｏｒｉｔｈｍ，ｂｕｔｔｈｅｔｒａｄｉｔｉｏｎａｌｍｅｔｈｏｄｃａｌｃｕｌａｔｅｓｔｈｅｃｏｒｒｅｌａｔｉｏｎｏｆｗｏｒｄｓｏｎｌｙｂｙｈｙ⁃ ｐｏｎｙｍｙ．Ｉｎｔｈｉｓｐａｐｅｒ，ａｎａｄｄｉｔｉｏｎａｌｆｉｆｔｅｅｎｒｅｌａｔｉｏｎｓｈｉｐｓｄｅｓｃｒｉｂｅｄｉｎＨｏｗＮｅｔｉｓｔａｋｅｎｉｎｔｏａｃｃｏｕｎｔ．Ｔｈｅｃｏｎｃｅｐｔｏｆｎｅｇａｔｉｖｅｃｏｒｒｅｌａｔｉｏｎｉｓｐｕｔｆｏｒｗａｒｄａｎｄｔｈｅｒａｎｇｅｏｆｃｏｒｒｅｌａｔｉｏｎｉｓｉｎｓｅｔ［－１，１］，ｗｈｉｃｈｃｏｒｒｅｓｐｏｎｄｓｔｏｔｈｅｒａｎｇｅｏｆｔｈｅｃｏｒｒｅｌａｔｉｏｎｆｕｎｃｔｉｏｎ．Ｔｈｒｏｕｇｈｔｈｅｃｏｒｒｅｓｐｏｎｄｉｎｇｒｅｌａｔｉｏｎｓｈｉｐｂｅｔｗｅｅｎｔｈｅｆｅａｔｕｒｅｓｉｎｔｈｅｂａｓｉｃｅｌｅｍｅｎｔ，ｔｈｅｃｏｒ⁃ ｒｅｌａｔｉｏｎｂｅｔｗｅｅｎｂａｓｉｃｅｌｅｍｅｎｔｓｉｓｃａｌｃｕｌａｔｅｄａｎｄｔｈｅｃｏｒｒｅｌａｔｉｏｎｏｆｐｒｏｂｌｅｍｓｃａｎｂｅｃａｌｃｕｌａｔｅｄ．Ｂａｓｅｄｏｎｔｈｅｔｅｓｔｏｆｔｈｏｕｓａｎｄｓｏｆｃｏｎｔｒａｄｉｃｔｏｒｙｐｒｏｂｌｅｍｓｉｎｔｈｅｄａｔａｂａｓｅ，ｔｈｅｒｅｓｕｌｔｓｓｈｏｗｅｄｔｈａｔｔｈｉｓｍｅｔｈｏｄｃａｎｅｆｆｅｃｔｉｖｅｌｙｉｎｃｒｅａｓｅｔｈｅａｍｏｕｎｔｏｆｓｔｒａｔｅｇｙｇｅｎｅｒａｔｉｎｇａｐｐｒｏａｃｈｅｓａｎｄｔｈｅｐｒｏｂａｂｉｌｉｔｙｏｆｃｏｎｔｒａｄｉｃｔｏｒｙｐｒｏｂｌｅｍｓｔｏｂｅｓｏｌｖｅｄｉｓｇｒｅａｔｌｙｐｒｏｍｏ⁃ ｔｅｄ．Ｋｅｙｗｏｒｄｓ：ｅｘｔｅｎｉｃｓ；ＨｏｗＮｅｔ；ｃｏｒｒｅｌａｔｉｏｎ；ｂａｓｉｃｅｌｅｍｅｎｔ；ｄｅｐｅｎｄｅｎｔｆｕｎｃｔｉｏｎ收稿日期：２０１３⁃１０⁃０６．网络出版日期：２０１５⁃０３⁃２６．基金项目：国家自然科学基金资助项目（６１２７３３０６）．通信作者：曹礼园．Ｅ⁃ｍａｉｌ：３６９２０６６６３＠ｑｑ．ｃｏｍ．可拓学［１］是一门中国原创的新学科，它以形式化的模型，探讨事物拓展的可能性以及开拓创新的规律与方法，并用于解决矛盾问题。知网［２］（Ｈｏｗ⁃ Ｎｅｔ）是一个以汉语和英语的词语所代表的概念为描述对象，以揭示概念与概念之间以及概念所具有的

第2期曹礼园，等：基于基元和知网的问题相关度计算 ·235· 属性之间的关系为基本内容的常识知识库。知网的们之间的相关度通过函数rele(B,B2):S×S→[-1，建网方式、知识获取和表达方式、事件概念分类方法 1],表示集合S中2个词语B,和B,的相关程度。和其自行设计的知识数据描述拓学中提出解决矛盾相关度函数的性质具有自反性和对称性，即对问题的策略生成知识需求。本文将可拓学和知网这于B,∈S,B2∈S,形式上有：个中国原创的理论和应用工具相结合，进一步提高 1)rele(B,B2)∈[-1,1]。相关度的计算值为了可拓学智能化水平，拓展了知网的应用。在文献 [-1,1]中的一个实数。 [3]中，蔡文教授首先提出物元模型的概念，文献 2)相关关系具有自反性，rele(B,B2)=rele [4]提出了关联函数的构造方法。知网是我国著名 (B2,B1)。机器翻译专家董振东先生创立的一个知识系统，它 3)rele(B,B2)=1,当且仅当B,=B,即如果2 包含丰富的语义知识和世界知识。文献[5]通过知个词汇是词语等价，则相关度为1。识描述结构和上下位关系计算义原相似度，文献 4)rele(B,B2)=-1,当且仅当即存在对义或反 [6]和[7]分别提出了一种利用相关度来计算词语义关系，相关度为-1。相关度的算法。 5)rele(B,B2)=0。如果2个基元没有任何共同特征，那么其相关度为0。 1 传统的可拓策略生成系统分析问题定义2正相关。给定2个基元B,和B,如的不足 rele(B,B2)>0,则称B,、B2正相关。定义3负相关。给定2个基元B,和B2,如传统的策略生成系统是先建立可拓模型，即建 rele(B,B2)<0,则称B,、B,负相关。立问题P的核问题P。的可拓模型为P。=go×L。,其在知网中，美丽与漂亮的相关度为1，美丽与丑中，g。为问题的目标，1。为问题的条件。再确定问陋的相关度0.814815，在情感分析中，美丽与丑陋题的关联函数K,然后对问题P。进行相容性分析，是反义的。美丽和丑陋在句子中是可以替换的，但若不相容（目标与条件有矛盾），则对问题的目标或这并不符合句子的原意。条件进行可拓分析，得到问题的发散树或相关树，通负相关是指2个词语是对义或者反义，或者两过对问题发散树或相关树的“叶”基元进行可拓变者在路径中存在对义或反义关系。如：假设O,与换，生成候选策略集合，最后对策略集合中的策略进 O3是反义（对义）关系（根据《同义、反义以及对义组行优度评价，推荐优度较高的策略供决策者选择。的形成》获得)，则O,、O,的相关度就是在路径中存这种分析问题的方法存在着一些不足之处。在对义或反义关系，rele(Os,O,)为负数。首先，这个解决问题的方法对每个问题都进行 2.2词语相关度计算整个过程，当遇到类似的问题时，系统依然重复上次相似的词语相关的可能性也大些，把词语的相策略生成的过程，增加了策略生成的时间。似度和基于直接关系和语义关系挖掘规则获得的关其次，这个过程无法对问题进行归类。也找不系作为判断是否相关的依据而得出来的基本相关度到问题之间关联性，因而无法对问题进行归并，进而找到通用解。同时导致策略的针对性不强。部分按比例相加，就得到了词语的相关度。可见，在可拓策略生成系统中，在原问题和核问 2.2.1相似度部分Sim(W,W2) 题建模后，增加另一个过程一一进入矛盾问题库，用 2个词语相似度计算，直接采用文献[5]中方法问题相关度判断是否与已有矛盾问题相关（或相计算。同)是非常重要的。如果问题与已在问题库的问题 2.2.2基本相关度部分Rele_prim(W,W2) 类似，则可直接进入可拓策略库搜索选取相应的策对于2个汉语词语W和W2,如果W,有n个义略，缩短问题解决的时间，提高问题解决的概率。项（概念）：S1,S2,…,Sn,W2有m个义项（概念）： S,S2,…,Sn规定，W,和W2的相关度是各个概念 2 词语相关度计算模型的相关度绝对值最大的那个值，也就是说： 2.1 词语相关概念 Rele_prim(W,W2)= 定义1词语相关度。给定2个词语B和B,它 ±.m Rele-prim(S,S)川

属性之间的关系为基本内容的常识知识库。知网的建网方式、知识获取和表达方式、事件概念分类方法和其自行设计的知识数据描述拓学中提出解决矛盾问题的策略生成知识需求。本文将可拓学和知网这个中国原创的理论和应用工具相结合，进一步提高了可拓学智能化水平，拓展了知网的应用。在文献［３］中，蔡文教授首先提出物元模型的概念，文献［４］提出了关联函数的构造方法。知网是我国著名机器翻译专家董振东先生创立的一个知识系统，它包含丰富的语义知识和世界知识。文献［５］通过知识描述结构和上下位关系计算义原相似度，文献［６］和［７］分别提出了一种利用相关度来计算词语相关度的算法。１传统的可拓策略生成系统分析问题的不足传统的策略生成系统是先建立可拓模型，即建立问题Ｐ的核问题Ｐ０的可拓模型为Ｐ０＝ｇ０ × ｌ０，其中，ｇ０为问题的目标，ｌ０为问题的条件。再确定问题的关联函数Ｋ，然后对问题Ｐ０进行相容性分析，若不相容（目标与条件有矛盾），则对问题的目标或条件进行可拓分析，得到问题的发散树或相关树，通过对问题发散树或相关树的“叶”基元进行可拓变换，生成候选策略集合，最后对策略集合中的策略进行优度评价，推荐优度较高的策略供决策者选择。这种分析问题的方法存在着一些不足之处。首先，这个解决问题的方法对每个问题都进行整个过程，当遇到类似的问题时，系统依然重复上次策略生成的过程，增加了策略生成的时间。其次，这个过程无法对问题进行归类。也找不到问题之间关联性，因而无法对问题进行归并，进而找到通用解。同时导致策略的针对性不强。可见，在可拓策略生成系统中，在原问题和核问题建模后，增加另一个过程――进入矛盾问题库，用问题相关度判断是否与已有矛盾问题相关（或相同）是非常重要的。如果问题与已在问题库的问题类似，则可直接进入可拓策略库搜索选取相应的策略，缩短问题解决的时间，提高问题解决的概率。２词语相关度计算模型２．１词语相关概念定义１词语相关度。给定２个词语Ｂ１和Ｂ２，它们之间的相关度通过函数ｒｅｌｅ（Ｂ１，Ｂ２）：Ｓ × Ｓ→［－１，１］，表示集合Ｓ中２个词语Ｂ１和Ｂ２的相关程度。相关度函数的性质具有自反性和对称性，即对于Ｂ１∈Ｓ，Ｂ２∈Ｓ，形式上有：１）ｒｅｌｅ（Ｂ１，Ｂ２）∈［－１，１］。相关度的计算值为［－１，１］中的一个实数。２）相关关系具有自反性，ｒｅｌｅ（Ｂ１，Ｂ２）＝ｒｅｌｅ（Ｂ２，Ｂ１）。３）ｒｅｌｅ（Ｂ１，Ｂ２）＝１，当且仅当Ｂ１＝Ｂ２，即如果２个词汇是词语等价，则相关度为１。４）ｒｅｌｅ（Ｂ１，Ｂ２）＝－１，当且仅当即存在对义或反义关系，相关度为－１。５）ｒｅｌｅ（Ｂ１，Ｂ２）＝０。如果２个基元没有任何共同特征，那么其相关度为０。定义２正相关。给定２个基元Ｂ１和Ｂ２，如ｒｅｌｅ（Ｂ１，Ｂ２）＞０，则称Ｂ１、Ｂ２正相关。定义３负相关。给定２个基元Ｂ１和Ｂ２，如ｒｅｌｅ（Ｂ１，Ｂ２）＜０，则称Ｂ１、Ｂ２负相关。在知网中，美丽与漂亮的相关度为１，美丽与丑陋的相关度０．８１４８１５，在情感分析中，美丽与丑陋是反义的。美丽和丑陋在句子中是可以替换的，但这并不符合句子的原意。负相关是指２个词语是对义或者反义，或者两者在路径中存在对义或反义关系。如：假设Ｏ１与Ｏ３是反义（对义）关系（根据《同义、反义以及对义组的形成》获得），则Ｏ５、Ｏ９的相关度就是在路径中存在对义或反义关系，ｒｅｌｅ（Ｏ５，Ｏ９）为负数。２．２词语相关度计算相似的词语相关的可能性也大些，把词语的相似度和基于直接关系和语义关系挖掘规则获得的关系作为判断是否相关的依据而得出来的基本相关度部分按比例相加，就得到了词语的相关度。２．２．１相似度部分Ｓｉｍ（Ｗ１，Ｗ２）２个词语相似度计算，直接采用文献［５］中方法计算。２．２．２基本相关度部分Ｒｅｌｅ＿ｐｒｉｍ（Ｗ１，Ｗ２）对于２个汉语词语Ｗ１和Ｗ２，如果Ｗ１有ｎ个义项（概念）：Ｓ１１，Ｓ１２，…，Ｓ１ｎ，Ｗ２有ｍ个义项（概念）：Ｓ１１，Ｓ１２，…，Ｓ１ｎ规定，Ｗ１和Ｗ２的相关度是各个概念的相关度绝对值最大的那个值，也就是说：Ｒｅｌｅ＿ｐｒｉｍ（Ｗ１，Ｗ２）＝ ± ｍａｘｉ＝１．．ｎ，ｊ＝１．．．ｍ｜Ｒｅｌｅ＿ｐｒｉｍ（Ｓ１ｉ，Ｓ２ｊ）｜第２期曹礼园，等：基于基元和知网的问题相关度计算 ·２３５·

.236. 智能系统学报第10卷这样，就把2个词语之间的相关度问题归结到了2 关系、对义关系、部件-整体关系、属性-宿主、材料个概念之间的相关度问题。成品、施事/经验者/关系主体-事件关系、受事/内下面来计算2个义项S,和S,之间的相关度。容/领属物等-事件关系、工具-事件关系、场所-事 S,与S2的知网形式化表示为件、时间-事件关系、值-属性关系、实体-值关系、事 S1=(P11P12,…) 件-角色关系、相关关系等16种关系。间接关系指 S2=(P2P2,…）根据语义关系挖掘规则获得的关系[。定义相对相关度Rele-prim,(S,S2), Rele_prim(S,S2)= Rele_prim,(S,S2)代表概念相对于概念S,在关系 [w,Rele_prim,(S,S2)+ i上的相对相关度，定义 wRele_prim,(S2,S,)]/2 1,(p=P3j=1,2,3,…,n)） Re le_prim;(S1,S2)= 0,其他式中：∑,=1,∑=1ij=%,#,,*,@,$, 它包括直接关系和间接关系。 &,其中间接关系挖掘规则总结如表1。直接关系包括上下位关系之外、同义关系、反义表1知网间接关系挖掘规则 Table 1 HowNet indirect relation mining rules 直接关系关系符间接关系挖掘规则部分-整体 % 以下位义原为主要特征的概念与原概念也构成部分与整体关系。 1)以相关义原为主要特性或第二特性的概念与原概念相关：相关关系 2)具体相同相关元素的概念是相关的。材料-成品关系成品的解释义原与材料概念相关。 1)以相同事件义原为施事，经验者的概念相互关联：施事/经验者/ 2)以事件为角色的概念与原概念相关：关系主体-事件 3)与事件构成时间/地点-事件关系的概念与原概念：或工作-时间关系 4)以事件义原为主要特征的概念与原概念。 1)与事件存在施事、受事关系的概念与原概念相关：时间地点 @ 2)以事件为角色的概念与原概念相关：事件关系 3)以事件义原为主要特征的概念与原概念相关。 1)与事件存在施事、受事关系的概念与原概念相关；受事/内容/ 2)以事件为角色的概念与原概念相关：领属物-事件 3)以事件构成时间/地点-事件关系的概念与原概念相关： 4)以事件义原为主要特征的概念与原概念相关。 1)以宿主为主要特征的概念与原概念之间同样存在宿主-属性关宿主-属性系； 2)以该属性所对应属性值概念与原概念具有属性-值关系。 0:是S,对S2对应的关系的权值，w是S2对S “国庆”和“烟花炮竹”通过事件“祝贺”相关，计对应的关系的权值，都是可调节的参数。算如下：例如：在关系@上S,与S2相关，在关系*上S2与S,相关，国庆：timel时间，dayl日，@congratudate|祝贺，# 所以Re le_prim(S1,S2)=(w@*1+w,*1)/2 countryl国家 2.2.3词语相关度Rele(W,W2)计算烟花炮竹：tooll用具，*whileAway I消闲，*con- Re le(WI,W2)= gratulate|祝贺 BSim(S1,S2)+B2Rele_prim;(S1,S2)

这样，就把２个词语之间的相关度问题归结到了２个概念之间的相关度问题。下面来计算２个义项Ｓ１和Ｓ２之间的相关度。Ｓ１与Ｓ２的知网形式化表示为Ｓ１＝（ｐ１１，ｐ１２，…）Ｓ２＝（ｐ２１，ｐ２２，…）定义相对相关度Ｒｅｌｅ＿ｐｒｉｍｉ（Ｓ１，Ｓ２），Ｒｅｌｅ＿ｐｒｉｍｉ（Ｓ１，Ｓ２）代表概念相对于概念Ｓ１在关系ｉ上的相对相关度，定义Ｒｅｌｅ＿ｐｒｉｍｉ（Ｓ１，Ｓ２）＝１，（ｐ１ｉ＝ｐ２ｊ，ｊ＝１，２，３，…，ｎ）０，其他 { 它包括直接关系和间接关系。直接关系包括上下位关系之外、同义关系、反义关系、对义关系、部件－整体关系、属性－宿主、材料－成品、施事／经验者／关系主体－事件关系、受事／内容／领属物等－事件关系、工具－事件关系、场所－事件、时间－事件关系、值－属性关系、实体－值关系、事件－角色关系、相关关系等１６种关系。间接关系指根据语义关系挖掘规则获得的关系［９］。Ｒｅｌｅ＿ｐｒｉｍ（Ｓ１，Ｓ２）＝［∑ｗｉＲｅｌｅ＿ｐｒｉｍｉ（Ｓ１，Ｓ２）＋ ∑ｗｊＲｅｌｅ＿ｐｒｉｍｊ（Ｓ２，Ｓ１）］／２式中： ∑ ｍ１ｗｉ＝１，∑ ｎ１ｗｊ＝１ｉ，ｊ＝％，＃，？，∗，＠，＄，＆，其中间接关系挖掘规则总结如表１。表１知网间接关系挖掘规则Ｔａｂｌｅ１ＨｏｗＮｅｔｉｎｄｉｒｅｃｔｒｅｌａｔｉｏｎｍｉｎｉｎｇｒｕｌｅｓ直接关系关系符间接关系挖掘规则部分－整体％以下位义原为主要特征的概念与原概念也构成部分与整体关系。相关关系＃１）以相关义原为主要特性或第二特性的概念与原概念相关；２）具体相同相关元素的概念是相关的。材料－成品关系？成品的解释义原与材料概念相关。施事／经验者／关系主体－事件或工作－时间关系 ∗ １）以相同事件义原为施事，经验者的概念相互关联；２）以事件为角色的概念与原概念相关；３）与事件构成时间／地点－事件关系的概念与原概念；４）以事件义原为主要特征的概念与原概念。时间地点－事件关系＠１）与事件存在施事、受事关系的概念与原概念相关；２）以事件为角色的概念与原概念相关；３）以事件义原为主要特征的概念与原概念相关。受事／内容／领属物－事件＄１）与事件存在施事、受事关系的概念与原概念相关；２）以事件为角色的概念与原概念相关；３）以事件构成时间／地点－事件关系的概念与原概念相关；４）以事件义原为主要特征的概念与原概念相关。宿主－属性＆１）以宿主为主要特征的概念与原概念之间同样存在宿主－属性关系；２）以该属性所对应属性值概念与原概念具有属性－值关系。ｗｉ是Ｓ１对Ｓ２对应的关系的权值，ｗｊ是Ｓ２对Ｓ１对应的关系的权值，都是可调节的参数。例如：国庆：ｔｉｍｅ｜时间，ｄａｙ｜日，＠ｃｏｎｇｒａｔｕｄａｔｅ｜祝贺，＃ｃｏｕｎｔｒｙ｜国家烟花炮竹：ｔｏｏｌ｜用具，∗ｗｈｉｌｅＡｗａｙ｜消闲，∗ｃｏｎ⁃ ｇｒａｔｕｌａｔｅ｜祝贺 “国庆”和“烟花炮竹”通过事件“祝贺”相关，计算如下：在关系＠上Ｓ１与Ｓ２相关，在关系∗上Ｓ２与Ｓ１相关，所以Ｒｅｌｅ＿ｐｒｉｍ（Ｓ１，Ｓ２）＝（ｗ＠ ∗１＋ｗ∗∗１）／２２．２．３词语相关度Ｒｅｌｅ（Ｗ１，Ｗ２）计算Ｒｅｌｅ（Ｗ１，Ｗ２）＝ β１Ｓｉｍ（Ｓ１，Ｓ２）＋ β２Ｒｅｌｅ＿ｐｒｉｍｉ（Ｓ１，Ｓ２） ·２３６· 智能系统学报第１０卷

第2期曹礼园，等：基于基元和知网的问题相关度计算 .237· 式中：B1+B2=1。 5)没有建立起对应关系的特征与空特征对应。 B,和B,是相似度Sim(S,S2)和基本相关度3.2基元相关度计算 Rele_prim(S,S2)在总体相关度所占的比例。每一个特征就是一个词语，特征对应特征，相当于词语对应词语，即用词语相关度计算方法计算对 3基元及问题相关度计算应特征相关度。将对应起来的特征分别计算关联 3.1基元概念以及基元与基元的对应关系度，最后按比例相加，就是基元相关，计算公式为 3.1.1基元的概念 Rele_B(B,B)=>R,Rele(W:,W:) 定义4以物0为对象，Cn为特征，0关于 C的量值V构成的有序三元组： R是一个比例系数，等于1/k 3.3问题相关度计算 M=(Om,Cm,Vn）作为描述物的基本元，称为一维物元，0。、Cm、问题建模是按以下步骤进行： V三者称为物元M的三要素，其中Cn和V构成的界定问题1的目标g,与条件l,和问题2的目标二元组(Cm,Vn)称为物0的特征元。 82与条件2，并用基元表示分别建立问题的可拓模为方便起见，把物元的全体记为￡(M),物的全型P,=g1×L1、P2=g2×L利用基元相关公式分别计算出目标基元和条件基元的相关度以后，再计算体记为￡(0m),特征的全体记为￡(Cm)。关于特问题相关度Rele_P(P,P2),计算公式为征C.的取值范围记为V(Cm),称为C的量域。 Rele_P(P,P2)= 一物具有多个特征，与一维物元相仿，可以定义多维物元： Rele_B(B,Ba）×Rele_B,(B,B2）定义5物0，n个特征名cn1,cn2,…,cnn及 4 案例分析 0m关于cm(i=1,2,…,n)对应的量值vm(i=1,2, 利用以下6个问题测试问题相关度问题： …,n)所构成的阵列： P曹冲称象； P2用直尺测量一张纸的厚度： Cm2 M= =[O.C V] P,把一根长为2m、宽为1.2m、高为0.5m的桌子抬进高为2m、宽为1m的门； Cmn P,把一根长为3m、半径为0.2m的竹杆抬进高称为n维物元，其中为2.5m、宽为2m的城门； Cml 根据文献[1]中的方法，建立问题的可拓模型 P=G×L,进而提取核问题： C= V= .. P。=g0×l0 C P1=g1*L1= 3.1.2基元与基元之间的对应关系「大象A, 重量，x 在基元中，最重要是的特征与特征的对应关系。可分性，依靠下列方法建立基元的特征与另一基元的特征的 [秤B,称量，[0,200] 对应关系： P2=g2*l2= 1)首先计算2个基元的所有特征两两之间的相纸张A, 关度；厚度， 2)从所有的相关度值中选择最大的一个，将这可叠加性， 1 个相关度值对应的2个特征对应起来； [直尺B,测量，[1,20]] 3)从所有的相关度值中删去那些已经建立对应 P3=g3×13= 关系的特征的相关度值：「桌子长 271 「门宽11 4)重复上述2)和3)，直到所有的相关度值都高2 宽1.2 被删除；高0.5」

式中： β１＋ β２＝１。 β１和 β２是相似度Ｓｉｍ（Ｓ１，Ｓ２）和基本相关度Ｒｅｌｅ＿ｐｒｉｍ（Ｓ１，Ｓ２）在总体相关度所占的比例。３基元及问题相关度计算３．１基元概念以及基元与基元的对应关系３．１．１基元的概念定义４以物Ｏｍ为对象，Ｃｍ为特征，Ｏｍ关于Ｃｍ的量值Ｖｍ构成的有序三元组：Ｍ＝（Ｏｍ，Ｃｍ，Ｖｍ）作为描述物的基本元，称为一维物元，Ｏｍ、Ｃｍ、Ｖｍ三者称为物元Ｍ的三要素，其中Ｃｍ和Ｖｍ构成的二元组（Ｃｍ，Ｖｍ）称为物Ｏｍ的特征元。为方便起见，把物元的全体记为￡（Ｍ），物的全体记为￡（Ｏｍ），特征的全体记为￡（Ｃｍ）。关于特征Ｃｍ的取值范围记为Ｖ（Ｃｍ），称为Ｃｍ的量域。一物具有多个特征，与一维物元相仿，可以定义多维物元：定义５物Ｏｍ，ｎ个特征名ｃｍ１，ｃｍ２，…，ｃｍｎ及Ｏｍ关于ｃｍｉ（ｉ＝１，２，…，ｎ）对应的量值ｖｍｉ（ｉ＝１，２， …，ｎ）所构成的阵列：Ｍ＝Ｏｍｃｍ１ｖｍ１ｃｍ２ｖｍ２ ︙ ︙ ｃｍｎｖｍｎ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú ＝［ＯｍＣｍＶｍ］称为ｎ维物元，其中Ｃｍ＝ｃｍ１ｃｍ２ ︙ ｃｍｎ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú Ｖｍ＝ｖｍ１ｖｍ２ ︙ ｖｍｎ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú ３．１．２基元与基元之间的对应关系在基元中，最重要是的特征与特征的对应关系。依靠下列方法建立基元的特征与另一基元的特征的对应关系：１）首先计算２个基元的所有特征两两之间的相关度；２）从所有的相关度值中选择最大的一个，将这个相关度值对应的２个特征对应起来；３）从所有的相关度值中删去那些已经建立对应关系的特征的相关度值；４）重复上述２）和３），直到所有的相关度值都被删除；５）没有建立起对应关系的特征与空特征对应。３．２基元相关度计算每一个特征就是一个词语，特征对应特征，相当于词语对应词语，即用词语相关度计算方法计算对应特征相关度。将对应起来的特征分别计算关联度，最后按比例相加，就是基元相关，计算公式为Ｒｅｌｅ＿Ｂ（Ｂ１，Ｂ２）＝ ∑ ｋ１ＲｉＲｅｌｅ（Ｗ１，Ｗ２）Ｒｉ是一个比例系数，等于１／ｋ３．３问题相关度计算问题建模是按以下步骤进行：界定问题１的目标ｇ１与条件ｌ１和问题２的目标ｇ２与条件ｌ２，并用基元表示分别建立问题的可拓模型Ｐ１＝ｇ１ × ｌ１、Ｐ２＝ｇ２ × ｌ２利用基元相关公式分别计算出目标基元和条件基元的相关度以后，再计算问题相关度Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ２），计算公式为Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ２）＝Ｒｅｌｅ＿Ｂｇ（Ｂｇ１，Ｂｇ２） × Ｒｅｌｅ＿Ｂｌ（Ｂｌ１，Ｂｌ２）４案例分析利用以下６个问题测试问题相关度问题：Ｐ１曹冲称象；Ｐ２用直尺测量一张纸的厚度；Ｐ３把一根长为２ｍ、宽为１．２ｍ、高为０．５ｍ的桌子抬进高为２ｍ、宽为１ｍ的门；Ｐ４把一根长为３ｍ、半径为０．２ｍ的竹杆抬进高为２．５ｍ、宽为２ｍ的城门；根据文献［１］中的方法，建立问题的可拓模型Ｐ＝Ｇ × Ｌ，进而提取核问题：Ｐ０＝ｇ０ × ｌ０Ｐ１＝ｇ１∗ｌ１＝大象Ａ，重量，可分性，ｘ－１ é ë ê ê ê ù û ú ú ú ∗ [秤Ｂ，称量，［０，２００］ ] Ｐ２＝ｇ２∗ｌ２＝纸张Ａ，厚度，可叠加性，ｙ１ é ë ê ê ê ù û ú ú ú ∗ [直尺Ｂ，测量，［１，２０］ ] Ｐ３＝ｇ３ × ｌ３＝门宽１高２ é ë ê ê ù û ú ú × 桌子长２宽１．２高０．５ é ë ê ê êê ù û ú ú úú 第２期曹礼园，等：基于基元和知网的问题相关度计算 ·２３７·

·238, 智能系统学报第10卷 P4=g4×L4= 将相关问题放在一起研究，并运用可拓学策略生「城宽2.51 「竹杆长 3 成方法再次研究解决矛盾问题，实验结果如下。高2」半径0.2 表2实验结果问题相关度计算 Table 2 Result of test Rele_P(P1,P2)=-0.394 方法无问题相基于问题 Rele_P(P1,P3)=+0.204 数量关度方法相关度计算 Rele_P(P,P4)=+0.075 解决的问题数量 1390 1539 Rele_P(P2,P3)=-0.076 未解决的问题数量 392 241 Rele_P(P2,P4)=+0.204 在运用基于问题相关度计算方法后，有73.85% Rele_P(P3,P4)=+0.654 的问题是相关的，其中有140个未解决的问题被解在参数的选择上，由于一般认为%、#、？、*、@、决了，而在已经解决的问题中，有325个问题找到了 $、&所代表的关系权重程度逐渐下降，即表1中的更好的方法改进策略。所以在总体情况下，基于问关系的重要程度逐步下降。经多次测试，最终设置题相关度方法对策略生成的改进量为19.27%：其中参数如下：w1=0.25,w2=0.2,03=0.2,w4=0.15, 是将未解决的问题变成已解决5.80%，13.46%是将 05=0.10,06=0.05,107=0.05,其中，1~7分别指关已解决的问题找到更好的策略。系%、#、？、*、@、$、&。对于相关度的太低的相关度值，可以认为它不6结束语相关，把相关度大于0.3作为相关的阈值。通过计算基元的相关度进而计算问题的相关 Rele_P(P1,P2)=-0.394 度，可以使相关度很高的问题归类。正相关度高的 Rele_P(P3,P4)=+0.654 问题之间，可通过解决问题A而找出类似的方法解解决策略：Rele_P(P,Pz)=-0.394说明这个决问题B,而负相关的问题之间，通过解决问题A,而矛盾问题是负相关的。对于P,采取复制变换，用逆向找出解决问题B的方法。而将相关问题归类测量N张纸的厚度N×y∈[1,20]cm。后，可通过归纳总结得出此类问题的一般特征，找出通过解决问题P,采用可拓变换中的逆变换找解决此类问题的一般规律，进而改进策略生成方法，出解决问题P,的方法，即利用分解变换（在利用分使未解决的矛盾问题得到解决，或者使已解决的矛解变换的之前，先利用置换变换)。盾问题找到更优的策略。 Rele_P(P3,P4)=+0.654 实践证明，这种方法可有效增加策略生成途径，说明这2个矛盾问题是高度正相关的，P,、P4 使矛盾问题解决的概率大大提高。可采取类似的方法解决。对P,将桌子旋转，高变为宽，宽变为高，则可抬入门内。对P,也可采取这参考文献：种方法。 [1]杨春燕，蔡文.可拓工程[M].北京：科学出版社，2007： 5实验及结果 1-344. [2]董振东.How Net[EB/0L].[2013-05-12].htp://www 根据上述方法，利用C++,采用VS编程环境实 keenage.com. 现计算问题相关度程序，并对问题库里的2413个矛 [3]蔡文.可拓集合和不相容问题[J].科学探索报，1983 盾问题的问题相关度计算。实验参数设置如下： (1):83-97 01=0.25,102=0.2,03=0.2,104=0.15,05=0.10, CAI Wen.Extension set and non compatible problems [J]. w6=0.05,w7=0.05。 Science Journal,1983 (1):83-97 其中，1~7分别指关系%、#、？、*、@、$、&。阈 [4]李桥兴，刘思峰.基于区间距和区间侧距的初等关联函值为0.3。数构造[J].哈尔滨工业大学学报，2006,38(7)：1097- 通过计算，其中1782个与其他问题相关。 1100

Ｐ４＝ｇ４ × ｌ４＝城宽２．５高２ é ë ê ê ù û ú ú × 竹杆长３半径０．２ é ë ê ê ù û ú ú 问题相关度计算Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ２）＝－０．３９４Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ３）＝＋０．２０４Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ４）＝＋０．０７５Ｒｅｌｅ＿Ｐ（Ｐ２，Ｐ３）＝－０．０７６Ｒｅｌｅ＿Ｐ（Ｐ２，Ｐ４）＝＋０．２０４Ｒｅｌｅ＿Ｐ（Ｐ３，Ｐ４）＝＋０．６５４在参数的选择上，由于一般认为％、＃、？、∗、＠、＄、＆所代表的关系权重程度逐渐下降，即表１中的关系的重要程度逐步下降。经多次测试，最终设置参数如下：ｗ１＝０．２５，ｗ２＝０．２，ｗ３＝０．２，ｗ４＝０．１５，ｗ５＝０．１０，ｗ６＝０．０５，ｗ７＝０．０５，其中，１～７分别指关系％、＃、？、∗、＠、＄、＆。对于相关度的太低的相关度值，可以认为它不相关，把相关度大于０．３作为相关的阈值。Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ２）＝－０．３９４Ｒｅｌｅ＿Ｐ（Ｐ３，Ｐ４）＝＋０．６５４解决策略：Ｒｅｌｅ＿Ｐ（Ｐ１，Ｐ２）＝－０．３９４说明这个矛盾问题是负相关的。对于Ｐ１，采取复制变换，用测量Ｎ张纸的厚度Ｎ × ｙ ∈［１，２０］ｃｍ。通过解决问题Ｐ１，采用可拓变换中的逆变换找出解决问题Ｐ２的方法，即利用分解变换（在利用分解变换的之前，先利用置换变换）。Ｒｅｌｅ＿Ｐ（Ｐ３，Ｐ４）＝＋０．６５４说明这２个矛盾问题是高度正相关的，Ｐ３、Ｐ４可采取类似的方法解决。对Ｐ３，将桌子旋转，高变为宽，宽变为高，则可抬入门内。对Ｐ４也可采取这种方法。５实验及结果根据上述方法，利用Ｃ＋＋，采用ＶＳ编程环境实现计算问题相关度程序，并对问题库里的２４１３个矛盾问题的问题相关度计算。实验参数设置如下：ｗ１＝０．２５，ｗ２＝０．２，ｗ３＝０．２，ｗ４＝０．１５，ｗ５＝０．１０，ｗ６＝０．０５，ｗ７＝０．０５。其中，１～７分别指关系％、＃、？、∗、＠、＄、＆。阈值为０．３。通过计算，其中１７８２个与其他问题相关。将相关问题放在一起研究，并运用可拓学策略生成方法再次研究解决矛盾问题，实验结果如下。表２实验结果Ｔａｂｌｅ２Ｒｅｓｕｌｔｏｆｔｅｓｔ方法数量无问题相关度方法基于问题相关度计算解决的问题数量１３９０１５３９未解决的问题数量３９２２４１在运用基于问题相关度计算方法后，有７３．８５％的问题是相关的，其中有１４０个未解决的问题被解决了，而在已经解决的问题中，有３２５个问题找到了更好的方法改进策略。所以在总体情况下，基于问题相关度方法对策略生成的改进量为１９．２７％：其中是将未解决的问题变成已解决５．８０％，１３．４６％是将已解决的问题找到更好的策略。６结束语通过计算基元的相关度进而计算问题的相关度，可以使相关度很高的问题归类。正相关度高的问题之间，可通过解决问题Ａ而找出类似的方法解决问题Ｂ，而负相关的问题之间，通过解决问题Ａ，而逆向找出解决问题Ｂ的方法。而将相关问题归类后，可通过归纳总结得出此类问题的一般特征，找出解决此类问题的一般规律，进而改进策略生成方法，使未解决的矛盾问题得到解决，或者使已解决的矛盾问题找到更优的策略。实践证明，这种方法可有效增加策略生成途径，使矛盾问题解决的概率大大提高。参考文献：［１］杨春燕，蔡文．可拓工程［Ｍ］．北京：科学出版社，２００７：１⁃３４４．［２］董振东．ＨｏｗＮｅｔ［ＥＢ／ＯＬ］．［２０１３⁃０５⁃１２］．ｈｔｔｐ：／／ｗｗｗ．ｋｅｅｎａｇｅ．ｃｏｍ．［３］蔡文．可拓集合和不相容问题［Ｊ］．科学探索报，１９８３（１）：８３⁃９７ＣＡＩＷｅｎ．Ｅｘｔｅｎｓｉｏｎｓｅｔａｎｄｎｏｎｃｏｍｐａｔｉｂｌｅｐｒｏｂｌｅｍｓ［Ｊ］．ＳｃｉｅｎｃｅＪｏｕｒｎａｌ，１９８３（１）：８３⁃９７［４］李桥兴，刘思峰．基于区间距和区间侧距的初等关联函数构造［Ｊ］．哈尔滨工业大学学报，２００６，３８（７）：１０９７⁃ １１００． ·２３８· 智能系统学报第１０卷

第2期曹礼园，等：基于基元和知网的问题相关度计算 ·239. LI Qiaoxing,LIU Sifeng.Elementary dependent function is [10]刘宗妹.本体可拓模型的复合元实现及应用研究[D]. constructed based on the interval distance and lateral dis- 广州：广东工业大学，2010：1-48. tance[J].Journal of Harbin Institute of Technology,2006, LIU Zongmei.Meta ontology extension model research and 38(7):1097-1100. application of the[D].Guangzhou:Guangdong University [5]刘群，李素建.基于《知网》的词汇语义相似度计算[J] of Technology,2010:1-48. 计算语言学及中文信息处理，2002(7)：59-76. [11]李立希，杨春燕，李铧汶.可拓策略生成系统[M].北京： LIU Qun,LI Sujian.based on How Net semantic similarity 科学出版社，2006：1-231， calculation[J].Computational Linguistics and Chinese Infor- [12]方卓君，李卫华，李承晓.自助游可拓策略生成系统的研 mation Processing,2002(7):59-76. 究与实现[J].广东工业大学学报，2009,26(2)：83 [6]赵应秋，罗军，张君艳基于知网的词语语义相关度计 89. 算[J].信息技术，2010(3)：90-93. FANG Zhuojun,LI Weihua,LI Chengxiao.The self-help ZHAO Yingqiu,LUO Jun,ZHANG Junyan.The word se- travel extension and implementation[].Journal of Guang- mantic relevancy computation based on HowNet[J].Infor- dong University of Technology,2009,26(2):83-89. mation Technology.2010(3):90-93. [13]李承晓，李卫华.租房可拓策略生成系统[J].智能系统 [7]许云，樊效忠，张锋.基于知网的语义相关度计算[J刀] 学报，2011,6(3)：272-278. 北京理工大学学报，2005,25(5)：411414. LI Chengxiao,LI Weihua.The extension strategy genera- XU Yun,FAN Xiaozhong,ZHANG Feng.Semantic relevan- ting system for rental of intelligent[J].CAAI Transactions cy computing based on How Net[J].Journal of Beijing Insti- on Intelligent Systems,2011,6(3):272-278. tute of Technology,2005,25(5):411-414. 作者简介： [8]江敏，肖诗斌，王弘蔚，等.一种改进的基于《知网》的词曹礼园，女，1987年生，硕士研究语语义形似度计算[J].中文信息学报，2008,22(5)：生，主要研究方向为智能软件。 84-89. JIANG Min,XIAO Shibin,WANG Hongwei,et al.An im- proved word similarity computing method based on HowNet [J].Journal of Chinese Information Processing,2008,22 (5):84-89. 李卫华，女，1957年生，教授，主要 [9]王红玲，吕强，徐瑞.中文语义相关度计算模型研究[J] 研究方向为面向Agent计算、网络信息计算机工程与应用，2009,45(7)：22-26 系统、智能软件。发表学术论文40余 WANG Hongling,LV Qiang,XU Rui.Chinese semantic rel- 篇。 ativity calculation of model [J]Computer Engineering and Applications,2009,45(7):22-26

ＬＩＱｉａｏｘｉｎｇ，ＬＩＵＳｉｆｅｎｇ．Ｅｌｅｍｅｎｔａｒｙｄｅｐｅｎｄｅｎｔｆｕｎｃｔｉｏｎｉｓｃｏｎｓｔｒｕｃｔｅｄｂａｓｅｄｏｎｔｈｅｉｎｔｅｒｖａｌｄｉｓｔａｎｃｅａｎｄｌａｔｅｒａｌｄｉｓ⁃ ｔａｎｃｅ［Ｊ］．ＪｏｕｒｎａｌｏｆＨａｒｂｉｎＩｎｓｔｉｔｕｔｅｏｆＴｅｃｈｎｏｌｏｇｙ，２００６，３８（７）：１０９７⁃１１００．［５］刘群，李素建．基于《知网》的词汇语义相似度计算［Ｊ］．计算语言学及中文信息处理，２００２（７）：５９⁃７６．ＬＩＵＱｕｎ，ＬＩＳｕｊｉａｎ．ｂａｓｅｄｏｎＨｏｗＮｅｔｓｅｍａｎｔｉｃｓｉｍｉｌａｒｉｔｙｃａｌｃｕｌａｔｉｏｎ［Ｊ］．ＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓａｎｄＣｈｉｎｅｓｅＩｎｆｏｒ⁃ ｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇ，２００２（７）：５９⁃７６．［６］赵应秋，罗军，张君艳．基于知网的词语语义相关度计算［Ｊ］．信息技术，２０１０（３）：９０⁃９３．ＺＨＡＯＹｉｎｇｑｉｕ，ＬＵＯＪｕｎ，ＺＨＡＮＧＪｕｎｙａｎ．Ｔｈｅｗｏｒｄｓｅ⁃ ｍａｎｔｉｃｒｅｌｅｖａｎｃｙｃｏｍｐｕｔａｔｉｏｎｂａｓｅｄｏｎＨｏｗＮｅｔ［Ｊ］．Ｉｎｆｏｒ⁃ ｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２０１０（３）：９０⁃９３．［７］许云，樊效忠，张锋．基于知网的语义相关度计算［Ｊ］．北京理工大学学报，２００５，２５（５）：４１１⁃４１４．ＸＵＹｕｎ，ＦＡＮＸｉａｏｚｈｏｎｇ，ＺＨＡＮＧＦｅｎｇ．Ｓｅｍａｎｔｉｃｒｅｌｅｖａｎ⁃ ｃｙｃｏｍｐｕｔｉｎｇｂａｓｅｄｏｎＨｏｗＮｅｔ［Ｊ］．ＪｏｕｒｎａｌｏｆＢｅｉｊｉｎｇＩｎｓｔｉ⁃ ｔｕｔｅｏｆＴｅｃｈｎｏｌｏｇｙ，２００５，２５（５）：４１１⁃４１４．［８］江敏，肖诗斌，王弘蔚，等．一种改进的基于《知网》的词语语义形似度计算［Ｊ］．中文信息学报，２００８，２２（５）：８４⁃８９．ＪＩＡＮＧＭｉｎ，ＸＩＡＯＳｈｉｂｉｎ，ＷＡＮＧＨｏｎｇｗｅｉ，ｅｔａｌ．Ａｎｉｍ⁃ ｐｒｏｖｅｄｗｏｒｄｓｉｍｉｌａｒｉｔｙｃｏｍｐｕｔｉｎｇｍｅｔｈｏｄｂａｓｅｄｏｎＨｏｗＮｅｔ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｈｉｎｅｓｅＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇ，２００８，２２（５）：８４⁃８９．［９］王红玲，吕强，徐瑞．中文语义相关度计算模型研究［Ｊ］．计算机工程与应用，２００９，４５（７）：２２⁃２６ＷＡＮＧＨｏｎｇｌｉｎｇ，ＬＶＱｉａｎｇ，ＸＵＲｕｉ．Ｃｈｉｎｅｓｅｓｅｍａｎｔｉｃｒｅｌ⁃ ａｔｉｖｉｔｙｃａｌｃｕｌａｔｉｏｎｏｆｍｏｄｅｌ［Ｊ］ＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，２００９，４５（７）：２２⁃２６．［１０］刘宗妹．本体可拓模型的复合元实现及应用研究［Ｄ］．广州：广东工业大学，２０１０：１⁃４８．ＬＩＵＺｏｎｇｍｅｉ．Ｍｅｔａｏｎｔｏｌｏｇｙｅｘｔｅｎｓｉｏｎｍｏｄｅｌｒｅｓｅａｒｃｈａｎｄａｐｐｌｉｃａｔｉｏｎｏｆｔｈｅ［Ｄ］．Ｇｕａｎｇｚｈｏｕ：ＧｕａｎｇｄｏｎｇＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，２０１０：１⁃４８．［１１］李立希，杨春燕，李铧汶．可拓策略生成系统［Ｍ］．北京：科学出版社，２００６：１⁃２３１．［１２］方卓君，李卫华，李承晓．自助游可拓策略生成系统的研究与实现［Ｊ］．广东工业大学学报，２００９，２６（２）：８３⁃ ８９．ＦＡＮＧＺｈｕｏｊｕｎ，ＬＩＷｅｉｈｕａ，ＬＩＣｈｅｎｇｘｉａｏ．Ｔｈｅｓｅｌｆ⁃ｈｅｌｐｔｒａｖｅｌｅｘｔｅｎｓｉｏｎａｎｄｉｍｐｌｅｍｅｎｔａｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＧｕａｎｇ⁃ ｄｏｎｇＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，２００９，２６（２）：８３⁃８９．［１３］李承晓，李卫华．租房可拓策略生成系统［Ｊ］．智能系统学报，２０１１，６（３）：２７２⁃２７８．ＬＩＣｈｅｎｇｘｉａｏ，ＬＩＷｅｉｈｕａ．Ｔｈｅｅｘｔｅｎｓｉｏｎｓｔｒａｔｅｇｙｇｅｎｅｒａ⁃ ｔｉｎｇｓｙｓｔｅｍｆｏｒｒｅｎｔａｌｏｆｉｎｔｅｌｌｉｇｅｎｔ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１１，６（３）：２７２⁃２７８．作者简介：曹礼园，女，１９８７年生，硕士研究生，主要研究方向为智能软件。李卫华，女，１９５７年生，教授，主要研究方向为面向Ａｇｅｎｔ计算、网络信息系统、智能软件。发表学术论文４０余篇。第２期曹礼园，等：基于基元和知网的问题相关度计算 ·２３９·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录