机器感知与模式识别：模式匹配不确定性的多因素集结度量

团购合买资源类别：文库，文档格式：PDF，文档页数：7，文件大小：705.46KB

第10卷第2期智能系统学报 Vol.10 No.2 2015年4月 CAAI Transactions on Intelligent Systems Apr.2015 D0:10.3969/j.issn.1673-4785.201405061 网络出版地址：http://www.enki..net/kcms/detail/23.1538.TP.20150302.1106.004.html 模式匹配不确定性的多因素集结度量胡文彬，潘祝山，纪兆辉 (淮海工学院计算机工程学院，江苏连云港222005) 摘要：为了能够有效度量模式匹配的不确定性，提出了一个模式匹配不确定性的度量模型，根据不确定性因素间的关系提出了一个集结算子。使用全知嫡度量语义匹配和属性匹配的不确定性，引入过程不确定性的度量方法度量匹配决策过程的不确定性。使用多因素集结算子判断各因素的影响程度，并可合成各度量结果。实验证明，所提模型和方法能够有效度量模式匹配的不确定性，且具有高效性和可扩展性。关键词：模式定义：模式分析：模式匹配：不确定性分析：数据不确定性度量：度量方法：决策分析：嫡：集结评估方法中图分类号：TP18:TP391文献标志码：A文章编号：1673-4785(2015)02-0286-07 中文引用格式：胡文彬，潘祝山，纪兆辉.模式匹配不确定性的多因素集结度量[J].智能系统学报，2015,10(2)：286-292. 英文引用格式：HU Wenbin,PAN Zhushan,JI Zhaohui..Uncertain measure for schema matching based on the aggregation of un- certain factors[J].CAAI Transactions on Intelligent Systems,2015,10(2):286-292. Uncertain measure for schema matching based on the aggregation of uncertain factors HU Wenbin,PAN Zhushan,JI Zhaohui (School of Computer Engineering,Huaihai Institute of Technology,Lianyungang 222005,China) Abstract:To measure efficiently uncertainty of schema matching,a measure model based on all uncertain factors was proposed and an aggregation operator was given according to the relations of uncertain factors.A measure meth- od of semantic matching and attribute matching based on all known entropy uncertain ratio was designed.A measure algorithm of process uncertainty was introduced to measure uncertainty of a decision making process.The aggrega- tion operator based on relationships between uncertain factors was proposed to determine influence degree of uncer- tain factors and merge all measure values in the measure process.The real world examples illustrate that the pro- posed model and methods can completely reflect three factors of uncertainty and can measure efficiently uncertainty for schema matching.The proposed methods are efficient and scalable. Keywords:schema definition;schema analysis;schema matching;uncertainty analysis;measured data uncertain- ty;measurement method;decision analysis;entropy;aggregation estimation method 模式匹配是许多领域的关键操作，是模式对象影响模式集成的整个过程[)，被认为是开展大规模间的映射或相应关系的识别)。由于模式对象间数据集成的一个关键瓶颈，不确定性管理是未来的的语义不能完全来源于数据和元数据信息，因此模挑战之一[3)。通常，自动或是半自动模式匹配的方式匹配中存在固有的不确定性，而且其不确定性会法都是耗时和难于实施的，尤其是进行大规模模式匹配就更困难了，但若能在具体模式匹配实施前，对收稿日期：2014-06-06.网络出版日期：2015-03-02. 整个过程进行不确定性度量，将会为模式匹配在语基金项目：国家自然科学基金资助项目(60903027)；江苏省自然科学重大研究项目资助项目(BK2011023):江苏省自然科学基金资义Wb、模式集成、无线网络和电子商务等诸多领助项目(BK2011370). 域中的高效应用提供决策参考。通信作者：胡文彬.E-mail:hwb1008@163.com

第１０卷第２期智能系统学报Ｖｏｌ．１０ №．２２０１５年４月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｐｒ．２０１５ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１４０５０６１网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１５０３０２．１１０６．００４．ｈｔｍｌ模式匹配不确定性的多因素集结度量胡文彬，潘祝山，纪兆辉（淮海工学院计算机工程学院，江苏连云港２２２００５）摘要：为了能够有效度量模式匹配的不确定性，提出了一个模式匹配不确定性的度量模型，根据不确定性因素间的关系提出了一个集结算子。使用全知熵度量语义匹配和属性匹配的不确定性，引入过程不确定性的度量方法度量匹配决策过程的不确定性。使用多因素集结算子判断各因素的影响程度，并可合成各度量结果。实验证明，所提模型和方法能够有效度量模式匹配的不确定性，且具有高效性和可扩展性。关键词：模式定义；模式分析；模式匹配；不确定性分析；数据不确定性度量；度量方法；决策分析；熵；集结评估方法中图分类号：ＴＰ１８；ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１５）０２⁃０２８６⁃０７中文引用格式：胡文彬，潘祝山，纪兆辉．模式匹配不确定性的多因素集结度量［Ｊ］．智能系统学报，２０１５，１０（２）：２８６⁃２９２．英文引用格式：ＨＵＷｅｎｂｉｎ，ＰＡＮＺｈｕｓｈａｎ，ＪＩＺｈａｏｈｕｉ．Ｕｎｃｅｒｔａｉｎｍｅａｓｕｒｅｆｏｒｓｃｈｅｍａｍａｔｃｈｉｎｇｂａｓｅｄｏｎｔｈｅａｇｇｒｅｇａｔｉｏｎｏｆｕｎ⁃ ｃｅｒｔａｉｎｆａｃｔｏｒｓ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１５，１０（２）：２８６⁃２９２．ＵｎｃｅｒｔａｉｎｍｅａｓｕｒｅｆｏｒｓｃｈｅｍａｍａｔｃｈｉｎｇｂａｓｅｄｏｎｔｈｅａｇｇｒｅｇａｔｉｏｎｏｆｕｎｃｅｒｔａｉｎｆａｃｔｏｒｓＨＵＷｅｎｂｉｎ，ＰＡＮＺｈｕｓｈａｎ，ＪＩＺｈａｏｈｕｉ（ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒｉｎｇ，ＨｕａｉｈａｉＩｎｓｔｉｔｕｔｅｏｆＴｅｃｈｎｏｌｏｇｙ，Ｌｉａｎｙｕｎｇａｎｇ２２２００５，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｏｍｅａｓｕｒｅｅｆｆｉｃｉｅｎｔｌｙｕｎｃｅｒｔａｉｎｔｙｏｆｓｃｈｅｍａｍａｔｃｈｉｎｇ，ａｍｅａｓｕｒｅｍｏｄｅｌｂａｓｅｄｏｎａｌｌｕｎｃｅｒｔａｉｎｆａｃｔｏｒｓｗａｓｐｒｏｐｏｓｅｄａｎｄａｎａｇｇｒｅｇａｔｉｏｎｏｐｅｒａｔｏｒｗａｓｇｉｖｅｎａｃｃｏｒｄｉｎｇｔｏｔｈｅｒｅｌａｔｉｏｎｓｏｆｕｎｃｅｒｔａｉｎｆａｃｔｏｒｓ．Ａｍｅａｓｕｒｅｍｅｔｈ⁃ ｏｄｏｆｓｅｍａｎｔｉｃｍａｔｃｈｉｎｇａｎｄａｔｔｒｉｂｕｔｅｍａｔｃｈｉｎｇｂａｓｅｄｏｎａｌｌｋｎｏｗｎｅｎｔｒｏｐｙｕｎｃｅｒｔａｉｎｒａｔｉｏｗａｓｄｅｓｉｇｎｅｄ．Ａｍｅａｓｕｒｅａｌｇｏｒｉｔｈｍｏｆｐｒｏｃｅｓｓｕｎｃｅｒｔａｉｎｔｙｗａｓｉｎｔｒｏｄｕｃｅｄｔｏｍｅａｓｕｒｅｕｎｃｅｒｔａｉｎｔｙｏｆａｄｅｃｉｓｉｏｎｍａｋｉｎｇｐｒｏｃｅｓｓ．Ｔｈｅａｇｇｒｅｇａ⁃ ｔｉｏｎｏｐｅｒａｔｏｒｂａｓｅｄｏｎｒｅｌａｔｉｏｎｓｈｉｐｓｂｅｔｗｅｅｎｕｎｃｅｒｔａｉｎｆａｃｔｏｒｓｗａｓｐｒｏｐｏｓｅｄｔｏｄｅｔｅｒｍｉｎｅｉｎｆｌｕｅｎｃｅｄｅｇｒｅｅｏｆｕｎｃｅｒ⁃ ｔａｉｎｆａｃｔｏｒｓａｎｄｍｅｒｇｅａｌｌｍｅａｓｕｒｅｖａｌｕｅｓｉｎｔｈｅｍｅａｓｕｒｅｐｒｏｃｅｓｓ．Ｔｈｅｒｅａｌｗｏｒｌｄｅｘａｍｐｌｅｓｉｌｌｕｓｔｒａｔｅｔｈａｔｔｈｅｐｒｏ⁃ ｐｏｓｅｄｍｏｄｅｌａｎｄｍｅｔｈｏｄｓｃａｎｃｏｍｐｌｅｔｅｌｙｒｅｆｌｅｃｔｔｈｒｅｅｆａｃｔｏｒｓｏｆｕｎｃｅｒｔａｉｎｔｙａｎｄｃａｎｍｅａｓｕｒｅｅｆｆｉｃｉｅｎｔｌｙｕｎｃｅｒｔａｉｎｔｙｆｏｒｓｃｈｅｍａｍａｔｃｈｉｎｇ．Ｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｓａｒｅｅｆｆｉｃｉｅｎｔａｎｄｓｃａｌａｂｌｅ．Ｋｅｙｗｏｒｄｓ：ｓｃｈｅｍａｄｅｆｉｎｉｔｉｏｎ；ｓｃｈｅｍａａｎａｌｙｓｉｓ；ｓｃｈｅｍａｍａｔｃｈｉｎｇ；ｕｎｃｅｒｔａｉｎｔｙａｎａｌｙｓｉｓ；ｍｅａｓｕｒｅｄｄａｔａｕｎｃｅｒｔａｉｎ⁃ ｔｙ；ｍｅａｓｕｒｅｍｅｎｔｍｅｔｈｏｄ；ｄｅｃｉｓｉｏｎａｎａｌｙｓｉｓ；ｅｎｔｒｏｐｙ；ａｇｇｒｅｇａｔｉｏｎｅｓｔｉｍａｔｉｏｎｍｅｔｈｏｄ收稿日期：２０１４⁃０６⁃０６．网络出版日期：２０１５⁃０３⁃０２．基金项目：国家自然科学基金资助项目（６０９０３０２７）；江苏省自然科学重大研究项目资助项目（ＢＫ２０１１０２３）；江苏省自然科学基金资助项目（ＢＫ２０１１３７０）．通信作者：胡文彬．Ｅ⁃ｍａｉｌ：ｈｗｂ１００８＠１６３．ｃｏｍ．模式匹配是许多领域的关键操作，是模式对象间的映射或相应关系的识别［１］。由于模式对象间的语义不能完全来源于数据和元数据信息，因此模式匹配中存在固有的不确定性，而且其不确定性会影响模式集成的整个过程［２］，被认为是开展大规模数据集成的一个关键瓶颈，不确定性管理是未来的挑战之一［３］。通常，自动或是半自动模式匹配的方法都是耗时和难于实施的，尤其是进行大规模模式匹配就更困难了，但若能在具体模式匹配实施前，对整个过程进行不确定性度量，将会为模式匹配在语义Ｗｅｂ、模式集成、无线网络和电子商务等诸多领域中的高效应用提供决策参考

第2期胡文彬，等：模式匹配不确定性的多因素集结度量 ·287. 模式匹配实质上是一多属性决策过程)，其过 1模式匹配中的不确定性程中需要考虑一定的不确定性。对模式匹配不确定性的度量研究目前比较少，相关领域主要针对科学根据不确定性模式匹配的处理过程，模式匹配数据库和确定数据库进行基于确定语义的匹配操 (schema matching,SM)的不确定性主要出现在语义作，主要目的是尽量提高映射结果的正确率。不确匹配、属性匹配和匹配决策过程中，存在于其中的不定模式匹配的相关研究中，基于不确定语义映射的确定性表现)，可归结为语义因素、属性因素和过模式集成)、基于相似度计算的方法、基于概率程决策因素，这3个不确定性因素具有源发性和主映射的模式匹配方法[6、基于by-table和by-tuple的导性。数据集成方法[]和To即-K方法[劉等均是在匹配结定义1不确定语义匹配。2个模式S,和S,的果上尽量提高输出正确率，而抛弃掉一些不确定性不确定语义匹配是一个三元组〈S,O,UM〉，其中S 信息和结果，因此会丢失一些对用户有用的信息，并是模式有限集，S,S2∈S,0∈S是模式对象有限集，且这些研究工作中均未对整个匹配的不确定性进行 UM={(r11,m〉，（T2,m2〉，…，〈Tk,mk〉，度量，未考虑匹配过程中不确定性因素对结果的综〈r21,m〉，…，〈T,m〉}是模式对象间的不确定合影响。由B.Liu在2007年提出的不确定性度量匹配关系集，r∈R,i=1,2,…,n,j=1,2,…,k,n= 适用于不精确数量数据的度量[910。与本文相近的 S,I和k=1S2I为所包含模式对象的个数，R={相等，工作有AMUR算法和粗糙集(rough set,RS)的不确包含，相交，超集，不相交，不相容}是6种相互排斥定性度量，AMUR算法处理的对象是RFD数据[。的语义关系集，m:为r,的不确定率。 RS理论是由波兰科学家Pawlak[2]在1982年提出定义2不确定属性匹配。2个模式对象的不的一种有效处理不确定性的工具，对S不确定性确定属性匹配是一个三元组〈A,T,UD〉，其中A是度量的研究是近年来的研究热点，在经典RS理论属性集，T={ANM,ATM,KRM,DIM}是匹配类型集，中，产生不确定性的原因有集合的粗糙性和知识 ANM是属性名匹配，ATM是属性数据类型匹配， (概念)的不确定性)。基于信息熵的度量方法[ KRM是关键字约束匹配，DM是数据实例匹配，能够反映出产生不确定性的2个因素，但不能够全 UD={(A,UD1〉，(A2,UD2〉，〈A,UD3〉，〈A4 面地反映出知识不确定性，该方法被应用在粗糙集 UD,〉}是各类属性匹配的不确定率集，A,∈A。的异常值发觉中：基于不确定熵的度量方法[1)综合定义3不确定决策过程。不确定决策过程了粗糙熵、精确度和包含度3种基本方法，能够反映 UDP是一个四元组〈T,ST,P,),其中T是任务集，出粗糙性和知识的不确定性：基于知识粒度的不确 ST是状态集，P是不确定度集，f:T×ST→P是一个定性度量方法[1)适于解决集合的粗糙性：定位服务决策函数。的不确定性度量方法[6]运用粗糙集和证据理论进定义4模式匹配的不确定性度量。模式匹配行不确定性度量。这些方法的实际应用范围有限，的不确定性度量是满足系统不确定性度量[1]中4 容易受系统规模的影响，且未详细讨论不确定性因个条件的不确定性度量。素对度量结果的影响程度。本文针对不确定性模式匹配的处理过程]，提 2模式匹配的不确定性度量出了一个多因素集结的模式匹配不确定性度量模型， 2.1不确定性度量模型根据语义匹配和属性匹配不确定性因素的特点，运用模式集成中的模式匹配不确定性度量模型由模全知嫡度量其中的不确定性，并引入过程不确定性度式对象清洗(schema object cleanout,SOC)、语义匹量方法对匹配决策的不确定性进行了度量。根据不配不确定性度量(uncertainty measure of semantic 确定性因素间的相互关系，给出了一个集结算子，用 matching,UMSM)、属性匹配不确定性度量(uncer- 于判断各不确定性因素的影响程度和合成度量结果 tainty measure of attribute matching,UMAM)、决策过以生成总不确定率。所提出的模型和方法能够有效程不确定性度量(uncertainty measure of process, 度量模式匹配的不确定性，能够综合各不确定性因素 UMP)和不确定性度量合成器(uncertainty measure 产生的影响，能够处理大规模模式匹配的不确定性度 synthesizer,UMS)5个模块组成。模式匹配不确定量，为复杂系统的不确定性度量奠定了基础。性度量模型的框架如图1所示

模式匹配实质上是一多属性决策过程［４］，其过程中需要考虑一定的不确定性。对模式匹配不确定性的度量研究目前比较少，相关领域主要针对科学数据库和确定数据库进行基于确定语义的匹配操作，主要目的是尽量提高映射结果的正确率。不确定模式匹配的相关研究中，基于不确定语义映射的模式集成［２］、基于相似度计算的方法［５］、基于概率映射的模式匹配方法［６］、基于ｂｙ⁃ｔａｂｌｅ和ｂｙ⁃ｔｕｐｌｅ的数据集成方法［７］和Ｔｏｐ⁃Ｋ方法［８］等均是在匹配结果上尽量提高输出正确率，而抛弃掉一些不确定性信息和结果，因此会丢失一些对用户有用的信息，并且这些研究工作中均未对整个匹配的不确定性进行度量，未考虑匹配过程中不确定性因素对结果的综合影响。由Ｂ．Ｌｉｕ在２００７年提出的不确定性度量适用于不精确数量数据的度量［９⁃１０］。与本文相近的工作有ＡＭＵＲ算法和粗糙集（ｒｏｕｇｈｓｅｔ，ＲＳ）的不确定性度量，ＡＭＵＲ算法处理的对象是ＲＦＩＤ数据［１１］。ＲＳ理论是由波兰科学家Ｐａｗｌａｋ［１２］在１９８２年提出的一种有效处理不确定性的工具，对ＲＳ不确定性度量的研究是近年来的研究热点，在经典ＲＳ理论中，产生不确定性的原因有集合的粗糙性和知识（概念）的不确定性［１３］。基于信息熵的度量方法［１４］能够反映出产生不确定性的２个因素，但不能够全面地反映出知识不确定性，该方法被应用在粗糙集的异常值发觉中；基于不确定熵的度量方法［１３］综合了粗糙熵、精确度和包含度３种基本方法，能够反映出粗糙性和知识的不确定性；基于知识粒度的不确定性度量方法［１５］适于解决集合的粗糙性；定位服务的不确定性度量方法［１６］运用粗糙集和证据理论进行不确定性度量。这些方法的实际应用范围有限，容易受系统规模的影响，且未详细讨论不确定性因素对度量结果的影响程度。本文针对不确定性模式匹配的处理过程［１７］，提出了一个多因素集结的模式匹配不确定性度量模型，根据语义匹配和属性匹配不确定性因素的特点，运用全知熵度量其中的不确定性，并引入过程不确定性度量方法对匹配决策的不确定性进行了度量。根据不确定性因素间的相互关系，给出了一个集结算子，用于判断各不确定性因素的影响程度和合成度量结果以生成总不确定率。所提出的模型和方法能够有效度量模式匹配的不确定性，能够综合各不确定性因素产生的影响，能够处理大规模模式匹配的不确定性度量，为复杂系统的不确定性度量奠定了基础。１模式匹配中的不确定性根据不确定性模式匹配的处理过程，模式匹配（ｓｃｈｅｍａｍａｔｃｈｉｎｇ，ＳＭ）的不确定性主要出现在语义匹配、属性匹配和匹配决策过程中，存在于其中的不确定性表现［１７］，可归结为语义因素、属性因素和过程决策因素，这３个不确定性因素具有源发性和主导性。定义１不确定语义匹配。２个模式Ｓ１和Ｓ２的不确定语义匹配是一个三元组〈Ｓ，Ｏ，ＵＭ〉，其中Ｓ是模式有限集，Ｓ１，Ｓ２∈Ｓ，Ｏ∈Ｓｉ是模式对象有限集，ＵＭ＝｛〈ｒ１１，ｍ１１〉，〈ｒ１２，ｍ１２〉， …，〈ｒ１ｋ，ｍ１ｋ〉，〈ｒ２１，ｍ２１〉， …，〈ｒｎｋ，ｍｎｋ〉｝是模式对象间的不确定匹配关系集，ｒｉｊ∈Ｒ，ｉ＝１，２，…，ｎ，ｊ＝１，２，…，ｋ，ｎ＝｜Ｓ１｜和ｋ＝｜Ｓ２｜为所包含模式对象的个数，Ｒ＝｛相等，包含，相交，超集，不相交，不相容｝是６种相互排斥的语义关系集，ｍｉｊ为ｒｉｊ的不确定率。定义２不确定属性匹配。２个模式对象的不确定属性匹配是一个三元组〈Ａ，Ｔ，ＵＤ〉，其中Ａ是属性集，Ｔ＝｛ＡＮＭ，ＡＴＭ，ＫＲＭ，ＤＩＭ｝是匹配类型集，ＡＮＭ是属性名匹配，ＡＴＭ是属性数据类型匹配，ＫＲＭ是关键字约束匹配，ＤＩＭ是数据实例匹配，ＵＤ＝｛〈Ａ１，ＵＤ１〉，〈Ａ２，ＵＤ２〉，〈Ａ３，ＵＤ３〉，〈Ａ４，ＵＤ４〉｝是各类属性匹配的不确定率集，Ａｉ∈Ａ。定义３不确定决策过程。不确定决策过程ＵＤＰ是一个四元组〈Ｔ，ＳＴ，Ｐ，ｆ〉，其中Ｔ是任务集，ＳＴ是状态集，Ｐ是不确定度集，ｆ：Ｔ×ＳＴ→Ｐ是一个决策函数。定义４模式匹配的不确定性度量。模式匹配的不确定性度量是满足系统不确定性度量［１８］中４个条件的不确定性度量。２模式匹配的不确定性度量２．１不确定性度量模型模式集成中的模式匹配不确定性度量模型由模式对象清洗（ｓｃｈｅｍａｏｂｊｅｃｔｃｌｅａｎｏｕｔ，ＳＯＣ）、语义匹配不确定性度量（ｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｏｆｓｅｍａｎｔｉｃｍａｔｃｈｉｎｇ，ＵＭＳＭ）、属性匹配不确定性度量（ｕｎｃｅｒ⁃ ｔａｉｎｔｙｍｅａｓｕｒｅｏｆａｔｔｒｉｂｕｔｅｍａｔｃｈｉｎｇ，ＵＭＡＭ）、决策过程不确定性度量（ｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｏｆｐｒｏｃｅｓｓ，ＵＭＰ）和不确定性度量合成器（ｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｓｙｎｔｈｅｓｉｚｅｒ，ＵＭＳ）５个模块组成。模式匹配不确定性度量模型的框架如图１所示。第２期胡文彬，等：模式匹配不确定性的多因素集结度量 ·２８７·

·288· 智能系统学报第10卷 H(C)为C在U上的信息熵，且H(C)=- USUMAM 42 UMP EP SOD result US ∑1sEP(X,)logp(X,)（0/IND(C)=1X,.X, PRD UMSM UMS …,Xn},n=IO/IND(C)I),H(D1C)为条件嫡，且图1模式匹配不确定性的度量模型 H(D1C)=-∑1EP(X)∑1P(y1 Fig.1 Uncertainty measure model for schema matching X)log(p(yIX)（0/IND(D)={Y,Y2,…,Y}, 待匹配模式集作为输入，由SOC清洗掉确定模式对 m=1O/ND(D)I),H(D)为D在U上的信息熵。象，不确定部分(uncertainty set,US)由UMSM和可将模式匹配看做一个决策系统，C的元素为 UMAM进行语义匹配和属性匹配不确定性的度量，定义1中R所包含的元素，D={0(不是)，1（是），2 再由PUM对整个决策过程的不确定性进行度量，最 (不确定)}。所定义的不确定率满足粗糙集不确定后由UMS合成各度量结果而得到总不确定率。性度量的基本准则。 2.2模式对象清洗定理模式匹配的全知熵不确定率满足粗糙模式匹配的复杂度会随数据集成规模的增大而集不确定性度量的基本准则。增大，对输入模式进行预处理至关重要。在S0C中证明全知嫡不确定率4=1-(H（C→ 使用属性约减方法[1)对输入模式所包含的模式对 D)-H(D))/(log(IOI)-H(D))=1-(H(C)+ 象进行等价类划分(equipollence partition,EP)后，再 H(D1C)-H(D))/(log(IO1)-H(D))。R,和R2 进行正域约减(positive region deduction,PRD)和模是U上的2个等价关系。式对象约简(schema object deduction,SOD),得到可 1)0≤(H(C)+H(DIC)-H(D))/ 能存在不确定性的部分—模式对象约简集。模式 (log(IO1)-H(D))≤1，因此0≤μm≤1非负；匹配不确定性的度量规模经过SOC的处理后明显 2)若R,≈R2,则H(C1)=H(C2),H(D1)= 缩小。 H(D2),所以u满足不变性： 2.3基于全知熵的不确定性度量 3)若R,<R2,则根据文献的定理7有H(C,)< 粗糙性是指由于知识的不完备性或不精确性， HC2),H(D)<H(D2),所以L满足单调性。导致对象与对象之间不可分辨，从而使得对象与概综上所述，模式匹配的全知嫡不确定率满足粗念之间的关系具有不确定性。信息熵是信息理糙集不确定性度量的基本准则]。论中用于分析不确定程度的一种重要度量，以所需 2.3.2语义匹配的不确定性度量信息量的多少来衡量不确定性的程度2。基于信语义匹配是用于确定各模式及其模式对象间匹息嫡的度量方式中全知嫡不确定率对系统的不确定配程度的过程之一，由于模式对象的语义不能完全性比较敏感，能够较为准确地反映不确定性的变化来源于数据和元数据信息，并且识别确定的语义映规律2)。模式匹配的执行过程能够表达其系统内射是非常困难的，因此语义匹配中产生的不确定性的条件属性知识和决策属性知识，模式匹配的不确是模式匹配中存在不确定性的主因之一[2)。语义定性结构和程度可由属性知识完全确定，因此基于匹配是一决策过程，语义匹配的不确定率如下：全知嫡的度量方式适于度量模式匹配的不确定性。八1=1- 2.3.1模式匹配的全知嫡不确定率 (H(CD)-H(D))/(log(I 0 1)-H(D)) 定义5模式匹配的全知嫡不确定率。四元组式中：C,是语义匹配条件属性集，D,是语义匹配决 DS=(O,MA,V,)为模式匹配决策系统，其中，0为策属性集，0，∈0是模式对象集。模式对象有限集；MA=CUD是匹配属性的集合，C为 2.3.3属性匹配的不确定性度量不确定匹配关系集，D为决策属性集，C∩D=中，a∈ 属性匹配不确定性的度量由UMAM来完成，实 CUD;V=UV.是属性的值域，f:O×MA→V是一个信现属性名匹配(ANM)、数据类型匹配(ATM)、关键息函数。模式匹配的全知嫡不确定率定义为字约束匹配(KRM)和数据实例匹配(DIM)的不确八=1- 定性度量，计算出属性匹配的总不确定率。属性匹 (H(C-D)-H(D))/(log(I 1)-H(D)) 配过程同样是一决策过程，其中的条件属性集合均式中：Hm(C→D)=H(C)+H(DIC)为全知嫡21 为{相等，包含，相交，超集，不相交}

图１模式匹配不确定性的度量模型Ｆｉｇ．１Ｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｍｏｄｅｌｆｏｒｓｃｈｅｍａｍａｔｃｈｉｎｇ待匹配模式集作为输入，由ＳＯＣ清洗掉确定模式对象，不确定部分（ｕｎｃｅｒｔａｉｎｔｙｓｅｔ，ＵＳ）由ＵＭＳＭ和ＵＭＡＭ进行语义匹配和属性匹配不确定性的度量，再由ＰＵＭ对整个决策过程的不确定性进行度量，最后由ＵＭＳ合成各度量结果而得到总不确定率。２．２模式对象清洗模式匹配的复杂度会随数据集成规模的增大而增大，对输入模式进行预处理至关重要。在ＳＯＣ中使用属性约减方法［１９］对输入模式所包含的模式对象进行等价类划分（ｅｑｕｉｐｏｌｌｅｎｃｅｐａｒｔｉｔｉｏｎ，ＥＰ）后，再进行正域约减（ｐｏｓｉｔｉｖｅｒｅｇｉｏｎｄｅｄｕｃｔｉｏｎ，ＰＲＤ）和模式对象约简（ｓｃｈｅｍａｏｂｊｅｃｔｄｅｄｕｃｔｉｏｎ，ＳＯＤ），得到可能存在不确定性的部分———模式对象约简集。模式匹配不确定性的度量规模经过ＳＯＣ的处理后明显缩小。２．３基于全知熵的不确定性度量粗糙性是指由于知识的不完备性或不精确性，导致对象与对象之间不可分辨，从而使得对象与概念之间的关系具有不确定性［１２］。信息熵是信息理论中用于分析不确定程度的一种重要度量，以所需信息量的多少来衡量不确定性的程度［２０］。基于信息熵的度量方式中全知熵不确定率对系统的不确定性比较敏感，能够较为准确地反映不确定性的变化规律［２１］。模式匹配的执行过程能够表达其系统内的条件属性知识和决策属性知识，模式匹配的不确定性结构和程度可由属性知识完全确定，因此基于全知熵的度量方式适于度量模式匹配的不确定性。２．３．１模式匹配的全知熵不确定率定义５模式匹配的全知熵不确定率。四元组ＤＳ＝（Ｏ，ＭＡ，Ｖ，ｆ）为模式匹配决策系统，其中，Ｏ为模式对象有限集；ＭＡ＝Ｃ∪Ｄ是匹配属性的集合，Ｃ为不确定匹配关系集，Ｄ为决策属性集，Ｃ∩Ｄ＝ ϕ，ａ∈ Ｃ∪Ｄ；Ｖ＝∪Ｖａ是属性的值域，ｆ：Ｏ×ＭＡ→Ｖ是一个信息函数。模式匹配的全知熵不确定率定义为 μａｌｌ＝１－（Ｈａｌｌ（Ｃ → Ｄ）－Ｈ（Ｄ））／（ｌｏｇ（｜Ｏ｜）－Ｈ（Ｄ））式中：Ｈａｌｌ（Ｃ→Ｄ）＝Ｈ（Ｃ）＋Ｈ（Ｄ｜Ｃ）为全知熵［２１］，Ｈ（Ｃ）为Ｃ在Ｕ上的信息熵，且Ｈ（Ｃ）＝－ ∑１≤ｉ≤ｎｐ（Ｘｉ）ｌｏｇ（ｐ（Ｘｉ））（Ｏ／ＩＮＤ（Ｃ）＝｛Ｘ１，Ｘ２， …，Ｘｎ｝，ｎ＝｜Ｏ／ＩＮＤ（Ｃ）｜），Ｈ（Ｄ｜Ｃ）为条件熵，且Ｈ（Ｄ｜Ｃ）＝－ ∑１≤ｉ≤ｎｐ（Ｘｉ）∑１≤ｊ≤ｍｐ（Ｙｊ｜Ｘｉ）ｌｏｇ（ｐ（Ｙｊ｜Ｘｉ））（Ｏ／ＩＮＤ（Ｄ）＝｛Ｙ１，Ｙ２，…，Ｙｍ｝，ｍ＝｜Ｏ／ＩＮＤ（Ｄ）｜），Ｈ（Ｄ）为Ｄ在Ｕ上的信息熵。可将模式匹配看做一个决策系统，Ｃ的元素为定义１中Ｒ所包含的元素，Ｄ＝｛０（不是），１（是），２（不确定）｝。所定义的不确定率满足粗糙集不确定性度量的基本准则。定理模式匹配的全知熵不确定率满足粗糙集不确定性度量的基本准则。证明全知熵不确定率 μａｌｌ＝１－（Ｈａｌｌ（Ｃ→ Ｄ）－Ｈ（Ｄ））／（ｌｏｇ（｜Ｏ｜）－Ｈ（Ｄ））＝１－（Ｈ（Ｃ）＋Ｈ（Ｄ｜Ｃ）－Ｈ（Ｄ））／（ｌｏｇ（｜Ｏ｜）－Ｈ（Ｄ））。Ｒ１和Ｒ２是Ｕ上的２个等价关系。１）０ ≤ （Ｈ（Ｃ）＋Ｈ（Ｄ｜Ｃ）－Ｈ（Ｄ））／（ｌｏｇ（｜Ｏ｜）－Ｈ（Ｄ））≤１，因此０≤μａｌｌ≤１非负；２）若Ｒ１ ≈Ｒ２，则Ｈ（Ｃ１）＝Ｈ（Ｃ２），Ｈ（Ｄ１）＝Ｈ（Ｄ２），所以 μａｌｌ满足不变性；３）若Ｒ１﹤Ｒ２，则根据文献［２２］的定理７有Ｈ（Ｃ１）＜Ｈ（Ｃ２），Ｈ（Ｄ１）＜Ｈ（Ｄ２），所以 μａｌｌ满足单调性。综上所述，模式匹配的全知熵不确定率满足粗糙集不确定性度量的基本准则［２３］。２．３．２语义匹配的不确定性度量语义匹配是用于确定各模式及其模式对象间匹配程度的过程之一，由于模式对象的语义不能完全来源于数据和元数据信息，并且识别确定的语义映射是非常困难的，因此语义匹配中产生的不确定性是模式匹配中存在不确定性的主因之一［２４］。语义匹配是一决策过程，语义匹配的不确定率如下： μ１＝１－（Ｈａｌｌ（Ｃ１ → Ｄ１）－Ｈ（Ｄ１））／（ｌｏｇ（｜Ｏ１｜）－Ｈ（Ｄ１））式中：Ｃ１是语义匹配条件属性集，Ｄ１是语义匹配决策属性集，Ｏ１∈Ｏ是模式对象集。２．３．３属性匹配的不确定性度量属性匹配不确定性的度量由ＵＭＡＭ来完成，实现属性名匹配（ＡＮＭ）、数据类型匹配（ＡＴＭ）、关键字约束匹配（ＫＲＭ）和数据实例匹配（ＤＩＭ）的不确定性度量，计算出属性匹配的总不确定率。属性匹配过程同样是一决策过程，其中的条件属性集合均为｛相等，包含，相交，超集，不相交｝。 ·２８８· 智能系统学报第１０卷

第2期胡文彬，等：模式匹配不确定性的多因素集结度量 ·289 根据定义5属性匹配的不确定率如下：须执行的过程，因此可令K(B)=0,K(B,)=0。 3不确定性因素的集结度量式中：4=1-（H(Cx一Dx）-H(D:)/ 3.1不确定性因素影响程度的判断 (log(1U2I)-H(D2:)),i=1,2,3,4,分别是4种属影响模式匹配的不确定因素之间往往不是孤立性匹配的不确定率，“2/ 4j=1,2,34,是各属的，它们之间可能存在着某些关系，这将影响不确定性的准确度量，各因素及其权重的简单线性组合也从一性匹配不确定率的权值。定程度上忽略了这些因素之间存在的相互关系。 2.4匹配决策过程的不确定性度量定义6不确定性的集结度量。U(SM)=f 模式匹配是根据运行时管理者的决策或过程数 (S(SM),A(SM),P(SM))称为模式匹配SM不确据有条件执行的，因而其过程中存在不确定性是毫定性的集结度量，U(SM)∈[0,1]，U(SM)越大SM 无疑问的2]。用Petrinets表示模式匹配的决策过的不确定性就越大，其中f称为以S(SM)、A(SM) 程(decision process,DP),如图2。和P(SM)为自变量的不确定性度量函数，f:[0,1]× [0,1]×[0,1]→[0,1]。基于f对SM不确定性的度量将所有不确定性 B B 因素映射到一个[0,1]上，反映了模式匹配的不确定性。图2模式匹配的过程模型模式匹配中任何不确定因素的细微变化都将影 Fig.2 Process model of schema matching 响到整个过程。综合语义匹配、属性匹配和决策过 t:为任务块，B,为SOC的执行过程，B2为语义匹程这3个方面的不确定因素以进行模式匹配不确定配和属性匹配的顺序执行过程，B,为属性匹配的执性的客观度量，而不是各因素的简单线性组合，需要行过程，B,为匹配结果合并过程。图2可转换为图考虑这3个因素的内在关系。为了讨论单个因素对 3形式。不确定性的影响以及多个因素集结起来对不确定性的影响，下面给出相关定义。定义7分别对因素S(SM),A(SM)和P(SM) 作如下变换：图3转换后的过程模型 S'(SM)=2S(SM)-1 Fig.3 Converted process model A'(SM)=2A(SM)-1 决策过程不确定性的计算通式如下： P'(SM)=2P(SM)-1 K(DP)= 令因素e∈{S(SM),A(SM),P(SM)},相应地， ze{S'(SM),A'(SM),P'(SM)}称为因素e对SM ∑p(BS)logP(BS)+∑p(B,)U(B,) 不确定性的影响，ze[-1,1]。若≥0，则称e为积 K= 式中：N是过程中任务的总数量，M是可能被执行任极因素：若z=0,则称e为不变因素；若z|z2 ∑(T×K(B,) 1⊕2=了21+22+·2,1≤0,2≤0，或 3= 8 1≥0,2≤0，lz1|<z2 式中：T:是任务B被执行的次数。由于B,和B4为必 0,其他

根据定义５属性匹配的不确定率如下： μ２＝ ∑ ４ｉ＝１（μ ２２ｉ／∑ ４ｊ＝１ μ２ｊ）式中： μ２ｉ＝１－（Ｈａｌｌ（Ｃ２ｉ → Ｄ２ｉ）－Ｈ（Ｄ２ｉ））／（ｌｏｇ（｜Ｕ２ｉ｜）－Ｈ（Ｄ２ｉ）），ｉ＝１，２，３，４，分别是４种属性匹配的不确定率， μ２ｉ／∑ ４ｊ＝１ μ２ｊ，ｊ＝１，２，３，４，是各属性匹配不确定率的权值。２．４匹配决策过程的不确定性度量模式匹配是根据运行时管理者的决策或过程数据有条件执行的，因而其过程中存在不确定性是毫无疑问的［２５］。用Ｐｅｔｒｉｎｅｔｓ表示模式匹配的决策过程（ｄｅｃｉｓｉｏｎｐｒｏｃｅｓｓ，ＤＰ），如图２。图２模式匹配的过程模型Ｆｉｇ．２Ｐｒｏｃｅｓｓｍｏｄｅｌｏｆｓｃｈｅｍａｍａｔｃｈｉｎｇｔｉ为任务块，Ｂ１为ＳＯＣ的执行过程，Ｂ２为语义匹配和属性匹配的顺序执行过程，Ｂ３为属性匹配的执行过程，Ｂ４为匹配结果合并过程。图２可转换为图３形式。图３转换后的过程模型Ｆｉｇ．３Ｃｏｎｖｅｒｔｅｄｐｒｏｃｅｓｓｍｏｄｅｌ决策过程不确定性的计算通式如下： Κ（ＤＰ）＝－ ∑ Ｍｋ＝１ｐ（ＢＳｋ）ｌｏｇ２ｐ（ＢＳｋ）＋ ∑ Ｎｇ＝１ｐ（Ｂｇ）Ｕ（Ｂｇ）式中：Ｎ是过程中任务的总数量，Ｍ是可能被执行任务的总数，ＢＳｋ是第ｋ个可能被执行的任务，Ｐ（ＢＳｋ）是执行概率，Ｂｇ是过程中第ｇ个任务，Ｐ（Ｂｇ）是为了完成整个过程而由所有Ｍ个可执行任务执行的Ｂｇ的概率，Ｕ（Ｂｇ）＝ ∑ Ｎｉ＝１Ｐ（Ｂｉ）ｌｏｇ２（Ｂｉ）。决策过程不确定率 μ３的计算公式如下： μ３＝ ∑ Ｎｉ＝１（Ｔｉ × Κ（Ｂｉ）） ∑ Ｎｉ＝１Ｔｉ式中：Ｔｉ是任务Ｂｉ被执行的次数。由于Ｂ１和Ｂ４为必须执行的过程，因此可令Ｋ（Ｂ１）＝０，Ｋ（Ｂ４）＝０。３不确定性因素的集结度量３．１不确定性因素影响程度的判断影响模式匹配的不确定因素之间往往不是孤立的，它们之间可能存在着某些关系，这将影响不确定性的准确度量，各因素及其权重的简单线性组合也从一定程度上忽略了这些因素之间存在的相互关系［２６］。定义６不确定性的集结度量。Ｕ（ＳＭ）＝ｆ（Ｓ（ＳＭ），Ａ（ＳＭ），Ｐ（ＳＭ））称为模式匹配ＳＭ不确定性的集结度量，Ｕ（ＳＭ） ∈［０，１］，Ｕ（ＳＭ）越大ＳＭ的不确定性就越大，其中ｆ称为以Ｓ（ＳＭ）、Ａ（ＳＭ）和Ｐ（ＳＭ）为自变量的不确定性度量函数，ｆ：［０，１］ × ［０，１］×［０，１］ →［０，１］。基于ｆ对ＳＭ不确定性的度量将所有不确定性因素映射到一个［０，１］上，反映了模式匹配的不确定性。模式匹配中任何不确定因素的细微变化都将影响到整个过程。综合语义匹配、属性匹配和决策过程这３个方面的不确定因素以进行模式匹配不确定性的客观度量，而不是各因素的简单线性组合，需要考虑这３个因素的内在关系。为了讨论单个因素对不确定性的影响以及多个因素集结起来对不确定性的影响，下面给出相关定义。定义７分别对因素Ｓ（ＳＭ），Ａ（ＳＭ）和Ｐ（ＳＭ）作如下变换：Ｓ′（ＳＭ）＝２Ｓ（ＳＭ）－１Ａ′（ＳＭ）＝２Ａ（ＳＭ）－１Ｐ′（ＳＭ）＝２Ｐ（ＳＭ）－１令因素ｅ∈｛Ｓ（ＳＭ），Ａ（ＳＭ），Ｐ（ＳＭ）｝，相应地，ｚ∈｛Ｓ′（ＳＭ），Ａ′（ＳＭ），Ｐ′（ＳＭ）｝称为因素ｅ对ＳＭ不确定性的影响，ｚ∈［－１，１］。若ｚ≥０，则称ｅ为积极因素；若ｚ＝０，则称ｅ为不变因素；若ｚ＜０，则称ｅ为消极因素。定义８若给定ｚ１，ｚ２ ∈｛Ｓ′（ＳＭ），Ａ′（ＳＭ），Ｐ′（ＳＭ）｝，ｚ１≠ｚ２，集结算子定义如下：ｚ１ 􀱇 ｚ２＝ｚ１＋ｚ２－ｚ１·ｚ２，ｚ１ ≥ ０，ｚ２ ≥ ０，或ｚ１ ≥ ０，ｚ２ ≤ ０，ｚ１＞ｚ２ｚ１＋ｚ２＋ｚ１·ｚ２，ｚ１ ≤ ０，ｚ２ ≤ ０，或ｚ１ ≥ ０，ｚ２ ≤ ０，ｚ１＜ｚ２０，其他 ì î í ï ï ï ï ï ï ï ï ï ï ïï 第２期胡文彬，等：模式匹配不确定性的多因素集结度量 ·２８９·

·290 智能系统学报第10卷若已存在一个不确定因素e1,再给定一个不确 (ATM)、关键字匹配(KRM)和数据实例匹配(DIM)4 定因素e2,它们的影响分别为1和2，则2个因素c 个过程，每个过程中条件属性个数1C1=6,条件属性之间的内在相互关系有如下特性：值域VC={0,1,2},每个过程中的模式个数和模式对 1)增长性，若e2是一个积极因素，即z2>0。e,和象个数见表3。模式匹配的不确定率见表4。 e,对SM不确定性的集结影响z应该满足z>z1:若e, Student PID pname ser class native birthday speciality_id dep_id 也是一个积极因素，则>2也同样成立。 030405唐杰男030404051江苏南京02/09/81102001 02 030506陈海爱男030404051江苏南京06/06/82102002 03 2)不变性，若e2是一个不变因素，即2=0。e1 030505陈珂山男030404051苏州10/09/82102001 02 和e,对SM不确定性的集结影响z应该满足z=z1, 图4存储在校生数据的模式截图即SM的不确定性受e,的影响大：若e,也是一个不 Fig.4 Schema data of undergraduate 变因素，则SM的不确定性不受加入因素的影响。 3)减弱性，若e2是一个消极因素，即z2 序无关。 4 2008p 9 3.2总不确定率 5 2009sp 模式匹配的总不确定率主要由3部分来确定，注：表中数据为2005年春至2009年春江苏省VFP二级考试分别是语义匹配的不确定率S(M)、属性匹配的不的数据情况确定率A(M)和决策过程的不确定率P(M)。由于表2语义匹配不确定性度量的实验参数 1⊕2⊕z∈[-1,1]，而模式匹配不确定性度量函数 Table 2 Experiment parameters of uncertainty measure- 的值域为[0,1]，因此模式匹配不确定性的度量函 ment for semantic matching 数（即，总不确定率）定义为模式模式对条件属性决策属性 Lale =f(S(M),A(M),P(M))= No. 个数1S1象个数1U川IC,1 Vc ID,I 1/2[z1⊕x2⊕z3]+1/2 2 610,1.2}10,1,2 式中：a1,2,a3∈{S'(M),A'(M),P'(M)},S(M)= 2 52 6{0,1,2}1{0,1,2} u1,A(M)=u2,P(M)=3o 注：{0,1,2}中，0一是，1一不是，2一不确定 4 实验与分析表3属性匹配不确定性度量的实验参数 4.1实验 Table 3 Experiment parameters of uncertainty measure- 设计2种实验方案：1)较小不确定性的度量。对 ment for attribute matching 2个模式S,(在校生)和S2(毕业生)间的匹配进行不方案1 方案2 匹配类型确定性度量，所包含模式对象的详细信息分别如图 ISI IUI ISI IUI 4、5所示：2)多模式对象匹配不确定性的度量。对5 ANM v 301 个模式间的匹配进行不确定性度量，共包含57个模 ATM 2 16 j 301 式对象，实验数据情况见表1。实验参数见表2。属 KRM 2 2 5 5 性匹配包括属性名匹配(ANM)、属性类型匹配 DIM 2 300 5 3501

若已存在一个不确定因素ｅ１，再给定一个不确定因素ｅ２，它们的影响分别为ｚ１和ｚ２，则２个因素ｃ之间的内在相互关系有如下特性：１）增长性，若ｅ２是一个积极因素，即ｚ２＞０。ｅ１和ｅ２对ＳＭ不确定性的集结影响ｚ应该满足ｚ＞ｚ１；若ｅ１也是一个积极因素，则ｚ＞ｚ２也同样成立。２）不变性，若ｅ２是一个不变因素，即ｚ２＝０。ｅ１和ｅ２对ＳＭ不确定性的集结影响ｚ应该满足ｚ＝ｚ１，即ＳＭ的不确定性受ｅ１的影响大；若ｅ１也是一个不变因素，则ＳＭ的不确定性不受加入因素的影响。３）减弱性，若ｅ２是一个消极因素，即ｚ２＜０。ｅ１和ｅ２对ＳＭ不确定性的集结影响ｚ应该满足ｚ＜ｚ１；若ｅ１也是一个消极因素，则ｚ＜ｚ２也同样成立。一个积极因素和一个消极因素对ＳＭ不确定性的集结影响取决于绝对值大的因素，且集结影响值小于较大的绝对值。４）有界性，ｚ１⊕ｚ２∈［－１，１］，以确保多个因素的集结影响可以通过两两集结来实现。５）交换率，ｚ１⊕ｚ２＝ｚ２⊕ｚ１，这可以保证２个给定不确定性因素对ＳＭ不确定性的影响保持不变。６）结合率，（ｚ１⊕ｚ２）⊕ｚ３＝ｚ１⊕（ｚ２⊕ｚ３），这表明２个以上因素的集结影响与各因素参与计算的次序无关。３．２总不确定率模式匹配的总不确定率主要由３部分来确定，分别是语义匹配的不确定率Ｓ（Ｍ）、属性匹配的不确定率Ａ（Ｍ）和决策过程的不确定率Ｐ（Ｍ）。由于ｚ１⊕ｚ２⊕ｚ３∈［－１，１］，而模式匹配不确定性度量函数的值域为［０，１］，因此模式匹配不确定性的度量函数（即，总不确定率）定义为 μｗｈｏｌｅ＝ｆ（Ｓ（Ｍ），Ａ（Ｍ），Ｐ（Ｍ））＝１／２［ｚ１ ⊕ ｚ２ ⊕ ｚ３］＋１／２式中：ｚ１，ｚ２，ｚ３∈｛Ｓ′（Ｍ），Ａ′（Ｍ），Ｐ′（Ｍ）｝，Ｓ（Ｍ）＝ μ１，Ａ（Ｍ）＝ μ２，Ｐ（Ｍ）＝ μ３。４实验与分析４．１实验设计２种实验方案：１）较小不确定性的度量。对２个模式Ｓ１（在校生）和Ｓ２（毕业生）间的匹配进行不确定性度量，所包含模式对象的详细信息分别如图４、５所示；２）多模式对象匹配不确定性的度量。对５个模式间的匹配进行不确定性度量，共包含５７个模式对象，实验数据情况见表１。实验参数见表２。属性匹配包括属性名匹配（ＡＮＭ）、属性类型匹配（ＡＴＭ）、关键字匹配（ＫＲＭ）和数据实例匹配（ＤＩＭ）４个过程，每个过程中条件属性个数｜Ｃ｜＝６，条件属性值域ＶＣ＝｛０，１，２｝，每个过程中的模式个数和模式对象个数见表３。模式匹配的不确定率见表４。图４存储在校生数据的模式截图Ｆｉｇ．４Ｓｃｈｅｍａｄａｔａｏｆｕｎｄｅｒｇｒａｄｕａｔｅ图５存储毕业生数据的模式截图Ｆｉｇ．５Ｓｃｈｅｍａｄａｔａｏｆｇｒａｄｕａｔｅ表１实验数据情况Ｔａｂｌｅ１Ｅｘｐｅｒｉｍｅｎｔａｌｄａｔａ序号年份对象个数１２００５ｓｐ１７２２００６ａｕ１７３２００７ａｕ７４２００８ｓｐ９５２００９ｓｐ７注：表中数据为２００５年春至２００９年春江苏省ＶＦＰ二级考试的数据情况表２语义匹配不确定性度量的实验参数Ｔａｂｌｅ２Ｅｘｐｅｒｉｍｅｎｔｐａｒａｍｅｔｅｒｓｏｆｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅ⁃ ｍｅｎｔｆｏｒｓｅｍａｎｔｉｃｍａｔｃｈｉｎｇＮｏ．模式个数｜Ｓ｜模式对象个数｜Ｕ｜条件属性｜Ｃ１｜ＶＣ１决策属性｜Ｄ１｜ＶＤ１１２２６｛０，１，２｝１０，１，２｝２５５２６｛０，１，２｝１｛０，１，２｝注：｛０，１，２｝中，０—是，１—不是，２—不确定表３属性匹配不确定性度量的实验参数Ｔａｂｌｅ３Ｅｘｐｅｒｉｍｅｎｔｐａｒａｍｅｔｅｒｓｏｆｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅ⁃ ｍｅｎｔｆｏｒａｔｔｒｉｂｕｔｅｍａｔｃｈｉｎｇ匹配类型方案１｜Ｓ｜｜Ｕ｜方案２｜Ｓ｜｜Ｕ｜ＡＮＭ２１２５３０１ＡＴＭ２１６５３０１ＫＲＭ２２５５ＤＩＭ２３００５３５０１ ·２９０· 智能系统学报第１０卷

第2期胡文彬，等：模式匹配不确定性的多因素集结度量 ·291· 表42种方案下的模式匹配的不确定率 [2]MAGNANI M,RIZOPOULOS N,BRIEN P,et al.Schema Table 4 Uncertainty ratio of schema matching from two integration based on uncertain semantic mappings[J].Lec- projects ture Notes in Computer Science,2005(3716):31-46. 第1种方案第2种方案 [3]HALEVY A,RAJARAMAN A,ORDILLE J.Data integra- USM 41=0 41=0.34 tion:the teenage years[Z].Seoul,2006:9-16. UAM u3=0.21 [4]翁年凤，刁兴春，曹建军，等.不确定模式匹配研究综述 43=0.95 [J刀.计算机科学，2011,38(12)：1-5. DP 43=0.17 43=0.17 WENG Nianfeng,DIAO Xingchun,CHAO Jianjun,et al. 总计 ubh.=0.19 Mwbole =0.72 Survey of uncertain schema matching[J].Computer Sci- 4.2分析 ence,2011,38(12):1-5. 第1种方案中，首先通过S0C处理后，匹配规模 [5]姜芳艽，孟小峰，贾琳琳.Deep Web集成服务的不确定比2中降低50%。2个模式的模式对象名语义相同，模式匹配[J].计算机学报，2008,31(8)：1412-1421. 因此μ，=0。属性匹配中只有属性名匹配具有不确定 JIANG Fangjiao,MENG Xiaofeng,JIA Linlin.Uncertain 性。决策过程中的不确定率随模式匹配规模的减小 schema matching in deep web integration service[J].Chi- 而降低，利用公式计算得到的u值符合实际情况。 nese Journal of Computers,2008,31(8):1412-1421. [6]MAGNANI M,MONTESI D.Probabilistic data integration 第2种方案中，模式对象规模和属性匹配的规模突然 [R].Bologna(italy):UBLCS,2009. 增大，通过S0C的处理后，匹配规模降低了近1/10， [7]DONG X L,HALEVY A,YU CONG.Data integration with 同时计算效率也明显提高，不确定率随匹配规模增大 uncertainty[J].The VLDB Journal,2009,18:469-500. 而增大符合不确定性度量的基本准则。实验表明度 [8]AVIGDOR G.Managing uncertainty in schema matching 量模式匹配不确定性的模型和不确定率计算方法具 with top-k schema mappings[J].Journal on Data Seman- 有可行性、有效性、可扩展性和高效性。 tics,2006,6:90-114. [9]LIU Baoding.Uncertainty theory[M].Berlin:Springer-Ver- 5 结束语 1ag,2007:3-12. 模式匹配的不确定性研究是国际上相关领域近 [10]LIU Baoding.Some research problems in uncertainty theory [J].Journal of Uncertain Systems,2009,3(1):3-10. 年来才兴起的热点研究方向，度量原始匹配的不确 [11]王永利，钱江波，孙淑荣.AMUR:一种RFID数据不确定性是关键问题。本文根据模式匹配中产生不确定定性的自适应度量算法[J].电子学报，2011,39(3)：性的主要因素，首次将全知嫡不确定率和过程不确 579-584 定率结合起来，并证明模式匹配的全知熵不确定率 WANG Yongli,QIAN Jiangbo,SUN Shurong.AMUR:an 满足粗糙集不确定性度量的基本准则，提出了一个 adaptive measuring algorithm of underlying uncertainty for 多因素集结的模式匹配不确定性度量模型，利用集 rfid data[J].Chinese of Journal Electronics,2011,39 结算子判断各不确定性因素对模式匹配不确定性的 (3):579-584 影响程度和合成各阶段的度量结果，实验证明本文 [12]PAWLAL Z.Rough sets[J].International Journal of Com- 提出的方法与已有方法相比可获得更加合理的度量 puter and Information Science,1982,11(5):341-356. 结果。所提模型解决了不确定性度量中规模限制问 [13]QIU Taorong,YOU Min,GE Hanjuan,et al.A method of 题，使得大规模模式匹配不确定性的处理复杂度降 uncertainty measure based on rough set[Z].2008:544- 547 低。下一步的工作将探讨动态环境下模式匹配不确 [14]JIANG Feng,SUI Yuefei,CAO Cungen.An information 定性的度量方法及其处理过程中不确定性传播的测 entropy-based approach to outlier detection in rough sets 算方法。 [J].Expert Systems with Applications,2010,37(9): 参考文献： 6338-6344. [15]LIANG Jiye,WANG Junhong,QIAN Yuhua.A new meas- [1]SHVAIKO P,EUZENAT J.A survey of schema-based matc- ure of uncertainty based on knowledge granulation for rough hing approaches[J].Journal on Data Semantics IV,2005 sets[]].Information Sciences,2009,179(4):458-470. (3730):146-171 [16]IFTIKHAR-U S,ARYYA G.Managing uncertainty in loca-

表４２种方案下的模式匹配的不确定率Ｔａｂｌｅ４Ｕｎｃｅｒｔａｉｎｔｙｒａｔｉｏｏｆｓｃｈｅｍａｍａｔｃｈｉｎｇｆｒｏｍｔｗｏｐｒｏｊｅｃｔｓ第１种方案第２种方案ＵＳＭ μ１＝０ μ１＝０．３４ＵＡＭ μ２＝０．２１ μ２＝０．９５ＤＰ μ３＝０．１７ μ３＝０．１７总计 μｗｈｏｌｅ＝０．１９ μｗｈｏｌｅ＝０．７２４．２分析第１种方案中，首先通过ＳＯＣ处理后，匹配规模比［２］中降低５０％。２个模式的模式对象名语义相同，因此 μ１＝０。属性匹配中只有属性名匹配具有不确定性。决策过程中的不确定率随模式匹配规模的减小而降低，利用公式计算得到的 μｗｈｏｌｅ值符合实际情况。第２种方案中，模式对象规模和属性匹配的规模突然增大，通过ＳＯＣ的处理后，匹配规模降低了近１／１０，同时计算效率也明显提高，不确定率随匹配规模增大而增大符合不确定性度量的基本准则。实验表明度量模式匹配不确定性的模型和不确定率计算方法具有可行性、有效性、可扩展性和高效性。５结束语模式匹配的不确定性研究是国际上相关领域近年来才兴起的热点研究方向，度量原始匹配的不确定性是关键问题。本文根据模式匹配中产生不确定性的主要因素，首次将全知熵不确定率和过程不确定率结合起来，并证明模式匹配的全知熵不确定率满足粗糙集不确定性度量的基本准则，提出了一个多因素集结的模式匹配不确定性度量模型，利用集结算子判断各不确定性因素对模式匹配不确定性的影响程度和合成各阶段的度量结果，实验证明本文提出的方法与已有方法相比可获得更加合理的度量结果。所提模型解决了不确定性度量中规模限制问题，使得大规模模式匹配不确定性的处理复杂度降低。下一步的工作将探讨动态环境下模式匹配不确定性的度量方法及其处理过程中不确定性传播的测算方法。参考文献：［１］ＳＨＶＡＩＫＯＰ，ＥＵＺＥＮＡＴＪ．Ａｓｕｒｖｅｙｏｆｓｃｈｅｍａ⁃ｂａｓｅｄｍａｔｃ⁃ ｈｉｎｇａｐｐｒｏａｃｈｅｓ［Ｊ］．ＪｏｕｒｎａｌｏｎＤａｔａＳｅｍａｎｔｉｃｓＩＶ，２００５（３７３０）：１４６⁃１７１．［２］ＭＡＧＮＡＮＩＭ，ＲＩＺＯＰＯＵＬＯＳＮ，ＢＲＩＥＮＰ，ｅｔａｌ．Ｓｃｈｅｍａｉｎｔｅｇｒａｔｉｏｎｂａｓｅｄｏｎｕｎｃｅｒｔａｉｎｓｅｍａｎｔｉｃｍａｐｐｉｎｇｓ［Ｊ］．Ｌｅｃ⁃ ｔｕｒｅＮｏｔｅｓｉｎＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，２００５（３７１６）：３１⁃４６．［３］ＨＡＬＥＶＹＡ，ＲＡＪＡＲＡＭＡＮＡ，ＯＲＤＩＬＬＥＪ．Ｄａｔａｉｎｔｅｇｒａ⁃ ｔｉｏｎ：ｔｈｅｔｅｅｎａｇｅｙｅａｒｓ［Ｚ］．Ｓｅｏｕｌ，２００６：９⁃１６．［４］翁年凤，刁兴春，曹建军，等．不确定模式匹配研究综述［Ｊ］．计算机科学，２０１１，３８（１２）：１⁃５．ＷＥＮＧＮｉａｎｆｅｎｇ，ＤＩＡＯＸｉｎｇｃｈｕｎ，ＣＨＡＯＪｉａｎｊｕｎ，ｅｔａｌ．Ｓｕｒｖｅｙｏｆｕｎｃｅｒｔａｉｎｓｃｈｅｍａｍａｔｃｈｉｎｇ［Ｊ］．ＣｏｍｐｕｔｅｒＳｃｉ⁃ ｅｎｃｅ，２０１１，３８（１２）：１⁃５．［５］姜芳艽，孟小峰，贾琳琳．ＤｅｅｐＷｅｂ集成服务的不确定模式匹配［Ｊ］．计算机学报，２００８，３１（８）：１４１２⁃１４２１．ＪＩＡＮＧＦａｎｇｊｉａｏ，ＭＥＮＧＸｉａｏｆｅｎｇ，ＪＩＡＬｉｎｌｉｎ．Ｕｎｃｅｒｔａｉｎｓｃｈｅｍａｍａｔｃｈｉｎｇｉｎｄｅｅｐｗｅｂｉｎｔｅｇｒａｔｉｏｎｓｅｒｖｉｃｅ［Ｊ］．Ｃｈｉ⁃ ｎｅｓｅＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒｓ，２００８，３１（８）：１４１２⁃１４２１．［６］ＭＡＧＮＡＮＩＭ，ＭＯＮＴＥＳＩＤ．Ｐｒｏｂａｂｉｌｉｓｔｉｃｄａｔａｉｎｔｅｇｒａｔｉｏｎ［Ｒ］．Ｂｏｌｏｇｎａ（ｉｔａｌｙ）：ＵＢＬＣＳ，２００９．［７］ＤＯＮＧＸＬ，ＨＡＬＥＶＹＡ，ＹＵＣＯＮＧ．Ｄａｔａｉｎｔｅｇｒａｔｉｏｎｗｉｔｈｕｎｃｅｒｔａｉｎｔｙ［Ｊ］．ＴｈｅＶＬＤＢＪｏｕｒｎａｌ，２００９，１８：４６９⁃５００．［８］ＡＶＩＧＤＯＲＧ．Ｍａｎａｇｉｎｇｕｎｃｅｒｔａｉｎｔｙｉｎｓｃｈｅｍａｍａｔｃｈｉｎｇｗｉｔｈｔｏｐ⁃ｋｓｃｈｅｍａｍａｐｐｉｎｇｓ［Ｊ］．ＪｏｕｒｎａｌｏｎＤａｔａＳｅｍａｎ⁃ ｔｉｃｓ，２００６，６：９０⁃１１４．［９］ＬＩＵＢａｏｄｉｎｇ．Ｕｎｃｅｒｔａｉｎｔｙｔｈｅｏｒｙ［Ｍ］．Ｂｅｒｌｉｎ：Ｓｐｒｉｎｇｅｒ⁃Ｖｅｒ⁃ ｌａｇ，２００７：３⁃１２．［１０］ＬＩＵＢａｏｄｉｎｇ．Ｓｏｍｅｒｅｓｅａｒｃｈｐｒｏｂｌｅｍｓｉｎｕｎｃｅｒｔａｉｎｔｙｔｈｅｏｒｙ［Ｊ］．ＪｏｕｒｎａｌｏｆＵｎｃｅｒｔａｉｎＳｙｓｔｅｍｓ，２００９，３（１）：３⁃１０．［１１］王永利，钱江波，孙淑荣．ＡＭＵＲ：一种ＲＦＩＤ数据不确定性的自适应度量算法［Ｊ］．电子学报，２０１１，３９（３）：５７９⁃５８４．ＷＡＮＧＹｏｎｇｌｉ，ＱＩＡＮＪｉａｎｇｂｏ，ＳＵＮＳｈｕｒｏｎｇ．ＡＭＵＲ：ａｎａｄａｐｔｉｖｅｍｅａｓｕｒｉｎｇａｌｇｏｒｉｔｈｍｏｆｕｎｄｅｒｌｙｉｎｇｕｎｃｅｒｔａｉｎｔｙｆｏｒｒｆｉｄｄａｔａ［Ｊ］．ＣｈｉｎｅｓｅｏｆＪｏｕｒｎａｌＥｌｅｃｔｒｏｎｉｃｓ，２０１１，３９（３）：５７９⁃５８４．［１２］ＰＡＷＬＡＬＺ．Ｒｏｕｇｈｓｅｔｓ［Ｊ］．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍ⁃ ｐｕｔｅｒａｎｄＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ，１９８２，１１（５）：３４１⁃３５６．［１３］ＱＩＵＴａｏｒｏｎｇ，ＹＯＵＭｉｎ，ＧＥＨａｎｊｕａｎ，ｅｔａｌ．Ａｍｅｔｈｏｄｏｆｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｂａｓｅｄｏｎｒｏｕｇｈｓｅｔ［Ｚ］．２００８：５４４⁃ ５４７．［１４］ＪＩＡＮＧＦｅｎｇ，ＳＵＩＹｕｅｆｅｉ，ＣＡＯＣｕｎｇｅｎ．Ａｎｉｎｆｏｒｍａｔｉｏｎｅｎｔｒｏｐｙ⁃ｂａｓｅｄａｐｐｒｏａｃｈｔｏｏｕｔｌｉｅｒｄｅｔｅｃｔｉｏｎｉｎｒｏｕｇｈｓｅｔｓ［Ｊ］．ＥｘｐｅｒｔＳｙｓｔｅｍｓｗｉｔｈＡｐｐｌｉｃａｔｉｏｎｓ，２０１０，３７（９）：６３３８⁃６３４４．［１５］ＬＩＡＮＧＪｉｙｅ，ＷＡＮＧＪｕｎｈｏｎｇ，ＱＩＡＮＹｕｈｕａ．Ａｎｅｗｍｅａｓ⁃ ｕｒｅｏｆｕｎｃｅｒｔａｉｎｔｙｂａｓｅｄｏｎｋｎｏｗｌｅｄｇｅｇｒａｎｕｌａｔｉｏｎｆｏｒｒｏｕｇｈｓｅｔｓ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅｓ，２００９，１７９（４）：４５８⁃４７０．［１６］ＩＦＴＩＫＨＡＲ⁃ＵＳ，ＡＲＹＹＡＧ．Ｍａｎａｇｉｎｇｕｎｃｅｒｔａｉｎｔｙｉｎｌｏｃａ⁃ 第２期胡文彬，等：模式匹配不确定性的多因素集结度量 ·２９１·

.292. 智能系统学报第10卷 tion services using rough set and evidence theory[J].Ex- [24]MAGNANI M,MONTESI D.Uncertainty in data integra- pert System with Application,2007,32(2):386-396. tion:current approaches and open problems [M].En- [17]胡文彬，李千目，张宏.基于领域知识的不确定性关系 schede,The Netherlands:the Centre for Telematics and 模式集成[J].南京理工大学学报：自然科学版，2010， Information Technology,2007:26-32. 34(4)：409-414. [25]JUNG J Y,CHIN C H,CARDOSO J.An entropy-based HU Wenbin,LI Qianmu,ZHANG Hong.Uncertain rela- uncertainty measure of process models[J].Information tion schema integration based on domain knowledge[J]. Processing Letters,2011,111(3):135-141. Journal of Nanjing University of Science and Technology: [26]岳昆，刘惟一，王晓玲.一种基于不确定性因素叠加的 Natural Science,2010,34(4):409-414. Wb服务质量度量方法[J].计算机研究与发展， [18]胡文彬，张宏，李千目.基于全知嫡的模式集成不确定 2009,46(5):841-849. 性度量模型[J].南京航空航天大学学报，2012,44 YUE Kun,LIU Weiyi,WANG Xiaoling.An approach for (4):575-579. measuring quality of web services based on the superposi- HU Wenbin,ZHANG Hong,LI Qianmu.Uncertainty tion of uncertain factors[J].Journal of Computer Research measure model of schema integration based on all known and Development,2009,46(5):841-849. entropy[J].Journal of Nanjing University of Aeronautics 作者简介： Astronautics,2012,44(4):575-579. 胡文彬，女，1976年生，博士，中国 [19]WANG J G,MENG G Y,ZHENG X L.The attribute re- 计算机学会会员，主要研究方向为数据 duce based on rough sets and sat algorithm[Z].2008:98- 集成、社会网络、隐私保护，作为主要成 102 员完成省级课题1项，参与完成市级课 [20]LIANG Jiye,QIAN Yuhua.Information granules and entro- 题2项。发表学术论文10余篇，其中 py theory in information systems[].Science in China Se. 被EI检索3篇。 ries F:Information Sciences,2008,51(10):1427-1444. [21]赵军，周应华.基于粗集理论的系统不确定性度量方式潘祝山，男，1968年生，副教授，主研究[J].小型微型计算机系统，2010,31(2)：354- 要研究方向为人工智能、确定性理论。 359. 参与省市级课题多项。 ZHAO Jun,ZHOU Yinghua.Study on system uncertainty measures based on rough set theory[J].Journalof Chinese Computer Systems,2010,31(2):354-359. [22]YU Daren,HU Qinghua,WU Congxin.Uncertainty meas- 纪兆辉，男，1971年生，副教授，中 ures for fuzzy relations and their applications[J].Applied 国计算机学会高级会员，主要研究方向 Soft Computing,2007,7(3):1135-1143. 为数据挖掘，语义Web、多Agent等。发 [23]胡军，王国胤.粗糙集的不确定性度量准则[J].模式识表学术论文20余篇，主持、参与省市级别与人工智能，2010,23(5)：606-615. 科研课题10余项。 HU Jun,WANG Guoyin.Uncertainty measure rule sets of rough sets[J].Pattern Recognition and Artificial Intelli- gence.2010,23(5):606-615

ｔｉｏｎｓｅｒｖｉｃｅｓｕｓｉｎｇｒｏｕｇｈｓｅｔａｎｄｅｖｉｄｅｎｃｅｔｈｅｏｒｙ［Ｊ］．Ｅｘ⁃ ｐｅｒｔＳｙｓｔｅｍｗｉｔｈＡｐｐｌｉｃａｔｉｏｎ，２００７，３２（２）：３８６⁃３９６．［１７］胡文彬，李千目，张宏．基于领域知识的不确定性关系模式集成［Ｊ］．南京理工大学学报：自然科学版，２０１０，３４（４）：４０９⁃４１４．ＨＵＷｅｎｂｉｎ，ＬＩＱｉａｎｍｕ，ＺＨＡＮＧＨｏｎｇ．Ｕｎｃｅｒｔａｉｎｒｅｌａ⁃ ｔｉｏｎｓｃｈｅｍａｉｎｔｅｇｒａｔｉｏｎｂａｓｅｄｏｎｄｏｍａｉｎｋｎｏｗｌｅｄｇｅ［Ｊ］．ＪｏｕｒｎａｌｏｆＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ：ＮａｔｕｒａｌＳｃｉｅｎｃｅ，２０１０，３４（４）：４０９⁃４１４．［１８］胡文彬，张宏，李千目．基于全知熵的模式集成不确定性度量模型［Ｊ］．南京航空航天大学学报，２０１２，４４（４）：５７５⁃５７９．ＨＵＷｅｎｂｉｎ，ＺＨＡＮＧＨｏｎｇ，ＬＩＱｉａｎｍｕ．Ｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｍｏｄｅｌｏｆｓｃｈｅｍａｉｎｔｅｇｒａｔｉｏｎｂａｓｅｄｏｎａｌｌｋｎｏｗｎｅｎｔｒｏｐｙ［Ｊ］．ＪｏｕｒｎａｌｏｆＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＡｅｒｏｎａｕｔｉｃｓ＆Ａｓｔｒｏｎａｕｔｉｃｓ，２０１２，４４（４）：５７５⁃５７９．［１９］ＷＡＮＧＪＧ，ＭＥＮＧＧＹ，ＺＨＥＮＧＸＬ．Ｔｈｅａｔｔｒｉｂｕｔｅｒｅ⁃ ｄｕｃｅｂａｓｅｄｏｎｒｏｕｇｈｓｅｔｓａｎｄｓａｔａｌｇｏｒｉｔｈｍ［Ｚ］．２００８：９８⁃ １０２．［２０］ＬＩＡＮＧＪｉｙｅ，ＱＩＡＮＹｕｈｕａ．Ｉｎｆｏｒｍａｔｉｏｎｇｒａｎｕｌｅｓａｎｄｅｎｔｒｏ⁃ ｐｙｔｈｅｏｒｙｉｎｉｎｆｏｒｍａｔｉｏｎｓｙｓｔｅｍｓ［Ｊ］．ＳｃｉｅｎｃｅｉｎＣｈｉｎａＳｅ⁃ ｒｉｅｓＦ：ＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅｓ，２００８，５１（１０）：１４２７⁃１４４４．［２１］赵军，周应华．基于粗集理论的系统不确定性度量方式研究［Ｊ］．小型微型计算机系统，２０１０，３１（２）：３５４⁃ ３５９．ＺＨＡＯＪｕｎ，ＺＨＯＵＹｉｎｇｈｕａ．Ｓｔｕｄｙｏｎｓｙｓｔｅｍｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｓｂａｓｅｄｏｎｒｏｕｇｈｓｅｔｔｈｅｏｒｙ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｈｉｎｅｓｅＣｏｍｐｕｔｅｒＳｙｓｔｅｍｓ，２０１０，３１（２）：３５４⁃３５９．［２２］ＹＵＤａｒｅｎ，ＨＵＱｉｎｇｈｕａ，ＷＵＣｏｎｇｘｉｎ．Ｕｎｃｅｒｔａｉｎｔｙｍｅａｓ⁃ ｕｒｅｓｆｏｒｆｕｚｚｙｒｅｌａｔｉｏｎｓａｎｄｔｈｅｉｒａｐｐｌｉｃａｔｉｏｎｓ［Ｊ］．ＡｐｐｌｉｅｄＳｏｆｔＣｏｍｐｕｔｉｎｇ，２００７，７（３）：１１３５⁃１１４３．［２３］胡军，王国胤．粗糙集的不确定性度量准则［Ｊ］．模式识别与人工智能，２０１０，２３（５）：６０６⁃６１５．ＨＵＪｕｎ，ＷＡＮＧＧｕｏｙｉｎ．Ｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｒｕｌｅｓｅｔｓｏｆｒｏｕｇｈｓｅｔｓ［Ｊ］．ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎａｎｄＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉ⁃ ｇｅｎｃｅ．２０１０，２３（５）：６０６⁃６１５．［２４］ＭＡＧＮＡＮＩＭ，ＭＯＮＴＥＳＩＤ．Ｕｎｃｅｒｔａｉｎｔｙｉｎｄａｔａｉｎｔｅｇｒａ⁃ ｔｉｏｎ：ｃｕｒｒｅｎｔａｐｐｒｏａｃｈｅｓａｎｄｏｐｅｎｐｒｏｂｌｅｍｓ［Ｍ］．Ｅｎ⁃ ｓｃｈｅｄｅ，ＴｈｅＮｅｔｈｅｒｌａｎｄｓ：ｔｈｅＣｅｎｔｒｅｆｏｒＴｅｌｅｍａｔｉｃｓａｎｄＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２００７：２６⁃３２．［２５］ＪＵＮＧＪＹ，ＣＨＩＮＣＨ，ＣＡＲＤＯＳＯＪ．Ａｎｅｎｔｒｏｐｙ⁃ｂａｓｅｄｕｎｃｅｒｔａｉｎｔｙｍｅａｓｕｒｅｏｆｐｒｏｃｅｓｓｍｏｄｅｌｓ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＬｅｔｔｅｒｓ，２０１１，１１１（３）：１３５⁃１４１．［２６］岳昆，刘惟一，王晓玲．一种基于不确定性因素叠加的Ｗｅｂ服务质量度量方法［Ｊ］．计算机研究与发展，２００９，４６（５）：８４１⁃８４９．ＹＵＥＫｕｎ，ＬＩＵＷｅｉｙｉ，ＷＡＮＧＸｉａｏｌｉｎｇ．Ａｎａｐｐｒｏａｃｈｆｏｒｍｅａｓｕｒｉｎｇｑｕａｌｉｔｙｏｆｗｅｂｓｅｒｖｉｃｅｓｂａｓｅｄｏｎｔｈｅｓｕｐｅｒｐｏｓｉ⁃ ｔｉｏｎｏｆｕｎｃｅｒｔａｉｎｆａｃｔｏｒｓ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＲｅｓｅａｒｃｈａｎｄＤｅｖｅｌｏｐｍｅｎｔ，２００９，４６（５）：８４１⁃８４９．作者简介：胡文彬，女，１９７６年生，博士，中国计算机学会会员，主要研究方向为数据集成、社会网络、隐私保护，作为主要成员完成省级课题１项，参与完成市级课题２项。发表学术论文１０余篇，其中被ＥＩ检索３篇。潘祝山，男，１９６８年生，副教授，主要研究方向为人工智能、确定性理论。参与省市级课题多项。纪兆辉，男，１９７１年生，副教授，中国计算机学会高级会员，主要研究方向为数据挖掘、语义Ｗｅｂ、多Ａｇｅｎｔ等。发表学术论文２０余篇，主持、参与省市级科研课题１０余项。 ·２９２· 智能系统学报第１０卷

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录