第7卷第2期 智能系统学报 Vol.7 No.2 2012年4月 CAAI Transactions on Intelligent Systems Apr.2012 D0I:10.3969/i.issn.16734785.201009010 网络出版t地址:htp://www.cnki.net/kcma/detail/23.1538.TP.20120416.0852.003.html 模糊相似关系下变精度模糊粗糙集 邓廷权12,杨成东2,3,张月童 (1.哈尔滨工程大学理学院,黑龙江哈尔滨150001;2.哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨 150001:3.临沂大学信息学院,山东临沂276000) 摘要:经典变精度模糊粗糙集模型是基于模糊等价关系建立的.在实际应用中,模糊等价关系很难直接构造,需 要通过求模糊相似关系的传递闭包生成.对模糊关系的这种改造会丢失较多有价值的信息,而且还增大了模糊粗糙 集应用的计算复杂度.基于模糊逻辑算子构造2个模糊集的相对错误包含度,构造性地提出基于模糊相似关系的变 精度模糊粗糙集模型,研究了该模型的性质.该模型一方面具有变精度粗糙集的优点,对噪声数据具有很好的容错 能力,另一方面是基于模糊相似关系建立的,其应用范围更为广泛. 关键词:变精度粗糙集;模糊相似关系;相对错误包含度;模糊逻辑算子;模糊粗糙集 中图分类号:TP8;TP301文献标识码:A文章编号:16734785(2012)02-014805 Fuzzy similarity relation based variable precision fuzzy rough sets DENG Tingquan'.2,YANG Chengdong23,ZHANG Yuetong' (1.College of Science,Harbin Engineering University,Harbin 150001,China;2.College of Computer Science and Technology, Harbin Engineering University,Harbin 150001,China;3.School of Informatics,Linyi University,Linyi 276000,China) Abstract:A classical variable precision fuzzy rough set was built on the basis of fuzzy equivalent relationships. Nonetheless,it is hard to directly obtain the fuzzy equivalent relationships,which are usually replaced by a closure of fuzzy equivalent relationships,and this method causes a loss of much valuable information and increases the com- putation complexity in the application of the fuzzy rough set.This paper first took advantage of a fuzzy logical opera- tor to construct fuzzy relative error rates of classification,and then proposed a variable precision fuzzy rough set model based on fuzzy similarity relationships.Moreover,the properties of this model were investigated.On the one hand,the model is able to deal with noise data with the advantages of variable precision rough sets;on the other hand,since it is based on fuzzy similarity relationships,the model could be applied more widely. Keywords:variable precision rough sets;fuzzy similarity relation;relative error rates of classification;fuzzy logical operator;fuzzy rough sets Z.Pawlak山于1982年提出的粗糙集是一种有处理方面的原因,信息系统或数据库中不可避免地 效的软计算工具,已经广泛应用于决策分析、数据 含有噪音,而经典粗糙集对噪音数据比较敏感.鉴 挖掘、机器学习和人工智能等各个领域.随着理论研 于此,1993年W.Ziarko2]引入了集合的相对错误 究的深人和应用的需求,经典粗糙集有了进一步的 包含度的概念,并提出了变精度粗糙集模型,该模 拓展,其中变精度粗糙集和模糊粗糙集是2种典型 型有效地解决了人为错误或噪音导致的错误分类问 的代表。 题,具有较好的抗噪和容错能力。 从实际应用的角度而言,由于数据获取或数据 经典粗糙集处理的是清晰(分明)的、离散的符 号值数据,但在实际中经常遇到连续的、具有模糊性 收稿日期:201009-19.网络出版日期:2012-04-16. 基金项目:国家自然科学基金资助项目(10771043);水下机器人国 的数据.对于这类问题,经典做法是将连续的属性 防技术重点实验室基金资助项目(002010260730). 通信作者:杨成东.E-mail:yangchengdong2008@163.com. 值离散化后运用经典粗糙集处理,这种方法造成了
第2期 邓廷权,等:模糊相似关系下变精度模糊粗糙集 ·149 一定的信息损失.模糊粗糙集35]将粗糙集和模糊 2)对称性:R(x,y)=R(y,x),Hx,y∈U. 集理论结合起来,利用数据相似性程度作为数据间 模糊相似关系R通常不满足传递性,即R不满足 的相似关系,从而避免了连续属性值离散化带来的 RR二R.若满足传递性,则称R为模糊等价关系 信息损失 模糊逻辑算子是模糊集理论和模糊逻辑中的重 变精度模糊粗糙集[69是变精度粗糙集与模糊 要概念,在模糊信息分析和处理中具有重要应用 粗糙集的融合.它不仅具有变精度粗糙集的特点, T-范数和模糊蕴含是2种重要的模糊逻辑算子. 具有一定的抗噪和容错能力,也具有模糊粗糙集的 若*满足1)交换律;2)结合律;3)关于2个变 特点,能够处理具有模糊性的知识. 量都是递增的;4)边界条件:0*b=0;1*b=b对任 然而,变精度模糊粗糙集是基于模糊等价关系 意b∈[0,1]成立,称[0,1]上的二元运算*为T 建立的.在实际应用中,很难直接构造模糊等价关 范数.若→满足1)边界条件:1→0=0,0→0=0→ 系,往往先构造模糊相似关系,再通过求模糊相似 1=1→1=1;2)关于第1个变量单调递减,关于第2 关系的传递闭包将其模糊等价关系.文献[10]指 个变量单调递增,称[0,1]上的二元运算→为模糊 出,这种方法会丢失较多有价值的信息.因此,研究 蕴含算子. 模糊相似关系下的变精度模糊粗糙集模型具有重要 有很多T范数和模糊蕴含算子.比如 的意义 a *b min(a,b),a*b =ab, a*b max(0,a +b-1), (2) 1基础知识 都是典型且常用的T范数.模糊蕴含算子常通过T 首先回顾经典粗糙集模型. 范数以如下方式构造: 定义1)设U是有限论域,R是U上的一个 1)负蕴含:→b=1-T(a,1-b). 等价关系,XCU,X的R下近似和R上近似分别定 2)剩余蕴含:a→b=sup入∈[0,1]Ia*入≤b}, 义为Rx={x∈UI[x]RCX},Rx={x∈UI[x]gn 其中sup为集合的上确界. X≠☑}.集合bnr(X)=RX-RX称为X的R边界 本文只考虑T范数的模糊剩余蕴含算子 域;posR(X)=RX称为X的R正域;negr(X)=U- 式(2)对应的模糊剩余蕴含算子分别为: EX称为X的R负域.显然,RX=posR(X)U a→b=1,a≤b: bng(X). Lt,a b. 在经典粗糙集模型基础上,W.Ziarko提出变精 a→b= Jl,a≤b; 度粗糙集模型,增强了模型的抗噪和容错能力, lb/a,a b. 定义22)设U是有限论域,R是U上的一个 a→b=min{1,1-a+b}. 等价关系,0≤B0; I S(F)I 1X1=0. 式中:S(F:)为支集,即S(F:)={x∈UIF:(x)> (1) 0. 式中:XI为集合X的基数, 定义3中的模糊相对错误包含度是定义2中分 2模糊集的相对错误包含度 明集合的相对错误包含度在模糊集中的推广 命题1对HF,F,F2∈F(U),若FCF2,则 论域U的全体模糊子集组成的集合称为U的 e(F,F)≥e(F,F2). 模糊幂集,记作F(U).给定论域U和V,则U×V 证明当F=O时,e(F,F,)=e(F,F2)=0. 的模糊子集R∈F(U×)是一个模糊关系.一个模 当F≠O时,因为F二F2,则对于任意的x∈U,有 糊关系R称为模糊相似关系,若R满足: F(x)≤F2(x).由+算子定义可知,它是关于第2 1)自反性:R(x,x)=1,Hx∈U; 变量递增的.所以
·150. 智能系统学报 第7卷 ∑F(x)→F,(x)≤∑F(x)→F,(x). 的等价类且x∈[y]R eS(F) xeS(F) 根据经典集合的相对错误包含度与模糊相对错 因此, 误包含度的定义可知, 1-(∑F(x)→F,(x)/S(F)≥ 米a5SF) c([y]R,F)≤B,即x∈RF. 1-(∑F(x)→F,(x)/S(F), 证毕. S(F) 命题3当R为经典等价关,F为U的分明子 即e(F,F)≥e(F,F2). 集,B=0时,该模型退化为Pawlak粗糙集, 3 模糊相似关系下变精度模糊粗糙集 证明同理于命题2. 定义4设U是有限论域,F(U)是U的模糊 4 变精度模糊粗糙集的性质 幂集,R是U×U上的模糊相似关系.HFeF(U), 下面研究新建立的变精度模糊粗糙集的性质。 F关于R的B下模糊近似RF与B上模糊近似RF 分别定义为: 性质1当0≤β<0.5时,B模糊近似有以下性质: RF(x)=(),W≠⑦: 1)RFCR F: 2)R☑=0,RU=RU=U; L0. W=☑. 3)若F1CF2,则RF CRF2,RF CRF2; F(x)= 「on(x),W≠☑; 4)R(F UF2)2RF URF2; L0. 所=0. 5)Re(FF2)CRFOReF2; 式中:B是精度控制参数,0≤B≤0.5; 6)R(F UF2)2RFURF2; W={y∈UIe([y]R,F)≤B, 7)Re(FF2)CRFORF2. R(y,x)≤sup(F)}, 证明1)HxeU,若W=⑦,那么RF(x)= Wi=ye Ul e([y]R,F)<1-B; 0,显然RF(x)≤RF(x).若W≠⑦,则Hy∈W, @p(x)sup(R(y,x)I yWl, 都满足e([y]R,F)≤B.由于0≤B<0.5,所以 wr(x)sup(R(y,x)I yW, e([y]R,F)≤1-B,,即y∈W.根据RF与RF的 sup(F)=supF(x); 定义可知,RgF(x)≤RF(x). 当R为U上的经典等价关系,F为U的分明子 由x的任意性得RgFCRgF, 集且0≤B<0.5时,定义4退化为定义2;当R为经 2)Hx∈U,若W。=0,因为sup(☑)=0,所以 典等价关系,F为U的分明子集且B=0时,定义4 对于VyeW,都有R(y,x)≤sup(☑)=0,根据@r 退化为定义1.因此,有下面2个命题. (x)的定义,可知飞⑦(x)=0;若W。=☑,根据RF 命题2当R为U上的经典等价关系,F为U (x)的定义可知,£⑦(x)=0.由x的任意性得 的分明子集,0≤B<0.5时,该模型退化为Ziarko R0=0. 变精度粗糙集模型。 由性质1得,RUCR&U,因此仅需证RU=U. 证明仅证B下模糊近似可以退化到Ziarko下 Hx∈U,都有U(x)=1,所以Hy∈U,都有 近似,B上模糊近似可以退化到Ziarko上近似的证 明类似. e([y]R,U)=0≤B.而R(y,x)≤sup(U)=1,所以 用R?F表示集合F在Ziarko模型下的B下近似 W=U.由于R是模糊相似关系,所以R(x,x)= RF=U{E∈U/RIc(E,F)≤B},经典等价关系R 1.根据@r(x)的定义可得,£U(x)=1.由x的任 和分明子集F分别为特殊的模糊关系和模糊集,下 意性得RU=U. 面证明RgF(x)=1,当且仅当xeR始F, 3)Hx∈U,若W=☑,根据RF(x)的定义可 对于Hx∈F,则3E∈U/R,使得x∈E且 知,RF,(x)=0,显然RF,(x)≤RF2(x) c(E,F)≤B.若ECF,那么e(E,F)=O;若 若W≠O,那么对于Hy∈W,都满足 c(E,F)≤B,根据定义1可知,e(E,F)≤B,即x∈ e([y]R,F,)≤B且R(y,x)≤sup(F).由于F,C W.根据ω(x)的定义可知,RF(x)=1. F2,有e([y]R,F2)≤e([y]R,F)1≤B.又由 反之,若RgF(x)=1,则3yeU,使得 R(y,x)≤sup(F1)≤sup(F2)得y∈W2,即WC e([y]R,F)≤B,且R(y,x)=1. W 由于R是经典的等价关系,所以[y]R就是y 根据RF(x)的定义可知,RF,(x)≤RF2(x)
第2期 邓廷权,等:模糊相似关系下变精度模糊粗糙集 ·151· 即C: 4)一般地,0≠0 同理可证F,CR形F2 例如,取a→b=min(1,1-a+b), 4)由FUF22F1,F,UF22F2和性质3可得 Γ10.10.2 R(F1UF2)2RF1,R(F1UF2)2RF2.所以, R=0.110.7 R(FUF2)RFURPF2. L0.20.71 5)由F,∩F2CF1,F,∩F2CF2和性质3可得 则B=0.45时,0={1,0.1,0.2},因此0≠ R(F,nF2)CRF,R(F1∩F2)二RF2·因此, ⑦,这是条件过宽所致,特别地,对模糊蕴含算子 R(F,∩F2)CRF,nRF2 加个限制,则空集的上近似为空集。 6)证明过程同性质4)的证明过程, 性质2若模糊蕴含算子满足80=0(s>0), 7)证明过程同性质5)的证明过程. 则0=0. 注:1)不能保证R(F,UF2)=RF,URF2·反 证明根据模糊相对错误包含度的定义可知, 1,a≤b 若s0=0(s>0),则e(F1,F2)=1.因为[x]R≠ 例如下:取a→b= b/a,a>b令B=0.25, ☑,所以Hx∈U,都有e([x]r,☑)=1.由于0≤B6令B=0.45, 同理可证FCF. 「1 0.40.60.40.85 5 结论 0.4 10.680.920.84 本文研究了基于模糊相似关系的变精度模糊粗 R= 0.60.6810.730.81 糙集模型。用模糊相似关系来刻画未知的集合,新 0.40.920.731 0.79 的变精度模糊粗糙集模型有如下优势: 0.850.840.810.79 1 1)该模型是对变精度粗糙集的一般化和模糊化; F={0.1028,0.2887,0.1038,0.3500,0.8980}, 2)该模型既能够处理连续值模糊信息,又具有 则RF={0,0.4,0.6,0.4,0.85},F={1,0.68,1, 一定程度的抗噪和容错能力; 0.73,0.85}. 3)该模型是基于模糊相似关系建立的,不需要 显然RF丈F丈RF.因此,B上模糊近似和B下 对论域进行任何形式的划分,而是用模糊相似矩阵 模糊近似也不满足扩张性和反扩张性, 表示模糊信息,具有更大的灵活性和实用性, 3)B上模糊近似和β下模糊近似与经典变精度 相同,也不满足幂等性。 参考文献: 仍取2)中的例子,按照定义可以计算得 [1]PAWLAK Z.Rough sets[J].International Journal of Com- R(RF)={0.6,0.92,0.73,0.92,0.85}. puter and Information Sciences,1982,11:341-356. 显然R(RF)≠RF,所以B下模糊近似不满足 [2]ZIARKO W.Variable precision rough set model[J].Jour- 幂等性.同样,B上模糊近似也不满足幂等性。 nal of Computer and System Science,1993,46(1):39-59
·152· 智能系统学报 第7卷 [3]DUBOIS D,PRADE H.Rough fuzzy sets and fuzzy rough [10]王熙照,赵素云.基于相似关系的模糊粗糙集模型 sets[J].International Joumal of General Systems,1999. [J].计算机科学,2004,31(10A):31-35. 17:191-209 WANG Xizhao,ZHAO Suyun.Modelling fuzzy rough sets [4]郭海刚,高井贵,张振良.模糊相似关系下的模糊粗糙 based on similarity relation[J].Computer Science,2004 集[J].辽宁师范大学学报:自然科学版,2006,29(3): 31(10A):3135 289291. [11]尤飞,冯艳宾,李洪兴.模糊蕴涵算子及其构造(I) GUO Haigang,GAO Jinggui,ZHANG Zhenliang.Fuzzy [J].北京师范大学学报:自然科学版,2003,39(5): rough sets based on fuzzy similar relation[J].Joural of Li- 606611. aoning Normal University:Natural Science Edition,2006, YOU Fei,FENG Yanbin,LI Hongxing.Fuzzy implication 29(3):289-291. operators and their construction(I)[J].Joural of Beijing [5]米据生,吴伟志,张文修.粗糙集的构造与公理化方法 Normal University:Natural Science,2003,39 (5):606- [J].模式识别与人工智能,2002,15(3):280-286. 611. MI Jusheng,WU Weizhi,ZHANG Wenxiu.Constructive 作者简介: and axiomatic approaches of the theory of rough sets[J. 邓廷权,男,1965年生,教授,博士 Pattem Recognition and Artificial Intelligence,2002,15 生导师,主要研究方向为模糊信息分 (3):280-286. 析、数学形态学与图像分析、智能识别 [6]李凡,刘启和,杨国玮.变精度模糊粗糙集的一种定义 与计算机视觉等.主持国家自然科学基 [J].控制与决策,2008,23(11):1206-1210. 金、中国博士后科学基金、黑龙江省博 LI Fan,LIU Qihe,YANG Guowei.Definition of variable 士后科学基金等多项科研项目.近年 precision fuzzy rough sets[J].Control and Decision, 来,发表学术论文30余篇,其中10余篇论文被SCI、EI、ISPT 2008,23(11):1206-1210. 等检索 [7]张东星,苗夺谦,李道国,等.基于数据库系统的可变 精度粗糙集模型[J].计算机科学,2005,32(12):172- 杨成东,男,1984年生,博士研究 174. 生,主要研究方向为数据挖掘、智能计 ZHANG Dongxing,MIAO Duoqian,LI Daoguo,et al.A 算、粗糙集理论及其应用等。 variable precision rough set model based on database system [J].Computer Science,2005,32(12):172-174. [8]黄春娥,张振良.基于截集的变精度模糊粗糙集模型 [J].模糊系统与数学,2004,18(9):200-203. HUANG Chune,ZHANG Zhenliang.Variable precision 张月童,男,1982年生,硕士研究 fuzzy rough set model based on cut set[J].Fuzzy Systems 生,主要研究方向为智能计算、粗糙集 and Mathematics,2004,18(9):200-203. 理论等 [9]冯林,王国胤。用于数据分析的变精度模糊粗糙模型 [J].西南交通大学学报,2008,43(5):582589. FENG Lin,WANG Guoyin.Variable precision fuzzy rough model for data analysis[J].Joumal of Southwest Jiaotong University,2008,43(5):582-589