第11卷第4期 智能系统学报 Vol.11 No.4 2016年8月 CAAI Transactions on Intelligent Systems Aug.2016 D0I:10.11992/is.201606016 网络出版地址:http:/www.cnki.net/kcms/detail/23.1538.TP.20160808.0831.026.html 基于不完备信息系统的三角模糊数决策粗糙集 李亚鸽14,杨宏志2,徐久成3 (1.郑州大学数学与统计学院,河南郑州450001;2.河南财经政法大学,河南郑州450046:3.河南师范大学计算 机与信息工程学院,河南新乡453007:4.新乡学院数学与信息科学学院,河南新乡453007) 摘要:在不完备信息系统中,针对用区间值表示一个未知参量时,整个区间内取值机会被认为是均等的,得到的结 果可能会产生过大误差的问题,将三角模糊数引入到决策粗糙集中,提出了一种基于不完备信息系统的三角模糊数 决策粗糙集。首先,定义了一种描述不完备信息的相似关系:然后,针对不完备信息系统中的缺失值,利用三角模糊 数来获取损失函数,构建了三角模糊数决策粗糙集模型:实例表明,本文提出的方法不仅能够弥补用区间数表示的 不足,而且可以突出可能性最大的主值,从而减少分类误差。 关键词:不完备信息系统:区间值:三角模糊数:决策粗糙集 中图分类号:TP18文献标志码:A文章编号:1673-4785(2016)04-0449-10 中文引用格式:李亚鸽,杨宏志,徐久成.基于不完备信息系统的三角模糊数决策粗糙集[J].智能系统学报,2016,11(4):449- 458. 英文引用格式:LI Yage,YANG Hongzhi,XU Jiucheng..Triangular fuzzy number decision-theoretic rough sets under incomplete information systems[J].CAAI Transactions on Intelligent Systems,2016,11(4):449-458. Triangular fuzzy number decision-theoretic rough sets under incomplete information systems LI Yage'4,YANG Hongzhi2,XU Jiucheng (1.School of Mathematics and Statistics,Zhengzhou University,Zhengzhou 450001,China;2.Henan University of Economics and Law,Zhengzhou,Zhengzhou 450046,China;3.College of Computer and Information Engineering,Henan Normal University,Xinx- iang 453007.China;4.Department of Mathematics and Information Science,Xinxiang University,Xinxiang 453007,China) Abstract:Aiming at the problems that when using an interval value to represent an unknown parameter in an incom- plete information system,the opportunity to obtain the value over the whole interval is considered to be equal,but the result may cause an over-large error.In order to solve this problem,a triangular fuzzy number was introduced into decision-theoretic rough sets,and a triangular fuzzy decision-theoretic rough set under incomplete information systems is proposed.Firstly,a new similarity relation was defined to describe incomplete information systems. Then,in view of the missing values,a model of triangular fuzzy number decision-theoretic rough sets was construc- ted to obtain the loss function.Finally,examples show that the proposed method not only makes up for deficiency in representation of the interval value,but also highlights the main value most likely to reduce the classification error. Keywords:incomplete information system;interval value;triangular fuzzy number;decision-theoretic rough sets 在现实生活中,由于测量误差、数据获取能力不足等原因,使得大量的信息系统都是不完备的口。 一般来说,不完备信息系统(incomplete information 收稿日期:2016-06-03.,网络出版日期:2016-08-08. systems,S)中的未知属性值有3种不同的情况。 基金项目:国家自然科学基金项目(61370169,61402153):河南省科技 一种是未知属性值是被遗漏的,但又确实存在 攻关重点项目(142102210056,162102210261):河南省高等 学校重点科研项目(16A520057). 的[)。根据这样的解释,Kryszkiewicz构建满足自反 通信作者:李亚鸽.E-mail:liyagezzu@163.com
第 11 卷第 4 期 智 能 系 统 学 报 Vol.11 №.4 2016 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2016 DOI:10.11992 / tis.201606016 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20160808.0831.026.html 基于不完备信息系统的三角模糊数决策粗糙集 李亚鸽1,4 ,杨宏志2 ,徐久成3 (1.郑州大学 数学与统计学院,河南 郑州 450001; 2. 河南财经政法大学,河南 郑州 450046; 3. 河南师范大学 计算 机与信息工程学院,河南 新乡 453007; 4.新乡学院 数学与信息科学学院,河南 新乡 453007) 摘 要:在不完备信息系统中,针对用区间值表示一个未知参量时,整个区间内取值机会被认为是均等的,得到的结 果可能会产生过大误差的问题,将三角模糊数引入到决策粗糙集中,提出了一种基于不完备信息系统的三角模糊数 决策粗糙集。 首先,定义了一种描述不完备信息的相似关系;然后,针对不完备信息系统中的缺失值,利用三角模糊 数来获取损失函数,构建了三角模糊数决策粗糙集模型;实例表明,本文提出的方法不仅能够弥补用区间数表示的 不足,而且可以突出可能性最大的主值,从而减少分类误差。 关键词:不完备信息系统;区间值;三角模糊数;决策粗糙集 中图分类号: TP18 文献标志码:A 文章编号:1673-4785(2016)04-0449-10 中文引用格式:李亚鸽,杨宏志,徐久成. 基于不完备信息系统的三角模糊数决策粗糙集[ J]. 智能系统学报, 2016, 11( 4): 449- 458. 英文引用格式:LI Yage , YANG Hongzhi, XU Jiucheng. Triangular fuzzy number decision⁃theoretic rough sets under incomplete information systems[J]. CAAI Transactions on Intelligent Systems, 2016, 11(4): 449-458. Triangular fuzzy number decision⁃theoretic rough sets under incomplete information systems LI Yage 1,4 , YANG Hongzhi 2 , XU Jiucheng 3 (1. School of Mathematics and Statistics, Zhengzhou University, Zhengzhou 450001, China; 2. Henan University of Economics and Law, Zhengzhou, Zhengzhou 450046, China; 3. College of Computer and Information Engineering, Henan Normal University, Xinx⁃ iang 453007, China; 4. Department of Mathematics and Information Science,Xinxiang University, Xinxiang 453007,China) Abstract:Aiming at the problems that when using an interval value to represent an unknown parameter in an incom⁃ plete information system, the opportunity to obtain the value over the whole interval is considered to be equal, but the result may cause an over⁃large error. In order to solve this problem, a triangular fuzzy number was introduced into decision⁃theoretic rough sets, and a triangular fuzzy decision⁃theoretic rough set under incomplete information systems is proposed. Firstly, a new similarity relation was defined to describe incomplete information systems. Then, in view of the missing values, a model of triangular fuzzy number decision⁃theoretic rough sets was construc⁃ ted to obtain the loss function. Finally, examples show that the proposed method not only makes up for deficiency in representation of the interval value, but also highlights the main value most likely to reduce the classification error. Keywords: incomplete information system; interval value; triangular fuzzy number; decision⁃theoretic rough sets 收稿日期:2016-06-03. 网络出版日期:2016-08-08. 基金项目:国家自然科学基金项目( 61370169, 61402153);河南省科技 攻关重点项目(142102210056, 162102210261);河南省高等 学校重点科研项目(16A520057). 通信作者:李亚鸽. E⁃mail:liyagezzu@ 163.com. 在现实生活中,由于测量误差、数据获取能力不 足等原因,使得大量的信息系统都是不完备的[1] 。 一般来说,不完备信息系统( incomplete information systems, IIS)中的未知属性值有 3 种不同的情况。 一种是 未 知 属 性 值 是 被 遗 漏 的, 但 又 确 实 存 在 的[2] 。 根据这样的解释,Kryszkiewicz 构建满足自反
.450 智能系统学报 第11卷 性和对称性的容差关系[),并研究了S中的知识 a、}分别表示接受某事件、延迟决策和拒绝某事件3 约简问题:基于容差关系,王国胤等)提出了限制 种行动。考虑到采取不同行动会产生不同的损失, 容差关系:杨习贝等给出了一种可变精度分类关 用入p、入即、入P分别表示当x属于X时,采取行动 系,对限制容差关系进行了扩展:一种是未知属性值 ap、ag、aw下的损失;用入N、入BN、入w分别表示当x不 被认为是丢失的,不允许被比较[s),据此,Stefanows-- 属于X时,采取行动ap、ag、ax下的损失。因此采取 k等构建了非对称相似关系[6),并建立了近似集的 ap、ag、aw3种行动下的期望损失可分别表示为 概念:另外一种是未知属性值被认为是暂时性缺失。 R(apI [x])=AppP(XI [x])+ApxP(XI [x]) 决策粗糙集是20世纪90年代由Yao提出的一 R(aBI[x])=入即P(XI[x])+入BNP(XI[x]) 种重要的粗糙集模型[],该理论的核心内容是通过 R(ayI [x])=ANpP(XI [x])+ANP(XI [x]) 分析比较各种决策的风险损失,找出最小风险损失 (1) 决策,以此作为把对象划分到正域、负域和边界域的 式中:[x]为样本在属性集下的等价类,P(XI[x]) 依据。贾修一等劉提出了一种基于决策风险最最 和P(一XI[x])分别表示将等价类[x]划分为X和 小化的属性约简定义,它要求在约简后的属性集合 X的概率。根据贝叶斯决策准则,需要选择期望 上所做出的决策风险小:王国胤等列对国内外有关 损失最小的行动集作为最佳行动方案,于是得到如 决策粗糙集模型进行了综述和分析:Li等1o根据决 下3条决策规则: 策者的不同风险偏好,给出了乐观决策、悲观决策与 P)若R(apI[x])≤R(agI[x])和R(apI 中性决策的多角度决策粗糙集模型:叶东毅等)提 [x])≤R(avI[x]同时成立,那么x EPOS(X): 出了基于模糊数风险最小化的拓展决策粗糙集模 B)若R(aBI[x])≤R(apI[x])和R(aB 型;此外,决策粗糙集已在邮件信息过滤系统、文本 [x])≤R(awI[x])同时成立,那么x∈BND(X): 聚类和分类、石油开采中得到了较好应用2-6。 N)若R(awI[x])≤R(apI[x])和R(awl 然而,在已有对决策粗糙集的研究中,代价敏感 [x])≤R(agI[x]同时成立,那么x∈NEG(X)。 损失函数大都由专家提供。考虑到人为判断的模糊 由于P(XI[x])+P(XI[x])=1,所以上述 性,单值损失函数存在很大误差,损失函数应具有一 规则只与概率P(X1[x])和相关的损失函数入有 定的伸缩性,为此,刘盾等提出区间决策粗糙集, 关。基于常识,做出正确决策产生的损失要小于做 讨论了用区间值来刻画损失函数:考虑到信息系统 出错误决策产生的损失,故有0≤入P≤入即<入p, 的不完备性,马兴斌等[讨论了不完备信息系统中 0≤入w≤入N<入w。基于这两个条件,从规则P) 的多重代价决策粗糙集:刘盾等1]将不完备信息引 ~)可以获得以下3个阈值: 入到区间决策粗糙集中,构建了一个混合信息知识 入pw-入N 表,用以处理S中的三支决策问题,但是这仍具有 Q= (入PN-入BN)+(入BP-入p) 一定的误差,特别地,在S中,用区间数表示一个 ABN ANN 未知参量时,整个区间内取值机会被认为是均等的, B=(AN-As)+(AP-A即 得到的结果可能会产生过大误差。而在三角模糊数 APN -ANN 区间取值中,主值a的取值机会最大,由a靠近上 Y=(Aps Ass)(Asr -m) (2) 限、下限取值可能性递减。因此,使用三角模糊数进 基于上述3个阈值,规则P)~N)可简明表示为 行不确定性值的评判,不仅能够突出取可能性最大 P)若P(XI[x])≥a且P(XI[x])≥y,则 的主值,而且可以弥补用区间数表示的不足。基于 x∈POS(X); 此,本文在S的基础上提出了使用三角模糊数来 B)若P(XI[x])≤a且P(XI[x])≥B,则 改善只用上下限表示的区间数取值,构建了三角模 x∈BND(X); 糊数决策粗糙集模型。 N')若P(XI[x])≤B且P(XI[x])≤y,则 1基础知识 x ENEG(X)。 1.2三角模糊数 1.1决策粗糙集 模糊集作为精确数值的一种扩展形式,被用于 决策粗糙集[2-2]模型利用两个状态集和3个 处理模糊、不精确和不确定性决策问题。在模糊集 行动集描述决策过程。状态集2={X,一X}分别 理论中,隶属函数是它的一个最基本元素。在隶属 表示某事件属于X和不属于X,行动集A={ap,ag, 函数中,三角模糊数是其中具有代表性的一个
性和对称性的容差关系[3] ,并研究了 IIS 中的知识 约简问题;基于容差关系,王国胤等[1] 提出了限制 容差关系;杨习贝等[4] 给出了一种可变精度分类关 系,对限制容差关系进行了扩展;一种是未知属性值 被认为是丢失的,不允许被比较[5] ,据此,Stefanows⁃ ki 等构建了非对称相似关系[6] ,并建立了近似集的 概念;另外一种是未知属性值被认为是暂时性缺失。 决策粗糙集是 20 世纪 90 年代由 Yao 提出的一 种重要的粗糙集模型[7] ,该理论的核心内容是通过 分析比较各种决策的风险损失,找出最小风险损失 决策,以此作为把对象划分到正域、负域和边界域的 依据。 贾修一等[8] 提出了一种基于决策风险最最 小化的属性约简定义,它要求在约简后的属性集合 上所做出的决策风险小;王国胤等[9] 对国内外有关 决策粗糙集模型进行了综述和分析;Li 等[10]根据决 策者的不同风险偏好,给出了乐观决策、悲观决策与 中性决策的多角度决策粗糙集模型;叶东毅等[11] 提 出了基于模糊数风险最小化的拓展决策粗糙集模 型;此外,决策粗糙集已在邮件信息过滤系统、文本 聚类和分类、石油开采中得到了较好应用[12-16] 。 然而,在已有对决策粗糙集的研究中,代价敏感 损失函数大都由专家提供。 考虑到人为判断的模糊 性,单值损失函数存在很大误差,损失函数应具有一 定的伸缩性,为此,刘盾等[17]提出区间决策粗糙集, 讨论了用区间值来刻画损失函数;考虑到信息系统 的不完备性,马兴斌等[18]讨论了不完备信息系统中 的多重代价决策粗糙集;刘盾等[19] 将不完备信息引 入到区间决策粗糙集中,构建了一个混合信息知识 表,用以处理 IIS 中的三支决策问题,但是这仍具有 一定的误差,特别地,在 IIS 中,用区间数表示一个 未知参量时,整个区间内取值机会被认为是均等的, 得到的结果可能会产生过大误差。 而在三角模糊数 区间取值中,主值 a 的取值机会最大,由 a 靠近上 限、下限取值可能性递减。 因此,使用三角模糊数进 行不确定性值的评判,不仅能够突出取可能性最大 的主值,而且可以弥补用区间数表示的不足。 基于 此,本文在 IIS 的基础上提出了使用三角模糊数来 改善只用上下限表示的区间数取值,构建了三角模 糊数决策粗糙集模型。 1 基础知识 1.1 决策粗糙集 决策粗糙集[20-21] 模型利用两个状态集和 3 个 行动集描述决策过程。 状态集 Ω = {X, ØX}分别 表示某事件属于 X 和不属于 X,行动集 A = {aP , aB , aN}分别表示接受某事件、延迟决策和拒绝某事件 3 种行动。 考虑到采取不同行动会产生不同的损失, 用 λPP 、λBP 、λNP 分别表示当 x 属于 X 时,采取行动 aP 、aB 、aN下的损失;用 λPN、λBN、λNN分别表示当 x 不 属于 X 时,采取行动 aP 、aB 、aN下的损失。 因此采取 aP 、aB 、aN3 种行动下的期望损失可分别表示为 R(aP | [x]) = λPPP(X | [x]) + λPNP(¬ X | [x]) R(aB | [x]) = λBPP(X | [x]) + λBNP(¬ X | [x]) R(aN | [x]) = λNPP(X | [x]) + λNNP(¬ X | [x]) (1) 式中:[x]为样本在属性集下的等价类,P(X | [x]) 和 P(ØX | [x])分别表示将等价类[x]划分为 X 和 ØX 的概率。 根据贝叶斯决策准则,需要选择期望 损失最小的行动集作为最佳行动方案,于是得到如 下 3 条决策规则: P) 若 R( aP | [ x]) ≤ R( aB | [ x]) 和 R( aP | [x]) ≤ R(aN | [x]同时成立,那么 x ÎPOS(X); B) 若 R( aB | [ x]) ≤ R( aP | [ x]) 和 R( aB | [x]) ≤ R(aN | [x])同时成立,那么 x ÎBND(X); N) 若 R( aN | [ x]) ≤ R( aP | [ x]) 和 R( aN | [x]) ≤ R(aB | [x]同时成立,那么 x ÎNEG(X)。 由于 P(X | [x])+P(ØX | [x])= 1,所以上述 规则只与概率 P(X | [ x])和相关的损失函数 λ 有 关。 基于常识,做出正确决策产生的损失要小于做 出错误决策产生的损失,故有 0 ≤ λPP≤ λBP <λNP , 0 ≤ λNN≤ λBN <λPN。 基于这两个条件,从规则 P) ~N)可以获得以下 3 个阈值: α = λPN - λBN (λPN - λBN) + (λBP - λPP ) β = λBN - λNN (λBN - λNN) + (λNP - λBP ) γ = λPN - λNN (λPN - λNN) + (λNP - λPP ) (2) 基于上述 3 个阈值,规则 P) ~N)可简明表示为 P′) 若 P(X | [x]) ≥ α 且 P(X | [x]) ≥ γ ,则 x ÎPOS(X); B′) 若 P(X | [x]) ≤ α 且 P(X | [x]) ≥ β, 则 x ÎBND(X); N′) 若 P(X | [x]) ≤ β 且 P(X | [x]) ≤ γ, 则 x ÎNEG(X)。 1.2 三角模糊数 模糊集作为精确数值的一种扩展形式,被用于 处理模糊、不精确和不确定性决策问题。 在模糊集 理论中,隶属函数是它的一个最基本元素。 在隶属 函数中,三角模糊数是其中具有代表性的一个。 ·450· 智 能 系 统 学 报 第 11 卷
第4期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·451 定义2[2)实数R上的模糊数a=(L,m,u)是 a,(x)=a:(y)≠* 一个三角模糊数,其中,l、m、u为实数,且IAmAu,m a:(x)≠a:(y)Aa:(x)≠*Λa:(y)≠* 称为三角模糊数a的主值,l与u分别称为a的下界 1/v。l, 其他 和上界。 (4) 模糊数a的隶属函数的表达式可表示为 式中:|V.表示在属性a:上值域元素的个数。 0, xx L∈[0,1],相似关系SR为SR,的L-截集,其中L 当l=m或m=u时,三角模糊数就转变为区间 称为阈值或置信水平,即 数,由此可见区间数是三角模糊数的一个特例。在区 Vx,x,SR(x,x)台 间数取值中,上下限的各个取值可以认为是机会均等 a,∈A,S(x,x)=∑ Sa(xi,x -≥L(6) 的,而在三角模糊数区间取值中,主值α的取值机会 m 最大,而由a靠近上限、下限的取值可能性递减。 对于每一个x,的等价类[x]5=U,{为S(x, 对于任意两个模糊三角数a1=(L1,m1,41), x)≥L},其中S片是自反的、对称的,但不是传递 a2=(凸2,m2,42),根据扩展定理21相应的运算规则 的。其中,L的值可以看作决策偏好的粒度,一个较 如下: 高的值代表了一个较强的不可分辨关系。特别地, 1)a1+a1=(L1+l2,m1+m2,41+u2): 2)a1-a2=(l1-l2,m1-m2,u1-2); 如果L=1,即有5气)=∑8=1,此时。 m 3)a1a2=(L1l2,m1m2,u42): a:(x)=a:(y)≠*。在这种情况下,基于L-截集的 4)a1/a2-(l/u2,m/m2,u1/八2): 相似关系转化为等价类。如果L=0,即有 5)Aa2=(入l2,入m2,入2),A∈R且入>0。 5)=∑82=0,此时4,(),. m 2基于S的三角模糊数决策粗糙集 a(x)≠*,a:(y)≠*,x、x没有任何关系。 2.1不完备信息系统 根据相似度的定义(5),基于L截集相似关系 定义12]不完备信息系统S=(U,AT,V, (6),我们定义在S中的两个近似和3个决策区域。 f)。其中,U是一个被称为论域的对象集合;AT是 定义5不完备信息系统S=(U,AT,V,f)。 非空有限的属性集合:对于Va∈AT,有a:U→V, x∈U,令0B) 2.2相似度及相关知识 (8) 在S=(U,AT,V,f)中,V=V{*},*表示 相对应的3个决策区域分别为 未知的值。陈圣兵等25]在不完备信息系统中,分析 P0Sa,e)(x)={x∈U1Pr(x|[x]5R)≥a 并讨论了空值相等的概率问题。基于文献[25],我 BND'B (x)={xE UI B Pr(xI [x]SR)<a) 们提出了在不完备信息系统中相似度的概念。 NEG(x)={x∈UIPr(xI[x])≤By 定义3不完备信息系统IS=(U,AT,V, (9) f)。U={x1,x2,…,xn}为n个对象的集合,A= 2.3整数值排序法 {a1,a2,…,am}为m个属性的集合。x,x,由 整数值排序法是通过把模糊数直接转化成单个 a:确定的相似度关系S。(x:,x)为 实数,然后依据实数大小来判定模糊数的次序。这种 S(xi,x)= 排序方法,涉及到决策者的风险偏好。根据Kumar
定义 2 [22] 实数 R 上的模糊数 a = (l, m, u)是 一个三角模糊数,其中,l、m、u 为实数,且 lλmλu,m 称为三角模糊数 a 的主值,l 与 u 分别称为 a 的下界 和上界。 模糊数 a 的隶属函数的表达式可表示为 Ua(x) = 0, x < l x - l m - l , l ≤ x ≤ m u - x u - m , m ≤ x ≤ u 0, u > x ì î í ï ï ï ï ï ï ïï (3) 当 l = m 或 m = u 时,三角模糊数就转变为区间 数,由此可见区间数是三角模糊数的一个特例。 在区 间数取值中,上下限的各个取值可以认为是机会均等 的,而在三角模糊数区间取值中,主值 a 的取值机会 最大,而由 a 靠近上限、下限的取值可能性递减。 对于任意两个模糊三角数 a1 = ( l 1 , m1 , u1 ), a2 = (l 2 , m2 , u2 ),根据扩展定理[24]相应的运算规则 如下: 1) a1 +a1 = (l 1 + l 2 , m1 +m2 , u1 +u2 ); 2) a1 -a2 = (l 1 -l 2 , m1 -m2 , u1 -u2 ); 3) a1 a2 = (l 1 l 2 , m1 m2 , u1 u2 ); 4) a1 / a2 = (l 1 / u2 , m1 / m2 , u1 / l 2 ); 5) λ a2 = (λ l 2 , λ m2 , λ u2 ), λ ÎR 且λ > 0。 2 基于 IIS 的三角模糊数决策粗糙集 2.1 不完备信息系统 定义 1 [23] 不完备信息系统 IIS = (U, AT, V , f )。 其中,U 是一个被称为论域的对象集合;AT 是 非空有限的属性集合;对于"a ÎAT,有 a: U ®Va , 其中 Va是属性 a 的值域(包括遗漏型空值和缺失型 空值)。 属性值域集合 V = Ua Î AT Va ,f 为信息函数, 对于"a ÎA,x ÎU,有 f ( x, a) ÎVa 。 在本文中,IIS 中所有的未知值都被认为是被遗漏的。 2.2 相似度及相关知识 在 IIS = (U, AT, V, f )中,V = Va È{*},*表示 未知的值。 陈圣兵等[25 ]在不完备信息系统中,分析 并讨论了空值相等的概率问题。 基于文献[25],我 们提出了在不完备信息系统中相似度的概念。 定义 3 不完备信息系统 IIS = (U, AT, V, f )。U = { x1 , x2 , …, xn } 为 n 个对象的集合,A = { a1 ,a2 , …, am }为 m 个属性的集合。 "xi, xj, 由 ai确定的相似度关系 Sai (xi,xj) 为 Sai (xi,xj) = 1, ai (x) = ai (y) ≠ ∗ 0, ai (x) ≠ ai (y) ∧ ai (x) ≠ ∗ ∧ ai (y) ≠ ∗ 1 / Vai , 其他 ì î í ï ï ï ï (4) 式中: Vai 表示在属性 ai上值域元素的个数。 任意两个对象 xi、xj的相似度 S(xi, xj)为 S xi,xj ( ) = ∑ Sai xi,xj ( ) m (5) 定义 4 不完备信息系统 IIS = (U, AT, V,f )。 "L Î[0, 1],相似关系 SRA L为 SRA的 L⁃截集,其中 L 称为阈值或置信水平,即 "xi, xj,SRA L (xi, xj) Û "aiÎA, S(xi, xj) = ∑a i ∈A Sai xi,xj ( ) m ≥ L (6) 对于每一个 xi的等价类 [xi] L SR = Uxi { xj |S(xi, xj ) ≥ L },其中 SI L A 是自反的、对称的,但不是传递 的。 其中,L 的值可以看作决策偏好的粒度,一个较 高的值代表了一个较强的不可分辨关系。 特别地, 如果 L = 1,即有 S(xi,xj) = ∑ Sa(xi,xj) m = 1, 此时, ai(x)= ai( y) ¹∗。 在这种情况下,基于 L⁃截集的 相似 关 系 转 化 为 等 价 类。 如 果 L = 0, 即 有 S(xi,xj) =∑ Sa(xi,xj) m = 0,此时,ai ( x) ¹ai ( y), ai ( x)¹*, ai(y) ¹∗, xi、 xj没有任何关系。 根据相似度的定义(5),基于 L⁃截集相似关系 (6),我们定义在 IIS 中的两个近似和 3 个决策区域。 定义 5 不完备信息系统 IIS = (U, AT, V, f )。 "x ÎU,令 0 < β ≤ α ≤ 1, 基于 L⁃截集相似关系的 下、上近似为 SR L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) ≥ α} (7) SR L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) > β} (8) 相对应的 3 个决策区域分别为 POS L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) ≥ α} BND L (α,β ) (x) = x ∈ U | β < Pr x | [x] L SR { ( ) < α} NEG L (α,β ) (x) = x ∈ U | Pr x | [x] L SR { ( ) ≤ β} (9) 2.3 整数值排序法 整数值排序法是通过把模糊数直接转化成单个 实数,然后依据实数大小来判定模糊数的次序。 这种 排序方法,涉及到决策者的风险偏好。 根据 Kumar 第 4 期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·451·
452 智能系统学报 第11卷 A[2]的研究结论,三角模糊数r(a)的排序函数为 R(axI[x])≤R(aBI[x])同时成立,那么x∈ r(a)=0.5[p(l+m)+(1-p)(m+u)] NEG(X)。 (10) 在本文,我们选取整数值排序方法来研究三角 式中:P是决策者的风险偏好指数,反映出决策者的 模糊数决策粗糙集。基于式(10),各期望损失值可 乐观程度。在式(10)中p值越大意味着决策者越 以分别计算得到 乐观,即悲观决策者会高估损失值,而乐观决策者则 r(R(apI [x]S))=r(App)Pr(XI [x]sR)+ 会低估损失值。特别地,当p=0和p=1时,r(a) r(ApN)(1-Pr(XI [x]s) 的值分别代表了悲观决策者和乐观决策者的观点。 r(R(agI [x]5R))=r(App)Pr(XI [x]sB)+ 2.4基于IS的三角模糊数决策粗糙集的模型实现 r(入w)(1-Pr(XI[x]sR) 根据贝叶斯决策过程,运用三角模糊数,不同状 r(R(axI [x]sR))=r(ANp)Pr(XI [x]sB)+ 态对应的三角模糊数损失值如表1所示。 r(ANN)(1-Pr(XI [x]sR) 表1不同状态下对应的三角模糊数损失值 其中 Table 1 The triangular fuzzy numbers loss values of different states r(App)=0.5[p(lpp mpp)+(1-p)(upp mpp) X(P) X(P) r(Apx)=0.5[p(lpN mps)+(1-p)(upN mpN) a。入pp=(Lpp,mp,up)ApN=(lpx,mpw,upx) r(入Bp)=0.5[p(lBp+mBr)+(1-p)(up+mgr)] da Aup (lp,map,uup)Asx (lax,max,uax) r(ABx)=0.5[p(LBN mgx)+(1-p)(uBs mgx) ax Axp =(Isp,mxp,UxP)Axx (Isx,mss uxx) r(Asp)=0.5[p(lsp msp)+(1-p)(usp msp) 在表1中,入pp=(lpp,mm,upr)、A即=(lP, r(ANx)=0.5[p(lNN msx)+(1 -p)(uNN msx) m即,u即)、p=(Lp,mP,up)分别表示当x属于 故得到如下3条决策规则: X时,采取行动ap、aB、ax下的损失;用入w=(lpN, P2)若r(R(apI[x]SR))≤r((aBI[x])) mpN,upN)、入gN=(LgN,mgN,ugN)、入w=(lN,mw, 和r(R(apI[x]))≤r(R(awI[x]))同时成 uN)分别表示当x不属于X时,采取行动ap、aga、 立,那么xeP0S(X); 下的损失。根据决策粗糙集的基本条件,假定损失 B2)若r(R(aBI[x]))≤r(R(apI[x]5)) 值满足以下条件: 和r(R(agI[x]))≤r(R(awI[x]5))同时成 lp≤LgP<lp mpp≤m<mNp 立,那么x∈BND(X): upp≤ugp<upp INN≤ln<lpw N2)若r(R(awI[x]5))≤r(R(apI[x])) mN≤mgN<mPN UNN≤uBN<upN 和r(R(awI[x]))≤r(R(aaI[x]))同时成 因此采取ap、aB、aw3种行动下的期望损失可 立,那么x ENEG(X)。 分别表示为 由此,可推导出三角模糊数决策粗糙集的3个 R(apI [x])=AppP(XI [x])+ApP(XI [x]) 阈值,其结果为 R(agI [x])=AgpP(XI [x])+ABxP(XI [x]) (r(dw)-r(入N)) R(aNI [x])=ANpP(XI [x])+ANNP(XI[x]) (r(入N)-r(入BN))+(r(ABP)-r(入P)) (11) (r(AgN)-r(Asx)) 根据贝叶斯决策准则,需要选择期望损失最小 B=(r(a)-r(A)+(r(A)-r八即)) 的行动集作为最佳行动方案,于是可得到如下3条 (r(入pN)-r(AN)) 决策规则: Y=(r(m)-r(Ass))(r(sr)-r(m) P,)若R(apI[x])≤R(aBI[x])和 (12) R(apl[x])≤R(awI[x])同时成立,那么x∈ 考虑到决策者的风险态度,基于决策粗糙集依 POS(X); 次提出乐观决策模型、中性决策模型和悲观决策模 B,)若R(agI[x])≤R(apI[x])和 型。类似于Li,Zhou的思想o),在整数值排序方法 中决策者的风险态度指数是三角模糊数排序的重要 R(agI[x])≤R(awI[x])同时成立,那么x∈ BND(X); 要素,它会影响到阈值的取值。特别地,当p=1,对 于乐观决策者,其阈值可以表达为 N,)若R(awI[x])≤R(apI[x])和
A [26]的研究结论,三角模糊数 r(a)的排序函数为 r(a) = 0.5[ρ(l + m) + (1 - ρ)(m + u)] (10) 式中: ρ 是决策者的风险偏好指数,反映出决策者的 乐观程度。 在式(10) 中 ρ 值越大意味着决策者越 乐观,即悲观决策者会高估损失值,而乐观决策者则 会低估损失值。 特别地,当 ρ = 0 和 ρ = 1 时,r(a) 的值分别代表了悲观决策者和乐观决策者的观点。 2.4 基于 IIS 的三角模糊数决策粗糙集的模型实现 根据贝叶斯决策过程,运用三角模糊数,不同状 态对应的三角模糊数损失值如表 1 所示。 表 1 不同状态下对应的三角模糊数损失值 Table 1 The triangular fuzzy numbers loss values of different states X(P) ¬ X(P) ap λPP = (lPP ,mPP ,uPP ) λPN = (lPN ,mPN ,uPN ) aB λBP = (lBP ,mBP ,uBP ) λBN = (lBN ,mBN ,uBN ) aN λNP = (lNP ,mNP ,uNP ) λNN = (lNN ,mNN ,uNN ) 在表 1 中, λPP = ( lPP , mPP , uPP )、 λBP = ( lBP , mBP , uBP )、 λNP = (lNP , mNP , uNP )分别表示当 x 属于 X 时,采取行动 aP 、 aB 、aN下的损失;用 λPN = ( lPN, mPN, uPN)、 λBN = (lBN, mBN, uB N)、 λNN = (lNN, mNN, uNN )分别表示当 x 不属于 X 时,采取行动 aP 、 aB 、aN 下的损失。 根据决策粗糙集的基本条件,假定损失 值满足以下条件: lPP ≤ lBP < lNP mPP ≤ mBP < mNP uPP ≤ uBP < uPP lNN ≤ lBN < lPN mNN ≤ mBN < mPN uNN ≤ uBN < uPN 因此采取 aP 、aB 、aN 3 种行动下的期望损失可 分别表示为 R(aP | [x]) = λPPP(X | [x]) + λPNP(¬ X | [x]) R(aB | [x]) = λBPP(X | [x]) + λBNP(¬ X | [x]) R(aN | [x]) = λNPP(X | [x]) + λNNP(¬ X | [x]) (11) 根据贝叶斯决策准则,需要选择期望损失最小 的行动集作为最佳行动方案,于是可得到如下 3 条 决策规则: P1 ) 若 R aP ( | [x] ) ≤ R aB ( | [x] ) 和 R aP ( | [x] ) ≤ R aN ( | [x] ) 同时成立,那么 x Î POS(X); B1 ) 若 R aB ( | [x] ) ≤ R aP ( | [x] ) 和 R aB ( | [x] ) ≤ R aN ( | [x] ) 同时成立,那么 x Î BND(X); N1 ) 若 R aN ( | [x] ) ≤ R aP ( | [x] ) 和 R aN ( | [x] ) ≤ R aB ( | [x] ) 同时成立,那么 x Î NEG(X)。 在本文,我们选取整数值排序方法来研究三角 模糊数决策粗糙集。 基于式(10),各期望损失值可 以分别计算得到 r(R aP | [x] L SR ( ) ) = r(λPP )Pr(X | [x]SR L ) + r(λPN)(1 - Pr(X | [x]SR L ) r(R aB | [x] L SR ( ) ) = r(λBP )Pr(X | [x]SR L ) + r(λBN)(1 - Pr(X | [x]SR L ) r(R aN | [x] L SR ( ) ) = r(λNP )Pr(X | [x]SR L ) + r(λNN)(1 - Pr(X | [x]SR L ) 其中 r λPP ( ) = 0.5[ρ lPP + mPP ( ) + (1 - ρ) uPP + mPP ( ) ] r λPN ( ) = 0.5[ρ lPN + mPN ( ) + (1 - ρ) uPN + mPN ( ) ] r λBP ( ) = 0.5[ρ lBP + mBP ( ) + (1 - ρ) uBP + mBP ( ) ] r λBN ( ) = 0.5[ρ lBN + mBN ( ) + (1 - ρ) uBN + mBN ( ) ] r λNP ( ) = 0.5[ρ lNP + mNP ( ) + (1 - ρ) uNP + mNP ( ) ] r λNN ( ) = 0.5[ρ lNN + mNN ( ) + (1 - ρ) uNN + mNN ( ) ] 故得到如下 3 条决策规则: P2 )若 r(R aP | [x] L SR ( ) ) ≤ r(R aB | [x] L SR ( ) ) 和 r(R aP | [x] L SR ( ) ) ≤ r(R aN | [x] L SR ( ) ) 同时成 立,那么 x ÎPOS(X); B2 )若 r(R aB | [x] L SR ( ) ) ≤ r(R aP | [x] L SR ( ) ) 和 r(R aB | [x] L SR ( ) ) ≤ r(R aN | [x] L SR ( ) ) 同时成 立,那么 x ÎBND(X); N2 )若 r(R aN | [x] L SR ( ) ) ≤ r(R aP | [x] L SR ( ) ) 和 r(R aN | [x] L SR ( ) ) ≤ r(R aB | [x] L SR ( ) ) 同时成 立,那么 x ÎNEG(X)。 由此,可推导出三角模糊数决策粗糙集的 3 个 阈值,其结果为 α = (r λPN ( ) - r λBN ( ) ) (r λPN ( ) - r λBN ( ) ) + (r λBP ( ) - r λPP ( ) ) β = (r λBN ( ) - r λNN ( ) ) (r λBN ( ) - r λNN ( ) ) + (r λNP ( ) - r λBP ( ) ) γ = (r λPN ( ) - r λNN ( ) ) (r λPN ( ) - r λNN ( ) ) + (r λNP ( ) - r λPP ( ) ) (12) 考虑到决策者的风险态度,基于决策粗糙集依 次提出乐观决策模型、中性决策模型和悲观决策模 型。 类似于 Li、Zhou 的思想[10] ,在整数值排序方法 中决策者的风险态度指数是三角模糊数排序的重要 要素,它会影响到阈值的取值。 特别地,当 ρ = 1, 对 于乐观决策者,其阈值可以表达为 ·452· 智 能 系 统 学 报 第 11 卷
第4期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 .453· (LpN+mpN)-(LBN+mB) a=1 ((les +mpx)-(lBN mBN)+(lap mgp)-(lpp mpp)) (lBN mBs)-(lNN mNs) B=(s+ms)-(+m)+(s+msr)-(s+m)) (lps mpx)-(INx mxx) =ps mps)-(s +msx)+(sr mr)-(le +mr)) 当P=0,对于悲观决策者,其阈值可以表达为 (mpN upN)-(mBN uBN) a= (mpN ups)-(mBN +ugs)+(mgp ugp)-(mpp +upp)) (mBN UBN)-(mNN UNN) B=((mgs ug)(m+(mr usr)-(mar+ue)) (mpw+upw)-(mN+uN) Y=((mps+ups)-(m++(mar us)-(mm un) 鉴于Yao2)的讨论结果,首先考虑决策规则诊断决策表S=为例1),来说明 (B)中存在α>8的情况,即 基于S的三角模糊数决策粗糙集决策过程。U= r(入p)-r(入p)r(Ap)-r(入p) {x,2,x3,x4,x5,x6,x7,xg,xg,x10}分别是10 r(Aps)-r(ABx)r(ABx)-r(Asx) 位病人的编号,条件属性集C={a1,a2,a3,a4, 该条件蕴含着0≤B<Q≤1,此时,通过权衡可 a5,a6,a,}分别表示以上病人的7种症状:温度、咳 以得到以下简化规则。 嗽、流鼻涕、头疼、恶心、有痰、肌肉疼。决策属性集 P'2)若Pr(XI[x])≥a,则x∈POS(X); D={X,一X},其中X表示病人患有流感,一X表示 B'2)若B<Pr(XI[x])<a,则x∈BND(X); 病人没有患有流感。病人患病的实际情况如表2。 N'2)若Pr(XI[x])≤B,则x∈NEG(X)。 表2病人患病的实际情况 对于乐观决策者,此时p=1,所对应的三支决 Table 2 The status of the illness patients 策规则为 a d2 as as a6 OP'2)若Pr(KI[x]5)≥a,则x∈POS(X): 3 OB'2)若B<Pr(XI[x])<a,则x∈BND(X): X2 2 2 ON',)若Pr(XI[x])≤B,则x∈NEG(X)。 3 2 2 2 1 2 对于悲观决策者,此时p=0,所对应的三支决 2 2 1 3 策规则为 2 2 1 2 PP'2)若Pr(XI[x])≥a,则x∈POS(X); 2 2 PB'2)若B<Pr(XI[x]5)<a,则x∈ 2 3 BND(X); 1 PN'2)若Pr(XI[x])≤B,则x∈NEG(X)。 此外,为了保证研究的完备性,决策规则(B)还 有另一种情况,即: X10 3 2 2 3 r(AB即)-r(ApP)、r(AP)-r(A即) 为描述方便,在表2中,根据医生的经验,对每 r(ApN)-r(ABN)r(ABN)-r(ANN) 个属性所对应值的大小有如下定义: 该条件蕴含着0≤a<y<B≤1,此时,通过 温度a1:1代表高,2代表较高,3代表正常: 权衡可以得到以下简化规则: 咳嗽a2:1代表是,2代表不是: P3)若Pr(X1[x]5)≥y,则xEPOS(X); 流鼻涕a3:1代表是,2代表不是: N3)若Pr(XI[x])≤y,则x∈NEG(X)。 头疼a4:1代表很严重,2代表有点严重,3代表 不严重; 3案例分析 恶心a5:1代表是,2代表不是; 医学诊断是一种根据病人现有症状来判断所得 有痰a6:1代表有,2代表没有; 疾病类列的决策过程,在下面的讨论中,以医学流感 肌肉疼a,:1代表很严重,2代表有点严重,3代
a = lPN + mPN ( ) - lBN + mBN ( ) lPN + mPN ( ) - lBN + mBN ( ) + lBP + mBP ( ) - lPP + mPP ( ( ) ) β = lBN + mBN ( ) - lNN + mNN ( ) lBN + mBN ( ) - lBN + mNN ( ) + lBN + mNP ( ) - lBN + mBP ( ( ) ) γ = lPN + mPN ( ) - lNN + mNN ( ) lPN + mPN ( ) - lNN + mNN ( ) + lNP + mNP ( ) - lPP + mPP ( ( ) ) 当 ρ = 0, 对于悲观决策者,其阈值可以表达为 a = mPN + uPN ( ) - mBN + uBN ( ) mPN + uPN ( ) - mBN + uBN ( ) + mBP + uBP ( ) - mPP + uPP ( ( ) ) β = mBN + uBN ( ) - mNN + uNN ( ) mBN + uBN ( ) - mNN + uNN ( ) + mNP + uNP ( ) - mBP + uBP ( ( ) ) γ = mPN + uPN ( ) - mNN + uNN ( ) mPN + uPN ( ) - mNN + uNN ( ) + mNP + uNP ( ) - mPP + uPP ( ( ) ) 鉴于 Yao [27] 的讨论结果,首先考虑决策规则 (B)中存在 α >β 的情况,即 r λBP ( ) - r λPP ( ) r λPN ( ) - r λBN ( ) < r λNP ( ) - r λBP ( ) r λBN ( ) - r λNN ( ) 该条件蕴含着 0 ≤ β <α ≤1, 此时,通过权衡可 以得到以下简化规则。 P′2 ) 若 Pr X | [x] L SR ( ) ≥ α, 则 x ÎPOS(X); B′2 ) 若 β <Pr X | [x] L SR ( ) <α, 则 x ÎBND(X); N′2 ) 若 Pr X | [x] L SR ( ) ≤ β, 则 x ÎNEG(X)。 对于乐观决策者,此时 ρ = 1, 所对应的三支决 策规则为 OP′2) 若 Pr X | [x] L SR ( ) ≥ α, 则 x ÎPOS(X); OB′2 ) 若 β <Pr X | [x] L SR ( ) <α, 则 x ÎBND(X); ON′2 ) 若 Pr X | [x] L SR ( ) ≤ β, 则 x ÎNEG(X)。 对于悲观决策者,此时 ρ = 0,所对应的三支决 策规则为 PP′2 ) 若 Pr X | [x] L SR ( ) ≥ α, 则 x ÎPOS(X); PB′2 ) 若 β < Pr X | [x] L SR ( ) < α, 则 x Î BND(X); PN′2 ) 若 Pr X | [x] L SR ( ) ≤ β, 则 x ÎNEG(X)。 此外,为了保证研究的完备性,决策规则(B)还 有另一种情况,即: r λBP ( ) - r λPP ( ) r λPN ( ) - r λBN ( ) ≥ r λNP ( ) - r λBP ( ) r λBN ( ) - r λNN ( ) 该条件蕴含着 0 ≤ α < γ < β ≤ 1, 此时,通过 权衡可以得到以下简化规则: P3 ) 若 Pr X | [x] L SR ( ) ≥ γ ,则 x ÎPOS(X); N3 ) 若 Pr X | [x] L SR ( ) ≤ γ ,则 x ÎNEG(X)。 3 案例分析 医学诊断是一种根据病人现有症状来判断所得 疾病类列的决策过程,在下面的讨论中,以医学流感 诊断决策表 S = <U, A = C ∪ D >为例[ 1 9 ] ,来说明 基于 IIS 的三角模糊数决策粗糙集决策过程。 U = {x1 , x2 , x3 , x4 , x5 , x6 , x7 , x8 , x9 , x10 }分别是 10 位病人的编号,条件属性集 C = { a1 , a2 , a3 , a4 , a5 , a6 , a7 }分别表示以上病人的 7 种症状:温度、咳 嗽、流鼻涕、头疼、恶心、有痰、肌肉疼。 决策属性集 D = {X, ØX},其中 X 表示病人患有流感,ØX 表示 病人没有患有流感。 病人患病的实际情况如表 2。 表 2 病人患病的实际情况 Table 2 The status of the illness patients U a1 a2 a3 a4 a5 a6 a7 x1 1 1 ∗ 1 1 1 3 x2 3 2 2 3 2 2 ∗ x3 2 ∗ 2 2 1 2 2 x4 2 1 2 ∗ 1 1 3 x5 2 1 1 2 1 ∗ 2 x6 2 2 2 ∗ 2 2 ∗ x7 1 1 2 1 ∗ 2 3 x8 1 1 ∗ 1 1 ∗ 3 x9 2 1 1 1 1 1 ∗ x10 3 2 ∗ 2 2 2 3 为描述方便,在表 2 中,根据医生的经验,对每 个属性所对应值的大小有如下定义: 温度 a1 :1 代表高,2 代表较高,3 代表正常; 咳嗽 a2 :1 代表是,2 代表不是; 流鼻涕 a3 :1 代表是,2 代表不是; 头疼 a4 :1 代表很严重,2 代表有点严重,3 代表 不严重; 恶心 a5 :1 代表是,2 代表不是; 有痰 a6 :1 代表有,2 代表没有; 肌肉疼 a7 :1 代表很严重,2 代表有点严重,3 代 第 4 期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·453·
.454 智能系统学报 第11卷 表不严重,*代表缺失值。 区间,如表3所示。然后,根据式(4),计算对象U 首先,根据医生的经验给出三角模糊数的损失 中任意两位患者x,x的相似度,结果如表4所示。 表3病人的综合评估损失情况 Table 3 Comprehensive assessment of the patient's losses U App 入BP ANP APN 入gN ANN [0,u,1.5u][2,3u,3.5u][4u,5u,7u][ul.5u,2u][2.5u,3w,4.5u][5u,7u,8u] [3u.3.2u,3.5u][4u.5u,5.5u][6u.6.5u,7.5u][0,u,2u][2u.3u,3.5u][4u,6u.7u] [u,2,3.5u][3.5u,4u,4.5u][4.5u,5u,6u][0.5u,u,2u][2.5u,3u,4u][4.5u,5u,7.5m] [u,2u,2.5u][3u,3.5u,4][5u,6u,7.5u][u,2u,3m][3.5u,4u,5u][5.5u,6u,7u] [0.5u,u,1.5u][2u,3u,4u][4.5u,5u,6.5u][1.5u,2u,3u][3.5u,3.8u,4u][4.5u,5u,7u] X6 [u,2u,3.5u][3.5u,4u,5u][5u,6u,7.5u][0.5u,u,2u][2.5u,3u,4u][2.5u,3u,4u] [u,1.5u,2u][3u,3.2u,3.5u][4.5u,5u,7u][u,2u,3.5u][4u,5u,6u][6.5u,6.8u,7u] [0.5u,u,1.5u][2u,3u,3.5u][4u,5u,7.5u][1.5u,2u,3u][4u,5u,5.5u][6u,7u,7.5u] [0,u,1.5u][2,3u,4u][5u,6u,7u][u,2u,3.5u][4,4.2u,4.5u][5,6u,7.5u] X10 [3u,3.5u,4u][4.5u,5u,5.5u][6u,6.5u,7u][0.5u,u,2u][2.5u,3u,3.5u][4u,5u,6u] 表4各个病人之间相似度表示 Table 4 The similarity between the individual patient S(x4,x,) X2 1 1.000.140.280.690.430.190.710.850.640.28 X2 0.141.000.420.260.140.690.420.210.140.64 0.280.421.000.550.710.620.430.360.430.50 4 0.690.260.551.000.55 0.40 0.550.620.62 0.33 0.430.140.71 55 33 0.280.430.640.36 0.190.69 0.62 0.40 0.3 0.26 0.19 0.55 0.710.420.43 0.55 0.28 0.48 1.000.79 0.36 0.50 0.850.210.36 0.32 0.43 0.26 0.791.000.570.36 0.640.140.430.62 0.64 0.190.360.571.000.21 0.280.640.500.360.360.550.500.360.211.00 在表3中,令L=0.5+£(£是正的无穷小数), 位患者得流感的条件概率如下: 基于相似度可得x的等价类: Pr(X1[x1]5)=[x1]5R∩X/[x1]5=0.80 [x1]5={x1,x4,x7,xg,xg} Pr(X1[x,])=[x,]nX/[x2]=0 [x2]5m={x2,t6,x10) Pr(X1[x3]5)=[x3]5∩X/[x3]5=0.50 [x3]={x3,4xx6} Pr(X1[x4])=[x4]5nX/[x4]5=0.71 [x]={x1,x34x5,7,x8,xg》 Pr(X1[x5]5)=[x5]5∩X/[x5]=0.50 [x5]5={x34x5,xg) Pr(X1[x6]5)=[x6]5∩X/[x6]=0.20 [x6]5={x2,x3,x6,x7,x0} Pr(X1[x,]5)=[x,]5∩X/[x,]=1.00 [x]5={x1,48,x,} Pr(X1[xg]5)=[xg]5∩X/[xg]5=0.75 [x]={x1,出7,g,xg} Pr(X1[xg]5R)=[xg]5∩X/[xg]=0.80 [xo]SR =x1,xx,} Pr(XI [&0]5R)=[o]5X/[x]5R=0 [xo]={x2,6,x10】 根据2.2节整数排序法的三角模糊数r(a)的排 根据医生的经验,集合X={1,x4,x5,x7,xg} 序函数式(10),当p=0和p=1时,r(a)的值分别代 时,这些患者得流感的概率相对较高。根据表2,每 表悲观决策者和乐观决策者的观点。根据式(12)
表不严重,∗代表缺失值。 首先,根据医生的经验给出三角模糊数的损失 区间,如表 3 所示。 然后,根据式(4),计算对象 U 中任意两位患者 xi,xj 的相似度,结果如表 4 所示。 表 3 病人的综合评估损失情况 Table 3 Comprehensive assessment of the patient's losses U λPP λBP λNP λPN λBN λNN x1 [0,u,1.5u] [2u,3u,3.5u] [4u,5u,7u] [u1.5u,2u] [2.5u,3u,4.5u] [5u,7u,8u] x2 [3u,3.2u,3.5u] [4u,5u,5.5u] [6u,6.5u,7.5u] [0,u,2u] [2u,3u,3.5u] [4u,6u,7u] x3 [u,2u,3.5u] [3.5u,4u,4.5u] [4.5u,5u,6u] [0.5u,u,2u] [2.5u,3u, 4u] [4.5u,5u,7.5u] x4 [u,2u,2.5u] [3u,3.5u,4u] [5u,6u,7.5u] [u,2u,3u] [3.5u,4u,5u] [5.5u,6u,7u] x5 [0.5u,u,1.5u] [2u,3u,4u] [4.5u,5u,6.5u] [1.5u,2u,3u] [3.5u,3.8u,4u] [4.5u,5u,7u] x6 [u,2u,3.5u] [3.5u,4u,5u] [5u,6u,7.5u] [0.5u,u,2u] [2.5u,3u,4u] [2.5u,3u,4u] x7 [u,1.5u,2u] [3u,3.2u,3.5u] [4.5u,5u,7u] [u,2u,3.5u] [4u,5u,6u] [6.5u,6.8u,7u] x8 [0.5u,u,1.5u] [2u,3u,3.5u] [4u,5u,7.5u] [1.5u,2u,3u] [4u,5u,5.5u] [6u,7u,7.5u] x9 [0,u,1.5u] [2u,3u,4u] [5u,6u,7u] [u,2u,3.5u] [4u,4.2u,4.5u] [5u,6u,7.5u] x10 [3u,3.5u,4u] [4.5u,5u,5.5u] [6u,6.5u,7u] [0.5u,u,2u] [2.5u,3u,3.5u] [4u,5u,6u] 表 4 各个病人之间相似度表示 Table 4 The similarity between the individual patient S(xi,xj) x1 x2 x3 x4 x5 x6 x7 x8 x9 x1 0 x1 1.00 0.14 0.28 0.69 0.43 0.19 0.71 0.85 0.64 0.28 x2 0.14 1.00 0.42 0.26 0.14 0.69 0.42 0.21 0.14 0.64 x3 0.28 0.42 1.00 0.55 0.71 0.62 0.43 0.36 0.43 0.50 x4 0.69 0.26 0.55 1.00 0.55 0.40 0.55 0.62 0.62 0.33 x5 0.43 0.14 0.71 0.55 1.00 0.33 0.28 0.43 0.64 0.36 x6 0.19 0.69 0.62 0.40 0.33 1.00 0.79 0.26 0.19 0.55 x7 0.71 0.42 0.43 0.55 0.28 0.48 1.00 0.79 0.36 0.50 x8 0.85 0.21 0.36 0.32 0.43 0.26 0.79 1.00 0.57 0.36 x9 0.64 0.14 0.43 0.62 0.64 0.19 0.36 0.57 1.00 0.21 x10 0.28 0.64 0.50 0.36 0.36 0.55 0.50 0.36 0.21 1.00 在表 3 中,令 L = 0.5+ ε ( ε 是正的无穷小数), 基于相似度可得 xi的等价类: [x1 ] L SR = x1 ,x4 ,x7 ,x8 ,x9 { } [x2 ] L SR = x2 ,x6 ,x10 { } [x3 ] L SR = x3 ,x4 ,x5 ,x6 { } [x4 ] L SR = x1 ,x3 ,x4 ,x5 ,x7 ,x8 ,x9 { } [x5 ] L SR = x3 ,x4 ,x5 ,x9 { } [x6 ] L SR = x2 ,x3 ,x6 ,x7 ,x10 { } [x7 ] L SR = x1 ,x4 ,x8 ,x9 { } [x8 ] L SR = x1 ,x7 ,x8 ,x9 { } [x9 ] L SR = x1 ,x4 ,x5 ,x8 ,x9 { } [x10 ] L SR = x2 ,x6 ,x10 { } 根据医生的经验,集合 X = { x1 , x4 , x5 , x7 , x8 } 时,这些患者得流感的概率相对较高。 根据表 2,每 位患者得流感的条件概率如下: Pr X | [x1 ] L SR ( ) = [x1 ] L SR ∩ X / [x1 ] L SR = 0.80 Pr X | [x2 ] L SR ( ) = [x2 ] L SR ∩ X / [x2 ] L SR = 0 Pr X | [x3 ] L SR ( ) = [x3 ] L SR ∩ X / [x3 ] L SR = 0.50 Pr X | [x4 ] L SR ( ) = [x4 ] L SR ∩ X / [x4 ] L SR = 0.71 Pr X | [x5 ] L SR ( ) = [x5 ] L SR ∩ X / [x5 ] L SR = 0.50 Pr X | [x6 ] L SR ( ) = [x6 ] L SR ∩ X / [x6 ] L SR = 0.20 Pr X | [x7 ] L SR ( ) = [x7 ] L SR ∩ X / [x7 ] L SR = 1.00 Pr X | [x8 ] L SR ( ) = [x8 ] L SR ∩ X / [x8 ] L SR = 0.75 Pr X | [x9 ] L SR ( ) = [x9 ] L SR ∩ X / [x9 ] L SR = 0.80 Pr X | [x10 ] L SR ( ) = [x10 ] L SR ∩ X / [x10 ] L SR = 0 根据 2.2 节整数排序法的三角模糊数 r(a)的排 序函数式(10),当 ρ = 0 和ρ = 1 时,r(a)的值分别代 表悲观决策者和乐观决策者的观点。 根据式(12) ·454· 智 能 系 统 学 报 第 11 卷
第4期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 455. 可得各个病人的三角模糊数决策粗糙集相关阈值, NEG(X)。通过与X={x1,x4,x5,x,xg}对比可以 计算结果如表5所示。 发现,x3不是诱发患者患病的主要因素,但对于乐观 表5各个病人的相关阈值计算结果 决策者来说,还需对它进行进一步的诊断。x,也不 Table 5 The associated threshold value of each patient's 是诱发患者患病的主要因素,但乐观决策者和悲观 乐观决策者 悲观决策者 决策者认为都需要进一步的诊断。因此,决策粗糙 U Y B Y 集能为现实的决策系统提供了一种修正误分类错误 x0.61900.57140.54290.65220.42110.5476 的方法。 20.42860.42860.58820.63110.50000.5780 在上述实例中,我们求得的相似关系及条件概 30.53330.43330.55170.64710.61540.6333 率是在L=0.5+ε的基础上进行讨论的。下面我们 x40.66670.66670.51520.57140.40000.4706 将探讨L∈[0.5,1],步长0.1时,与之相对应的乐 x50.50000.50000.42860.48280.38360.4375 观决策者和悲观决策者的决策,结果如表7所示。 表7L取不同的值所对应的决策结果 x60.45780.45780.50000.63160.47060.5556 Table 7 The different decision results corresponding to L x10.53330.53330.59540.46670.50930.4940 values 30.64520.64520.55880.50000.47830.4872 L值 乐观决策者 悲观决策者 x0.57890.57890.44440.51610.34780.4324 POS(X)5,xsxxx4x5,xx9 x100.46430.46430.55560.60000.53850.5714 0.5 NEG(X) x2,X6,x10 2,3,x6,X0 表5列出了每位病人在风险偏好者决策准则、风 BND(X) X3 险厌恶者决策准则下,αB和y的取值情况。可以看 POS(X) X1,x4,x7,x8,xg X1,X4,x7,x8,x9 出,a2较α1取值普遍大,B2较B,取值普遍小,这说明 0.6 NEG(X) x2,x3,X5,6,10x2,X3,X5,X6,X10 悲观主义者厌恶风险,它通过较大的α值和较小的B BND(X) 值避免生病被延误的概率:而乐观主义者偏好风险, POS(X) 1,4,5,,81,x4,x5,X7,s 它通过较小的α值和较大的B值获取无病的概率。 0.7 NEG(X) 根据三角模糊数决策粗糙集中的决策规则,在 BND(X) X3,X6 X3,6 决策判定过程中需要比较条件概率Pr(XI[x:]s) POS(X),,:, 和阈值aB,的大小。当L=0.5+e时,乐观决策者 X1,X4,x5,X,xs 0.8 NEG(X) 2,x3,x6,xg,X102,x3,X6,Xg,x0 和悲观决策者的决策结果如表6所示。 BND(X) 表6决策结果 Table 6 the decision results POS(X) X1,t4,X5,7,g 1,x4,X5,7,x8 0.9 NEG(X) 乐观决策者悲观决策者 X2,X3,X6,X9,X10 X2,X3,X6,X9,X10 BND(X) X1 POS(X) POS(X) % NEG(X) NEG(X) POS(X) 1,4,x5,,g x1,4,5,,8 Xy BND(X) NEG(X) 1.0 NEG(X) 专 POS(X) POS(X) BND(X) POS(X) POS(X) 从表7可以看出,随着决策偏好的粒度L的变 6 NEG(X) NEG(X) 化,决策者的选择会有一定的变化。当L=0.7时,乐 POS(X) POS(X) 观决策者和悲观决策者认为x、x。需要进一步的诊 POS(X) POS(X) 断,才能确诊。然而当L≥0.8时,乐观决策者和悲 POS(X) POS(X) 观决策者认为x?、x。不需要进一步诊断,即可视为无 x10 NEG(X) NEG(X) 患病者。且随着粒度的增大,决策者的决策趋于稳 从表6可以看出,在乐观决策者看来,{x1,x4, 定的状态。 x5,x,xg,xg}∈POS(X),{x2,x6,xo}∈NEG(X), 在IS中,基于已给出的相似关系及已求得的条 {x3}∈BND(X)。但在悲观决策者看来,{x1,x4, 件概率,取三角模糊数的端点值作为区间值,将基于 x5,x7,xg,xg∈P0S(X),{x2,x3,x6,x0}∈ 不完备信息系统的三角模糊数决策粗糙集与文献
可得各个病人的三角模糊数决策粗糙集相关阈值, 计算结果如表 5 所示。 表 5 各个病人的相关阈值计算结果 Table 5 The associated threshold value of each patient's U 乐观决策者 α1 β1 γ1 悲观决策者 α1 β1 γ1 x1 0.619 0 0.571 4 0.542 9 0.652 2 0.421 1 0.547 6 x2 0.428 6 0.428 6 0.588 2 0.631 1 0.500 0 0.578 0 x3 0.533 3 0.433 3 0.551 7 0.647 1 0.615 4 0.633 3 x4 0.666 7 0.666 7 0.515 2 0.571 4 0.400 0 0.470 6 x5 0.500 0 0.500 0 0.428 6 0.482 8 0.383 6 0.437 5 x6 0.457 8 0.457 8 0.500 0 0.631 6 0.470 6 0.555 6 x7 0.533 3 0.533 3 0.595 4 0.466 7 0.509 3 0.494 0 x8 0.645 2 0.645 2 0.558 8 0.500 0 0.478 3 0.487 2 x9 0.578 9 0.578 9 0.444 4 0.516 1 0.347 8 0.432 4 x10 0.464 3 0.464 3 0.555 6 0.600 0 0.538 5 0.571 4 表 5 列出了每位病人在风险偏好者决策准则、风 险厌恶者决策准则下, α、β 和 γ 的取值情况。 可以看 出, α2 较 α1 取值普遍大,β2 较 β1 取值普遍小,这说明 悲观主义者厌恶风险,它通过较大的 α 值和较小的 β 值避免生病被延误的概率;而乐观主义者偏好风险, 它通过较小的 α 值和较大的 β 值获取无病的概率。 根据三角模糊数决策粗糙集中的决策规则,在 决策判定过程中需要比较条件概率 Pr(X | [ xi]SR L ) 和阈值 αi、βi 的大小。 当 L = 0.5+ε 时,乐观决策者 和悲观决策者的决策结果如表 6 所示。 表 6 决策结果 Table 6 the decision results U 乐观决策者 悲观决策者 x1 POS(X) POS(X) x2 NEG(X) NEG(X) x3 BND(X) NEG(X) x4 POS(X) POS(X) x5 POS(X) POS(X) x6 NEG(X) NEG(X) x7 POS(X) POS(X) x8 POS(X) POS(X) x9 POS(X) POS(X) x10 NEG(X) NEG(X) 从表 6 可以看出,在乐观决策者看来,{x1 , x4 , x5 , x7 , x8 , x9 }ÎPOS(X),{x2 , x6 , x10 }ÎNEG(X), {x3 }ÎBND( X)。 但在悲观决策者看来, { x1 , x4 , x5 , x7 , x8 , x9 ÎPOS ( X), { x2 , x3 , x6 , x10 } Î NEG(X)。 通过与 X = {x1 , x4 , x5 , x7 , x8 }对比可以 发现,x3不是诱发患者患病的主要因素,但对于乐观 决策者来说,还需对它进行进一步的诊断。 x9也不 是诱发患者患病的主要因素,但乐观决策者和悲观 决策者认为都需要进一步的诊断。 因此,决策粗糙 集能为现实的决策系统提供了一种修正误分类错误 的方法。 在上述实例中,我们求得的相似关系及条件概 率是在 L = 0.5+ε 的基础上进行讨论的。 下面我们 将探讨 L Î[0.5, 1],步长 0.1 时,与之相对应的乐 观决策者和悲观决策者的决策,结果如表 7 所示。 表 7 L 取不同的值所对应的决策结果 Table 7 The different decision results corresponding to L values L 值 乐观决策者 悲观决策者 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9 0.5 NEG(X) x2 , x6 , x10 x2 , x3 , x6 , x10 BND(X) x3 POS(X) x1 , x4 , x7 , x8 , x9 x1 , x4 ,x7 , x8 , x9 0.6 NEG(X) x2 , x3 , x5 , x6 , x10 x2 , x3 , x5 , x6 , x10 BND(X) POS(X) x1 , x4 , x5 , x7 , x8 x1 , x4 , x5 , x7 , x8 0.7 NEG(X) x2 , x9 , x10 x2 , x9 , x10 BND(X) x3 , x6 x3 , x6 POS(X) x1 , x4 , x5 , x7 ,x8 x1 , x4 , x5 ,x7 ,x8 0.8 NEG(X) x2 , x3 , x6 , x9 , x10 x2 , x3 , x6 , x9 , x10 BND(X) POS(X) x1 , x4 , x5 ,x7 ,x8 x1 , x4 , x5 ,x7 ,x8 0.9 NEG(X) x2 , x3 , x6 , x9 , x10 x2 , x3 , x6 , x9 , x10 BND(X) POS(X) x1 , x4 , x5 , x7 , x8 x1 , x4 , x5 , x7 ,x8 1.0 NEG(X) x2 , x3 , x6 , x9 , x10 x2 , x3 , x6 , x9 , x10 BND(X) 从表 7 可以看出,随着决策偏好的粒度 L 的变 化,决策者的选择会有一定的变化。 当 L = 0.7 时,乐 观决策者和悲观决策者认为 x3 、x6需要进一步的诊 断,才能确诊。 然而当 L≥0.8 时,乐观决策者和悲 观决策者认为 x3 、x6不需要进一步诊断,即可视为无 患病者。 且随着粒度的增大,决策者的决策趋于稳 定的状态。 在 IIS 中,基于已给出的相似关系及已求得的条 件概率,取三角模糊数的端点值作为区间值,将基于 不完备信息系统的三角模糊数决策粗糙集与文献 第 4 期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·455·
456 智能系统学报 第11卷 [17]中的区间决策粗糙集方法作对比,在测试数据 间值的乐观决策者和悲观决策者来说,都需对它进 集上进行实验,根据文献[17]可得相对应的各个病 行进一步的诊断。 人的相关阈值,乐观和悲观决策者的决策结果,及当 表10。L取不同的值所对应的决策结果 L∈[0.5,1],步长0.1时,随着L粒度的变化,与之 Table 10 The different decision results corresponding to L 对应的乐观和悲观决策者的决策,结果如表8~10 values 所示。 乐观决策者 悲观决策者 表8各个病人的相关阈值计算结果 P0S(X)1,x3,x4,名,xg,xg1,x3,x4,x,8,g Table 8 The associated threshold value of each patient's 0.5 NEG(X) X2,X6,x0 X2,x5,X6,x10 乐观决策者 悲观决策者 BND(X) B B P0S(X)1,x4,5,名3,Xg,xg 1,x4,5,,xg,g x10.50000.25000.40000.50000.25000.3333 0.6 NEG(X) X2,X6,X0 X2,x3,6,x0 x20.83330.33330.58330.83330.33330.6250 BND(X) x3 x30.28570.50000.33330.28570.50000.4703 POS(X) 1,x4,3,8,g1,x3,X4,X5,,s x40.66670.55560.60000.66670.55560.5000 0.7 NEG(X) X2,X6:X0 x2,x6,x0 x50.56670.80000.55450.56670.80000.6000 BND(X) 3,X5 g x60.57420.50000.53330.57420.50000.6667 POS(X),4,x5,,x8,x9x1,x4,x5,x7,x8,x9 x,0.85560.66670.61110.85560.66670.4000 0.8 NEG(X) 2,X3,x6,i0 X2,X3,x6,t0 x80.25000.20000.22220.25000.20000.3500 BND(X) xg0.87290.75000.63630.87290.75000.5714 POS(X)x x1,4,t38,tg x10 0.33330.14280.20000.33330.14280.3333 0.9 NEG(X) x2,x3,x6,x0 X2,X3,x6,x0 表9决策结果 BND(X) Table 9 The decision results POS(X),x4,x5,x,xs,x1,X4,x5,,x U 乐观决策者 悲观决策者 1.0 NEG(X) 2,X3,X6,3x10 x2,X3,x6,t10 POS(X) POS(X) BND(X) 2 NEG(X) NEG(X) 从表10可以看出,当L≥0.8时,乐观和悲观决 3 POS(X) POS(X) 策者的决策结果趋于稳定,其中x,不是诱发患者患 XA POS(X) POS(X) 病的主要因素,但是对于取区间值的乐观和悲观决 策者来说,都需对它进行进一步的诊断。与采用三 5 BND(X) NEG(X 专 NEG(X) NEG(X) 角模糊数方法相比,采用区间值分析与实际经验值 7 POS(X) POS(X) 会产生较大的误差。 x8 POS(X) POS(X) 4结束语 Xg POS(X) POS(X) 本文基于S,从决策粗糙集出发,利用三角模 x10 NEG(X) NEG(X) 糊数来设定损失函数,首先提出一种描述不完备信 从表9可以看出,取区间值作为基础数据集时, 息的相似关系。然后,针对$中缺失值,借助三角 在乐观决策者看来,{x1,x3,x4,x7,x8,xg}∈ 模糊数的运算法则,利用三角模糊数来获取损失函 POS(X),{x2,x6,x1o}∈NEG(X),{x5}∈BND(X)。 数,构建出三角模糊数决策粗糙集的基础模型。通 但在悲观决策者看来,{x1,x3,x4,x,x8,x9}∈ 过实例可知,不同于区间数决策粗糙集的决策机制, POS(X),{x2,5,x6,xo}∈NEG(X)。通过与表6 利用三角模糊数来获取损失函数,不仅能弥补使用 及集合X={x1,x4,x5,x7,xg}得流感的概率相对较 区间参数时无法考虑区间内取值机会不等的问题, 高的患者对比可以发现,x是诱发患者患病的主要 而且能更加细致地描述各个参量,使决策结果更加 因素,但是悲观决策者认为不需要进一步的诊断。 符合实际应用。下一个阶段,将着重研究其他不确 而x,不是诱发患者患病的主要因素,但是对于取区 定环境下相应的扩展粗糙集模型的建立,如损失函
[17]中的区间决策粗糙集方法作对比,在测试数据 集上进行实验,根据文献[17]可得相对应的各个病 人的相关阈值,乐观和悲观决策者的决策结果,及当 L Î[0.5, 1],步长 0.1 时,随着 L 粒度的变化,与之 对应的乐观和悲观决策者的决策,结果如表 8 ~ 10 所示。 表 8 各个病人的相关阈值计算结果 Table 8 The associated threshold value of each patient's U 乐观决策者 α1 β1 γ1 悲观决策者 α1 β1 γ1 x1 0.500 0 0.250 0 0.400 0 0.500 0 0.250 0 0.333 3 x2 0.833 3 0.333 3 0.583 3 0.833 3 0.333 3 0.625 0 x3 0.285 7 0.500 0 0.333 3 0.285 7 0.500 0 0.470 3 x4 0.666 7 0.555 6 0.600 0 0.666 7 0.555 6 0.500 0 x5 0.566 7 0.800 0 0.554 5 0.566 7 0.800 0 0.600 0 x6 0.574 2 0.500 0 0.533 3 0.574 2 0.500 0 0.666 7 x7 0.855 6 0.666 7 0.611 1 0.855 6 0.666 7 0.400 0 x8 0.250 0 0.200 0 0.222 2 0.250 0 0.200 0 0.350 0 x9 0.872 9 0.750 0 0.636 3 0.872 9 0.750 0 0.571 4 x10 0.333 3 0.142 8 0.200 0 0.333 3 0.142 8 0.333 3 表 9 决策结果 Table 9 The decision results U 乐观决策者 悲观决策者 x1 POS(X) POS(X) x2 NEG(X) NEG(X) x3 POS(X) POS(X) x4 POS(X) POS(X) x5 BND(X) NEG(X) x6 NEG(X) NEG(X) x7 POS(X) POS(X) x8 POS(X) POS(X) x9 POS(X) POS(X) x10 NEG(X) NEG(X) 从表 9 可以看出,取区间值作为基础数据集时, 在乐观 决 策 者 看 来, { x1 , x3 , x4 , x7 , x8 , x9 } Î POS(X), {x2 , x6 , x10 }ÎNEG(X),{x5 }ÎBND(X)。 但在悲观决策者看来, { x1 , x3 , x4 , x7 , x8 , x9 } Î POS(X),{x2 , x5 , x6 , x10 } ÎNEG(X)。 通过与表 6 及集合 X = {x1 , x4 , x5 , x7 , x8 }得流感的概率相对较 高的患者对比可以发现,x5是诱发患者患病的主要 因素,但是悲观决策者认为不需要进一步的诊断。 而 x3不是诱发患者患病的主要因素,但是对于取区 间值的乐观决策者和悲观决策者来说,都需对它进 行进一步的诊断。 表 10 L 取不同的值所对应的决策结果 Table 10 The different decision results corresponding to L values L 乐观决策者 悲观决策者 POS(X) x1, x3, x4, x7, x8, x9 x1, x3, x4, x7, x8, x9 0.5 NEG(X) x2 , x6 , x10 x2 , x5 , x6 , x10 BND(X) x5 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9 0.6 NEG(X) x2 , x6 , x10 x2 , x3 , x6 , x10 BND(X) x3 POS(X) x1 , x4 , x7 , x8 , x9 x1 , x3 , x4 , x5 , x7 , x8 0.7 NEG(X) x2 , x6 , x10 x2 , x6 , x10 BND(X) x3 , x5 x9 POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7, x8, x9 0.8 NEG(X) x2 , x3 , x6 , x10 x2 , x3 , x6 , x10 BND(X) POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5,x7,x8, x9 0.9 NEG(X) x2 , x3 , x6 , x10 x2 , x3 , x6 , x10 BND(X) POS(X) x1, x4, x5, x7, x8, x9 x1, x4, x5, x7,x8, x9 1.0 NEG(X) x2 , x3 , x6 , x10 x2 , x3 , x6 , x10 BND(X) 从表 10 可以看出,当 L≥0.8 时,乐观和悲观决 策者的决策结果趋于稳定,其中 x9不是诱发患者患 病的主要因素,但是对于取区间值的乐观和悲观决 策者来说,都需对它进行进一步的诊断。 与采用三 角模糊数方法相比,采用区间值分析与实际经验值 会产生较大的误差。 4 结束语 本文基于 IIS,从决策粗糙集出发,利用三角模 糊数来设定损失函数,首先提出一种描述不完备信 息的相似关系。 然后,针对 IIS 中缺失值,借助三角 模糊数的运算法则,利用三角模糊数来获取损失函 数,构建出三角模糊数决策粗糙集的基础模型。 通 过实例可知,不同于区间数决策粗糙集的决策机制, 利用三角模糊数来获取损失函数,不仅能弥补使用 区间参数时无法考虑区间内取值机会不等的问题, 而且能更加细致地描述各个参量,使决策结果更加 符合实际应用。 下一个阶段,将着重研究其他不确 定环境下相应的扩展粗糙集模型的建立,如损失函 ·456· 智 能 系 统 学 报 第 11 卷
第4期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 .457. 数是随机数且服从正态分布等情况下的研究。 decision model[J].International journal of computational intelligence systems,2011,4(1):1-11. 参考文献: [11]衷锦仪,叶东毅.基于模糊数风险最小化的拓展决策粗 [1]王国胤.Rough集理论在不完备信息系统中的扩充[J]: 糙集模型[J].计算机科学,2014,41(3):50-54,75. 计算机研究与发展,2002,39(10):1238-1243. ZHONG Jinyi,YE Dongyi.Extended decision-theoretic WANG Guoyin.Extension of rough set under incomplete in- rough set models based on fuzzy minimum cost[J].Com- formation systems[J].Journal of computer research and de- puter science,2014,41(3):50-54. velopment,.2002,39(10):1238-1243. [12]LIU Dun,LI Huaxiong,ZHOU Xianzhong.Two decades' [2]GRZYMALA-BUSSE J W.On the unknown attribute values research on decision-theoretic rough sets[C]//Proceeding in learning from examples[C]//RAS Z W,ZEMANKOVA of the 9th IEEE International Conference on Cognitive Infor- matics.Beijing:IEEE,2010:968-973. M.Proceedings of the 6th International Symposium on Meth- [13]李华雄,刘盾,周献中.决策粗糙集模型研究综述[J] odologies for Intelligent Systems (ISMIS-91).Berlin,Hei- 重庆邮电大学学报:自然科学版,2010,22(5):624- delberg:Springer-Verlag,1991,542:368-377. 630. [3]KRYSZKIEWICZ M.Rough set approach to incomplete in- LI Huaxiong,LIU Dun,ZHOU Xianzhong.Rewiew on de- formation systems[J].Information sciences,1988,112(1/ cision-theoretic rough set model[J].Journal of Chongqing 2/3/4):39-49. university of posts and telecommunications:natural science [4]杨习贝,杨静宇,於东军,等.不完备信息系统中的可变 edition,2010.22(5):624-630. 精度分类粗糙集模型[J].系统工程理论与实践,2008, [14]李华雄,周献中,李天瑞,等.决策粗糙集理论及其研 28(5):116-121. 究进展[M].北京:科学出版社,2011. YANG Xibei,YANG Jingyu,YU Dongjun,et al.Rough set LI Huaxiong,ZHOU Xianzhong,LI Tianrui,et al.Deci- model based on variable parameter classification in incom- sion-theoretic rough sets theory and recent research[M]. plete information systems[J].Systems engineering-theory Beijing:Science Press,2011. practice,2008,28(5):116-121 [15]刘盾,姚一豫,李天瑞.三枝决策粗糙集[J].计算机科 [5]GRZYMALA-BUSSE J W,WANG A Y.Modified algorithms 学,2011,38(1):246-250. LEMI and LEM2 for rule induction from data with missing LIU Dun,YAO Yiyu,LI Tianrui.Three-way decision-theo- attribute values[C//Proceeding of the Fifth Intemational retic rough sets[J].Computer science,2011,38(1):246 Workshop on Rough Sets and Soft Computing (RSSC97)at -250. the Third Joint Conference on Information Sciences JCIS' [16]LIANG Decui,PEDRYCZ W,LIU Dun,et al.Three-way 97).Research Triangle Park,NC,1997:69-72. decisions based on decision-theoretic rough sets under lin- [6]STEFANOWSKI J,TSOUKIaS A.Incomplete information ta- guistic assessment with the aid of group decision making bles and rough classification[J].Computational intelligence, [J].Applied soft computing,2015,29:256-269. 2001.17(3):545-566. [17]刘盾,李天瑞,李华雄.区间决策粗糙集[].计算机科 [7]YAO YY,WONG S K M.A decision theoretic framework 学,2012,39(7):178-181.214. for approximating concepts[].International journal of man- LIU Dun,LI Tianrui,LI Huaxiong.Interval-valued deci- machine studies,1922.37(6):793-809. sion-theoretic rough sets[]].Computer science,2012,39 [8]贾修一,商琳,陈家骏.决策风险最小化属性约简[J]. (7):178-181,214. 计算机科学与探索,2011,5(2):155-160. [18]马兴斌,鞠恒荣,杨习贝,等.不完备信息系统中的多 JIA Xiuyi,SHANG Lin,CHEN Jiajun.Attribute reduction 重代价决策粗糙集[J].南京大学学报:自然科学版, based on minimum decision cost[].Journal of frontiers of 2015,51(2):335-342. computer science technology,2011,5(2):155-160. MA Xingbin,JU Hengrong,YANG Xibei,et al.Multi-cost [9]于洪,王国胤,姚一豫.决策粗糙集理论研究现状与展 based decision-theoretic rough sets in incomplete informa- 望[J].计算机学报,2015,38(8):1628-1639 tion systems[J.Journal of Nanjing university:natural sci- YU Hong,WANG Guoyin,YAO Yiyu.Current research and ences,2015,51(2):335-342. future perspectives on decision-theoretic rough sets[].Chi- [19]LIU Dun,LIANG Decui,WANG Changchun.A novel nese journal of computers,2015,38(8):1628-1639 three-way decision model based on incomplete information [10]LI Huaxiong,ZHOU Xianzhong.Risk decision making system[J].Knowledge-based systems,2016,91:32-45. based on decision-theoretic rough set:a three-way view [20]YAO YY,WONG S K M.A decision theoretic framework
数是随机数且服从正态分布等情况下的研究。 参考文献: [1]王国胤. Rough 集理论在不完备信息系统中的扩充[ J]. 计算机研究与发展, 2002, 39(10): 1238-1243. WANG Guoyin. Extension of rough set under incomplete in⁃ formation systems[J]. Journal of computer research and de⁃ velopment, 2002, 39(10): 1238-1243. [2]GRZYMALA⁃BUSSE J W. On the unknown attribute values in learning from examples[C] / / RAS Z W, ZEMANKOVA M. Proceedings of the 6th International Symposium on Meth⁃ odologies for Intelligent Systems ( ISMIS⁃91). Berlin, Hei⁃ delberg: Springer⁃Verlag, 1991, 542: 368-377. [3]KRYSZKIEWICZ M. Rough set approach to incomplete in⁃ formation systems[J]. Information sciences, 1988, 112(1 / 2 / 3 / 4): 39-49. [4]杨习贝, 杨静宇, 於东军, 等. 不完备信息系统中的可变 精度分类粗糙集模型[ J]. 系统工程理论与实践, 2008, 28(5): 116-121. YANG Xibei, YANG Jingyu, YU Dongjun, et al. Rough set model based on variable parameter classification in incom⁃ plete information systems[ J]. Systems engineering⁃theory & practice, 2008, 28(5): 116-121. [5]GRZYMALA⁃BUSSE J W, WANG A Y. Modified algorithms LEM1 and LEM2 for rule induction from data with missing attribute values [ C] / / Proceeding of the Fifth International Workshop on Rough Sets and Soft Computing (RSSC'97) at the Third Joint Conference on Information Sciences ( JCIS ' 97). Research Triangle Park, NC, 1997: 69-72. [6]STEFANOWSKI J, TSOUKIàS A. Incomplete information ta⁃ bles and rough classification[J]. Computational intelligence, 2001, 17(3): 545-566. [7]YAO Y Y, WONG S K M. A decision theoretic framework for approximating concepts[J]. International journal of man⁃ machine studies, 1922, 37(6): 793-809. [8]贾修一, 商琳, 陈家骏. 决策风险最小化属性约简[ J]. 计算机科学与探索, 2011, 5(2): 155-160. JIA Xiuyi, SHANG Lin, CHEN Jiajun. Attribute reduction based on minimum decision cost[ J]. Journal of frontiers of computer science & technology, 2011, 5(2): 155-160. [9]于洪, 王国胤, 姚一豫. 决策粗糙集理论研究现状与展 望[J]. 计算机学报, 2015, 38(8): 1628-1639. YU Hong, WANG Guoyin, YAO Yiyu. Current research and future perspectives on decision⁃theoretic rough sets[J]. Chi⁃ nese journal of computers, 2015, 38(8): 1628-1639. [ 10 ] LI Huaxiong, ZHOU Xianzhong. Risk decision making based on decision⁃theoretic rough set: a three⁃way view decision model[ J]. International journal of computational intelligence systems, 2011, 4(1): 1-11. [11]衷锦仪, 叶东毅. 基于模糊数风险最小化的拓展决策粗 糙集模型[J]. 计算机科学, 2014, 41(3): 50-54, 75. ZHONG Jinyi, YE Dongyi. Extended decision⁃theoretic rough set models based on fuzzy minimum cost[ J]. Com⁃ puter science, 2014, 41(3): 50-54. [12]LIU Dun, LI Huaxiong, ZHOU Xianzhong. Two decades’ research on decision⁃theoretic rough sets[C] / / Proceeding of the 9th IEEE International Conference on Cognitive Infor⁃ matics. Beijing: IEEE, 2010: 968-973. [13]李华雄, 刘盾, 周献中. 决策粗糙集模型研究综述[ J]. 重庆邮电大学学报: 自然科学版, 2010, 22(5): 624- 630. LI Huaxiong, LIU Dun, ZHOU Xianzhong. Rewiew on de⁃ cision⁃theoretic rough set model[ J]. Journal of Chongqing university of posts and telecommunications: natural science edition, 2010, 22(5): 624-630. [14]李华雄, 周献中, 李天瑞, 等. 决策粗糙集理论及其研 究进展[M]. 北京: 科学出版社, 2011. LI Huaxiong, ZHOU Xianzhong, LI Tianrui, et al. Deci⁃ sion⁃theoretic rough sets theory and recent research [ M]. Beijing: Science Press, 2011. [15]刘盾, 姚一豫, 李天瑞. 三枝决策粗糙集[J]. 计算机科 学, 2011, 38(1): 246-250. LIU Dun, YAO Yiyu, LI Tianrui. Three⁃way decision⁃theo⁃ retic rough sets[J]. Computer science, 2011, 38(1): 246 -250. [16]LIANG Decui, PEDRYCZ W, LIU Dun, et al. Three⁃way decisions based on decision⁃theoretic rough sets under lin⁃ guistic assessment with the aid of group decision making [J]. Applied soft computing, 2015, 29: 256-269. [17]刘盾, 李天瑞, 李华雄. 区间决策粗糙集[J]. 计算机科 学, 2012, 39(7): 178-181, 214. LIU Dun, LI Tianrui, LI Huaxiong. Interval⁃valued deci⁃ sion⁃theoretic rough sets[J]. Computer science, 2012, 39 (7): 178-181, 214. [18]马兴斌, 鞠恒荣, 杨习贝, 等. 不完备信息系统中的多 重代价决策粗糙集[ J]. 南京大学学报: 自然科学版, 2015, 51(2): 335-342. MA Xingbin, JU Hengrong, YANG Xibei, et al. Multi⁃cost based decision⁃theoretic rough sets in incomplete informa⁃ tion systems[J]. Journal of Nanjing university: natural sci⁃ ences, 2015, 51(2): 335-342. [19] LIU Dun, LIANG Decui, WANG Changchun. A novel three⁃way decision model based on incomplete information system[J]. Knowledge⁃based systems, 2016, 91: 32-45. [20]YAO Y Y, WONG S K M. A decision theoretic framework 第 4 期 李亚鸽,等:基于不完备信息系统的三角模糊数决策粗糙集 ·457·
.458. 智能系统学报 第11卷 for approximating concepts[J].International journal of [27]YAO Yiyu.The superiority of three-way decisions in proba- man-machine studies,1992,37(6):793-809 bilistic rough set models[J].Information sciences,2011, [21]YAO Yiyu.Decision-theoretic rough set models[M]//YAO 181(6):1080-1096. Jingtao,LINGRAS P,WU Weizhi,et al.Rough Sets and 作者简介: Knowledge Technology.Berlin Heidelberg:Springer, 李亚鸽,女,1990年生,硕士研究 2007,4481:1-12. 生,主要研究方向为粗糙集、粒计算、三 [22]唐国春.模糊排序中的面积模糊度[J].上海第二工业 支决策。 大学学报,1999,16(2):48-55. TANG Guochun.The area degree of fuzziness in fuzzy scheduling[J].Journal of Shanghai second polytechnic uni- versity,1999,16(2):48-55. [23]KRYSZKIEWICZ M.Rough set approach to incomplete in- 杨宏志,男,1962年生,教授,博士, formation systems[]]Information sciences,1998,112(1/ 主要研究方向为粗糙集、概念格、粒计 2/3/4):39-49. 算。杨宏志教授长期从事应用数学的 [24]KAUFMAN A,GUPTA MM.Introduction to fuzzy arithme- 教学与研究工作,先后发表学术论文30 tic:theory and application[M].New York:Van Nostrand 余篇,出版著作2部,承担并完成省级项 Reinhold,1985. 目8项。 [25]陈圣兵,李龙澍,纪霞,等.不完备信息系统中基于集 对相似度的粗集模型[J].计算机科学,2010,37(7): 186-190. 徐久成,男,1964年生,教授,博士 CHEN Shengbing,LI Longshu,JI Xia,et al.Extension of 生导师,主要研究方向为数据挖掘、粒 rough set model based on SPA similarity degree in incom- 计算与知识获取、生物信息学等。发表 plete information systems[J].Computer science,2010,37 学术论文100余篇,其中被SCI收录14 (7):186-190. 篇,被I收录30余篇:出版专著1部, [26]KUMAR A,SINGH P,KAUR A,et al.A new approach 主编国家“十一.五”、“十二五”规划统编教材3部。获河南 for ranking of L-R type generalized fuzzy numbers[J].Ex- 省自然科学优秀学术论文一等奖3项、河南省高等教育省级 pert systems with applications,2011,38(9):10906- 教学成果一等奖2项,河南省教育厅科技成果一等奖1项。 10910
for approximating concepts [ J ]. International journal of man⁃machine studies, 1992, 37(6): 793-809. [21]YAO Yiyu. Decision⁃theoretic rough set models[M] / / YAO Jingtao, LINGRAS P, WU Weizhi, et al. Rough Sets and Knowledge Technology. Berlin Heidelberg: Springer, 2007, 4481: 1-12. [22]唐国春. 模糊排序中的面积模糊度[ J]. 上海第二工业 大学学报, 1999, 16(2): 48-55. TANG Guochun. The area degree of fuzziness in fuzzy scheduling[J]. Journal of Shanghai second polytechnic uni⁃ versity, 1999, 16(2): 48-55. [23]KRYSZKIEWICZ M. Rough set approach to incomplete in⁃ formation systems[J]. Information sciences, 1998, 112(1 / 2 / 3 / 4): 39-49. [24]KAUFMAN A, GUPTA M M. Introduction to fuzzy arithme⁃ tic: theory and application[M]. New York: Van Nostrand Reinhold, 1985. [25]陈圣兵, 李龙澍, 纪霞, 等. 不完备信息系统中基于集 对相似度的粗集模型[ J]. 计算机科学, 2010, 37(7): 186-190. CHEN Shengbing, LI Longshu, JI Xia, et al. Extension of rough set model based on SPA similarity degree in incom⁃ plete information systems[J]. Computer science, 2010, 37 (7): 186-190. [26]KUMAR A, SINGH P, KAUR A, et al. A new approach for ranking of L⁃R type generalized fuzzy numbers[ J]. Ex⁃ pert systems with applications, 2011, 38 ( 9): 10906 - 10910. [27]YAO Yiyu. The superiority of three⁃way decisions in proba⁃ bilistic rough set models[ J]. Information sciences, 2011, 181(6): 1080-1096. 作者简介: 李亚鸽,女, 1990 年生, 硕士研究 生,主要研究方向为粗糙集、粒计算、三 支决策。 杨宏志,男,1962 年生,教授,博士, 主要研究方向为粗糙集、概念格、粒计 算。 杨宏志教授长期从事应用数学的 教学与研究工作,先后发表学术论文 30 余篇,出版著作 2 部,承担并完成省级项 目 8 项。 徐久成,男,1964 年生,教授,博士 生导师,主要研究方向为数据挖掘、粒 计算与知识获取、生物信息学等。 发表 学术论文 100 余篇,其中被 SCI 收录 14 篇,被 EI 收录 30 余篇;出版专著 1 部, 主编国家“十一.五”、“十二.五”规划统编教材 3 部。 获河南 省自然科学优秀学术论文一等奖 3 项、河南省高等教育省级 教学成果一等奖 2 项,河南省教育厅科技成果一等奖 1 项。 ·458· 智 能 系 统 学 报 第 11 卷