第9卷第2期 智能系统学报 Vol.9 No.2 2014年4月 CAAI Transactions on Intelligent Systems Apr.2014 D0I:10.3969/j.issn.1673-4785.201307012 网络出版地址:http://www.cmki.net/kcms/doi/CNKI:23-1538/TP.20131105.1201.003.html α优势关系下粗糙集模型的属性约简 韦碧鹏12,吕跃进2,李金海3 (1.柳州职业技术学院公共基础部,广西柳州545006:2.广西大学数学与信息科学学院,广西南宁530004;3.昆明 理工大学理学院,云南昆明650500) 摘要:不完备序信息系统中现有优势关系存在一些不足,提出了α优势关系的概念:然后在α优势关系的粗糙集 模型上,构造了不完备序信息系统以及序决策系统的优势区分矩阵和优势决策区分矩阵。在此基础上设计出了不 完备序信息系统以及序决策系统的属性约简算法。此外,对比分析表明了α《优势关系既具备了现有优势关系的优 点,克服了它们的缺点。实例分析验证了所提出方法的有效性。 关键词:粗糙集理论:不完备序信息系统:不完备序决策系统:α《优势关系:属性约简 中图分类号:TP18文献标志码:A文章编号:1673-4785(2014)02-0251-08 中文引用格式:韦碧鹏,吕跃进,李金海.a优势关系下粗糙集模型的属性约简[J].智能系统学报,2014,9(2):251-258。 英文引用格式:WEI Bipeng,L0 Yuejin,I Jinhai..Attribute reduction based on the rough set model under a dominance relation [J].CAAI Transactions on Intelligent Systems,2014,9(2):251-258. Attribute reduction based on the rough set model under o dominance relation WEI Bipeng'2,LU Yuejin2,LI Jinhai (1.Public Infrastructure Department,Liuzhou Vocational and Technical College,Liuzhou 545006,China;2.School of Mathematics and Information Science,Guangxi University,Nanning 530004,China;3.Faculty of Science,Kunming University of Science and Technology,Kunming 650500,China) Abstract:Through the analysis of the existing dominance relations in incomplete ordered information systems,the concept of I a dominance relation is presented.Based on the rough set model under the dominance relation,the notion of a dominance discernibility matrix of an incomplete ordered information system is proposed as well as that of a dominance decision discernibility matrix of an incomplete ordered decision system,and then the attribute re- duction algorithms are developed in these two types of databases.Compared with the existing dominance relations, the proposed dominance relation not only has distinct advantages,but it also avoids the others'shortcomings.Final- ly,a real example was used to demonstrate the effectiveness of the presented algorithms. Keywords:rough set theory;incomplete ordered information system;incomplete ordered decision system;a domi- nance relation;attribute reduction 波兰数学家Pawlak于1982年提出了粗糙集理 成功地运用于数据挖掘、模式识别、数据处理、决策 论),它是一种处理模糊、不精确性以及不确定性 分析等领域24。然而,在现实生活中,由于噪声、 的数学工具。近年来,由于它具有诸多优势,已经被 测量数据的不完整性等因素,不完备信息系统依然 广泛存在。而Pawlak提出的经典粗糙集并不适用 收稿日期:2013-07-05.网络出版日期:2013-11-05. 基金项目:国家自然科学基金资助项目(61305057,71361002):广西 不完备信息系统。这就有必要对它进行扩充以适用 自然科学基金资助项目(2013 GXNSFAA019016):2014年 度广西高校科研一般项目资助项目(YB2014501). 于处理不完备数据。目前,针对不完备信息系统缺 通信作者:李金海.E-mail:jhlixjtu(@163.com 失值的不同理解,对经典粗糙集的扩充研究有如下
第 9 卷第 2 期 智 能 系 统 学 报 Vol.9 №.2 2014 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2014 DOI:10.3969 / j.issn.1673⁃4785.201307012 网络出版地址:http: / / www.cnki.net / kcms/ doi / CNKI:23⁃1538 / TP.20131105.1201.003.html α 优势关系下粗糙集模型的属性约简 韦碧鹏1,2 ,吕跃进2 ,李金海3 (1.柳州职业技术学院 公共基础部,广西 柳州 545006; 2. 广西大学 数学与信息科学学院,广西 南宁 530004; 3.昆明 理工大学 理学院,云南 昆明 650500) 摘 要:不完备序信息系统中现有优势关系存在一些不足,提出了 α 优势关系的概念;然后在 α 优势关系的粗糙集 模型上,构造了不完备序信息系统以及序决策系统的优势区分矩阵和优势决策区分矩阵。 在此基础上设计出了不 完备序信息系统以及序决策系统的属性约简算法。 此外,对比分析表明了 α 优势关系既具备了现有优势关系的优 点,克服了它们的缺点。 实例分析验证了所提出方法的有效性。 关键词:粗糙集理论;不完备序信息系统;不完备序决策系统; α 优势关系;属性约简 中图分类号: TP18 文献标志码:A 文章编号:1673⁃4785(2014)02⁃0251⁃08 中文引用格式:韦碧鹏, 吕跃进,李金海. α 优势关系下粗糙集模型的属性约简[J]. 智能系统学报, 2014, 9(2): 251⁃258. 英文引用格式:WEI Bipeng, LÜ Yuejin, LI Jinhai. Attribute reduction based on the rough set model under α dominance relation [J]. CAAI Transactions on Intelligent Systems, 2014, 9(2): 251⁃258. Attribute reduction based on the rough set model under α dominance relation WEI Bipeng 1,2 , LÜ Yuejin 2 , LI Jinhai 3 (1. Public Infrastructure Department, Liuzhou Vocational and Technical College, Liuzhou 545006, China; 2. School of Mathematics and Information Science, Guangxi University, Nanning 530004, China; 3. Faculty of Science, Kunming University of Science and Technology, Kunming 650500, China) Abstract:Through the analysis of the existing dominance relations in incomplete ordered information systems, the concept of 了 α dominance relation is presented. Based on the rough set model under the dominance relation, the notion of a dominance discernibility matrix of an incomplete ordered information system is proposed as well as that of a dominance decision discernibility matrix of an incomplete ordered decision system, and then the attribute re⁃ duction algorithms are developed in these two types of databases. Compared with the existing dominance relations, the proposed dominance relation not only has distinct advantages, but it also avoids the others’ shortcomings. Final⁃ ly, a real example was used to demonstrate the effectiveness of the presented algorithms. Keywords:rough set theory; incomplete ordered information system; incomplete ordered decision system; α domi⁃ nance relation; attribute reduction 收稿日期:2013⁃07⁃05. 网络出版日期:2013⁃11⁃05. 基金项目:国家自然科学基金资助项目(61305057, 71361002);广西 自然科学基金资助项目( 2013GXNSFAA019016);2014 年 度广西高校科研一般项目资助项目(YB2014501). 通信作者:李金海. E⁃mail:jhlixjtu@ 163.com. 波兰数学家 Pawlak 于 1982 年提出了粗糙集理 论[1] ,它是一种处理模糊、不精确性以及不确定性 的数学工具。 近年来,由于它具有诸多优势,已经被 成功地运用于数据挖掘、模式识别、数据处理、决策 分析等领域[2⁃4] 。 然而,在现实生活中,由于噪声、 测量数据的不完整性等因素,不完备信息系统依然 广泛存在。 而 Pawlak 提出的经典粗糙集并不适用 不完备信息系统。 这就有必要对它进行扩充以适用 于处理不完备数据。 目前,针对不完备信息系统缺 失值的不同理解,对经典粗糙集的扩充研究有如下
.252 智能系统学报 第9卷 模型:Kryszkiewicz!)提出了基于容差关系的粗糙集 实中的数据集。此外,基于α优势关系的粗糙集模 模型,把不完备信息系统中的缺失值看作是遗漏型 型,给出了不完备序信息系统和序决策系统的区分 的,即可以和任意的对象进行比较:Stefanowski等[o) 矩阵属性约简算法,并表明了其区分矩阵只能运用 提出了基于非对称相似关系和量化容差关系的粗糙 属性集的幂集进行构造,而不能简单地运用单属性 集模型,把不完备信息系统中的缺失值看作是缺席 集进行构造。 型的:为了克服扩展模型的不足,王国胤[]又给出 1 了基于限制容差关系的粗糙集模型。这方面的更多 基本概念 研究,可以查看文献[8-10]。 四元组IS=(U,AT,V,f),其中U是非空有限 在现实世界中,很多的信息系统其属性值域可 的对象集合,AT是非空有限的属性集合,AT为条 能具有偏序性。此时,经典粗糙集方法显得无能为 件属性集,V=UV。,且V。是属性a的值域,满足 力。为了能够处理具有偏序关系的信息系统,Greco f:U×a→Vn(Hx∈U,a∈AT),称四元组1S为一 等提出了基于优势关系的粗糙集模型,即运用优 个信息系统。 势关系代替等价关系。为了让优势关系下的粗糙集 若存在一个属性a∈AT使得V,为空值(记作: 模型能够同时处理缺失值,Shao等[]把不完备序信 f(x,α)=*),则称该信息系统是不完备的信息系 息系统中的缺失值看作是遗漏型的,提出了基于优 统,记作:S;否则称为完备的信息系统。 势关系的不完备序信息系统,并讨论了属性约简和 定义1)设S=(U,AT,V,)是一个完备信 规则提取。针对文献[12]提出的优势关系过于宽 息系统,对于A≤AT,Hx,y∈U,有: 松,容易将实际不满足条件的对象误判为同一个优 R={(x,y)eU×Ulfx,a)≥fy,a),Ha∈A 势类,胡明礼等)通过引入一个阈值得到了广义扩 则称R为信息系统下的优势关系,满足这种关系 展优势关系的概念,并对规则提取进行了重新考虑。 的完备信息系统称之为序信息系统,记作:OIS。 此外,针对优势系统中缺失值是缺席型的情况,杨习 记:[x]={y∈U川(y,x)eR}={y∈U川 贝等4)提出了相似优势关系的粗糙集模型,并对属 fy,a)≥f(x,a),a∈A} 性约简做了研究。然而这并没有弥补文献[12]提 为对象x在序信息系统中的优势类,且 出的优势关系过于宽松的缺陷,并且改进后的模型 U/R={[x]Ix∈U}。 还容易将一些本属于同一决策类的对象误判为不同 定义2设S=(U,AT,V,)是一个不完备 决策类。这在一定程度上会影响文献[12]提出的 信息系统,对于A二AT,Hx,y∈U,有 模型决策分析的效果。因此,Lo等[s进一步又给 R≥={(x,y)eU×U川Ha∈Afx,a)≥ 出了限制优势粗糙集模型,既可以避免文献[12]提 f(y,a)Vf(x,a)=*Vf(y,a)=* 出的优势关系过于宽松的现象,又不容易将一些本 则称R≥是不完备信息系统上的一个优势关系,满 属于同一决策类的对象误判为不同的决策类。但文 足具有优势关系的不完备信息系统称之为不完备序 献[15]提出的限制优势关系在某些情况下又显得 信息系统,记作:IOIS。 过于严格,例如:当2个对象在各属性下的取值为 通过R:的定义,显然可以看出,在条件属性 x=(4,3,2,1),y=(*,*,2,1)时,且各属性值域 集A下,对象x优于对象y。 的最大值均为4,那么根据文献[15]提出的限制优 记:[y]≥={x∈U1(x,y)∈R},则 势关系,对象x是不优于对象y的:可现实生活中, [y]:≥描述的是:论域中的对象在条件属性A下,优 对象x优于对象y的可能性是非常大的,这有可能 于或者等于对象y的集合,简称为对象y的优势类。 导致数据集中的决策规则没有充分提取。 因此,U/R:≥中所有的优势类构成了论域U的覆 基于此,本文在分析不完备序信息系统中现有 盖,而不是论域U的划分,即UU/R≥=U。 的几种扩展粗糙集模型的基础上,提出了基于α优 定义3)设10IS=(U,AT,V,)是一个不完 势关系的粗糙集模型,它既吸收了其他扩展模型的 备序信息系统,HXCU,ACAT,对象集合X在优 优点,又能有效克服它们的局限性,更有利于处理现 势关系R:≥下关于属性集A二AT的上下近似集为
模型:Kryszkiewicz [5]提出了基于容差关系的粗糙集 模型,把不完备信息系统中的缺失值看作是遗漏型 的,即可以和任意的对象进行比较;Stefanowski 等[6] 提出了基于非对称相似关系和量化容差关系的粗糙 集模型,把不完备信息系统中的缺失值看作是缺席 型的;为了克服扩展模型的不足,王国胤[7] 又给出 了基于限制容差关系的粗糙集模型。 这方面的更多 研究,可以查看文献[8⁃10]。 在现实世界中,很多的信息系统其属性值域可 能具有偏序性。 此时,经典粗糙集方法显得无能为 力。 为了能够处理具有偏序关系的信息系统,Greco 等[11]提出了基于优势关系的粗糙集模型,即运用优 势关系代替等价关系。 为了让优势关系下的粗糙集 模型能够同时处理缺失值,Shao 等[12]把不完备序信 息系统中的缺失值看作是遗漏型的,提出了基于优 势关系的不完备序信息系统,并讨论了属性约简和 规则提取。 针对文献[12]提出的优势关系过于宽 松,容易将实际不满足条件的对象误判为同一个优 势类,胡明礼等[13]通过引入一个阈值得到了广义扩 展优势关系的概念,并对规则提取进行了重新考虑。 此外,针对优势系统中缺失值是缺席型的情况,杨习 贝等[14]提出了相似优势关系的粗糙集模型,并对属 性约简做了研究。 然而这并没有弥补文献[12] 提 出的优势关系过于宽松的缺陷,并且改进后的模型 还容易将一些本属于同一决策类的对象误判为不同 决策类。 这在一定程度上会影响文献[12] 提出的 模型决策分析的效果。 因此,Luo 等[15] 进一步又给 出了限制优势粗糙集模型,既可以避免文献[12]提 出的优势关系过于宽松的现象,又不容易将一些本 属于同一决策类的对象误判为不同的决策类。 但文 献[15]提出的限制优势关系在某些情况下又显得 过于严格,例如:当 2 个对象在各属性下的取值为 x =(4,3,2,1),y = (∗,∗,2,1) 时,且各属性值域 的最大值均为 4,那么根据文献[15]提出的限制优 势关系,对象 x 是不优于对象 y 的;可现实生活中, 对象 x 优于对象 y 的可能性是非常大的,这有可能 导致数据集中的决策规则没有充分提取。 基于此,本文在分析不完备序信息系统中现有 的几种扩展粗糙集模型的基础上,提出了基于 α 优 势关系的粗糙集模型,它既吸收了其他扩展模型的 优点,又能有效克服它们的局限性,更有利于处理现 实中的数据集。 此外,基于 α 优势关系的粗糙集模 型,给出了不完备序信息系统和序决策系统的区分 矩阵属性约简算法,并表明了其区分矩阵只能运用 属性集的幂集进行构造,而不能简单地运用单属性 集进行构造。 1 基本概念 四元组 IS = (U,AT,V,f), 其中 U 是非空有限 的对象集合, AT 是非空有限的属性集合, AT 为条 件属性集, V = ∪a∈AT Va , 且 Va 是属性 a 的值域,满足 f a :U ×a→Va ( ∀x∈U,a∈AT), 称四元组 IS 为一 个信息系统。 若存在一个属性 a ∈ AT 使得 Va 为空值(记作: f(x,a) = ∗ ),则称该信息系统是不完备的信息系 统,记作: IIS ;否则称为完备的信息系统。 定义 1 [11] 设 IS = (U,AT,V,f) 是一个完备信 息系统,对于 ∀A ⊆ AT, ∀x,y ∈ U, 有: R ≥ A = {(x,y) ∈U × U | f(x,a) ≥f(y,a),∀a ∈A} 则称 R ≥ A 为信息系统下的优势关系,满足这种关系 的完备信息系统称之为序信息系统,记作: OIS 。 记: [x] ≥ A = {y ∈ U | (y,x) ∈ R ≥ A } = {y ∈ U | f(y,a) ≥ f(x,a),∀a ∈ A} 为对 象 x 在 序 信 息 系 统 中 的 优 势 类, 且 U/ R ≥ A ={[x] ≥ A | x ∈ U} 。 定义 2 [12] 设 IIS = (U,AT,V,f) 是一个不完备 信息系统,对于 A ⊆ AT, ∀x,y ∈ U, 有 R ∗≥ A = {(x,y) ∈ U × U | ∀a ∈ A,f(x,a) ≥ f(y,a) ∨ f(x,a) = ∗ ∨ f(y,a) = ∗} 则称 R ∗≥ A 是不完备信息系统上的一个优势关系,满 足具有优势关系的不完备信息系统称之为不完备序 信息系统,记作: IOIS 。 通过 R ∗≥ A 的定义,显然可以看出,在条件属性 集 A 下,对象 x 优于对象 y 。 记: [y] ∗≥ A = {x ∈ U | (x,y) ∈ R ∗≥ A }, 则 [y] ∗≥ A 描述的是:论域中的对象在条件属性 A 下,优 于或者等于对象 y 的集合,简称为对象 y 的优势类。 因此, U/ R ∗≥ A 中所有的优势类构成了论域 U 的覆 盖,而不是论域 U 的划分,即 ∪ U/ R ∗≥ A = U 。 定义 3 [12] 设 IOIS = (U,AT,V,f) 是一个不完 备序信息系统, ∀X ⊆ U, A ⊆ AT, 对象集合 X 在优 势关系 R ∗≥ A 下关于属性集 A ⊆ AT 的上下近似集为 ·252· 智 能 系 统 学 报 第 9 卷
第2期 韦碧鹏,等:α优势关系下粗糙集模型的属性约简 ·253· R(X)={x∈UI[x]:Cx ER。然而,事实上,(x,y)∈R的可能性是 非常大。这说明文献[15]提出的限制优势关系划 R(X)={x∈UI[x]:nX≠⑦} 分的粒度过细,容易把一些本该属于优势类的对象 通过分析定义2,可以得出文献[12]在不完备 误判为不是优势类的对象,这样容易导致提取决策 序信息系统中提出的优势关系是以空值可以等于任 规则的不完全性。基于此,在不完备序信息系统中, 意值为假设前提的,即认为空值可以优于任意值,同 有必要提出一种相对于文献[12]提出的优势关系 时又认为任意值可以优于空值,这显然不符合实际 以及文献[15]提出的限制优势关系更加灵活的优 情况。例如:当x=(1,1,*),y=(1,1,4),z= (*,*,4)时,其中“4”表示属性值下最大的取值, 势关系。 “1”为属性值下最小的取值。根据定义2进行分析 2α优势关系的粗糙集模型 可得:(x,y)∈R,(x,z)∈R,(y,x)∈RA, (y,z)∈Ri,(z,x)∈Ri,(z,y)∈R≥成立。 设1OIS=(U,AT,Vf)是一个不完备序信息系 然而事实上,缺失值*优于属性值4以及属性值1 统,对于Va CAT,Hx,y∈U,对象在属性a下的取 优于缺失值*的可能性是非常之小,但是属性值4 值为V。={a1,a2,,anm{,并且a1<a2<…<am, 优于缺失值*以及缺失值*优于属性值1必然成 根据Vn的排序,令a1=1,a2=2…,am=m,则对象 立。因此,(x,y)∈R:≥,(x,z)∈R≥,(y,z)∈ 在属性a下的取值转变为V。={1,2,…,m},其中 R≥成立的可能性是非常之小。这说明文献[12] '(x)为对象x在V。中转化的值。 提出的优势关系的划分粒度过大,容易把不属于优 定义6设10IS=(U,AT,V,f)是一个不完备 势类的对象归结到优势类中。针对文献[12]提出 序信息系统,对于Va CAT,Hx,y∈U,对象在属 的不完备序信息系统粗糙集模型的缺陷,文献[15] 性a下的取值为V。={a1,a2,,an},并且a1<a2 提出了基于限制优势关系的粗糙集模型。 <·<am,则对象x在属性集a下优于y的概率为 定义4]设101S=(U,AT,V)是一个不完 1,fx,a)≥f(y,a) 备序信息系统,对于ACAT,Hx,y∈U,对象在属 V(x) f(x,a)≠*八f(y,a)=* 性集A下的限制优势关系为 m Ri={(x,y)∈U|Ha∈A.f(x,a)≥ R.(x,y)= m-V(y)+1 fx,a)=*八fy,a)≠* fy,a)V(f(x,a)=max'。∧f(y,a)= m *V(f(x,a)=*Af(y,a)=minv)UI f八x,a)=*Af(y,a)=* 其中maxV。={v∈Va1veVa,v≥v}, m minV。={v∈V.I,v∈V.,≤v},Iu是一个确定 o.f(x,a)f(y,a) 从定义6中得知,在单属性下,2个对象优于的 关系,1u={(x,x)1xeU}。因此,[y]2={x∈ 程度在0和1之间。当对象x在属性a下取值完全 U1(x,y)∈R≥} 小于对象y的取值时,用数值0来表示对象x劣于 定义5s]设10S=(U,AT,V,)是一个不完 对象y的程度,即概率:当对象x在属性a下取值完 备序信息系统,HXCU,ACAT,对象集合X在优 全大于对象y的取值时,用数值1来表示对象x优 势关系R下关于属性集A二AT的上下近似集为 于对象y的程度。然而,当对象x和对象y有一个 RA(X)={x∈U1[x]∈X} 缺失值时,且对象在属性下取值的多样性,使得很难 Re(X)={x∈UI[x]enX≠⑦ 确定2个对象的优于程度:根据概率的含义,即在m 通过分析定义4提出的限制优势关系,可以得 个数中,有n个数优于一个确定数值的概率为n/m, 出文献[15]提出的限制优势关系过于严格,划分的 得出定义6,2个对象中有一个为缺失值时它们的优 粒度过细。例如:当x=(4,3,2,1),y=(*,*,2, 于程度。当2个对象都为缺失值时,没有根据可以 1)时,其中“4”表示属性值下最大的取值,“1”为属 判别它们之间优于程度,因此,运用1/m概率来表 性值下最小的取值。根据定义4分析可得:(x,y) 示,意味着优于程度很小
R - ∗≥ A (X) = {x ∈ U | [x] ∗≥ A ⊆ X} R - ∗≥ A (X) = {x ∈ U | [x] ∗≥ A ∩ X ≠ ⌀} 通过分析定义 2,可以得出文献[12]在不完备 序信息系统中提出的优势关系是以空值可以等于任 意值为假设前提的,即认为空值可以优于任意值,同 时又认为任意值可以优于空值,这显然不符合实际 情况。 例如:当 x = (1,1,∗), y = (1,1,4), z = (∗,∗,4) 时,其中“4”表示属性值下最大的取值, “1”为属性值下最小的取值。 根据定义 2 进行分析 可得: (x,y) ∈ R ∗≥ A , (x,z) ∈ R ∗≥ A ,(y,x) ∈ R ∗≥ A , (y,z) ∈ R ∗≥ A ,(z,x) ∈ R ∗≥ A , (z,y) ∈ R ∗≥ A 成立。 然而事实上,缺失值 ∗ 优于属性值 4 以及属性值 1 优于缺失值 ∗ 的可能性是非常之小,但是属性值 4 优于缺失值 ∗ 以及缺失值 ∗ 优于属性值 1 必然成 立。 因此, (x,y) ∈ R ∗≥ A , (x,z) ∈ R ∗≥ A , (y,z) ∈ R ∗≥ A 成立的可能性是非常之小。 这说明文献[12] 提出的优势关系的划分粒度过大,容易把不属于优 势类的对象归结到优势类中。 针对文献[12] 提出 的不完备序信息系统粗糙集模型的缺陷,文献[15] 提出了基于限制优势关系的粗糙集模型。 定义 4 [15] 设 IOIS = (U,AT,V,f) 是一个不完 备序信息系统,对于 A ⊆ AT, ∀x,y ∈ U, 对象在属 性集 A 下的限制优势关系为 R ∗ A L≥ = {(x,y) ∈ U 2 | ∀a ∈ A,f(x,a) ≥ f(y,a) ∨ (f(x,a) = maxVa ∧ f(y,a) = ∗) ∨ (f(x,a) = ∗ ∧ f(y,a) = minVa )} ∪ IU 其中 maxVa = {v ∈ Va | ∀v ' ∈ Va ,v ≥ v ' }, minVa = {v ∈ Va | ,∀v ' ∈ Va ,v ≤ v ' }, IU 是一个确定 关系, IU = {(x,x) | x ∈ U} 。 因此, [y] ∗L≥ A = {x ∈ U | (x,y) ∈ R ∗L≥ A } 定义 5 [15] 设 IOIS = (U,AT,V,f) 是一个不完 备序信息系统, ∀X ⊆ U, A ⊆ AT, 对象集合 X 在优 势关系 R ∗L≥ A 下关于属性集 A ⊆ AT 的上下近似集为 R - ∗L≥ A (X) = {x ∈ U | [x] ∗L≥ A ⊆ X} R - ∗L≥ A (X) = {x ∈ U | [x] ∗L≥ A ∩ X ≠ ⌀} 通过分析定义 4 提出的限制优势关系,可以得 出文献[15]提出的限制优势关系过于严格,划分的 粒度过细。 例如:当 x = (4,3,2,1),y = (∗,∗,2, 1) 时,其中“4”表示属性值下最大的取值,“1”为属 性值下最小的取值。 根据定义 4 分析可得: (x,y) ∉ R ∗L≥ A 。 然而,事实上, (x,y) ∈ R ∗L≥ A 的可能性是 非常大。 这说明文献[15]提出的限制优势关系划 分的粒度过细,容易把一些本该属于优势类的对象 误判为不是优势类的对象,这样容易导致提取决策 规则的不完全性。 基于此,在不完备序信息系统中, 有必要提出一种相对于文献[12]提出的优势关系 以及文献[15]提出的限制优势关系更加灵活的优 势关系。 2 α 优势关系的粗糙集模型 设 IOIS = (U,AT,V,f) 是一个不完备序信息系 统,对于 ∀a ⊆ AT, ∀x,y ∈ U, 对象在属性 a 下的取 值为 Va = {a1 ,a2 ,....,am}, 并且 a1 < a2 < ... < am, 根据 Va 的排序,令 a1 = 1,a2 = 2,...,am = m, 则对象 在属性 a 下的取值转变为 V ' a = {1,2,....,m}, 其中 V ' a(x) 为对象 x 在 V ' a 中转化的值。 定义 6 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于 ∀a ⊆ AT, ∀x,y ∈ U, 对象在属 性 a 下的取值为 Va = {a1 ,a2 ,...,am }, 并且 a1 < a2 < ... < am , 则对象 x 在属性集 a 下优于 y 的概率为 Ra(x,y) = 1,f(x,a) ≥ f(y,a) V ' a(x) m ,f(x,a) ≠ ∗ ∧ f(y,a) = ∗ m - V ' a(y) + 1 m ,f(x,a) = ∗∧f(y,a) ≠∗ 1 m ,f(x,a) = ∗ ∧ f(y,a) = ∗ 0,f(x,a) < f(y,a) ì î í ï ï ï ï ï ï ï ï ï ï ï ï 从定义 6 中得知,在单属性下,2 个对象优于的 程度在 0 和 1 之间。 当对象 x 在属性 a 下取值完全 小于对象 y 的取值时,用数值 0 来表示对象 x 劣于 对象 y 的程度,即概率;当对象 x 在属性 a 下取值完 全大于对象 y 的取值时,用数值 1 来表示对象 x 优 于对象 y 的程度。 然而,当对象 x 和对象 y 有一个 缺失值时,且对象在属性下取值的多样性,使得很难 确定 2 个对象的优于程度;根据概率的含义,即在 m 个数中,有 n 个数优于一个确定数值的概率为 n / m, 得出定义 6,2 个对象中有一个为缺失值时它们的优 于程度。 当 2 个对象都为缺失值时,没有根据可以 判别它们之间优于程度,因此,运用 1 / m 概率来表 示,意味着优于程度很小。 第 2 期 韦碧鹏,等: α 优势关系下粗糙集模型的属性约简 ·253·
·254· 智能系统学报 第9卷 定义7设I0IS=(U,AT,V,)是一个不完备 R:除(X)={x∈U1[x]i≥∩X≠☑}= 序信息系统,对于A二AT,Hx,y∈U,则对象x在 U{[x]31x∈X 属性集A下优于y的概率为 可以看出,R(X)是确定属于X的一些对象 R,(x,y)=ΠR(x,y) a巴A 集,然而(X)是可能属于X的一些对象集。 通过定义7,可以得出不完备序信息系统各个 定理1设I0S=(U,AT,V,)是一个不完备 对象的优势类如下: 序信息系统,对于属性集HA二AT,对象集H 定义8设I01S=(U,AT,V,f)是一个不完备 XSU,则可以得出R:(X)CR(X)S 序信息系统,对于A二AT,Hx,y∈U,有 Ri(X),Ri(X)Ri(X)Ri(X) R={(x,y)∈U×U1R4(x,y)≥a 证明由性质2可得,VA C AT,Hx∈U, 则称R≥是不完备序信息系统上的一个α优势关 [x]≤[x]C[x],结合三者关系上下近似 系,其中00时,RX=R产X, 势类。由于U/Ra表示所有与优势关系族R≥相 RX=RiX;当a=1时,RAX=RX, 关的知识,记作U/Ra≥={[x]≥Ix∈U,则 R:≥X=R≥X。从而又可以验证了基于α优势关 U/R中的任何一个元素都是属于α优势类。从而 系的粗糙集模型是文献[12]提出的优势关系粗糙 可以得知U/R:≥中所有的α优势类构成了U中的覆 集模型和文献[15]提出的限制优势关系粗糙集模 盖,而不是U中的划分,即UU/Ra≥=U。 型的一种扩展形式:因此,本文提出的α优势关系的 根据定义8,结合定义2和定义4的概念,显然 粗糙集模型更具有灵活性,更加符合实际情况,更有 可以得出:当a>0时,Ra≥=R≥;当a=1时, 利于去处理现实中存在的不完备序信息系统。 R≥=R。因此,在不完备序信息系统中,本文 3 基于α优势关系粗糙集模型的属 提出的α优势关系是文献[12]提出的优势关系和 性约简 文献[15]提出的限制优势关系的一种扩展形式。 3.1不完备序信息系统的属性约简 性质1设101S=(U,AT,V,f)是一个不完备 定义10设10IS=(U,AT,Vf)是一个不完备 序信息系统,则α优势关系满足如下性质: 序信息系统,对于属性集A二AT,称属性集A是 1)R≥满足自反性,不满足对称性和传递性; IOIS的一个优势约简当且仅当Ra≥=R≥,且 2)当BCA≤AT时,R≥R≥CRg≥; BCA,Rg≥≠R≥成立。 3)当BCACAT时,Hx∈U, 定义10表明了基于α优势关系的不完备序信 [x]c[x]iec[x]ge。 息系统的属性约简保持的是对象的α优势类不变的 性质2设1OIS=(U,AT,V,)是一个不完备 最小属性组成的集合。基于此,下面给出其优势区 序信息系统,对于ACAT,R:≥、R≥、R三者 分矩阵构造的方法: 优势关系满足如下性质: 定义11设10IS=(U,AT,Vf)是一个不完备 I)R≥<R2<R≥,<表示优于; 序信息系统,对于Hx,y∈U,有 2)xeU,[x]iac[x]iaeC[x]≥。 A∈ATIy年[x]},y生[x] 定义9设I0IS=(U,AT,V,)是一个不完备 D(x,y)= AT,y∈[x] 序信息系统,HX二U,ACAT,对象集合X在优势 称D={Dx(x,y)IHx,y∈U}为IOIS关 关系R:a≥下关于属性集ACAT的上下近似集为: 于α优势关系的优势区分矩阵,其中属性集A为属 Ri(X)=xEUI [x]iaCX= 性集AT的幂集。 {x∈Xl[x]a≥CX} 根据对以往知识的了解,区分矩阵的构造是可
定义 7 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于 A ⊆ AT, ∀x,y ∈ U, 则对象 x 在 属性集 A 下优于 y 的概率为 RA(x,y) = ∏a∈A Ra(x,y) 通过定义 7,可以得出不完备序信息系统各个 对象的优势类如下: 定义 8 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于 A ⊆ AT, ∀x,y ∈ U, 有 R ∗α≥ A = {(x,y) ∈ U × U | RA(x,y) ≥ α} 则称 R ∗α≥ A 是不完备序信息系统上的一个 α 优势关 系,其中 0 < α ≤ 1。 记: [y] ∗α≥ A = {x ∈ U | (x,y) ∈ R ∗α≥ A }, 则 [y] ∗α≥ A 描述的对象是:在条件属性集A 下,以α 的优势 度优于对象y 的最大对象的集合,简称为对象y 的α 优 势类。 由于 U/ R ∗α≥ A 表示所有与优势关系族 R ∗α≥ A 相 关的知识,记作 U/ R ∗α≥ A = {[x] ∗α≥ A | x ∈ U}, 则 U/ R ∗α≥ A 中的任何一个元素都是属于 α 优势类。 从而 可以得知 U/ R ∗α≥ A 中所有的 α 优势类构成了 U 中的覆 盖,而不是 U 中的划分,即 ∪ U/ R ∗α≥ A = U 。 根据定义 8,结合定义 2 和定义 4 的概念,显然 可以得出:当 α > 0 时, R ∗α≥ A = R ∗≥ A ; 当 α = 1 时, R ∗α≥ A = R ∗L≥ A 。 因此,在不完备序信息系统中,本文 提出的 α 优势关系是文献[12]提出的优势关系和 文献[15]提出的限制优势关系的一种扩展形式。 性质 1 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,则 α 优势关系满足如下性质: 1) R ∗α≥ A 满足自反性,不满足对称性和传递性; 2)当 B ⊆ A ⊆ AT 时, R ∗α≥ AT ⊆ R ∗α≥ A ⊆ R ∗α≥ B ; 3)当 B ⊆ A ⊆ AT 时, ∀x ∈ U, [x] ∗α≥ AT ⊆ [x] ∗α≥ A ⊆ [x] ∗α≥ B 。 性质 2 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于 A ⊆ AT, R ∗≥ A 、 R ∗L≥ A 、 R ∗α≥ A 三者 优势关系满足如下性质: 1) R ∗≥ A ≺ R ∗L≥ A ≺ R ∗α≥ A , ≺ 表示优于 ; 2) ∀x ∈ U,[x] ∗L≥ A ⊆ [x] ∗α≥ A ⊆ [x] ∗≥ A 。 定义 9 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统, ∀X ⊆ U, A ⊆ AT, 对象集合 X 在优势 关系 R ∗α≥ A 下关于属性集 A ⊆ AT 的上下近似集为: R- ∗α≥ A (X) = {x ∈ U | [x] ∗α≥ A ⊆ X} = {x ∈ X | [x] ∗α≥ A ⊆ X} R - ∗α≥ A (X) = {x ∈ U | [x] ∗α≥ A ∩ X ≠ ⌀} = ∪ {[x] ∗α≥ A | x ∈ X} 可以看出, R- ∗α≥ A (X) 是确定属于 X 的一些对象 集,然而 R - ∗α≥ A (X) 是可能属于 X 的一些对象集。 定理 1 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统, 对于属性集 ∀A ⊆ AT, 对象集 ∀ X ⊆U, 则 可 以 得 出 R- ∗≥ A (X) ⊆ R- ∗α≥ A (X) ⊆ R- ∗L≥ A (X),R - ∗L≥ A (X) ⊆ R - ∗α≥ A (X) ⊆ R - ∗≥ A (X)。 证明 由性质 2 可得, ∀A ⊆ AT,∀x ∈ U, [x] ∗L≥ A ⊆[x] ∗α≥ A ⊆[x] ∗≥ A , 结合三者关系上下近似 的定义, ∀X ⊆ U, 得出 R- ∗≥ A (X) ⊆ R- ∗α≥ A(X)⊆ R- ∗L≥ A (X), R - ∗L≥ A (X) ⊆ R - ∗α≥ A (X) ⊆ R - ∗≥ A (X)。 证毕。 从定理 1 可知,当 α > 0 时, R- ∗α≥ A X = R- ∗≥ A X, R - ∗α≥ A X = R - ∗≥ A X ; 当 α = 1 时, R- ∗α≥ A X = R- ∗L≥ A X, R - ∗L≥ A X = R - ∗α≥ A X。 从而又可以验证了基于 α 优势关 系的粗糙集模型是文献[12]提出的优势关系粗糙 集模型和文献[15]提出的限制优势关系粗糙集模 型的一种扩展形式;因此,本文提出的 α 优势关系的 粗糙集模型更具有灵活性,更加符合实际情况,更有 利于去处理现实中存在的不完备序信息系统。 3 基于 α 优势关系粗糙集模型的属 性约简 3.1 不完备序信息系统的属性约简 定义 10 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于属性集 A ⊆ AT, 称属性集 A 是 IOIS 的一个优势约简当且仅当 R ∗α≥ A = R ∗α≥ AT , 且 ∀B ⊂ A,R ∗α≥ B ≠ R ∗α≥ AT 成立。 定义 10 表明了基于 α 优势关系的不完备序信 息系统的属性约简保持的是对象的 α 优势类不变的 最小属性组成的集合。 基于此,下面给出其优势区 分矩阵构造的方法: 定义 11 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于 ∀x,y ∈ U, 有 D ∗α≥ AT (x,y) = {A ∈ AT | y ∉ [x] ∗α≥ A },y ∉ [x] ∗α≥ AT AT,y ∈ [x] ∗α≥ AT { 称 D ∗α≥ AT = {D ∗α≥ AT (x,y) | ∀x,y∈U} 为 IOIS 关 于 α 优势关系的优势区分矩阵,其中属性集 A 为属 性集 AT 的幂集。 根据对以往知识的了解,区分矩阵的构造是可 ·254· 智 能 系 统 学 报 第 9 卷
第2期 韦碧鹏,等:α优势关系下粗糙集模型的属性约简 ·255. 以仅仅在单元素下进行。但是,在α优势关系的粗 分函数A≥=∧VD≥(x,y)中D(x,y) (,y)ex 糙集模型中,这样的构造是不成立的,如 是属性集的幂集组成的集合,因此,运用八作为连 假设基于α优势关系的优势区分矩阵可以如下 接符。例如:D,(x,y)中区分这2个对象的属性 构造: 集合为aAb,可以写成ab。即在优势区分矩阵 ({a∈AT1y座[x]aa},y生[x] 中,“,”表示“或”含义。 D(x,y)= AT,y∈[x]a 推论1设I0IS=(U,AT,V,)是一个不完备 存在这样的不完备序信息系统:U={x,y}, 序信息系统,对于AT={a,b,c},若区分函数 AT={a,b,c},x=(3,*,2),y=(*,2,1),其中在 D(x,y)中的2个对象可以运用属性集a、b、ab、 属性a下,最大的取值为4:在属性b下,最大的取值 abc加以区分,则ab、abc可以省略。 为3:根据定义6和定义7,计算得出对象在条件属 推论2设IOIS=(U,AT,V,)是一个不完备 性集下的优势概率为:R4r(x,y)=3/4×2/3=1/2。 序信息系统,对于AT={a,b,c},若区分函数 当α=0.6时,可以得出对象x不是对象y的α优势 Dr(x,y)中的2个对象仅仅能用属性集ab来区 类,即x生[y],≥;因此,运用单元素构成的优势区 分,则属性集ab为这2个对象的区分属性集。 分矩阵对不完备序信息系统进行属性约简,可以得 3.2不完备序决策系统的属性约简 出其约简为空集,这显然不符合属性约简的概念。 在α优势关系的不完备序信息系统中,若添加 但是,当根据定义11,即运用属性集的幂集构成的 决策属性d,则不完备序信息系统可以转变为 优势区分矩阵对该不完备序信息系统进行属性约简 IODS=(U,ATU{d},V,f)情形,其中属性d也是 时,可以得出属性集{a,b}为该系统的约简。显 一个准则,称之为决策属性,d主AT且*生V,则 然,可以验证基于《优势关系粗糙集模型的优势区 称IODS为不完备序决策系统。 分矩阵应该是在属性集的幂集下进行的。 记:R={(x,y)Ifx,d)≥f(y,d)},则称 定理2设IOS=(U,AT,V,f)是一个不完备 R:≥为决策属性d的一个优势关系。因此,可以记 序信息系统,对于A二AT,Dr(x,y)是基于a优 作:[y]a≥={x∈Ul(x,y)∈R≥}。 势关系的优势区分矩阵,Hx,y∈U,A∩D 定义12设10DS=(U,ATU{d},V,f)是一 (x,y)≠0(D(x,y)≠☑)当且仅当R≥= 个不完备序决策系统,若R≥二R≥,则称a优 Ra。 势关系的不完备序决策系统是协调的:否则称为不 证明(→)对于Hx,y∈U,ACAT,由性质 协调的。 1可得R≥CRA。要证明Ra腔=R≥,因此 定义13设1ODS=(U,ATU{d},V,f)是一 个不完备序决策系统,对于属性集A二AT,称属性 只需要证明R≥2R≥即可。然而由于A∩ 集A是IODS的一个优势约简当且仅当Ra≥≤ D≥(x,y)≠☑(D(x,y)≠☑),即存在a∈ Ra≥,且HBCA,Ra≥tRa≥成立。 A,a∈D(x,y),可以得出y年[x]a,即y主 从定义13中可以得出,基于α优势关系的不完 [x]≥,则y生[x];因为y是任意的,所以可 备序决策系统的属性约简保持α优势关系的协调性 以得出R22Ra,即R≥=R。 不变的最小子集。下面给出其优势决策区分矩阵构 (仁)由于R=R,可得Hx∈U, 造的方法。 [x]a4=[x],则存在a∈A,当y生[x]r 定义14设IODS=(U,ATU{d},V,f)是一 时,y生[x],即A∩Dx(x,y)≠。证毕。 个不完备序决策系统,对于Hx,y∈U,有 因此,令△n个wVD(x,)为a优势 ({A∈ATIy生[x]=},y年[x] Dia≥(x,y)= 关系下不完备序信息系统的区分函数,4·(x)= (AT,ye [x]ias AVD(x,y)为对象x在a优势关系下不完备 其中D≥={D(x,y)IVx,y∈U}称为IODS 序信息系统的区分函数。 中基于α优势关系的优势决策区分矩阵。 在α优势关系的不完备序信息系统中,由于区 定理3设1ODS=(U,ATU{d},V)是一个
以仅仅在单元素下进行。 但是,在 α 优势关系的粗 糙集模型中,这样的构造是不成立的,如 假设基于 α 优势关系的优势区分矩阵可以如下 构造: D ∗α≥ AT (x,y) = {a ∈ AT | y ∉ [x] ∗α≥ a },y ∉ [x] ∗α≥ AT AT,y ∈ [x] ∗α≥ AT { 存在这样的不完备序信息系统: U = {x,y}, AT ={a,b,c},x = (3,∗,2),y = (∗,2,1), 其中在 属性 a 下,最大的取值为 4;在属性 b 下,最大的取值 为 3;根据定义 6 和定义 7,计算得出对象在条件属 性集下的优势概率为: RAT(x,y) = 3 / 4 × 2 / 3 = 1 / 2。 当 α = 0.6 时,可以得出对象 x 不是对象 y 的 α 优势 类,即 x ∉ [y] ∗α≥ AT ; 因此,运用单元素构成的优势区 分矩阵对不完备序信息系统进行属性约简,可以得 出其约简为空集,这显然不符合属性约简的概念。 但是,当根据定义 11,即运用属性集的幂集构成的 优势区分矩阵对该不完备序信息系统进行属性约简 时,可以得出属性集 {a,b} 为该系统的约简。 显 然,可以验证基于 α 优势关系粗糙集模型的优势区 分矩阵应该是在属性集的幂集下进行的。 定理 2 设 IOIS = (U,AT,V,f) 是一个不完备 序信息系统,对于 A ⊆ AT,D ∗α≥ AT (x,y) 是基于 α 优 势关系的优势区分矩阵, ∀x,y ∈ U,A ∩ D ∗α≥ AT (x,y) ≠⌀(D ∗α≥ AT (x,y) ≠ ⌀) 当且仅当 R ∗α≥ A = R ∗α≥ AT 。 证明 (⇒) 对于 ∀x,y ∈ U,A ⊆ AT, 由性质 1 可得 R ∗α≥ AT ⊆ R ∗α≥ A 。 要证明 R ∗α≥ A = R ∗α≥ AT , 因此 只需要证明 R ∗α≥ AT ⊇ R ∗α≥ A 即可。 然而由于 A ∩ D ∗α≥ AT (x,y) ≠ ⌀(D ∗α≥ AT (x,y) ≠ ⌀), 即存在 a ∈ A,a ∈ D ∗α≥ AT (x,y), 可以得出 y ∉ [x] ∗α≥ a , 即 y ∉ [x] ∗α≥ A , 则 y ∉ [x] ∗α≥ AT ; 因为 y 是任意的,所以可 以得出 R ∗α≥ AT ⊇ R ∗α≥ A , 即 R ∗α≥ A = R ∗α≥ AT 。 (⇐) 由 于 R ∗α≥ A = R ∗α≥ AT , 可 得 ∀x ∈ U, [x] ∗α≥ A = [x] ∗α≥ AT , 则存在 a ∈ A, 当 y ∉ [x] ∗α≥ AT 时, y ∉ [x] ∗α≥ a , 即 A ∩ D ∗α≥ AT (x,y) ≠ ⌀。 证毕。 因此,令 Δ ∗≥ = ∧ (x,y)∈U×U ∨ D ∗α≥ AT (x,y) 为 α 优势 关系下不完备序信息系统的区分函数, Δ ∗≥ (x) = ∧y∈U ∨ D ∗α≥ AT (x,y) 为对象 x 在 α 优势关系下不完备 序信息系统的区分函数。 在 α 优势关系的不完备序信息系统中,由于区 分函数 Δ ∗≥ = ∧ (x,y)∈U×U ∨ D ∗α≥ AT (x,y) 中 D ∗α≥ AT (x,y) 是属性集的幂集组成的集合,因此,运用 ∧ 作为连 接符。 例如: D ∗α≥ AT (x,y) 中区分这 2 个对象的属性 集合为 a ∧ b, 可以写成 ab 。 即在优势区分矩阵 中,“,”表示“或”含义。 推论 1 设 IOIS = (U,AT,V,f) 是一个不完备 序信 息 系 统, 对 于 AT = {a,b,c}, 若 区 分 函 数 D ∗α≥ AT (x,y) 中的 2 个对象可以运用属性集 a、b、ab、 abc 加以区分,则 ab、abc 可以省略。 推论 2 设 IOIS = (U,AT,V,f) 是一个不完备 序信 息 系 统, 对 于 AT = {a,b,c}, 若 区 分 函 数 D ∗α≥ AT (x,y) 中的 2 个对象仅仅能用属性集 ab 来区 分,则属性集 ab 为这 2 个对象的区分属性集。 3.2 不完备序决策系统的属性约简 在 α 优势关系的不完备序信息系统中,若添加 决策属性 d, 则 不 完 备 序 信 息 系 统 可 以 转 变 为 IODS =(U,AT ∪ {d},V,f) 情形,其中属性 d 也是 一个准则,称之为决策属性, d ∉ AT 且 ∗ ∉ Vd , 则 称 IODS 为不完备序决策系统。 记: R ∗α≥ d = {(x,y) | f(x,d) ≥ f(y,d)}, 则称 R ∗α≥ d 为决策属性 d 的一个优势关系。 因此,可以记 作: [y] ∗α≥ d = {x ∈ U | (x,y) ∈ R ∗α≥ d }。 定义 12 设 IODS = (U,AT ∪ {d},V,f) 是一 个不完备序决策系统,若 R ∗α≥ AT ⊆ R ∗α≥ d , 则称 α 优 势关系的不完备序决策系统是协调的;否则称为不 协调的。 定义 13 设 IODS = (U,AT ∪ {d},V,f) 是一 个不完备序决策系统,对于属性集 A ⊆ AT, 称属性 集 A 是 IODS 的一个优势约简当且仅当 R ∗α≥ A ⊆ R ∗α≥ d , 且 ∀B ⊂ A,R ∗α≥ B ⊄ R ∗α≥ d 成立。 从定义 13 中可以得出,基于 α 优势关系的不完 备序决策系统的属性约简保持 α 优势关系的协调性 不变的最小子集。 下面给出其优势决策区分矩阵构 造的方法。 定义 14 设 IODS = (U,AT ∪ {d},V,f) 是一 个不完备序决策系统,对于 ∀x,y ∈ U, 有 D ∗α≥ d (x,y) = {A ∈ AT | y ∉ [x] ∗α≥ A },y ∉ [x] ∗α≥ d AT,y ∈ [x] ∗α≥ d { 其中 D ∗α≥ d = {D ∗α≥ d (x,y) | ∀x,y ∈ U} 称为 IODS 中基于 α 优势关系的优势决策区分矩阵。 定理 3 设 IODS = (U,AT ∪ {d},V,f) 是一个 第 2 期 韦碧鹏,等: α 优势关系下粗糙集模型的属性约简 ·255·
·256 智能系统学报 第9卷 不完备序决策系统,对于A二AT,D(x,y)是基 [5]r={2,3,4,5}。 于α优势关系的优势决策区分矩阵,Hx,y∈U,4 ②根据定义4,可以得出文献[15]提出的限制 ∩D产(x,y)≠O(D(x,y)≠☑)当且仅当 优势关系下,各个对象的优势类为:[1]={1,2, RiRi。 3,4,5},[2]2=12,[3]2=13},[4]= 证明(→)对于Hx∈U,ACAT,根据性质 {4},[5]2=12,5}。 1,可以得出[x]≥C[x]除。又由于Hx,ye ③令a=0.6,根据定义8,可得α优势关系下, U,A∩D(x,y)≠☑(Da(x,y)≠☑),即y 各个对象的a优势类为:[1]≥=1,2,3,4,5}, [x]≥,y生[x]≥,由于对象y的任意性,则可以 [2]腔={2},[3]≥={2,3},[4]≥={4}, 得出[x]eC[x],即RCR。 [5]={2,5}。 (=)由于R≥CR腔,则Hx∈U有 根据定义得出三者优势关系下各个对象的优势 [x]≥≤[x]≥成立。即当y庄[x]≥时,y 类,在文献[12]提出的优势关系下,对象4的优势 [x],因此AnD(x,y)≠0。证毕。 类为对象2、4,然而在条件属性c下,由于对象4取 因此,Ai≥=人VD(x,y)为a优势关 得最大值,因此,对象2优于对象4的可能性是非常 (x,y)eUxU 之小:另外,对象5的优势类为对象2、3、4、5,然而 系下不完备序决策系统的区分函数,△(x)= ,AVD(x,)为对象x在a优势关系下不完备 在条件属性a下,对象4优于对象5的可能性也是 非常之小。因此,可以说文献[12]提出的优势关系 序决策系统的区分函数。 划分的粒度过大了。在文献[15]提出的限制优势 4实例分析 关系下,对象3的优势类为对象3,然而对象2优于 对象3的可能性是非常之大。因此,说明了文献 例1下面给出一个不完备序决策系统,其中 [15]提出的限制优势关系划分的粒度过细了。然 U={1,2,3,4,5},AT={a,b,c}为条件属性,d为决 而,在α优势关系下,设定确定的取值,各个对象 策属性,且对象在单个条件属性a、b、c下最大的取 的优势类就不会出现上述的情况:可以看出,α优势 值分别为4、3、3,最小值都是1。运用表1给出的不 关系吸取了上述两者优势关系的优点,丢弃了两者 完备序决策系统来分析文献[12]提出的优势关系、 的缺陷,更加符合实际情况,更有利于去处理现实生 文献[15]提出的限制优势关系以及本文提出的α 活中存在复杂的不完备序信息系统。 优势关系之间的性能:并计算α优势关系不完备序 2)不完备序信息系统的属性约简 信息系统与决策系统的属性约简。 根据定义11,结合α优势类,可以得出不完备 表1不完备序决策系统 序信息系统的优势区分矩阵如表2。 Table 1 Incomplete ordered decision system 表2优势区分矩阵 U b d Table 2 Dominance discernibility matrix 1 2 3 4 5 2 2 1 a.b.c a.b.c a.b.c b.c 3 2 2 a,b,c a,b,c a,b.c c a,b.c 4 2 3 3 a.b.c a,b a,b.c ab 5 a,b.c a,b a,b.c a 1)把表1中的决策属性去掉,不完备序决策系 5 a.b.c a.b.c a,c c a,b,c 统转化为不完备序信息系统,分析三者优势关系之 故△≥=(a V b V e)A(aVb)∧a∧c 间的关系。 (aVc)∧(aAb)∧(bVc)=abc,即该不完备 ①根据定义2,可得文献[12]提出的优势关系 序信息系统的属性约简为abc。 下,各个对象的优势类为:[1]={1,2,3,4,5}, 3)不完备序决策系统的属性约简。 [2]={2},[3]={2,3},[4]={2,4}, 由于各个对象在决策属性下的优势类如下:
不完备序决策系统,对于 A ⊆ AT,D ∗α≥ d (x,y) 是基 于 α 优势关系的优势决策区分矩阵, ∀x,y ∈ U,A ∩ D ∗α≥ d (x,y) ≠ ⌀(D ∗α≥ d (x,y) ≠ ⌀) 当且仅当 R ∗α≥ A ⊆ R ∗α≥ d 。 证明 (⇒) 对于 ∀x ∈ U,A ⊆ AT, 根据性质 1,可以得出 [x] ∗α≥ AT ⊆ [x] ∗α≥ A 。 又由于 ∀x,y ∈ U,A ∩ D ∗α≥ d (x,y) ≠ ⌀(D ∗α≥ d (x,y) ≠ ⌀), 即 y ∉ [x] ∗α≥ d ,y ∉ [x] ∗α≥ A , 由于对象 y 的任意性,则可以 得出 [x] ∗α≥ A ⊆ [x] ∗α≥ d , 即 R ∗α≥ A ⊆ R ∗α≥ d 。 (⇐) 由 于 R ∗α≥ A ⊆ R ∗α≥ d , 则 ∀x ∈ U, 有 [x] ∗α≥ A ⊆ [x] ∗α≥ d 成立。 即当 y ∉ [x] ∗α≥ d 时, y ∉ [x] ∗α≥ A , 因此 A ∩ D ∗α≥ d (x,y) ≠ ⌀。 证毕。 因此, Δ ∗≥ d = ∧ (x,y)∈U×U ∨ D ∗α≥ d (x,y) 为 α 优势关 系下不完备序 决 策 系 统 的 区 分 函 数, Δ ∗≥ d (x) = ∧y∈U ∨ D ∗α≥ d (x,y) 为对象 x 在 α 优势关系下不完备 序决策系统的区分函数。 4 实例分析 例 1 下面给出一个不完备序决策系统,其中 U = {1,2,3,4,5},AT = {a,b,c} 为条件属性, d 为决 策属性,且对象在单个条件属性 a、b、c 下最大的取 值分别为 4、3、3,最小值都是 1。 运用表 1 给出的不 完备序决策系统来分析文献[12]提出的优势关系、 文献[15] 提出的限制优势关系以及本文提出的 α 优势关系之间的性能;并计算 α 优势关系不完备序 信息系统与决策系统的属性约简。 表 1 不完备序决策系统 Table 1 Incomplete ordered decision system U a b c d 1 1 1 1 1 2 4 3 ∗ 2 3 3 ∗ 2 2 4 1 2 3 3 5 ∗ 2 1 2 1)把表 1 中的决策属性去掉,不完备序决策系 统转化为不完备序信息系统,分析三者优势关系之 间的关系。 ① 根据定义 2,可得文献[12]提出的优势关系 下,各个对象的优势类为: [1] ∗≥ AT = {1,2,3,4,5}, [2] ∗≥ AT = {2}, [3] ∗≥ AT = {2,3}, [4] ∗≥ AT = {2,4}, [5] ∗≥ AT = {2,3,4,5}。 ② 根据定义 4,可以得出文献[15]提出的限制 优势关系下,各个对象的优势类为: [1] ∗L≥ AT = {1,2, 3,4,5}, [2] ∗L≥ AT ={2}, [3] ∗L≥ AT = {3}, [4] ∗L≥ AT = {4},[5] ∗L≥ AT = {2,5}。 ③ 令 α = 0.6, 根据定义 8,可得 α 优势关系下, 各个对象的 α 优势类为: [1] ∗α≥ AT = {1,2,3,4,5}, [2] ∗α≥ AT = {2}, [3] ∗α≥ AT = {2,3}, [4] ∗α≥ AT = {4}, [5] ∗α≥ AT = {2,5}。 根据定义得出三者优势关系下各个对象的优势 类,在文献[12]提出的优势关系下,对象 4 的优势 类为对象 2、4,然而在条件属性 c 下,由于对象 4 取 得最大值,因此,对象 2 优于对象 4 的可能性是非常 之小;另外,对象 5 的优势类为对象 2、3、4、5,然而 在条件属性 a 下,对象 4 优于对象 5 的可能性也是 非常之小。 因此,可以说文献[12]提出的优势关系 划分的粒度过大了。 在文献[15] 提出的限制优势 关系下,对象 3 的优势类为对象 3,然而对象 2 优于 对象 3 的可能性是非常之大。 因此,说明了文献 [15]提出的限制优势关系划分的粒度过细了。 然 而,在 α 优势关系下,设定确定的 α 取值,各个对象 的优势类就不会出现上述的情况;可以看出, α 优势 关系吸取了上述两者优势关系的优点,丢弃了两者 的缺陷,更加符合实际情况,更有利于去处理现实生 活中存在复杂的不完备序信息系统。 2)不完备序信息系统的属性约简 根据定义 11,结合 α 优势类,可以得出不完备 序信息系统的优势区分矩阵如表 2。 表 2 优势区分矩阵 Table 2 Dominance discernibility matrix U 1 2 3 4 5 1 a,b,c a,b,c a,b,c b,c a,b 2 a,b,c a,b,c a,b,c c a,b,c 3 a,b,c a,b a,b,c c ab 4 a,b,c a,b a a,b,c a 5 a,b,c a,b,c a,c c a,b,c 故 Δ ∗≥ = (a ∨ b ∨ c) ∧ (a ∨ b) ∧ a ∧ c ∧ (a ∨ c) ∧ (a ∧ b) ∧ (b ∨ c) = abc, 即该不完备 序信息系统的属性约简为 abc。 3)不完备序决策系统的属性约简。 由于各个对象在决策属性下的优势类如下: ·256· 智 能 系 统 学 报 第 9 卷
第2期 韦碧鹏,等:α优势关系下粗糙集模型的属性约简 .257. [1]={1,2,3,4,5},[2]={2,3,4,5}, decision system[J].Journal of University of Electronic Sci- [3]ae=2,3,4,5},[4]a≥={4},[5]a≥={2, ence and Technology of China,2007,36(6):1237-1240. 3,4,5}。 [4]罩丽珍,姚炳学,李金海.基于信息量的完备覆盖约简算 因此,得出R≥CRa,即该不完备序决策 法[J].计算机科学,2012,39(10):235-239. QIN Lizhen,YAO Bingxue,LI Jinhai.Complete algorithm 系统是协调的。 for covering reduction based on information quantity[J]. 根据定义14,可以得出不完备序决策系统的优 Computer science,2012,39(10):235-239. 势决策区分矩阵如表3。 [5]KRYSZKIEWICZ M.Rough set approach to incomplete in- 表3优势决策区分矩阵 formation systems[J].Information Sciences,1998,112: Table 3 Dominance decision discernibility matrix 39.49. 1 2 3 4 [6]STEFANOWSKI J,TSOUKIAS A.On the extension of rough a,b,c a,b.c a,b.c b.c a,b sets under incomplete information[C]//Proceedings of New a,b,c a,b,c a,b,c a,b,c Directions in Rough Sets,Data Mining and Granular-Soft 3 a.b,c a.b.c a,b.c a.b.c Computing.Berlin:Springer,1999:73-81. 4 a,b,c a,b,c a,b,c a,b,c a,b,c [7]王国胤.Rough集理论在不完备信息系统中的扩充[J]。 5 a,b,c a,b,c a,b,c a,b,c 计算机研究与发展,2002,39(10):1238-1243 △:≥=(a Vb V c)A(bVc)∧cA WANG Guoyin.Extension of rough set under incomplete in- formation systems[J].Jourmnal of Computer Research and (aVb)=ac V be,即表1中不完备序决策系统的 Development,2002,39(10):1238-1243. 属性约简为{a,c}或者{b,c}。 [8]LIANG J Y,QU K S.Information measures of roughness of 5结束语 knowledge and rough sets in incomplete information systems [J].Joumal of System Science and System Engineering, 由于现实中处理的数据很多是不完备的,且存 2001,24(5):544-547. 在偏序性,因此研究处理这种复杂数据情况的粗糙 [9]GRZYMALA-BUSSE J W.Characteristic relations for incom- 集方法是很有实际意义的。本文通过对现有优势关 plete data:a generalization of indisceribility relation[C] 系的分析后提出了α优势关系及其相应的粗糙集模 Proceedings of Rough Sets and Current Trends in Compu- 型,以使得对不完备序信息系统的数据分析更加合 ting.Berlin:Springer,2004:244-253. 理。此外,在基于α优势关系的粗糙集模型上,给出 [10]杨习贝,杨静宇,吴陈,等.不完备信息系统中的集对 分析方法[J].计算机科学,2007.34(4):171-174. 了不完备序信息系统的优势区分矩阵以及不完备序 决策系统的优势决策区分矩阵,从而实现了属性约 YANG Xibei,YANG Jingyu,WU Chen,et al.Set pair a- nalysis in incomplete information systems[J].Information 简,同时也表明了区分矩阵只能运用属性集的幂集 Science.2007.34(4):171-174. 进行构造,而不能运用单个属性集进行构造。 [11]GRECO S,MATARAZZO B,SLOWINGSKI R.Rough sets 需要指出的是,在α优势关系的基础上,还可以 theory for multicriteria decision analysis [J].European 进一步研究不协调不完备序决策系统的属性约简算 Journal of Operational Research,2001,129(1):1-47. 法,这是本文的下一步工作任务。 [12]SHAO M W,ZHANG W X.Dominance relation and rules 参考文献: in an incomplete ordered information system [J].Interna- tional Journal of Intelligent Systems,2005,20:13-27. [1]PAWLAK Z.Rough sets [J].International Journal of Com- [13]胡明礼,刘思峰.基于广义扩展优势关系的粗糙决策分 puter and Information Sciences,1982,11(5):341-356. 析方法[J].控制与决策,2007,22(12):1347-1351. [2]张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北 HU Mingli,LIU Sifeng.Rough analysis method of multi-at- 京:科学出版社,2001:14-19. tribute decision making based on generalized extended [3]李金海,吕跃进决策系统的快速属性约简算法[J].电子 dominance relation[J].Control and Decision,2007,22 科技大学学报,2007,36(6):1237-1240. (12):1347-1351. LI Jinhai,LO Yuejin.Quick attribute reduction algorithm on [14]YANG X B,YANG J Y,WU C,et al.Dominance-based
[1] ∗α≥ d = {1,2,3,4,5},[2] ∗α≥ d = {2,3,4,5}, [3] ∗α≥ d = {2,3,4,5},[4] ∗α≥ d = {4},[5] ∗α≥ d = {2, 3,4,5}。 因此,得出 R ∗α≥ AT ⊆ R ∗α≥ d , 即该不完备序决策 系统是协调的。 根据定义 14,可以得出不完备序决策系统的优 势决策区分矩阵如表 3。 表 3 优势决策区分矩阵 Table 3 Dominance decision discernibility matrix U 1 2 3 4 5 1 a,b,c a,b,c a,b,c b,c a,b 2 a,b,c a,b,c a,b,c c a,b,c 3 a,b,c a,b,c a,b,c c a,b,c 4 a,b,c a,b,c a,b,c a,b,c a,b,c 5 a,b,c a,b,c a,b,c c a,b,c Δ ∗≥ d = (a ∨ b ∨ c) ∧ (b ∨ c) ∧ c ∧ (a ∨ b) =ac ∨ bc ,即表 1 中不完备序决策系统的 属性约简为 {a,c} 或者 {b,c} 。 5 结束语 由于现实中处理的数据很多是不完备的,且存 在偏序性,因此研究处理这种复杂数据情况的粗糙 集方法是很有实际意义的。 本文通过对现有优势关 系的分析后提出了 α 优势关系及其相应的粗糙集模 型,以使得对不完备序信息系统的数据分析更加合 理。 此外,在基于 α 优势关系的粗糙集模型上,给出 了不完备序信息系统的优势区分矩阵以及不完备序 决策系统的优势决策区分矩阵,从而实现了属性约 简,同时也表明了区分矩阵只能运用属性集的幂集 进行构造,而不能运用单个属性集进行构造。 需要指出的是,在 α 优势关系的基础上,还可以 进一步研究不协调不完备序决策系统的属性约简算 法,这是本文的下一步工作任务。 参考文献: [1]PAWLAK Z. Rough sets [J]. International Journal of Com⁃ puter and Information Sciences, 1982, 11(5): 341⁃356. [2]张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北 京:科学出版社, 2001: 14⁃19. [3]李金海,吕跃进.决策系统的快速属性约简算法[ J].电子 科技大学学报, 2007, 36(6): 1237⁃1240. LI Jinhai, LÜ Yuejin. Quick attribute reduction algorithm on decision system[J]. Journal of University of Electronic Sci⁃ ence and Technology of China, 2007, 36(6): 1237⁃1240. [4]覃丽珍,姚炳学,李金海.基于信息量的完备覆盖约简算 法[J]. 计算机科学, 2012, 39(10): 235⁃239. QIN Lizhen, YAO Bingxue, LI Jinhai. Complete algorithm for covering reduction based on information quantity [ J]. Computer science, 2012, 39(10): 235⁃239. [5]KRYSZKIEWICZ M. Rough set approach to incomplete in⁃ formation systems [ J]. Information Sciences, 1998, 112: 39⁃49. [6]STEFANOWSKI J, TSOUKIAS A. On the extension of rough sets under incomplete information[C] / / Proceedings of New Directions in Rough Sets, Data Mining and Granular⁃Soft Computing. Berlin: Springer, 1999: 73⁃81. [7]王国胤. Rough 集理论在不完备信息系统中的扩充[ J]. 计算机研究与发展, 2002, 39 (10): 1238⁃1243. WANG Guoyin. Extension of rough set under incomplete in⁃ formation systems [ J]. Journal of Computer Research and Development, 2002, 39 (10): 1238⁃1243. [8]LIANG J Y, QU K S. Information measures of roughness of knowledge and rough sets in incomplete information systems [ J]. Journal of System Science and System Engineering, 2001, 24(5): 544⁃547. [9]GRZYMALA⁃BUSSE J W. Characteristic relations for incom⁃ plete data: a generalization of indiscernibility relation[C] / / Proceedings of Rough Sets and Current Trends in Compu⁃ ting. Berlin: Springer, 2004: 244⁃253. [10]杨习贝, 杨静宇, 吴陈, 等. 不完备信息系统中的集对 分析方法[J]. 计算机科学, 2007, 34(4): 171⁃174. YANG Xibei, YANG Jingyu, WU Chen, et al. Set pair a⁃ nalysis in incomplete information systems[ J]. Information Science, 2007, 34(4): 171⁃174. [11]GRECO S, MATARAZZO B, SLOWINGSKI R. Rough sets theory for multicriteria decision analysis [ J ]. European Journal of Operational Research, 2001, 129(1): 1⁃47. [12]SHAO M W, ZHANG W X. Dominance relation and rules in an incomplete ordered information system [ J]. Interna⁃ tional Journal of Intelligent Systems, 2005, 20: 13⁃27. [13]胡明礼, 刘思峰. 基于广义扩展优势关系的粗糙决策分 析方法[J]. 控制与决策, 2007, 22(12): 1347⁃1351. HU Mingli, LIU Sifeng. Rough analysis method of multi⁃at⁃ tribute decision making based on generalized extended dominance relation [ J]. Control and Decision, 2007, 22 (12): 1347⁃1351. [14]YANG X B, YANG J Y, WU C, et al. Dominance⁃based 第 2 期 韦碧鹏,等: α 优势关系下粗糙集模型的属性约简 ·257·
.258 智能系统学报 第9卷 rough set approach and knowledge reductions in incomplete ordered information system[J].Information Sciences, 吕跃进,男,1958年生,教授,中国 2008,178:1219-1234. 工业与应用数学学会理事、数学模型专 [15]LUO G Z,YANG X B.Limited dominance-based rough set 业委员会委员,中国复杂系统研究会理 model and knowledge reductions in incomplete decision 事,广西数学学会理事、数学模型专业 system[J].Journal of Information Science and Engineer- 委员会主任。主要研究方向为决策理 ing,2010,26:2199-2211 论与方法,数据挖掘。2006年获广西高校首届教学名师奖. 作者简介: 主持2项国家,2项广西自然科学基金项目,发表学术论文 韦碧鹏,男,1987年生,硕士,主要 近100篇,主要论文被同行引用达700多篇次。 研究方向为粗糙集的理论、粒计算,规 李金海,男,1984年生,博士,《美 则提取。近年来,发表学术论文5篇, 国数学评论(MR)》评论员,《Journal of 其中EI检索2篇。 Computer Engineering and Informatics》编 委,主要研究方向为粗糙集、概念格与 粒计算。现主持国家自然科学青年基 金1项,近几年,发表学术论文10余 篇,其中被SCI检索5篇,EI检索2篇。 第3届智能机械国际会议 3rd International Conference on Intelligent Machines (ICIM) The 3rd ICIM'2014 aims to offer a meeting opportunity for researchers,students,and industry-related researchers from a- round the world to present recent results and discuss the latest advances and new trends in the theory and application of In- telligent Machines with both efficient and flexible behaviour. he topics of interest include,but are not limited to: computational intelligence; intelligent hybrid systems; documents analysis and recognition; intelligent multimedia data analysis and processing; cognition and robotic systems; Submissions should be up to 6 pages,in double column IEEE proceeding format.Submitted papers will be double- blind reviewed by the Program Committee on the basis of novelty,relevance,and technical quality. Conference content will be submitted for inclusion into IEEE Xplore as well as other Abstracting and Indexing (A&l) databases. Website:http://icim.regim.org/
rough set approach and knowledge reductions in incomplete ordered information system [ J ]. Information Sciences, 2008, 178: 1219⁃1234. [15]LUO G Z, YANG X B. Limited dominance⁃based rough set model and knowledge reductions in incomplete decision system[ J]. Journal of Information Science and Engineer⁃ ing, 2010, 26: 2199⁃2211. 作者简介: 韦碧鹏,男,1987 年生,硕士,主要 研究方向为粗糙集的理论、粒计算,规 则提取。 近年来,发表学术论文 5 篇, 其中 EI 检索 2 篇。 吕跃进,男,1958 年生,教授,中国 工业与应用数学学会理事、数学模型专 业委员会委员,中国复杂系统研究会理 事,广西数学学会理事、数学模型专业 委员会主任。 主要研究方向为决策理 论与方法,数据挖掘。 2006 年获广西高校首届教学名师奖, 主持 2 项国家、2 项广西自然科学基金项目,发表学术论文 近 100 篇,主要论文被同行引用达 700 多篇次。 李金海,男,1984 年生,博士, 《 美 国数学评论(MR)》 评论员,《 Journal of Computer Engineering and Informatics》编 委,主要研究方向为粗糙集、概念格与 粒计算。 现主持国家自然科学青年基 金 1 项,近几年,发表学术论文 10 余 篇,其中被 SCI 检索 5 篇,EI 检索 2 篇。 第 3 届智能机械国际会议 3rd International Conference on Intelligent Machines ( ICIM) The 3rd ICIM’2014 aims to offer a meeting opportunity for researchers, students, and industry⁃related researchers from a⁃ round the world to present recent results and discuss the latest advances and new trends in the theory and application of In⁃ telligent Machines with both efficient and flexible behaviour. he topics of interest include, but are not limited to: computational intelligence; intelligent hybrid systems; documents analysis and recognition; intelligent multimedia data analysis and processing; cognition and robotic systems; Submissions should be up to 6 pages, in double column IEEE proceeding format. Submitted papers will be double⁃ blind reviewed by the Program Committee on the basis of novelty, relevance, and technical quality. Conference content will be submitted for inclusion into IEEE Xplore as well as other Abstracting and Indexing (A&I) databases. Website: http: / / icim.regim.org / ·258· 智 能 系 统 学 报 第 9 卷