·470· 智能系统学报 第13卷 wicz于1999年在不完备信息系统下引入广义决策 属性ak上的区间属性值,即对任意的x:∈U,a∈AT, 保持约简的概念,并提出基于差别矩阵的广义决策 有fx,a)=a4(x)=[,]o 保持约简方法;2007年,邓大勇等1首先分析了不 如果属性集AT由条件属性集C和决策属性集 相容信息系统下几种约简目标之间的关系;2009 D组成,C={a1,a2,…agh,D={d,即CUD=AT;V= 年,Miao等进一步分析了3种约简目标之间的关 VeU Vp,.其中,Vc为条件属性值集合,V,为决策属性 系,提出不可分辨关系保持约简以及相应的差别矩 值集合;f:U×C→Vc为区间值映射,f:U×D→Vo 阵构造方法;Zhou等在2011年对现有的13种属 为单值映射,则称区间值信息系统为区间值决策系 性约简目标进行总结,并将所有约简目标分为 统DS=(U,CUD,V,f)e 4类,完善了现有约简目标之间的关系。 定义1设=[,]和=[,1为任意两个区 分布约简保持了信息系统约简前后每条规则置 间值,则区间值的交运算与并运算如下。 信度不变。2003年,张文修等1提出了分配约简、 1)区间值交运算为 分布约简以及最大分布约简的概念,并分别给出了 0,(<)v(t<) 基于差别矩阵的分配约简、分布约简以及最大分布 hn2={ [max(,),min(,t】,其他 约简方法;2007年,徐伟华等在优势关系下提出 2)区间值并运算为 了两种约简概念,即分布约简和最大分布约简,同 U2=[min(,,max(,t】 时建立了基于差别矩阵的分布和最大分布约简的具 目前,度量区间值相似度比较合理的主要方法 体方法。如某一段时间内的温度、湿度等区间值数 有Jaccard相似率、悲观相似率和乐观相似率,本文 据在现实环境中大量存在,它较好地表示了许多不 统一采用Jaccard相似率来度量两个区间值的相似度。 确定类型数据,区间值决策系统是经典Pawlak决策 定义2DS=(U,CUD,Vf)为区间值决策系统, 系统的推广,充分地考虑了数据的不确定性,在近 对任意的x,x∈U,∈C,区间值a(x)=[,的和 几年得到了广泛关注。2009年,张楠等1定义了- a(x)=[,1的Jaccard相似率定义为 极大相容类的概念,提出了区间值决策系统的广义 决策保持约简:2016年,张楠等16在不协调区间值 0岛 决策系统中提出确定性规则保持约简;2016年,张 Jaccard相似率为两个区间数的交集与并集长 楠等讨论了不协调区间值决策系统中的知识约简 度的比值,它适合度量长度相似的两个区间数。 并提出了分布约简的概念。 例1区间值决策系统DS=(U,CUD,V,f),如 基于上述研究,文献[13]和14]分别对等价关系 表1所示,其中,U={x,2,…,x6为对象的集合,C= 和优势关系下的最大分布约简进行了研究,但未有 {a1,a2,a3,a4}为条件属性的集合,D={d为决策属性。 区间值决策系统的最大分布约简讨论。置信度表示 表1不协调区间值决策系统 了信息系统中规则的可信程度,置信度越大,规则 Table 1 Inconsistent interval-valued decision systems 的可信程度越高:置信度越小规则的可信程度越 U da d 低,在实际应用中,人们往往关注置信度最大的规 x10.863.131「-0.20,2.231「-0.26,2.261「-0.19.2.2011 则。为此,本文提出了区间值决策系统的最大分布 x2-0.12,2.1310.79,3.201 [0.73,3.26 [0.73,3.26]2 约简概念,为区间值决策系统提供了一种求取所有 属性约简的新方法。 x3【-0.13,2.20][0.86,2.95] 【-0.26,2.26]【-0.24,2.12]2 【-0.14,2.01 [0.853.011 0.71,3.11] -0.24,2.11]2 1基本知识 5【-0.13,2.13] 0.79,2.941-0.262.231 -0.252.3011 1.1区间值决策系统的粗糙近似 x6「-0.13,2.131[0.82,3.101 [-0.24,2.19] [-0.24,2.11]1 基于相容关系的区间值粗糙集模型是经典 令1=[,],1=,,分别计算n和n2的交 Pawlak粗糙集模型的推广,首先给出相关概念和 并: 性质。 给定区间值信息系统1s1S=(U,AT,Vf,其 1n2=[0.86,3.13]n[-0.12,2.13]=[0.86,2.13] 1U2=[0.86,3.13]U[-0.12,2.13]=[-0.12,3.13] 中,U是有限对象集合,U={x1,2,…,h:AT是有限 计算n,和n2的Jaccard相似率: 属性集合,AT={a,a2,…,am;V是全体属性的值 ,1n5.=0.391 域,即V=U_Va,Va是属性a∈AT的值域;f:UXAT→ 4,]U[,] EAT V是一个信息函数,它指定论域U中每一个对象x在 定义315] 对于区间值决策系统DS=(U,CUwicz[9]于 1999 年在不完备信息系统下引入广义决策 保持约简的概念,并提出基于差别矩阵的广义决策 保持约简方法;2007 年,邓大勇等[10]首先分析了不 相容信息系统下几种约简目标之间的关系;2009 年,Miao 等 [11]进一步分析了 3 种约简目标之间的关 系,提出不可分辨关系保持约简以及相应的差别矩 阵构造方法;Zhou 等 [12]在 2011 年对现有的 13 种属 性约简目标进行总结,并将所有约简目标分为 4 类,完善了现有约简目标之间的关系。 α 分布约简保持了信息系统约简前后每条规则置 信度不变。2003 年,张文修等[13]提出了分配约简、 分布约简以及最大分布约简的概念,并分别给出了 基于差别矩阵的分配约简、分布约简以及最大分布 约简方法;2007 年,徐伟华等[14]在优势关系下提出 了两种约简概念,即分布约简和最大分布约简,同 时建立了基于差别矩阵的分布和最大分布约简的具 体方法。如某一段时间内的温度、湿度等区间值数 据在现实环境中大量存在,它较好地表示了许多不 确定类型数据,区间值决策系统是经典 Pawlak 决策 系统的推广,充分地考虑了数据的不确定性,在近 几年得到了广泛关注。2009 年,张楠等[15]定义了 - 极大相容类的概念,提出了区间值决策系统的广义 决策保持约简;2016 年,张楠等[16]在不协调区间值 决策系统中提出确定性规则保持约简;2016 年,张 楠等[17]讨论了不协调区间值决策系统中的知识约简 并提出了分布约简的概念。 基于上述研究,文献[13]和[14]分别对等价关系 和优势关系下的最大分布约简进行了研究,但未有 区间值决策系统的最大分布约简讨论。置信度表示 了信息系统中规则的可信程度,置信度越大,规则 的可信程度越高;置信度越小,规则的可信程度越 低,在实际应用中,人们往往关注置信度最大的规 则。为此,本文提出了区间值决策系统的最大分布 约简概念,为区间值决策系统提供了一种求取所有 属性约简的新方法。 1 基本知识 1.1 区间值决策系统的粗糙近似 基于相容关系的区间值粗糙集模型是经典 Pawlak 粗糙集模型的推广,首先给出相关概念和 性质。 IS = (U,AT,V, f) U U = {x1, x2,··· , x|U|} AT AT = {a1,a2,··· ,a|AT|} V V = ∪ ak∈AT Vak Vak ak ∈ AT f :U×AT → U xi 给定区间值信息系统[ 1 5 - 1 8 ] ,其 中, 是有限对象集合, ; 是有限 属性集合, ; 是全体属性的值 域,即 , 是属性 的值域; V 是一个信息函数,它指定论域 中每一个对象 在 xi ∈ U ak ∈ AT f(xi ,ak) = ak(xi) =[l k i ,u k i ] 属性 ak 上的区间属性值,即对任意的 , , 有 。 AT D C = {a1,a2,···a|C|} D = {d} C ∪ D= AT VC ∪VD VC VD f : U ×C → VC f : U × D → VD DS = (U,C ∪ D,V, f) 如果属性集 由条件属性集 C 和决策属性集 组成, , ,即 ;V = ,其中, 为条件属性值集合, 为决策属性 值集合; 为区间值映射, 为单值映射,则称区间值信息系统为区间值决策系 统 。 η1=[l k i ,u k i ] η2=[l k j ,u k j 定义 1 设 和 ] 为任意两个区 间值,则区间值的交运算与并运算如下。 1) 区间值交运算为 η1 ∩η2 = { 0, (u k i < l k j )∨(u k j < l k i ) [max(l k i ,l k j ),min(u k i ,u k j )], 其他 2) 区间值并运算为 η1 ∪η2 = [min(l k i ,l k j ),max(u k i ,u k j )] 目前,度量区间值相似度比较合理的主要方法 有 Jaccard 相似率、悲观相似率和乐观相似率,本文 统一采用 Jaccard 相似率来度量两个区间值的相似度。 DS = (U,C ∪ D,V, f) xi , xj ∈ U ak ∈ C ak(xi)= [l k i ,u k i ] ak(xj) = [l k j ,u k j ] α k i j 定义 2 为区间值决策系统, 对任意的 , ,区间值 和 的 Jaccard 相似率[18] 定义为 α k i j= |[l k i ,u k i ]∩[l k j ,u k j ]| |[l k i ,u k i ]∪[l k j ,u k j ]| Jaccard 相似率为两个区间数的交集与并集长 度的比值,它适合度量长度相似的两个区间数。 DS = (U,C ∪ D,V, f) U = {x1, x2,··· , x6} {a1,a2,a3,a4} D ={d} 例 1 区间值决策系统 ,如 表 1 所示,其中, 为对象的集合,C = 为条件属性的集合, 为决策属性。 表 1 不协调区间值决策系统 Table 1 Inconsistent interval-valued decision systems U a1 a2 a3 a4 d x1 [0.86,3.13] [–0.20,2.23] [–0.26,2.26] [–0.19,2.20] 1 x2 [–0.12,2.13] [0.79,3.20] [0.73,3.26] [0.73,3.26] 2 x3 [–0.13,2.20] [0.86,2.95] [–0.26,2.26] [–0.24,2.12] 2 x4 [–0.14,2.01] [0.85,3.01] [0.71,3.11] [–0.24,2.11] 2 x5 [–0.13,2.13] [0.79,2.94] [–0.26,2.23] [–0.25,2.30] 1 x6 [–0.13,2.13] [0.82,3.10] [–0.24,2.19] [–0.24,2.11] 1 η1 = [l 1 1 ,u 1 1 ] η1 = [l 1 2 ,u 1 2 令 , ] ,分别计算 η1和 η2的交、 并: η1 ∩η2 = [0.86,3.13]∩[−0.12,2.13] = [0.86,2.13] η1 ∪η2 = [0.86,3.13]∪[−0.12,2.13] = [−0.12,3.13] 计算 η1和 η2的 Jaccard 相似率: α 1 12 = |[l 1 1 ,u 1 1 ]∩[l 1 2 ,u 1 2 ]| |[l 1 1 ,u 1 1 ]∪[l 1 2 ,u 1 2 ]| = 0.391 定义 3 DS = (U,C∪ [ 1 5 ] 对于区间值决策系统 ·470· 智 能 系 统 学 报 第 13 卷