而ＰＯＳＢ（Ｄ）⊆ＰＯＳＡ（Ｄ）显然成立，因此ＰＯＳＢ（Ｄ）＝ＰＯＳ

正在加载图片...

第3期冯丹，等：连续型数据的辨识矩阵属性约简方法 ·373· 而POSg(D)CPOS,(D)显然成立，因此POSB(D)= 表1病例决策信息表 P0S,(D)。 Table 1 Decision information for cases 另设x,x∈POS4(D)且[x:]。∩[x]。=☑，则序号 a 存在X,X,∈U/D(X。≠X)使得8(x:)≤X。=[x:]D 0.66 0.45 0.20 0.82 和8(x)CX1=[x]0。由于x4(x:)→x X2 0.47 0.30 0.06 0.65 1 6(x:),所以6(x:)CX。,从而x:∈POSg(D)。于是 X3 0.05 0.80 0.40 0.10 2 POS(D)CPOS(D),而POSB(D)CPOS,(D)是显 0.35 0.51 0.00 0.52 2 然成立的，因此POS(D)=POS4(D)。综上所述，结 0.31 0.20 0.15 0.70 论成立。根据定理1可以定义如下的辨识矩阵。 0.00 1.00 0.20 0.00 2 定义3设(U,A,F,D={d})为决策表，U= 取￡=0.25，根据定义1和定义2，计算关系矩阵 {x1,x2,…,xn},A={a1,a2,am},令 N,(i≤4)、N,以及决策关系矩阵N。分别为 DIS =(x,)x;EPOS,(D),;POS,(D)A 110000 110110 111111 d(x:)≠d(x)}U{(x,x)lx,x∈ 110110 110110 110111 P0S,(D)A[x:]。∩[x]。= 001001 001001 101011 N,= ,N3= 则称DIS为决策表(U,A,F,D)的可辨识域。对于 010110 ,N2= 110100 110111 任意的样本对(x:,x)eDIS,记 010110 110010 111111 {a∈A:年δn(x:)},(x:,x)∈DIS 001001 001001] 111111 DM(i,j)= 110010 110000 110010 (A,(x,x)生DIS 110110 110110 110010 则称DM(i,j)为x,x的辩识集合，称DM为基于 001001 001001 001101 邻域关系的辨识矩阵。 N .NA= ,N= 010110 010100 001101 定理2设DM为决策表(U,A,F,D={d})的 110110 010010 110010 辨识矩阵，B二A,则B是决策表的一个约简的充要 001001 001001 001101」条件是：B满足B∩DM(i,j)≠☑，Hx:,x∈U的最说明N4￠N。由以上计算知，POS(D)={x1,x, 小子集。 x5,x6}。根据定义3，得到辨识矩阵如表2所示。定理2说明通过辨识矩阵可以等价地刻画决策表2病例决策信息表的辨识矩阵表的属性约简。下面给出决策表的属性约简的辨 Table 2 Discernibility matrix of case decisions 识公式。通过析取和合取运算可以获得决策表的序号 X2 全部约简。 a1,a2,a4a1,a4 1,a2,a4 定义4设DM为决策表(U,A,F,D)的辨识矩阵，U={x1,x2,…,xn},辨识函数定义为 A y A f(U,A,F,D)=A (V DM(i,j)) x3 a1,a2,d4 A A a1,2,a4 A i.i=1 定理3设f(U,A,F,D)为决策表(U,A,F,D) A A A 的辨识函数，如果通过析取和合取运算，有 A A a1,a2,a4 a1,a2,a4 f(U,A,F,D)=V (A B) x6a1,a2,a4a1,a2,a4 A A a,a,aa A k=1 式中：B,CA,且B中每个属性只能出现一次。则称所以，可得决策表的辨识函数为 {B:k≤}是A的所有约简组成的集类。 f=(a Va)A(a VaVa)Aa2= A的所有约简组成的集类记为RED,(A)={B: (a1∧a2)V(a2Aa4) k≤}。因此{a1,a2}和{a2,a4}是病例决策表的两个下面通过一个具体的实例来说明应用辨识矩约简。阵方法如何求解邻域决策表的属性约简。 2属性约简算法例1表1是具有4种症状a1、a2、a3、a4的某些病例信息，具体描述如表1所示。经典粗糙集算法是以等价关系作为聚类标准而ＰＯＳＢ（Ｄ）⊆ＰＯＳＡ（Ｄ）显然成立，因此ＰＯＳＢ（Ｄ）＝ＰＯＳＡ（Ｄ）。另设ｘｉ，ｘｊ∈ＰＯＳＡ（Ｄ）且［ｘｉ］Ｄ∩［ｘｊ］Ｄ＝ ∅，则存在Ｘ０，Ｘ１∈Ｕ／ＤＸ０≠Ｘ１ ( ) 使得 δＡ（ｘｉ）⊆Ｘ０＝［ｘｉ］Ｄ和 δＡ（ｘｊ） ⊆ Ｘ１＝［ｘｊ］Ｄ。由于ｘｊ ∉ δＡ（ｘｉ） ⇒ ｘｊ ∉ δＢ（ｘｉ），所以 δＢ（ｘｉ）⊆Ｘ０，从而ｘｉ∈ＰＯＳＢ（Ｄ）。于是ＰＯＳＡ（Ｄ） ⊆ＰＯＳＢ（Ｄ），而ＰＯＳＢ（Ｄ）⊆ＰＯＳＡ（Ｄ）是显然成立的，因此ＰＯＳＢ（Ｄ）＝ＰＯＳＡ（Ｄ）。综上所述，结论成立。根据定理１可以定义如下的辨识矩阵。定义３设（Ｕ，Ａ，Ｆ，Ｄ＝｛ｄ｝）为决策表，Ｕ＝｛ｘ１，ｘ２，…，ｘｎ｝，Ａ＝｛ａ１，ａ２，…ａｍ｝，令ＤＩＳ＝｛（ｘｉ，ｘｊ）ｘｉ ∈ＰＯＳＡ（Ｄ），ｘｊ ∉ ＰＯＳＡ（Ｄ） ∧ ｄ（ｘｉ） ≠ ｄ（ｘｊ）｝ ∪ ｛（ｘｉ，ｘｊ）ｘｉ，ｘｊ ∈ ＰＯＳＡ（Ｄ） ∧ ［ｘｉ］Ｄ ∩ ［ｘｊ］Ｄ＝ ∅｝则称ＤＩＳ为决策表（Ｕ，Ａ，Ｆ，Ｄ）的可辨识域。对于任意的样本对（ｘｉ，ｘｊ）∈ＤＩＳ，记ＤＭ（ｉ，ｊ）＝｛ａｌ ∈ Ａ：ｘｊ ∉ δａｌ（ｘｉ）｝，（ｘｉ，ｘｊ） ∈ ＤＩＳＡ，（ｘｉ，ｘｊ） ∉ ＤＩＳ { 则称ＤＭ（ｉ，ｊ）为ｘｉ，ｘｊ的辩识集合，称ＤＭ为基于邻域关系的辨识矩阵。定理２设ＤＭ为决策表（Ｕ，Ａ，Ｆ，Ｄ＝｛ｄ｝）的辨识矩阵，Ｂ⊆Ａ，则Ｂ是决策表的一个约简的充要条件是：Ｂ满足Ｂ∩ＤＭ（ｉ，ｊ）≠∅，∀ｘｉ，ｘｊ∈Ｕ的最小子集。定理２说明通过辨识矩阵可以等价地刻画决策表的属性约简。下面给出决策表的属性约简的辨识公式。通过析取和合取运算可以获得决策表的全部约简。定义４设ＤＭ为决策表（Ｕ，Ａ，Ｆ，Ｄ）的辨识矩阵，Ｕ＝｛ｘ１，ｘ２，…，ｘｎ｝，辨识函数定义为ｆ(Ｕ，Ａ，Ｆ，Ｄ) ＝ ∧ ｎｉ，ｊ＝１（∨ ＤＭ（ｉ，ｊ））定理３设ｆ（Ｕ，Ａ，Ｆ，Ｄ）为决策表（Ｕ，Ａ，Ｆ，Ｄ）的辨识函数，如果通过析取和合取运算，有ｆ（Ｕ，Ａ，Ｆ，Ｄ）＝∨ ｌｋ＝１（∧ Ｂｋ）式中：Ｂｋ⊆Ａ，且Ｂｋ中每个属性只能出现一次。则称 {Ｂｋ：ｋ≤ｌ}是Ａ的所有约简组成的集类。Ａ的所有约简组成的集类记为ＲＥＤＤ（Ａ）＝｛Ｂｋ：ｋ≤ｌ｝。下面通过一个具体的实例来说明应用辨识矩阵方法如何求解邻域决策表的属性约简。例１表１是具有４种症状ａ１、ａ２、ａ３、ａ４的某些病例信息，具体描述如表１所示。表１病例决策信息表Ｔａｂｌｅ１Ｄｅｃｉｓｉｏｎｉｎｆｏｒｍａｔｉｏｎｆｏｒｃａｓｅｓ序号ａ１ａ２ａ３ａ４Ｄｘ１０．６６０．４５０．２００．８２１ｘ２０．４７０．３００．０６０．６５１ｘ３０．０５０．８００．４００．１０２ｘ４０．３５０．５１０．０００．５２２ｘ５０．３１０．２００．１５０．７０１ｘ６０．００１．０００．２００．００２取 ε ＝０．２５，根据定义１和定义２，计算关系矩阵Ｎｌ（ｉ≤４）、ＮＡ以及决策关系矩阵ＮＤ分别为Ｎ１＝１１００００１１０１１０００１００１０１０１１００１０１１０００１００１ é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ，Ｎ２＝１１０１１０１１０１１０００１００１１１０１００１１００１０００１００１ é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ，Ｎ３＝１１１１１１１１０１１１１０１０１１１１０１１１１１１１１１１１１１１１ é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú Ｎ４＝１１００１０１１０１１０００１００１０１０１１０１１０１１０００１００１ é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ，ＮＡ＝１１００００１１０１１０００１００１０１０１０００１００１０００１００１ é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ，ＮＤ＝１１００１０１１００１０００１１０１００１１０１１１００１０００１１０１ é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú 说明ＮＡ⊄ＮＤ。由以上计算知，ＰＯＳＡ（Ｄ）＝｛ｘ１，ｘ３，ｘ５，ｘ６｝。根据定义３，得到辨识矩阵如表２所示。表２病例决策信息表的辨识矩阵Ｔａｂｌｅ２Ｄｉｓｃｅｒｎｉｂｉｌｉｔｙｍａｔｒｉｘｏｆｃａｓｅｄｅｃｉｓｉｏｎｓ序号ｘ１ｘ２ｘ３ｘ４ｘ５ｘ６ｘ１ＡＡａ１，ａ２，ａ４ａ１，ａ４Ａａ１，ａ２，ａ４ｘ２ＡＡＡＡＡＡｘ３ａ１，ａ２，ａ４ＡＡＡａ１，ａ２，ａ４Ａｘ４ＡＡＡＡＡＡｘ５ＡＡａ１，ａ２，ａ４ＡＡａ１，ａ２，ａ４ｘ６ａ１，ａ２，ａ４ａ１，ａ２，ａ４ＡＡａ１，ａ２，ａ４Ａ所以，可得决策表的辨识函数为ｆ＝（ａ１ ∨ ａ４） ∧ （ａ１ ∨ ａ２ ∨ ａ４） ∧ ａ２＝（ａ１ ∧ ａ２） ∨ （ａ２ ∧ ａ４）因此｛ａ１，ａ２｝和｛ａ２，ａ４｝是病例决策表的两个约简。２属性约简算法经典粗糙集算法是以等价关系作为聚类标准第３期冯丹，等：连续型数据的辨识矩阵属性约简方法 ·３７３·

<<向上翻页向下翻页>>

点击下载：《智能系统学报》：连续型数据的辨识矩阵属性约简方法