正在加载图片...
·478 智能系统学报 第11卷 性偏序决策图决策结果输出可表示为表3。 表5乳腺癌数据集粒化规则 表3图2所示属性偏序决策图决策结果输出 Table 5 Graining rules of BCWD Table 3 Decision output of DDAPOS of Fig.2 序号 粒化规则 序号 决策输出结果 1 F(U<=2)THEN(c1=1,c32=0) R IF (C)AND (c3))THEN D=d) 2 F(U>2)THEN(c1=0,c2=1) R2 IF (c AND c )THEN (D=d2 3 IF(U<=3)THEN(c3=1,c4=0) R3 IF (c2)AND ea)AND (cs))THEN (D.=d3) 4 IF (U >3)THEN c3 =0,ca 1) Ra IF c2)AND c3)AND (c))THEN (D.=d2 5 IF (BN <=2)THEN cs 1,cs =0) Rs IF (c2)AND (ca)AND (cs))THEN (D=d2 ) 6 IF BN >2)THEN cs =0,c 1) 3实例实验结果与分析 表6乳腺癌数据决策信息表 Table 6 Decision information table of BCWD 下面通过一个医学诊断的实例介绍属性偏序决 策图的具体使用方法,并验证其规则提取的有效性。 原始数据 条件属性C 编号 D 3.1实验数据 UU BN C C2 eseses Co 选用UCI数据库的Breast Cancer Wisconsin Da- 1190394113101001N ta Set(BCWD)数据集验证属性偏序决策图的有效 1272039111 1 0 1 0 0 N 性,数据集属性组成如表4所示。该数据集共有 11732353 2 3 0 1 0 N 699个样本(其中有16个样本存在属性缺失),9个 11331361 1 3 1 010 0 1 N 属性,2个类(良性、恶性)。本实验别除了这些有属 12079868 4 8 010 1 0 1 性缺失的样本,因此实际使用了数据集中样本683 837480 4 4 100 10 1 0 1 P 个。实验采用10折交叉验证的方式对所述方法的 可行性进行验证,并与主流的模式分类算法进行了 10498371 1 11 0 对比分析。 …… 表4:乳腺癌数据集属性构成 3)根据决策形式信息表生成决策模式信息表。 Table 4 Attributes of BCWD 检索决策信息表中的模式,得到乳腺癌数据决策模 代码 属性 取值范围 式信息表如表7所示。 CT Clump Thickness 1-10 表7乳腺癌数据决策模式信息表 Uo Uniformity of Cell Size 1-10 Table 7 Decision pattern information table of BCWD Uok Uniformity of Cell Shape 1-10 C MA Marginal Adhesion 1~10 De SECS CI C2 C3 C6 Single Epithelial Cell Size 1~10 m 1 0 1 0 0 N 20 BN 1 Bare Nuclei 1-10 m 1 0 1 0 0 1 P > BC Bland Chromatin 1-10 m3 1 0 0 0 N 305 NN Normal Nucleoli 1-10 ma 0 0 0 1 P 17 Mitoses 1-10 ms 0 0 0 1 玉 3.2实验过程 0 少 5 1)原始数据特征(属性)选择。根据原始数 m 0 0 据分布,利用lasso算法完成特征子集选择,特征 ms 0 0 19 相关序列为:BN、U.、Um、CT、BC、NN、MA、 0 0 P SECS、M1)。本例选取其中3个属性:BV、U 0 1 0 1 0 1> U参与决策生成。 mu 0 1 0 1 0 N 2)原始数据粒化,生成决策形式信息表。以数 m12 0 1 0 0 1 140 据驱动的决策规则生成中,数据的形式可能是数值 m13 0 1 0 0 1 N 5 型、名义型、布尔型、区间型等。所有的原始数据需 1 0 0 0 1 P 根据不同粒化规则,转换为布尔型规则。根据原始 表8为决策模式不一致信息表,对条件属性相 数据分布,按表5规则完成数据粒化生成决策信息 同但决策属性不同的模式中,按照模式度较小的模 表如表6所示。 式的决策属性服从模式度较大模式的原则进行修性偏序决策图决策结果输出可表示为表 3。 表 3 图 2 所示属性偏序决策图决策结果输出 Table 3 Decision output of DDAPOS of Fig.2 序号 决策输出结果 R1 IF (( c1 ) AND ( c3 )) THEN ( Dresult = d1 ); R2 IF (( c1 ) AND ( c4 )) THEN (Dresult = d2 ); R3 IF (( c2 ) AND ( c3 ) AND (c5 )) THEN (Dresult = d3 ); R4 IF (( c2 ) AND ( c3 ) AND (c6 )) THEN (Dresult = d2 ); R5 IF (( c2 ) AND ( c4 ) AND (c5 )) THEN (Dresult = d2 ); 3 实例实验结果与分析 下面通过一个医学诊断的实例介绍属性偏序决 策图的具体使用方法,并验证其规则提取的有效性。 3.1 实验数据 选用 UCI 数据库的 Breast Cancer Wisconsin Da⁃ ta Set(BCWD)数据集验证属性偏序决策图的有效 性,数据集属性组成如表 4 所示。 该数据集共有 699 个样本(其中有 16 个样本存在属性缺失),9 个 属性,2 个类(良性、恶性)。 本实验剔除了这些有属 性缺失的样本,因此实际使用了数据集中样本 683 个。 实验采用 10 折交叉验证的方式对所述方法的 可行性进行验证,并与主流的模式分类算法进行了 对比分析。 表 4 乳腺癌数据集属性构成 Table 4 Attributes of BCWD 代码 属性 取值范围 CT Clump Thickness 1~ 10 Ucsi Uniformity of Cell Size 1~ 10 Ucsh Uniformity of Cell Shape 1~ 10 MA Marginal Adhesion 1~ 10 SECS Single Epithelial Cell Size 1~ 10 BN Bare Nuclei 1~ 10 BC Bland Chromatin 1~ 10 NN Normal Nucleoli 1~ 10 M Mitoses 1~ 10 3.2 实验过程 1)原始数据特征( 属性) 选择。 根据原始数 据分布,利用 lasso 算法完成特征子集选择,特征 相 关 序 列 为: BN、 Ucsh 、 Ucsi、 CT、 BC、 NN、 MA、 SECS、M [ 13] 。 本例选取其中 3 个属性:BN、Ucsh 、 Ucsi参与决策生成。 2)原始数据粒化,生成决策形式信息表。 以数 据驱动的决策规则生成中,数据的形式可能是数值 型、名义型、布尔型、区间型等。 所有的原始数据需 根据不同粒化规则,转换为布尔型规则。 根据原始 数据分布,按表 5 规则完成数据粒化生成决策信息 表如表 6 所示。 表 5 乳腺癌数据集粒化规则 Table 5 Graining rules of BCWD 序号 粒化规则 1 IF (Ucsi< = 2) THEN ( c1 = 1, c2 = 0 ) 2 IF (Ucsi>2) THEN ( c1 = 0, c2 = 1 ) 3 IF (Ucsh< = 3) THEN ( c3 = 1, c4 = 0 ) 4 IF (Ucsh>3) THEN ( c3 = 0 , c4 = 1 ) 5 IF (BN < = 2) THEN ( c5 = 1 , c6 = 0 ) 6 IF (BN >2) THEN ( c5 = 0, c6 = 1 ) 表 6 乳腺癌数据决策信息表 Table 6 Decision information table of BCWD 编号 原始数据 Ucsi Ucsh BN 条件属性 C c1 c2 c3 c4 c5 c6 D 1190394 1 1 3 1 0 1 0 0 1 N 1272039 1 1 1 1 0 1 0 1 0 N 1173235 3 2 3 0 1 1 0 0 1 N 1133136 1 1 3 1 0 1 0 0 1 N 1207986 8 4 8 0 1 0 1 0 1 P 837480 4 4 10 0 1 0 1 0 1 P 1049837 1 1 1 1 0 1 0 1 0 N … … … … … … … … … … … 3)根据决策形式信息表生成决策模式信息表。 检索决策信息表中的模式,得到乳腺癌数据决策模 式信息表如表 7 所示。 表 7 乳腺癌数据决策模式信息表 Table 7 Decision pattern information table of BCWD U C c1 c2 c3 c4 c5 c6 D De m1 1 0 1 0 0 1 N 20 m2 1 0 1 0 0 1 P 7 m3 1 0 1 0 1 0 N 305 m4 0 1 1 0 0 1 P 17 m5 0 1 1 0 0 1 N 3 m6 1 0 0 1 1 0 N 5 m7 1 0 0 1 1 0 P 1 m8 0 1 1 0 1 0 N 19 m9 0 1 1 0 1 0 P 2 m10 0 1 0 1 1 0 P 17 m11 0 1 0 1 1 0 N 3 m12 0 1 0 1 0 1 P 140 m13 0 1 0 1 0 1 N 5 m14 1 0 0 1 0 1 P 2 表 8 为决策模式不一致信息表,对条件属性相 同但决策属性不同的模式中,按照模式度较小的模 式的决策属性服从模式度较大模式的原则进行修 ·478· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有