正在加载图片...
第5期 黄琴,等:代价敏感数据的多标记特征选择算法 ·935· 表2~4中表示在正态分布函数下,用5种多 中给出的数据是AP取最优值时,所对应的PC、 标记特征选择算法分别对Yeast、Emotions和Birds HL、OE、Coverage、RL和k的值。另外,各项评价 这3个数据集进行特征降维,并用IBLR-ML 指标的最优值用黑体标注,」表示该项指标值越小 分类算法验证降维后的特征子集的分类性能,同 算法的分类性能越好,↑表示该项指标的值越大算 时,与原始数据集的分类性能进行对比。表2~4 法的分类性能越好。 表2 Yeast数据集的实验结果比较 Table 2 The comparisons of Yeast datasets 性能指标 原始数据集 CSMLFSIE算法MLFSIE算法 CSMLPA算法 MLPA算法 MLDM算法 PC(1/% 100 2.34 3.26 16.34 15.81 15.02 HL ( 0.1934±0.01180.193240.0121 0.1926±0.01150.2082±0.0092 0.2109±0.0102 0.2094±0.0086 OE() 0.2263±0.0316 0.2197±0.03380.2271±0.02750.2379±0.03440.2453±0.0306 0.2441±0.0356 Coverage() 6.1927±0.1747 6.1567±0.2028 6.1662±0.1822 6.4811±0.1564 6.5972±0.2097 6.5726±0.1803 RL() 0.1635±0.0117 0.1619±0.0122 0.1624±0.01170.1808±0.01340.1882±0.0148 0.1847±0.0147 AP(1) 0.7687±0.0200 0.7724±0.02150.7711±0.01940.7470±0.0221 0.7368±0.0212 0.7398±0.0229 45 45 J 表3 Emotions数据集的实验结果比较 Table 3 The comparisons of Emotions datasets 性能指标 原始数据集 CSMLFSIE算法 MLFSIE算法 CSMLPA算法 MLPA算法 MLDM算法 PC(/% 100 6.47 18.96 21.83 6.47 17.08 HL() 0.1883±0.02390.1864±0.0237 0.1853±0.01990.2024±0.02000.2218±0.02580.2249±0.0214 OE() 0.2581±0.0656 0.2582±0.0732 0.2514±0.05610.2784±0.0560 0.31530.0487 0.3020±0.0660 Coverage() 1.7087±0.1303 1.6905±0.1540 1.7292±0.14201.8031±0.1282 1.8908±0.1508 1.8674±0.1321 RL() 0.1496±0.0280 0.1488±0.0315 0.1519±0.02650.1683±0.02150.1914±0.0243 0.1826±0.0267 AP(1) 0.8126±0.0349 0.8135±0.0404 0.812740.03240.7950±0.0283 0.773440.0310 0.7803±0.0336 k 25 25 5 35 表4 Birds数据集的实验结果比较 Table 4 The comparisons of Birds datasets 性能指标 原始数据集 CSMLFSIE算法MLFSIE算法 CSMLPA算法 MLPA算法 MLDM算法 PC(1/% 100 11.65 46.54 21.83 2.77 2.95 HL() 0.0501±0.0065 0.051240.0075 0.0502±0.00770.0520±0.00750.0533±0.0084 0.0557±0.0087 OE() 0.7189±0.0446 0.7034±0.0437 0.70200.02880.7252±0.0349 0.7406±0.0301 0.7375±0.0403 Coverage(1)2.6227±0.5371 2.4450±0.5553 2.4856±0.56592.6571±0.5322 2.4642±0.4007 2.6112±0.5422 RL() 0.0915±0.0218 0.0841±0.0202 0.0848±0.0217 0.0920±0.0203 0.0883±0.0146 0.0930±0.0194 AP(↑) 0.5914±0.0458 0.6171±0.0577 0.6137±0.0502 0.5905±0.0564 0.5746±0.0426 0.5734±0.0472 45 35 5 30 25 由表2~4中的5种多标记分类性能评价指 行特征降维后,特征子集的分类性能优于原始数 标的结果可以看出,CSMLFSIE算法总体优于其 据集,其中,最为突出的是在PC这项指标上。另 他4种算法,较为明显的有Coverage、HL和AP 外,由表2~4可知,各个算法分类性能最优时, 这3项性能指标。同时,通过CSMLFSIE算法进 所对应的离散化参数k的取值也存在差异。由表2表 2~4 中表示在正态分布函数下,用 5 种多 标记特征选择算法分别对 Yeast、Emotions 和 Birds 这 3 个数据集进行特征降维,并用 IBLR-ML 分类算法验证降维后的特征子集的分类性能,同 时,与原始数据集的分类性能进行对比。表 2~4 中给出的数据是 AP 取最优值时,所对应的 PC、 HL、OE、Coverage、RL 和 k 的值。另外,各项评价 指标的最优值用黑体标注,↓表示该项指标值越小 算法的分类性能越好,↑表示该项指标的值越大算 法的分类性能越好。 表 2 Yeast 数据集的实验结果比较 Table 2 The comparisons of Yeast datasets 性能指标 原始数据集 CSMLFSIE算法 MLFSIE算法 CSMLPA算法 MLPA算法 MLDM算法 PC(↓)/% 100 2.34 3.26 16.34 15.81 15.02 HL (↓) 0.193 4±0.011 8 0.193 2±0.012 1 0.192 6±0.011 5 0.208 2±0.009 2 0.210 9±0.010 2 0.209 4±0.008 6 OE (↓) 0.226 3±0.031 6 0.219 7±0.033 8 0.227 1±0.027 5 0.237 9±0.034 4 0.245 3±0.030 6 0.244 1±0.035 6 Coverage(↓) 6.192 7±0.174 7 6.156 7±0.202 8 6.166 2±0.182 2 6.481 1±0.156 4 6.597 2±0.209 7 6.572 6±0.180 3 RL (↓) 0.163 5±0.011 7 0.161 9±0.012 2 0.162 4±0.011 7 0.180 8±0.013 4 0.188 2±0.014 8 0.184 7±0.014 7 AP (↑) 0.768 7±0.020 0 0.772 4±0.021 5 0.771 1±0.019 4 0.747 0±0.022 1 0.736 8±0.021 2 0.739 8±0.022 9 k — 45 45 5 5 5 表 3 Emotions 数据集的实验结果比较 Table 3 The comparisons of Emotions datasets 性能指标 原始数据集 CSMLFSIE算法 MLFSIE算法 CSMLPA算法 MLPA算法 MLDM算法 PC(↓)/% 100 6.47 18.96 21.83 6.47 17.08 HL (↓) 0.188 3±0.023 9 0.186 4±0.023 7 0.185 3±0.019 9 0.202 4±0.020 0 0.221 8±0.025 8 0.224 9±0.021 4 OE (↓) 0.258 1±0.065 6 0.258 2±0.073 2 0.251 4±0.056 1 0.278 4±0.056 0 0.315 3±0.048 7 0.302 0±0.066 0 Coverage(↓) 1.708 7±0.130 3 1.690 5±0.154 0 1.729 2±0.142 0 1.803 1±0.128 2 1.890 8±0.150 8 1.867 4±0.132 1 RL (↓) 0.149 6±0.028 0 0.148 8±0.031 5 0.151 9±0.026 5 0.168 3±0.021 5 0.191 4±0.024 3 0.182 6±0.026 7 AP (↑) 0.812 6±0.034 9 0.813 5±0.040 4 0.812 7±0.032 4 0.795 0±0.028 3 0.773 4±0.031 0 0.780 3±0.033 6 k — 25 25 5 35 5 表 4 Birds 数据集的实验结果比较 Table 4 The comparisons of Birds datasets 性能指标 原始数据集 CSMLFSIE算法 MLFSIE算法 CSMLPA算法 MLPA算法 MLDM算法 PC(↓)/% 100 11.65 46.54 21.83 2.77 2.95 HL (↓) 0.050 1±0.006 5 0.051 2±0.007 5 0.050 2±0.007 7 0.052 0±0.007 5 0.053 3±0.008 4 0.055 7±0.008 7 OE (↓) 0.718 9±0.044 6 0.703 4±0.043 7 0.702 0±0.028 8 0.725 2±0.034 9 0.740 6±0.030 1 0.737 5±0.040 3 Coverage(↓) 2.622 7±0.537 1 2.445 0±0.555 3 2.485 6±0.565 9 2.657 1±0.532 2 2.464 2±0.400 7 2.611 2±0.542 2 RL (↓) 0.091 5±0.021 8 0.084 1±0.020 2 0.084 8±0.021 7 0.092 0±0.020 3 0.088 3±0.014 6 0.093 0±0.019 4 AP (↑) 0.591 4±0.045 8 0.617 1±0.057 7 0.613 7±0.050 2 0.590 5±0.056 4 0.574 6±0.042 6 0.573 4±0.047 2 k — 45 35 5 30 25 由表 2~4 中的 5 种多标记分类性能评价指 标的结果可以看出,CSMLFSIE 算法总体优于其 他 4 种算法,较为明显的有 Coverage、HL 和 AP 这 3 项性能指标。同时,通过 CSMLFSIE 算法进 行特征降维后,特征子集的分类性能优于原始数 据集,其中,最为突出的是在 PC 这项指标上。另 外,由表 2~4 可知,各个算法分类性能最优时, 所对应的离散化参数 k 的取值也存在差异。由表 2 第 5 期 黄琴,等:代价敏感数据的多标记特征选择算法 ·935·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有