正在加载图片...
218. 智能系统学报 第10卷 训练集用来选择基因和调整分类器权重,测试集用 0.95r 来估计分类性能。训练集有38个样本(27个ALL 0.90 SVM-RFE SVDD 和11个AML),测试集有34个样本(20个ALL和 14个AML)。所有样本有7129个特征,对应于从 0.85 微阵列图像中提取出的归一化基因表达值。本实验 0.80 中,将ALL视为目标样本,AML视为负类样本。本 数据集可从文献[12]中得到。本实验中的所有方 0.75 法是从7129个特征中选取100个重要特征,并且 0.70 2345678910 仅有参数C需要设置。接下来的实验中,将会讨论 已选特征的好坏,然后去衡量分类精度的性能。 图1分类精度的变化 本实验的对比方法有SVM-RFE、SVDD-radius- Fig.I The accuracy with the change RFE、SVDD-dual-objective-.RFE以及SVDD-RFE。用 从图1可以看出,SVDD-RFE相较于SVM-RFE KNN(nearest neighbor)分类器来衡量选择的特征是 可以得到更好的分类精度。且在k=6时达到最好。 否合适。KNN由于其简单性和有效性成为一种很方 但通常会选择奇数,因此接下来的实验中,选择k= 便的分类器,它的核心思想是在训练集合中找到距离 5。接下来研究参数C的变化对4种特征选择方法 测试样本点最近的k个点,然后将该测试样本点的类 性能的影响。对于SVM-RFE,C在 {0.1,1,10,100,1000}集合中取值,对于SVDD- 别设置为k个点中数量最多类的类别标签。 RFE SVDD-radius-RFE SVDD-dual-objective-RFE 因为选择KNN作为分类器,参数k的选择对分 3种方法,C在[1/n,1]中取5个线性等距间隔,n 类精度有一定影响。出于运行时间上的考虑,仅对 是训练样本的个数,即{0.037,0.28,0.52,0.76,1}。 SVM-RFE和SVDD-RFE做了参数k的比较。令k 在表1中,给出了不同C变化下,各种方法的分类召 从1~10变化,同时分别令SVM-RFE中C=100,在 回率。此外还有不进行特征选择时,直接采用KNN SVDD-RFE中C=0.1。图1给出了2种算法在不同 分类器的识别效果。 k值下的分类精度变化曲线。 表14种特征选择方法和不做特征选择的性能比较 Table 1 The comparison of training between QINN and BPNN SVM-RFE SVDD-radius-RFE AML的 平均召 运行时 ALL的召AML的 平均召 运行时 C值 ALL的召 C值 回率/%召回率/%回率/% 间/s 回率/%召回率/%回率/% 间/s 0.1 100.00 14.29 57.14 507.64 0.037 0 100.00 50.00 154058.76 1 100.00 14.29 57.14 491.95 0.28 100.00 35.71 67.86 11917.37 10 100.00 14.29 57.14 500.43 0.52 100.00 42.86 71.43 12432.45 100 100.00 14.29 57.14 432.83 0.76 100.00 42.86 71.43 11575.10 1000 100.00 14.29 57.14 431.20 100.00 42.86 71.43 10359.75 SVDD-dual-objective-RFE SVDD-RFE ALL的召 AML的 平均召 运行时 ALL的召AML的 平均召 运行时 C值 C值 回率/%召回率/%回率/% 间/s 回率/%召回率/%回率/% 间/s 0.037 100.00 21.43 60.71 44230.98 0.037 95.00 92.86 93.93 163.87 0.28 95.00 35.71 65.36 9522.17 0.28 100.00 50.00 75.00 137.82 0.52 100.00 7.14 53.57 9721.61 0.52 100.00 50.00 75.00 165.13 0.76 100.00 7.14 53.57 10253.75 0.76 100.00 50.00 75.00 155.48 1 100.00 7.14 53.57 9398.531 100.00 50.00 75.00 153.83 None ALL的召AML的 平均召 运行时 C值 回率/%召回率/%回率/% 间/s 100.00 29.00 64.50训练集用来选择基因和调整分类器权重,测试集用 来估计分类性能。 训练集有 38 个样本(27 个 ALL 和 11 个 AML),测试集有 34 个样本(20 个 ALL 和 14 个 AML)。 所有样本有 7 129 个特征,对应于从 微阵列图像中提取出的归一化基因表达值。 本实验 中,将 ALL 视为目标样本,AML 视为负类样本。 本 数据集可从文献[12]中得到。 本实验中的所有方 法是从 7 129 个特征中选取 100 个重要特征,并且 仅有参数 C 需要设置。 接下来的实验中,将会讨论 已选特征的好坏,然后去衡量分类精度的性能。 本实验的对比方法有 SVM⁃RFE、SVDD⁃radius⁃ RFE、SVDD⁃dual⁃objective⁃ RFE 以及 SVDD⁃RFE。 用 KNN(nearest neighbor)分类器来衡量选择的特征是 否合适。 KNN 由于其简单性和有效性成为一种很方 便的分类器,它的核心思想是在训练集合中找到距离 测试样本点最近的 k 个点,然后将该测试样本点的类 别设置为 k 个点中数量最多类的类别标签。 因为选择 KNN 作为分类器,参数 k 的选择对分 类精度有一定影响。 出于运行时间上的考虑,仅对 SVM⁃RFE 和 SVDD⁃RFE 做了参数 k 的比较。 令 k 从 1~10 变化,同时分别令 SVM⁃RFE 中 C = 100,在 SVDD⁃RFE 中 C = 0.1。 图 1 给出了 2 种算法在不同 k 值下的分类精度变化曲线。 图 1 分类精度的变化 Fig.1 The accuracy with the change 从图 1 可以看出,SVDD⁃RFE 相较于 SVM⁃RFE 可以得到更好的分类精度。 且在 k = 6 时达到最好。 但通常会选择奇数,因此接下来的实验中,选择 k = 5 。 接下来研究参数 C 的变化对 4 种特征选择方法 性 能 的 影 响。 对 于 SVM⁃RFE, C 在 {0.1,1,10,100,1000} 集 合 中 取 值, 对 于 SVDD⁃ RFE、SVDD⁃radius⁃RFE 和 SVDD⁃ dual⁃objective⁃RFE 3 种方法, C 在 [1 / n,1] 中取 5 个线性等距间隔, n 是训练样本的个数,即 {0.037,0.28,0.52,0.76,1} 。 在表 1 中,给出了不同 C 变化下,各种方法的分类召 回率。 此外还有不进行特征选择时,直接采用 KNN 分类器的识别效果。 表 1 4 种特征选择方法和不做特征选择的性能比较 Table 1 The comparison of training between QINN and BPNN SVM⁃RFE C 值 ALL 的召 回率/ % AML 的 召回率/ % 平均召 回率/ % 运行时 间/ s SVDD⁃radius⁃RFE C 值 ALL 的召 回率/ % AML 的 召回率/ % 平均召 回率/ % 运行时 间/ s 0.1 100.00 14.29 57.14 507.64 0.037 0 100.00 50.00 154 058.76 1 100.00 14.29 57.14 491.95 0.28 100.00 35.71 67.86 11 917.37 10 100.00 14.29 57.14 500.43 0.52 100.00 42.86 71.43 12 432.45 100 100.00 14.29 57.14 432.83 0.76 100.00 42.86 71.43 11 575.10 1000 100.00 14.29 57.14 431.20 1 100.00 42.86 71.43 10 359.75 SVDD⁃dual⁃objective⁃RFE C 值 ALL 的召 回率/ % AML 的 召回率/ % 平均召 回率/ % 运行时 间/ s SVDD⁃RFE C 值 ALL 的召 回率/ % AML 的 召回率/ % 平均召 回率/ % 运行时 间/ s 0.037 100.00 21.43 60.71 44 230.98 0.037 95.00 92.86 93.93 163.87 0.28 95.00 35.71 65.36 9 522.17 0.28 100.00 50.00 75.00 137.82 0.52 100.00 7.14 53.57 9 721.61 0.52 100.00 50.00 75.00 165.13 0.76 100.00 7.14 53.57 10 253.75 0.76 100.00 50.00 75.00 155.48 1 100.00 7.14 53.57 9 398.531 100.00 50.00 75.00 153.83 None C 值 ALL 的召 回率/ % AML 的 召回率/ % 平均召 回率/ % 运行时 间/ s - 100.00 29.00 64.50 - ·218· 智 能 系 统 学 报 第 10 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有