第4期 左瑞娟,等:基于克隆选择的模糊分类规则提取算法 ·77· 选择是在经过高频变异后的种群中进行的.抗体再选 有很好的收敛效果:随着循环代数的增加,亲和力收 择的过程,是从变异的抗体群中找出变异较成功的n 敛达到最大值时,而规则个数也收敛至最小值,并且 个抗体,构成一个扩增抗体种群 收敛速度较快,其达到收敛的总循环代数N只需 6)新种群生成:在该过程中,将第5)步所得到的 80代.由此说明,文中所建立的目标函数(亲和力函 扩增抗体种群加入到1)中由N个抗体构成的种群 数)是合理的且适当的 中,并重新按亲和力降序排列找出其中亲和力最低的 表2亲和力及规则个数收敛情况 d个抗体.再随机产生d个抗体,替换上面的d个最 Table 2 Convergence about affinity and rules number 低亲和力的抗体,进行受体编辑,从而得到下一代的 代数 5 20 60 80 100 初始种群 亲和力 101.35135.16238.91253.93253.93 由5)6)可见克隆选择算法使每代的种群总是 朝着优良的变异方向进化,并采用受体编辑的手段有 规则个数 92 80 48 42 42 效地阻止局部寻优停滞的发生,从而更加有利于最优 3.2算法分类准确率及其稳定性 解的出现 以进化代数作为克隆选择的中止条件,当克隆选 表3是各循环代数下所得OPTS中的规则所 择的过程结束,抗体抗原亲和力达到稳定收敛后,可 确定的总分类准确率及其分类稳定性的统计.其中 以得到一个与初始种群相比平均亲和力高得多的抗 分类稳定性的统计采用的指标是分类准确率的标准 体种群.提取基因值为1的基因位对其进行解码得到 方差,反应了在随机情况下生成的规则集OPT_S 的分类稳定性】 对应的规则,考察该规则集的正确分类能力,并从多 次算法收敛后的抗体中找出正确分类能力最高的一 表3相应代数下所选规则的总分类正确率及 组构成最终的最优规则集OPT_S,从而完成克隆选 其分类稳定性统计 择算法对模糊f-then规则的提取 Table 3 Statistics a bout the classification correctness ratio and sta bility under different generations 3仿真结果 代数 5 20 60 80 100 经过多次实验,确定克隆选择算法中各参数设置 总分类 94 95 97.2 98.2 98.2 如下: 准确率/% 初始种群大小:N=6; 分类稳定性0.0230.0320.01160.00360.0036 克隆扩增种群大小:n=5; 循环代数:Nm; 由表3可以很清楚地看到:在收敛的情况下, 抗体变异率:a=exp(-p×f(OPT_S)),p= OPTS具有较高且较稳定的分类能力 Ngen 表4是在收敛的情况下最终确定的OPTS规 抗体中1与-1个数比例为:0.6:0.4: 则集合(共42条)的一部分,表4是通过Matlab编 正确分类能力与规则个数权值比值:WcP: 制程序的最终结果,每行为一条规则 Ws=1 :4 表4收敛情况下部分识别规则 Wcp:Ws的比值设定,经多次实验证明,当Ws Table 4 Part recognition rules in convergence 越大时,OPTS中包含的规则数就越多,经多次实验 1 23 4 5 678910 证明,在此二者比例选择为1:4时,所得规则的分类 111125.244500.627711111 能力较有保障,且分类性能比较稳定, 22220.247911.0000-11112 分类数据采用Matlab中自带的数据RIS,其包含 33250.64102 1.000011121 的数据类型为3类,共150个样本,每类50个样本. 44391.802000.33688-11122 以下是分别取Nm=10、20、30、50、80、100代 5513814.979001.000011211 分别进行10次仿真运算的平均结果 68220.232581.0000-11222 3.1算法收敛性效果 711210.109661.0000-12121 表2是抗体亲和力和规则个数的收敛情况.由 8123287.062900.6696512122 此可以很明显地看出该算法中亲和力和规则个数具 9163133.684300.8745612222 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net选择是在经过高频变异后的种群中进行的. 抗体再选 择的过程,是从变异的抗体群中找出变异较成功的 n 个抗体,构成一个扩增抗体种群. 6)新种群生成:在该过程中,将第 5) 步所得到的 扩增抗体种群加入到 1) 中由 N 个抗体构成的种群 中,并重新按亲和力降序排列找出其中亲和力最低的 d 个抗体. 再随机产生 d 个抗体 ,替换上面的 d 个最 低亲和力的抗体,进行受体编辑,从而得到下一代的 初始种群. 由 5) 、6) 可见克隆选择算法使每代的种群总是 朝着优良的变异方向进化,并采用受体编辑的手段有 效地阻止局部寻优停滞的发生,从而更加有利于最优 解的出现. 以进化代数作为克隆选择的中止条件,当克隆选 择的过程结束 ,抗体抗原亲和力达到稳定收敛后 ,可 以得到一个与初始种群相比平均亲和力高得多的抗 体种群. 提取基因值为 1 的基因位对其进行解码得到 对应的规则 ,考察该规则集的正确分类能力,并从多 次算法收敛后的抗体中找出正确分类能力最高的一 组构成最终的最优规则集 OPT _ S ,从而完成克隆选 择算法对模糊 if - then 规则的提取. 3 仿真结果 经过多次实验 ,确定克隆选择算法中各参数设置 如下: 初始种群大小: N = 6 ; 克隆扩增种群大小: n = 5 ; 循环代数: Ngen ; 抗体变异率:α= exp ( - ρ×f (OPT _ S) ) ,ρ= Ngen ; 抗体中 1 与 - 1 个数比例为:0. 6 :0. 4 ; 正确分类能力与规则个数权值比值: WNCP ∶ W S = 1 ∶4. WNCP ∶W S 的比值设定 ,经多次实验证明 ,当 W S 越大时,OPT _S 中包含的规则数就越多,经多次实验 证明,在此二者比例选择为 1 ∶4 时 ,所得规则的分类 能力较有保障 ,且分类性能比较稳定. 分类数据采用 Matlab 中自带的数据 IRIS,其包含 的数据类型为 3 类 ,共 150 个样本 ,每类 50 个样本. 以下是分别取 Ngen = 10、20、30、50、80、100 代 分别进行 10 次仿真运算的平均结果. 3. 1 算法收敛性效果 表 2 是抗体亲和力和规则个数的收敛情况. 由 此可以很明显地看出该算法中亲和力和规则个数具 有很好的收敛效果 :随着循环代数的增加 ,亲和力收 敛达到最大值时 ,而规则个数也收敛至最小值 ,并且 收敛速度较快 ,其达到收敛的总循环代数 Ngen只需 80 代. 由此说明 ,文中所建立的目标函数(亲和力函 数) 是合理的且适当的. 表 2 亲和力及规则个数收敛情况 Table 2 Convergence about affinity and rules number 代数 5 20 60 80 100 亲和力 101. 35 135. 16 238. 91 253. 93 253. 93 规则个数 92 80 48 42 42 3. 2 算法分类准确率及其稳定性 表 3 是各循环代数下所得 OPT _ S 中的规则所 确定的总分类准确率及其分类稳定性的统计. 其中 分类稳定性的统计采用的指标是分类准确率的标准 方差 ,反应了在随机情况下生成的规则集 OPT _ S 的分类稳定性. 表 3 相应代数下所选规则的总分类正确率及 其分类稳定性统计 Table 3 Statistics about the classification correctness ratio and stability under different generations 代数 5 20 60 80 100 总分类 准确率/ % 94 95 97. 2 98. 2 98. 2 分类稳定性 0. 023 0. 032 0. 011 6 0. 003 6 0. 003 6 由表 3 可以很清楚地看到 :在收敛的情况下 , OPT _ S 具有较高且较稳定的分类能力. 表 4 是在收敛的情况下最终确定的 OPT _ S 规 则集合(共 42 条) 的一部分 ,表 4 是通过 Matlab 编 制程序的最终结果 ,每行为一条规则. 表 4 收敛情况下部分识别规则 Table 4 Part recognition rules in convergence 1 2 3 4 5 6 7 8 9 10 1 1 1 12 5. 244 50 0. 627 7 1 1 1 1 1 2 2 2 2 0. 247 91 1. 000 0 - 1 1 1 1 2 3 3 2 5 0. 641 02 1. 000 0 1 1 1 2 1 4 4 3 9 1. 802 00 0. 336 88 - 1 1 1 2 2 5 5 1 38 14. 979 00 1. 000 0 1 1 2 1 1 6 8 2 2 0. 232 58 1. 000 0 - 1 1 2 2 2 7 11 2 1 0. 109 66 1. 000 0 - 1 2 1 2 1 8 12 3 28 7. 062 90 0. 669 65 1 2 1 2 2 9 16 3 13 3. 684 30 0. 874 56 1 2 2 2 2 第 4 期 左瑞娟 ,等 :基于克隆选择的模糊分类规则提取算法 ·77 ·