·76· 智能系统学报 第2卷 的规则集,而一味的减少规则的个数,而牺牲其分类 体,因此涉及到抗体亲和力的计算 能力.因此只能在保证OPT_S具有较高的分类能 ①NCP(R)和CF的确定:NCP(R)是OPT 力的基础上使规则的个数尽可能少,这就与WxCp和 S中规则能正确分类的样本个数,即落入模糊子 Ws的取值比例有着密切的关系,其具体的比例关 空间的学习样本类型与该子空间确定的类相符的样 系可以根据实际需要通过实验仿真确定 本个数.由表1的数据结构可以确定该模糊子空间所 2.2抗体编码及解码 代表的类及其规则的确定度.由此可以确定 在克隆选择算法中,有效规则集S就构成了一 NCP(R)和CF 条抗体的基本结构,其基因位就是S的各有效规 ②OPTS1的确定:即计算OPT_S中所有1 则,而各基因位的标号是相应有效规则的规则号,二 的个数 者在抗体中是一一对应且位置固定的.抗体的长度 这样,由式3)可以计算出各抗体和抗原的亲和 设为1,由S中有效规则的个数决定.对于确定的学 力,并将这条抗体按亲和力大小降序排列,并取出其 习样本,所得到的有效规则是确定的并且是可知的 中亲和力较大的n条抗体,这里取n=N. 因此一条抗体的具体结构可以表示为 3)克隆:对以上所选择的n个抗体进行克隆,即 SS1s2…5m/m∈(r=1,2,:L,L=2+32++ 复制.每个抗体需克隆的抗体个数由式(4确定: 2,m为有效规则号,r为S中所有规则号) number =Bxy i (4) 在抗体中包含满足优化目标的规则集OPTS 式中:B为克隆因子,ì为将各抗体亲和力按降序排序 为此这里随机的为抗体中的基因位赋值1或-1,加 后的序号.这样n个抗体克隆总数用Nc表示: 以区别,即sm=-1:表示规则m属于S但不属于 Nc OPT_S,sm=1:表示规则m属于S同时又属于 >round(number) ) OPT_S,这样,就可得到一条类似于图2的一条抗体 式中:round为取整运算,并且亲和力越高的抗体其克 编码形式 隆的抗体个数越多 4)高频变异:克隆后的抗体以某一变异率发生变 1-1-1-1 11 异,抗体的变异率不仅和亲和力有关,还与进化代数 5 5n S Sr Ss Srm-1 Sm 有关,因此计算相应于某代的不同亲和力的抗体的变 异率a为 a exp(-p xf(OPT S)). 6) 图2抗体编码 式中:P为衰减系数,这里取p=Nsm,Nn为进化代 Fig.2 Antibody code 数.∫为抗体和抗原之间的亲和力.由变异率计算式 抗体优化的最终结果中基因位为1所对应的有 可以看到亲和力越大的抗体其变异率越小:进化代数 效规则即为OPTS. 越大变异率也越小.这里抗体的变异机制为sm= 为了计算抗体与抗原即亲和力函数的亲和力以 smX(-1),即对于克隆后的抗体按以上的变异率随 及确定OPTS中包含的规则,还需要对抗体进行解 机使抗体中的某些基因位上的值发生变化,通过改变 码,即将基因位值为1所对应的规则还原出来.首先 其符号来实现.其过程如图3所示 确定抗体中“1”所对应的规则号sm=r,然后根据规 1- -11 则号与模糊子空间的关系表(如表1(a)、(b)可以确 4 - 11 定对应的模糊子空间及规则 S Sn Sn Srs Si 444 Srm 1 Srm 2.3克隆选择算法的操作 基于克隆选择算法的模糊f-then规则提取过 程如下 图3抗体变异 1)初始抗体种群产生:产生一个包含N条抗体 Fig.3 Antibody mutation 的初始种群.每条抗体生成时,随机为其基因位分配 克隆后大量的抗体群发生变异,该过程使抗体亲 1、-1.在此根据抗体的长度分别以60%和40%为基 和力在局部不断提高起到微观寻优调控的作用,有利 因位赋值1和-1,从而随机产生N条抗体 于最优解的出现 2)选择:从当前种群选择n个亲和力较高的抗 5)再选择:该过程类似于2的选择过程,只是该 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net的规则集 ,而一味的减少规则的个数 ,而牺牲其分类 能力. 因此只能在保证 OPT _ S 具有较高的分类能 力的基础上使规则的个数尽可能少 ,这就与 W NCP和 W S 的取值比例有着密切的关系 ,其具体的比例关 系可以根据实际需要通过实验仿真确定. 2. 2 抗体编码及解码 在克隆选择算法中 ,有效规则集 S 就构成了一 条抗体的基本结构 , 其基因位就是 S 的各有效规 则 ,而各基因位的标号是相应有效规则的规则号 ,二 者在抗体中是一一对应且位置固定的. 抗体的长度 设为 l ,由 S 中有效规则的个数决定. 对于确定的学 习样本 ,所得到的有效规则是确定的并且是可知的. 因此一条抗体的具体结构可以表示为 S = sr1 sr2 …srm l ( rm ∈( r = 1 ,2 , …, L) , L = 2 2 + 3 2 + …+ K 2 , rm 为有效规则号, r为 SALL中所有规则号) . 在抗体中包含满足优化目标的规则集 OPT _ S 为此这里随机的为抗体中的基因位赋值 1 或 - 1 ,加 以区别,即 srm = - 1 :表示规则 rm 属于 S 但不属于 OPT _ S , srm = 1 :表示规则 rm 属于 S 同时又属于 OPT _S ,这样,就可得到一条类似于图 2 的一条抗体 编码形式. 图 2 抗体编码 Fig. 2 Antibody code 抗体优化的最终结果中基因位为 1 所对应的有 效规则即为 OPT _S. 为了计算抗体与抗原即亲和力函数的亲和力以 及确定 OPT _S 中包含的规则,还需要对抗体进行解 码,即将基因位值为 1 所对应的规则还原出来. 首先 确定抗体中“1”所对应的规则号 srm = r,然后根据规 则号与模糊子空间的关系表(如表 1 (a) 、(b) ) 可以确 定对应的模糊子空间及规则. 2. 3 克隆选择算法的操作 基于克隆选择算法的模糊 if - then 规则提取过 程如下: 1)初始抗体种群产生:产生一个包含 N 条抗体 的初始种群. 每条抗体生成时 ,随机为其基因位分配 1、- 1. 在此根据抗体的长度分别以 60 %和 40 %为基 因位赋值 1 和 - 1 ,从而随机产生 N 条抗体. 2)选择 :从当前种群选择 n 个亲和力较高的抗 体,因此涉及到抗体亲和力的计算. ①NCP( R K mn ) 和 CF K mn的确定 :NCP( R K mn )是 OPT _ S 中规则 R K mn能正确分类的样本个数,即落入模糊子 空间的学习样本类型与该子空间确定的类相符的样 本个数. 由表 1 的数据结构可以确定该模糊子空间所 代表 的 类 及 其 规 则 的 确 定 度. 由 此 可 以 确 定 NCP( R K mn )和 CF K mn . ②| OPT _ S| 的确定:即计算 OPT _ S 中所有 1 的个数. 这样,由式(3) 可以计算出各抗体和抗原的亲和 力,并将这条抗体按亲和力大小降序排列 ,并取出其 中亲和力较大的 n条抗体,这里取 n = N. 3) 克隆:对以上所选择的 n 个抗体进行克隆,即 复制. 每个抗体需克隆的抗体个数由式(4)确定: number = β×N i . (4) 式中:β为克隆因子, i 为将各抗体亲和力按降序排序 后的序号. 这样 n个抗体克隆总数用 NC 表示: NC = ∑ n i =1 round(number) . (5) 式中:round 为取整运算,并且亲和力越高的抗体其克 隆的抗体个数越多. 4) 高频变异 :克隆后的抗体以某一变异率发生变 异,抗体的变异率不仅和亲和力有关,还与进化代数 有关,因此计算相应于某代的不同亲和力的抗体的变 异率α为 α= exp ( - ρ×f (OPT _S) ) . (6) 式中:ρ为衰减系数,这里取ρ= Ngen , Ngen 为进化代 数. f 为抗体和抗原之间的亲和力. 由变异率计算式 可以看到亲和力越大的抗体其变异率越小;进化代数 越大变异率也越小. 这里抗体的变异机制为srm = srm ×( - 1) ,即对于克隆后的抗体按以上的变异率随 机使抗体中的某些基因位上的值发生变化,通过改变 其符号来实现. 其过程如图 3 所示. 图 3 抗体变异 Fig. 3 Antibody mutation 克隆后大量的抗体群发生变异 ,该过程使抗体亲 和力在局部不断提高起到微观寻优调控的作用 ,有利 于最优解的出现. 5) 再选择 :该过程类似于 2) 的选择过程,只是该 ·76 · 智 能 系 统 学 报 第 2 卷