2种改进的神经网络结构学习算法.pdf_大学文库

0I:10.13374/j.1ssn1001-053x.1997.05.016 Vol.19 No.5 北京科技大学·学报第19卷第5期 0ct.1997 Journal of University of Science and Technology Beijing 1997年10月 2种改进的神经网络结构学习算法王克成) 王科俊) 余达太) 1)北京科技大学信息工程学院，北京100083 2)哈尔滨工程大学自控系，哈尔滨150001 摘要针对已提出的灵敏度计算和自构形2种神经网络结构学习算法，提出2种改进的算法，实验证明改进的算法比原算法有更好的泛化能力. 关键词神经网络，结构学习算法，灵敏度中图书分类号TP13 多层前向神经网络结构的确定是神经网络理论研究的热点之一，已提出了一些结构学习算法由于在理论上很难给出网络结构的最佳值，所以结构学习算法都是以启发式方法剪除过大网络或增长过小网络进行的， Mozer和Smokensky提出的灵敏度计算法是一种典型的剪除式结构学习算法.笔者利用它对异或(XOR)问题和正弦函数逼近问题的实验表明，这种算法对逼近问题优化产生的网络结构有较强的泛化能力；而对分类问题，泛化问题能力大大下降因而笔者提出了一种新的灵敏度计算法，并用XOR和正弦通近问题验证了新算法的有效性雷鸣提出的神经网络自构形学习算法也是一种剪除式结构学习算法作者的实验表明，经这种算法优化产生的网络泛化能力下降.分析自构形算法，发现算法在神经元合并时采用一阶线性回归计算，而实际上样本增加后，神经元输出不满足线性关系基于此笔者提出采用多项式回归导出合并算法对XOR和正弦函数逼近问题的实验表明，采用新的合并算法后自构形学习算法的泛化能力有很大提高， 1灵敏度计算型结构学习算法及其改进 Mozer和Smolensky在1989年提出了一种以灵敏度计算为基础的剪除式结构学习算法，其方法是在网络中的每一神经元内引人一名义参数，即： 1=0 (1) +(0=g"+”(+”(0) 其中：”+”，+分别为第1+1层的第个神经元的状态和输出；g+”()为神经元的作用函数；a+)为第1+1层第i个神经元与第1层第j个神经元间的连接权；u为名义参数，如果 4=0该神经元对网络无影响，“=】则该神经元为常规神经元 199610-08收稿第一作者男41岁副教授现在鞍山钢铁学院工作

《北京科技大学 ’ 学报第卷年第期月种改进的神经网络结构学习算法王克成 ’ 王科俊余达太北京科技大学信息工程学院，北京哈尔滨工程大学自控系，哈尔滨摘要针对已提出的灵敏度计算和自构形种神经网络结构学习算法，提出种改进的算法实验证明改进的算法比原算法有更好的泛化能力关键词神经网络，结构学习算法，灵敏度中图书分类号即多层前向神经网络结构的确定是神经网络理论研究的热点之一，已提出了一些结构学习算法由于在理论上很难给出网络结构的最佳值，所以结构学习算法都是以启发式方法剪除过大网络或增长过小网络进行的和提出的灵敏度计算法是一种典型的剪除式结构学习算法笔者利用它对异或问题和正弦函数逼近问题的实验表明，这种算法对逼近问题优化产生的网络结构有较强的泛化能力而对分类问题，泛化问题能力大大下降因而笔者提出了一种新的灵敏度计算法，并用和正弦逼近问题验证了新算法的有效性雷鸣提出的神经网络自构形学习算法也是一种剪除式结构学习算法作者的实验表明，经这种算法优化产生的网络泛化能力下降分析自构形算法，发现算法在神经元合并时采用一阶线性回归计算，而实际上样本增加后，神经元输出不满足线性关系基于此笔者提出采用多项式回归导出合并算法对和正弦函数逼近问题的实验表明，采用新的合并算法后自构形学习算法的泛化能力有很大提高灵敏度计算型结构学习算法及其改进和在年提出了一种以灵敏度计算为基础的剪除式结构学习算法，其方法是在网络中的每一神经元内引人一名义参数，即拜 “ ” 一，瓦 “ ” 呵“ ‘，。、丫十 ” 一 “ ” 衬 ‘ ” 其中邓十 ” ，川 ‘ ” 分别为第十层的第个神经元的状态和输出犷十 ” · 为神经元的作用函数。咒 ” 为第十，层第 ‘ 个神经元与第层第个神经元间的连接权。为名义参数，如果二该神经元对网络无影响，二则该神经元为常规神经元一一收稿第一作者男岁副教授现在鞍山钢铁学院工作 DOI ：10．13374／j ．issn1001－053x．1997．05．016

Vol.19 No.5 王克成等：2种改进的神经网辂结构学习算法 ·491· 定义灵敏度为： E S=- 0u-1 (2) 式(2)可通过反传计算.由于此值是在u=1下求得的，因此“仅是概念上的量，而不是网络中必须执行的参数.当S小于给定的阀值时，此神经元即被删除式(2)中的E定义为： E=”-四 (3) 式中：E为网络指标函数；d为期望输出.没有采用平方和形式的原因是在误差很小时，式(3)能提供对S的更好的估计利用式(I),(2)和(3)形成的结构学习算法，进行了2个实验，实验中采用仅含1个隐层的3 层神经网络，实验结果如表1和表2所示表中原样本指训练所用样本，而新的样本是未在训练中使用的样本MSE代表均方误差，用它的大小来衡量网络的泛化能力.表中的隐元素指网络中隐层内的神经元个数，显然这种方法对分类问题(XO)的优化不理想，但对逼近问题还可以针对这种情况，笔者提出采用式(4)进行灵敏度计算： E Saay (4) 表1XOR问题表2正弦函数逼近问题状态隐元数原样本(MSE)新样本(MSE) 状态隐元数原样本(MSE新样本(MSE 网优化前8 0.001281 0.001187 网优化前 10 0.018539 0.019388 网优化后3 0.019879 0.059272 网优化后 4 0.019355 0.019488 以改善算法形成网络的泛化能力.式(4)的优点是简单，直观，不需要附加计算表3和表4是利用式(4)形成的剪除式结构学习算法进行的实验结果.从结果看新方法对分类问题的网络优化效果非常好，网络泛化能力明显提高，但对逼近问题不如原方法，表3XOR问题表4正弦函数逼近问题状态隐元数原样本新样本状态隐元数原样本新样本优化前 P 0.008801 0.088242 优化前 10 0.008522 0.013886 优化后 0.043159 0.062535 优化后 0.012529 0.019047 2神经网络自构形学习算法及其改进雷鸣(1994)提出的网络自构形学习算法)也是一种剪除式学习结构算法.该算法是利用数理统计的方法引人隐单元之间的相关系数和分散度概念，考察隐层的神经元对网络的贡献，进而删除或合并那些作用小或作用相近的神经元设Op是隐层神经元i在学习完第p个样本时的输出，O是隐层神经元i在学习完n个样本后的平均输出，n为训练样本总数，则： (5)

王克成等种改进的神经网络结构学习算法定义灵敏度为一豁式可通过反传计算由于此值是在二下求得的，因此。仅是概念上的量，而不是网络中必须执行的参数当小于给定的阀值时，此神经元即被删除式中的定义为全…、一艺尸 “ 一式中为网络指标函数为期望输出没有采用平方和形式的原因是在误差很小时，式能提供对的更好的估计利用式，和形成的结构学习算法，进行了个实验，实验中采用仅含个隐层的层神经网络，实验结果如表和表所示表中原样本指训练所用样本，而新的样本是未在训练中使用的样本代表均方误差，用它的大小来衡量网络的泛化能力表中的隐元素指网络中隐层内的神经元个数显然这种方法对分类问题的优化不理想，但对逼近问题还可以针对这种情况，笔者提出采用式进行灵敏度计算表问题表正弦函数逼近问题状态隐元数原样本新样本状态隐元数原样本新样本网优化前网优化前网优化后网优化后以改善算法形成网络的泛化能力式的优点是简单，直观，不需要附加计算表和表是利用式形成的剪除式结构学习算法进行的实验结果从结果看新方法对分类问题的网络优化效果非常好，网络泛化能力明显提高，但对逼近问题不如原方法表问题表正弦函数逼近问题状态隐元数原样本新样本状态隐元数原样本新样本优化前优化前乃优化后优化后神经网络自构形学习算法及其改进雷鸣提出的网络自构形学习算法也是一种剪除式学习结构算法该算法是利用数理统计的方法引人隐单元之间的相关系数和分散度概念，考察隐层的神经元对网络的贡献，进而删除或合并那些作用小或作用相近的神经元设口，是隐层神经元在学习完第个样本时的输出，口是隐层神经元在学习完。个样本后的平均输出，为训练样本总数，则瓦一粤全。、，‘ 尸

Vol.19 No.5 王克成等：2种改进的神经网络结构学习算法 ·493 表5XOR问题表6正弦函数逼近问题状态隐元数原样本(MSE) 新样本(MSE 状态隐元数原样本(MSE)新样本(MSE) 网优化前8 0.008801 0.088242 网优化前10 0.008522 0.013886 网优化后4 0.007569 0.091116 网优化后2 0.020504 0.032192 利用上述算法对XOR和正弦函数逼近问题的实验结果如表5和表6所示从实验结果可以看出，用这种方法优化后的网络对训练过的样本效果很好，但对未训练过的新样本误差较大这说明它使网络的泛化能力降低了. 分析雷鸣的方法，发现它在合并规则中采用一元线性回归式(8)导出合并算法.但实际上，在输人样本较多时，0和O很难满足线性关系.笔者认为采用多项式回归处理O和O的关系更符合实际，一方面可以精确地反映O和O的关系，另一方面也可以通过调节回归多项式的阶次来提高网络的性能因此，提出了如下修改的合并算法，令： 0,=a。+a,0.+a,0+…+anO (13) 且取O,≈0，则输出神经元k的输入为 neim=o,0,+a,0,+w×1+Aa,0,= [a=a,+a,0+…+a,0a,0,+aw+aa)x1+a,0 (14) 从而合并算法为： a=an+(a1+a,0+…an0,)a (15) a=aih aoag 式(13)中的a。,a,a,…,a,利用最小二乘法求得.利用式(13)，(14)和(15)形成的改进的自构形学习算法的实验结果见表7和表8. 表7XOR问题表8正弦函数逼近问题状态隐元数原样本(MSE)新样本(MSE) 状态隐元数原样本(MSE)新样本(MSE) 网优化前8 0.009071 0.092468 网优化前 10 0.008504 0.013426 网优化后4 0.004782 0.082173 网优化后2 0.007513 0.013563 实验中分别采用了3次和5次回归多项式实验结果表明改进后的自构形学习算法形成的网络较未改进的算法形成的网络泛化能力有较大的提高，对旧样本的拟合能力也有很大的提高. 4结论 (I)对灵敏度法，采用直接灵敏度计算，具有简单、直观、不需附加计算的特点.实验证明对分类问题，可使网络的泛化能力有较大提高 (2)对自构形算法，采用多项式非线性回归导出神经元合并算法，更切实际，网络的泛化能力有很大提高

王克成等种改进的神经网络结构学习算法 · · 表 ’ 题状态隐元数原样本新样本表正弦函数逼近问题状态隐元数原样本新样本网优化前网优化后网优化前网优化后乃利用上述算法对和正弦函数逼近问题的实验结果如表和表所示从实验结果可以看出，用这种方法优化后的网络对训练过的样本效果很好，但对未训练过的新样本误差较大这说明它使网络的泛化能力降低了分析雷鸣的方法，发现它在合并规则中采用一元线性回归式导出合并算法但实际上，在输人样本较多时，，和，很难满足线性关系 · 笔者认为采用多项式回归处理口和的关系更符合实际，一方面可以精确地反映，和的关系，另一方面也可以通过调节回归多项式的阶次来提高网络的性能因此，提出了如下修改的合并算法，令。 ‘ 且取口七口，则输出神经元的输人为气气气口口十口 “ 又民，， “ 附，勺八逮，－月手 ‘ ，、， … ” 酬一，、 ‘ 。艺，从而合并算法为 ‘ 。一、乙， …… ” 云一 ’ 、肋肪勺式中的。，。，，，一 “ 。利用最小二乘法求得利用式，和形成的改进的自构形学习算法的实验结果见表和表表问题表正弦函数逼近问题状态隐元数原样本新样本状态隐元数原样本新样本网优化前网优化后，网优化前网优化后刀刀实验中分别采用了次和次回归多项式实验结果表明改进后的自构形学习算法形成的网络较未改进的算法形成的网络泛化能力有较大的提高，对旧样本的拟合能力也有很大的提高结论对灵敏度法，采用直接灵敏度计算，具有简单、直观、不需附加计算的特点实验证明对分类问题，可使网络的泛化能力有较大提高对自构形算法，采用多项式非线性回归导出神经元合并算法，更切实际，网络的泛化能力有很大提高