小批量下取得较小的错误率，这是由于Ｍｕｓｉｃ数据集中数据之间差异较大

正在加载图片...

第2期刘威，等：BP神经网络子批量学习方法研究 ·231. 小批量下取得较小的错误率，这是由于Music数据训练时间也呈现先减小后增大的趋势。集中数据之间差异较大，而这种差异性导致分类错 3)选择最优的批量和学习率组合可以成倍地误率整体比Seeds数据集高，为了适应数据间的这减小网络训练时间，而且数据集越大批量对网络收种差异，需要探索更多的空间，而小批量下的随机扰敛时间的影响越关键。动，可以使网络探索更多的空间，从而找到泛化能力 3.3.2 Waveform数据集分类准确率比较更好的空间，提升网络的分类能力。新所以对于M山依据图7在收敛的条件下，不同学习率和批量 sic这种数据间差异较大的数据集，在不考虑训练时的分类效果存在一定的差别，但差异较小。小批量间和迭代速度的情况下，使用小批量训练网络具有和大批量下的网络分类误差结果相似，说明批量对更好的泛化能力。于Waveform数据集网络的分类泛化能力影响较小。 3.3 Waveform分类实验 0.25 Waveform数据集由UCI提供的用于分类算法测试的实验数据集之一，该数据集包含5000个样解0.20 本的3分类数据集，实验在每个类别中随机抽取 a=7 -a=1 1000个样本作为训练集，剩余2000个样本为训练 -a=5+…a=0.5 -a=3+-a=0.1 集。网络隐层节点为50，E=0.005,迭代8000次， *-a=0.01 0.10 选取批量s为5、15、30、75、150、300、750、1500、 15307515030075015003000 批量 3000,相同条件下，取10次实验的平均结果作为讨图7 Music数据集不同学习率和批量下的错误率论对象，来测试学习率和批量对于训练时间（表3） Fig.7 Error rates of Waveform under different learn- 和分类错误率（图6）的影响。 ing rates and batch size 3.3.1 Waveform数据集训练时间比较综合对比图4,6、7可发现批量对网络的分类泛依据表4中不同学习率和批量下的网络训练时化能力存在一定的影响，选择理想的批量和学习率组间，学习批量对Waveform数据集网络的收敛时间影合，能够获得较好分类错误率，但其影响相对较小，在响较大，说明批量和学习率可大幅减小大数据网络收敛的情况下，不同批量下的分类错误率相近。的训练时间。从批量对于网络迭代次数和训练时间的影响角表4 Waveform数据集不同学习率和批量的训练时间度来看，批量对于网络分类泛化能力的影响较弱，网 Table 4 Training time of Waveform under different learn- 络的泛化能力和数据集本身性质有较大关系，而批 ing rates and batch size 量主要影响网络的迭代次数和训练时间。 a 515307515030075015003000 0.01 8187.0105.182.961.450.340.539.637.5 4 结论 0.0515522.525.240.953.547.837.835.732.8 本文基于BP神经网络全批量和单批量学习方 0.1110914.112.919.728.837.739.036.333.4 法，研究了子批量的神经网络学习方法，并探讨了学 0.51101307.4150.77.412.412.823.833.735.1 习率和批量对于网络收敛性和训练时间的影响，通 11173325.2160.165.414.07.721.724.429.9 过实验证明：1)子批量学习方法具有全批量稳定和 31312342.4166.484.660.950.039.838.134.9 单批量快速的优点：2)不同的学习率下存在不同的 74009428.0193.090.164.052.441.539.135.0 最优批量：3)选择适合的批量，不仅可以大幅缩短综合对比表1、3、4可发现学习率和训练批量对网络训练时间，同时还能够取得更好的分类准确率。于网络的收敛性、收敛时间具有如下规律：参考文献： 1)固定迭代次数下，当学习率小、批量大和学习率大、批量小的情况下，网络不收敛。前者是由于 [1]JACOBS R A.Increased rates of convergence through learn- 扰动较大导致网络不容易收敛造成，后者是由于过 ing rate adaptation [J].Neural networks,1988,1(4): 295-.307. 渡平滑导致网络收敛缓慢引起。 [2]刘么和，陈睿，彭伟，等.一种BP神经网络学习率的优 2)在收敛的情况下，批量保持稳定时，随着学化设计[J].湖北工业大学学报，2007,22(3)：1-3. 习率的增大，网络训练时间呈现先减小后增大的趋 LIU Yaohe,CHEN Rui,PENG Wei.Optimal design for 势：学习率保持稳定时，随着批量的逐渐增大，网络小批量下取得较小的错误率，这是由于Ｍｕｓｉｃ数据集中数据之间差异较大，而这种差异性导致分类错误率整体比Ｓｅｅｄｓ数据集高，为了适应数据间的这种差异，需要探索更多的空间，而小批量下的随机扰动，可以使网络探索更多的空间，从而找到泛化能力更好的空间，提升网络的分类能力。所以对于Ｍｕ⁃ ｓｉｃ这种数据间差异较大的数据集，在不考虑训练时间和迭代速度的情况下，使用小批量训练网络具有更好的泛化能力。３．３Ｗａｖｅｆｏｒｍ分类实验Ｗａｖｅｆｏｒｍ数据集由ＵＣＩ提供的用于分类算法测试的实验数据集之一，该数据集包含５０００个样本的３分类数据集，实验在每个类别中随机抽取１０００个样本作为训练集，剩余２０００个样本为训练集。网络隐层节点为５０，Ｅ＝０．００５，迭代８０００次，选取批量ｓ为５、１５、３０、７５、１５０、３００、７５０、１５００、３０００，相同条件下，取１０次实验的平均结果作为讨论对象，来测试学习率和批量对于训练时间（表３）和分类错误率（图６）的影响。３．３．１Ｗａｖｅｆｏｒｍ数据集训练时间比较依据表４中不同学习率和批量下的网络训练时间，学习批量对Ｗａｖｅｆｏｒｍ数据集网络的收敛时间影响较大，说明批量和学习率可大幅减小大数据网络的训练时间。表４Ｗａｖｅｆｏｒｍ数据集不同学习率和批量的训练时间Ｔａｂｌｅ４ＴｒａｉｎｉｎｇｔｉｍｅｏｆＷａｖｅｆｏｒｍｕｎｄｅｒｄｉｆｆｅｒｅｎｔｌｅａｒｎ⁃ ｉｎｇｒａｔｅｓａｎｄｂａｔｃｈｓｉｚｅ α ５１５３０７５１５０３００７５０１５００３００００．０１８１８７．０１０５．１８２．９６１．４５０．３４０．５３９．６３７．５０．０５１５５２２．５２５．２４０．９５３．５４７．８３７．８３５．７３２．８０．１１１０９１４．１１２．９１９．７２８．８３７．７３９．０３６．３３３．４０．５１１０１３０７．４１５０．７７．４１２．４１２．８２３．８３３．７３５．１１１１７３３２５．２１６０．１６５．４１４．０７．７２１．７２４．４２９．９３１３１２３４２．４１６６．４８４．６６０．９５０．０３９．８３８．１３４．９７４００９４２８．０１９３．０９０．１６４．０５２．４４１．５３９．１３５．０综合对比表１、３、４可发现学习率和训练批量对于网络的收敛性、收敛时间具有如下规律：１）固定迭代次数下，当学习率小、批量大和学习率大、批量小的情况下，网络不收敛。前者是由于扰动较大导致网络不容易收敛造成，后者是由于过渡平滑导致网络收敛缓慢引起。２）在收敛的情况下，批量保持稳定时，随着学习率的增大，网络训练时间呈现先减小后增大的趋势；学习率保持稳定时，随着批量的逐渐增大，网络训练时间也呈现先减小后增大的趋势。３）选择最优的批量和学习率组合可以成倍地减小网络训练时间，而且数据集越大批量对网络收敛时间的影响越关键。３．３．２Ｗａｖｅｆｏｒｍ数据集分类准确率比较依据图７在收敛的条件下，不同学习率和批量的分类效果存在一定的差别，但差异较小。小批量和大批量下的网络分类误差结果相似，说明批量对于Ｗａｖｅｆｏｒｍ数据集网络的分类泛化能力影响较小。图７Ｍｕｓｉｃ数据集不同学习率和批量下的错误率Ｆｉｇ．７ＥｒｒｏｒｒａｔｅｓｏｆＷａｖｅｆｏｒｍｕｎｄｅｒｄｉｆｆｅｒｅｎｔｌｅａｒｎ⁃ ｉｎｇｒａｔｅｓａｎｄｂａｔｃｈｓｉｚｅ综合对比图４、６、７可发现批量对网络的分类泛化能力存在一定的影响，选择理想的批量和学习率组合，能够获得较好分类错误率，但其影响相对较小，在收敛的情况下，不同批量下的分类错误率相近。从批量对于网络迭代次数和训练时间的影响角度来看，批量对于网络分类泛化能力的影响较弱，网络的泛化能力和数据集本身性质有较大关系，而批量主要影响网络的迭代次数和训练时间。４结论本文基于ＢＰ神经网络全批量和单批量学习方法，研究了子批量的神经网络学习方法，并探讨了学习率和批量对于网络收敛性和训练时间的影响，通过实验证明：１）子批量学习方法具有全批量稳定和单批量快速的优点；２）不同的学习率下存在不同的最优批量；３）选择适合的批量，不仅可以大幅缩短网络训练时间，同时还能够取得更好的分类准确率。参考文献：［１］ＪＡＣＯＢＳＲＡ．Ｉｎｃｒｅａｓｅｄｒａｔｅｓｏｆｃｏｎｖｅｒｇｅｎｃｅｔｈｒｏｕｇｈｌｅａｒｎ⁃ ｉｎｇｒａｔｅａｄａｐｔａｔｉｏｎ［Ｊ］．Ｎｅｕｒａｌｎｅｔｗｏｒｋｓ，１９８８，１（４）：２９５⁃３０７．［２］刘幺和，陈睿，彭伟，等．一种ＢＰ神经网络学习率的优化设计［Ｊ］．湖北工业大学学报，２００７，２２（３）：１⁃３．ＬＩＵＹａｏｈｅ，ＣＨＥＮＲｕｉ，ＰＥＮＧＷｅｉ．Ｏｐｔｉｍａｌｄｅｓｉｇｎｆｏｒ第２期刘威，等：ＢＰ神经网络子批量学习方法研究 ·２３１·

<<向上翻页向下翻页>>

点击下载：【机器学习】BP神经网络子批量学习方法研究编辑部