强的分类泛化能力。基于以上分析可知，基于样本权重的动态数据约简方法能够

正在加载图片...

.264 智能系统学报第12卷强的分类泛化能力。误差下取得了较小的训练和测试分类错误率，说明基于以上分析可知，基于样本权重的动态数据 DDR训练方法更加注重边界样本的作用，具有防止约简方法能够区分并挑选边界样本和核样本，并随过拟合的能力，能够训练分类泛化能力更好的神经着网络的迭代训练，逐渐增加边界样本比重，弱化核网络。样本作用，从而训练出泛化能力更好的神经网络分对比网络训练时间，DDR训练方法具有更短的类器。训练时间。由于每个数据集的训练样本个数，迭代 2.3标准数据集实验分析次数、批量值、权重下限值等训练参数不同，所以相为了验证基于动态数据约简的神经网络训练方对STD训练方法，DDR训练方法时间缩短程度有所法在标准分类数据集上的效果，选取10组标准数据不同，总体上选择的权重下限值和学习批量越小，集进行数值实验，其中Forest等9组来自UCI分类 DDR训练方法所需的训练时间越短，但过小的权重数据集，Mnist标准数据集来自官方网站。各组数据下限值和学习批量，容易引起网络波动，使得网络的集属性以及训练集，测试集样本个数信息见表1。分类泛化能力较差。 I0组数据集中Forest、IS、SL、Mnist具有固定的分类表2不同神经网络训练方法的分类错误率比较训练集个数和测试集个数，剩余的非固定数据集，训 Table 2 Comparison of classification error rate of different 练集和测试集个数比例基本保持1：1。 neural network training methods 表1UCI分类数据集的属性信息数据集 Method loss train-Avg test-Avg time Table 1 Attribute information of UCI classification data set 名称名称样本个数训练样本属性个数类别数 STD 0.0075 0.07 15.66 5.34 Forest Forest 523 198 27 4 DDR 0.0116 0.00 15.79 2.11 Glass 214 100 9 6 STD 0.0366 4.47 35.37 7.70 P 180 90 34 2 Glass DDR 0.0504 1.63 33.48 3.29 Iris 150 75 4 3 STD 0.0044 0.30 30.04 1.24 IS 2310 210 19 7 P DDR 0.0108 0.00 29.96 0.41 LIR 20000 10000 10 Seeds 210 105 > 3 STD 0.0258 3.07 4.22 0.67 Iris SL 6435 4000 36 DDR 0.0585 6 1.87 3.69 0.36 Wine 178 90 13 3 STD 0.0274 3.51 10.14 2.52 Mnist 60000 10000 784 10 IS DDR 0.0326 1.14 8.72 1.53 在相同的实验条件下，标准训练算法(STD)和 STD 0.1141 12.92 14.41 122.33 动态数据约简训练方法(DDR)训练的神经网络分 LIR DDR 0.1446 8.05 11.01 77.80 类器，最终训练集均方误差1oss,训练集分类错误率 train-Avg,测试集分类错误率test-Avg和训练时间 STD 0.0582 7.06 9.62 78.14 time,30次实验的平均结果如表2所示。对比STD DDR 0.0652 5.80 9.78 34.15 和DDR两种训练方法的最终均方误差，除Seeds数 STD 0.0340 3.40 6.44 1.42 据集外，STD训练方法的均方误差均大于DDR训练 Seeds DDR 0.0132 0.13 4.98 3.73 方法的均方误差，说明DDR训练方法在整个训练上更加关注边界样本，弱化了对于训练样本整体的 STD 0.0010 0.04 2.65 0.71 Wine “逼近拟合”。 DDR 0.0017 0.00 2.50 0.49 对比分类错误率，DDR训练方法比STD训练方 STD 0.0045 0.10 1.51 2104.83 法在较高的均方误差下具有更低的训练分类错误 Mnist DDR 0.0047 0.03 1.61 1129.18 率，除Forest、SL和Mnist3个数据集外取得相近的预测分类错误率外，DDR训练方法在其余数据集上基于以上对比分析可知，相对标准的神经网络均具有更低的测试分类错误率。综合对比均方误差训练方法STD,动态数据约简的神经网络训练方法和错分类错误率可知，DDR训练方法在较大的均方 DDR是一种收敛速度更快、分类泛化能力更好的神强的分类泛化能力。基于以上分析可知，基于样本权重的动态数据约简方法能够区分并挑选边界样本和核样本，并随着网络的迭代训练，逐渐增加边界样本比重，弱化核样本作用，从而训练出泛化能力更好的神经网络分类器。２．３标准数据集实验分析为了验证基于动态数据约简的神经网络训练方法在标准分类数据集上的效果，选取１０组标准数据集进行数值实验，其中Ｆｏｒｅｓｔ等９组来自ＵＣＩ分类数据集，Ｍｎｉｓｔ标准数据集来自官方网站。各组数据集属性以及训练集，测试集样本个数信息见表１。１０组数据集中Ｆｏｒｅｓｔ、ＩＳ、ＳＬ、Ｍｎｉｓｔ具有固定的分类训练集个数和测试集个数，剩余的非固定数据集，训练集和测试集个数比例基本保持１：１。表１ＵＣＩ分类数据集的属性信息Ｔａｂｌｅ１ＡｔｔｒｉｂｕｔｅｉｎｆｏｒｍａｔｉｏｎｏｆＵＣＩｃｌａｓｓｉｆｉｃａｔｉｏｎｄａｔａｓｅｔ名称样本个数训练样本属性个数类别数Ｆｏｒｅｓｔ５２３１９８２７４Ｇｌａｓｓ２１４１００９６ＩＰ１８０９０３４２Ｉｒｉｓ１５０７５４３ＩＳ２３１０２１０１９７ＬＩＲ２００００１００００６１１０Ｓｅｅｄｓ２１０１０５７３ＳＬ６４３５４０００３６６Ｗｉｎｅ１７８９０１３３Ｍｎｉｓｔ６００００１００００７８４１０在相同的实验条件下，标准训练算法（ＳＴＤ）和动态数据约简训练方法（ＤＤＲ）训练的神经网络分类器，最终训练集均方误差ｌｏｓｓ，训练集分类错误率ｔｒａｉｎ⁃Ａｖｇ，测试集分类错误率ｔｅｓｔ⁃Ａｖｇ和训练时间ｔｉｍｅ，３０次实验的平均结果如表２所示。对比ＳＴＤ和ＤＤＲ两种训练方法的最终均方误差，除Ｓｅｅｄｓ数据集外，ＳＴＤ训练方法的均方误差均大于ＤＤＲ训练方法的均方误差，说明ＤＤＲ训练方法在整个训练上更加关注边界样本，弱化了对于训练样本整体的 “逼近拟合”。对比分类错误率，ＤＤＲ训练方法比ＳＴＤ训练方法在较高的均方误差下具有更低的训练分类错误率，除Ｆｏｒｅｓｔ、ＳＬ和Ｍｎｉｓｔ３个数据集外取得相近的预测分类错误率外，ＤＤＲ训练方法在其余数据集上均具有更低的测试分类错误率。综合对比均方误差和错分类错误率可知，ＤＤＲ训练方法在较大的均方误差下取得了较小的训练和测试分类错误率，说明ＤＤＲ训练方法更加注重边界样本的作用，具有防止过拟合的能力，能够训练分类泛化能力更好的神经网络。对比网络训练时间，ＤＤＲ训练方法具有更短的训练时间。由于每个数据集的训练样本个数，迭代次数、批量值、权重下限值等训练参数不同，所以相对ＳＴＤ训练方法，ＤＤＲ训练方法时间缩短程度有所不同，总体上选择的权重下限值和学习批量越小，ＤＤＲ训练方法所需的训练时间越短，但过小的权重下限值和学习批量，容易引起网络波动，使得网络的分类泛化能力较差。表２不同神经网络训练方法的分类错误率比较Ｔａｂｌｅ２Ｃｏｍｐａｒｉｓｏｎｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎｅｒｒｏｒｒａｔｅｏｆｄｉｆｆｅｒｅｎｔｎｅｕｒａｌｎｅｔｗｏｒｋｔｒａｉｎｉｎｇｍｅｔｈｏｄｓ数据集名称Ｍｅｔｈｏｄｌｏｓｓｔｒａｉｎ⁃Ａｖｇｔｅｓｔ⁃ＡｖｇｔｉｍｅＦｏｒｅｓｔＳＴＤ０．００７５０．０７１５．６６５．３４ＤＤＲ０．０１１６０．００１５．７９２．１１ＧｌａｓｓＳＴＤ０．０３６６４．４７３５．３７７．７０ＤＤＲ０．０５０４１．６３３３．４８３．２９ＩＰＳＴＤ０．００４４０．３０３０．０４１．２４ＤＤＲ０．０１０８０．００２９．９６０．４１ＩｒｉｓＳＴＤ０．０２５８３．０７４．２２０．６７ＤＤＲ０．０５８５１．８７３．６９０．３６ＩＳＳＴＤ０．０２７４３．５１１０．１４２．５２ＤＤＲ０．０３２６１．１４８．７２１．５３ＬＩＲＳＴＤ０．１１４１１２．９２１４．４１１２２．３３ＤＤＲ０．１４４６８．０５１１．０１７７．８０ＳＬＳＴＤ０．０５８２７．０６９．６２７８．１４ＤＤＲ０．０６５２５．８０９．７８３４．１５ＳｅｅｄｓＳＴＤ０．０３４０３．４０６．４４１．４２ＤＤＲ０．０１３２０．１３４．９８３．７３ＷｉｎｅＳＴＤ０．００１００．０４２．６５０．７１ＤＤＲ０．００１７０．００２．５００．４９ＭｎｉｓｔＳＴＤ０．００４５０．１０１．５１２１０４．８３ＤＤＲ０．００４７０．０３１．６１１１２９．１８基于以上对比分析可知，相对标准的神经网络训练方法ＳＴＤ，动态数据约简的神经网络训练方法ＤＤＲ是一种收敛速度更快、分类泛化能力更好的神 ·２６４· 智能系统学报第１２卷

<<向上翻页向下翻页>>

点击下载：【机器学习】动态数据约简的神经网络分类器训练方法研究