３．２训练集ＭＮＩＳＴＭＮＩＳＴ［１４］由大小为２８×

正在加载图片...

第1期殷瑞，等：一种卷积神经网络的图像矩正则化策略 ·47 3.2训练集MNIST 表5CFAR-100数据集上的参数设置 MNIST4由大小为28×28的手写体0~9组成. Table 5 The parameter settings on dataset CIFAR-100 数据集中包含60000张训练图片和10000张测试 epoch stepsize 入数据，实验中预处理时将图片归一化到[0,1]。 300 0.001 100 0.01 0.004 Lecun Y提出的LeNet--5模型在数字分类任表6不同池化方法在CFAR-100数据集上的训练误差与务中取得了非常好的效果，本文采用的模型与测试误差 LeNet-5略有不同，将原来的非线性变换函数sig Table 6 Pooling methods'training errors and test errors moid替换为ReLU。实验中参数设置如表3所示， on dataset CIFAR-100 % stepsize=fixed表示学习率在学习过程中不变，实验方法训练误差预测误差中为20。平均池化 27.00 47.03 表3 MNIST数据集上的参数设置 Table 3 The parameter settings on dataset MNIST 最大池化 1.00 49.64 矩池化 14.00 45.38 epoch stepsize 2 入 100: 平均池化（训练） 100 0.01 fixed null 0.0005 平均池化（测试） 80 ·一最大池化（训练）最大池化（测试）训练过程中，3种池化方法几乎都完全过度抑矩池化（训练）合训练数据，权重衰减虽然可以预防过抑合，但在该矩池化（测试）数据集上效果甚微，表4比较各个池化方法在 40 MNIST数据集上的结果。矩池化方法只是一种正则化方法，因此可以与其他方法结合提高模型泛化能力。 50 100150200250300 表4不同池化方法在MNST数据集上的训练误差与测试训练轮数误差 Table 4 Pooling methods'training errors and test errors 图6数据集CFAR-100上的实验结果 on dataset MNIST % Fig.6 Experiments result on dataset CIFAR-100 方法训练误差预测误差 4 结束语平均池化 0.05 1.51 本文在卷积神经网络的框架上提出了一种可以最大池化 0.02 1.07 与其他正则化方法结合使用的池化策略，如drop- out、权重衰减、数据扩增等。矩池化将中心矩与随矩池化 0.10 0.93 机选择应用于CNN的池化层中，中心矩选择池化区 3.3训练集CIFAR-100 域的灰度重心而非最大值，在保持模型判别性的同 CFAR-100[]数据集与CIFAR-10类似，不同之时有效地消除噪声的影响：而选择的随机性，使每次处在于它增加了图片类别数到100，包含50000张选择具有一定的不确定性，从而更好地避免过抑合，训练数据（每类500张）及10000张测试数据。C1- 提高模型鲁棒性。除此之外，矩池化是一种无参的 FAR-100的训练模型以及参数设置如表5所示，与正则化方法，不会影响模型复杂度，可以与任何已有 CIFAR-I00的基本一致，为提高准确率将第3个卷的CNN模型相结合。实验表明该方法可以有效地积层数增加到128。相较于CIFAR-10,CIFAR-100 预防过抑合，提高模型的泛化能力。的训练数据相当有限，而模型却更加复杂。如参考文献：表6所示有限的训练数据下传统的池化方法并没有很好的泛化能力，而矩池化方法有效地降低了分类 [1]MONTAVON G,ORR G,MULLER K R.Neural networks: 误差。 tricks of the trade[M].2nd ed.Berlin Heidelberg:Spring- er,2012. 数据集CIFAR-100上的实验结果如图6所示， [2]HINTON G E,SRIVASTAVE N,KRIZHEVSKY A,et al. 可以看出，第1次调整学习率前，曲线已趋平缓，调 Improving neural networks by preventing co-adaptation of 整后曲线迅速下降，与CIFAR-I0实验结果一致。 feature detectors EB/OL].2012-07-03 ]http://arxiv３．２训练集ＭＮＩＳＴＭＮＩＳＴ［１４］由大小为２８×２８的手写体０～９组成，数据集中包含６００００张训练图片和１００００张测试数据，实验中预处理时将图片归一化到［０，１］。ＬｅｃｕｎＹ［１５］提出的ＬｅＮｅｔ⁃５模型在数字分类任务中取得了非常好的效果，本文采用的模型与ＬｅＮｅｔ⁃５略有不同，将原来的非线性变换函数ｓｉｇ⁃ ｍｏｉｄ替换为ＲｅＬＵ。实验中参数设置如表３所示，ｓｔｅｐｓｉｚｅ＝ｆｉｘｅｄ表示学习率在学习过程中不变，实验中为２０。表３ＭＮＩＳＴ数据集上的参数设置Ｔａｂｌｅ３ＴｈｅｐａｒａｍｅｔｅｒｓｅｔｔｉｎｇｓｏｎｄａｔａｓｅｔＭＮＩＳＴｅｐｏｃｈ α ｓｔｅｐｓｉｚｅ γ λ １０００．０１ｆｉｘｅｄｎｕｌｌ０．０００５训练过程中，３种池化方法几乎都完全过度抑合训练数据，权重衰减虽然可以预防过抑合，但在该数据集上效果甚微，表４比较各个池化方法在ＭＮＩＳＴ数据集上的结果。矩池化方法只是一种正则化方法，因此可以与其他方法结合提高模型泛化能力。表４不同池化方法在ＭＮＩＳＴ数据集上的训练误差与测试误差Ｔａｂｌｅ４Ｐｏｏｌｉｎｇｍｅｔｈｏｄｓ’ ｔｒａｉｎｉｎｇｅｒｒｏｒｓａｎｄｔｅｓｔｅｒｒｏｒｓｏｎｄａｔａｓｅｔＭＮＩＳＴ％方法训练误差预测误差平均池化０．０５１．５１最大池化０．０２１．０７矩池化０．１００．９３３．３训练集ＣＩＦＡＲ⁃１００ＣＩＦＡＲ⁃１００［８］数据集与ＣＩＦＡＲ⁃１０类似，不同之处在于它增加了图片类别数到１００，包含５００００张训练数据（每类５００张）及１００００张测试数据。ＣＩ⁃ ＦＡＲ－１００的训练模型以及参数设置如表５所示，与ＣＩＦＡＲ⁃１００的基本一致，为提高准确率将第３个卷积层数增加到１２８。相较于ＣＩＦＡＲ⁃１０，ＣＩＦＡＲ⁃１００的训练数据相当有限，而模型却更加复杂。如表６所示有限的训练数据下传统的池化方法并没有很好的泛化能力，而矩池化方法有效地降低了分类误差。数据集ＣＩＦＡＲ⁃１００上的实验结果如图６所示，可以看出，第１次调整学习率前，曲线已趋平缓，调整后曲线迅速下降，与ＣＩＦＡＲ⁃１０实验结果一致。表５ＣＩＦＡＲ⁃１００数据集上的参数设置Ｔａｂｌｅ５ＴｈｅｐａｒａｍｅｔｅｒｓｅｔｔｉｎｇｓｏｎｄａｔａｓｅｔＣＩＦＡＲ⁃１００ｅｐｏｃｈ α ｓｔｅｐｓｉｚｅ γ λ ３０００．００１１０００．０１０．００４表６不同池化方法在ＣＩＦＡＲ⁃１００数据集上的训练误差与测试误差Ｔａｂｌｅ６Ｐｏｏｌｉｎｇｍｅｔｈｏｄｓ’ ｔｒａｉｎｉｎｇｅｒｒｏｒｓａｎｄｔｅｓｔｅｒｒｏｒｓｏｎｄａｔａｓｅｔＣＩＦＡＲ⁃１００％方法训练误差预测误差平均池化２７．００４７．０３最大池化１．００４９．６４矩池化１４．００４５．３８图６数据集ＣＩＦＡＲ⁃１００上的实验结果Ｆｉｇ．６ＥｘｐｅｒｉｍｅｎｔｓｒｅｓｕｌｔｏｎｄａｔａｓｅｔＣＩＦＡＲ⁃１００４结束语本文在卷积神经网络的框架上提出了一种可以与其他正则化方法结合使用的池化策略，如ｄｒｏｐ⁃ ｏｕｔ、权重衰减、数据扩增等。矩池化将中心矩与随机选择应用于ＣＮＮ的池化层中，中心矩选择池化区域的灰度重心而非最大值，在保持模型判别性的同时有效地消除噪声的影响；而选择的随机性，使每次选择具有一定的不确定性，从而更好地避免过抑合，提高模型鲁棒性。除此之外，矩池化是一种无参的正则化方法，不会影响模型复杂度，可以与任何已有的ＣＮＮ模型相结合。实验表明该方法可以有效地预防过抑合，提高模型的泛化能力。参考文献：［１］ＭＯＮＴＡＶＯＮＧ，ＯＲＲＧ，ＭÜＬＬＥＲＫＲ．Ｎｅｕｒａｌｎｅｔｗｏｒｋｓ：ｔｒｉｃｋｓｏｆｔｈｅｔｒａｄｅ［Ｍ］．２ｎｄｅｄ．ＢｅｒｌｉｎＨｅｉｄｅｌｂｅｒｇ：Ｓｐｒｉｎｇ⁃ ｅｒ，２０１２．［２］ＨＩＮＴＯＮＧＥ，ＳＲＩＶＡＳＴＡＶＥＮ，ＫＲＩＺＨＥＶＳＫＹＡ，ｅｔａｌ．Ｉｍｐｒｏｖｉｎｇｎｅｕｒａｌｎｅｔｗｏｒｋｓｂｙｐｒｅｖｅｎｔｉｎｇｃｏ⁃ａｄａｐｔａｔｉｏｎｏｆｆｅａｔｕｒｅｄｅｔｅｃｔｏｒｓ［ＥＢ／ＯＬ］．［２０１２⁃０７⁃０３］．ｈｔｔｐ：／／ａｒｘｉｖ．第１期殷瑞，等：一种卷积神经网络的图像矩正则化策略 ·４７·

<<向上翻页向下翻页>>

点击下载：【智能系统】一种卷积神经网络的图像矩正则化策略编辑部