矩特征具有平移不变性、相似变换不变性、旋转不变性以及正交变换不变性，因此

正在加载图片...

第1期殷瑞，等：一种卷积神经网络的图像矩正则化策略 ·45 矩特征具有平移不变性、相似变换不变性、旋转不变最近邻插值法[选择与插入点最近的像素作性以及正交变换不变性，因此它被成功地应用于图为中心矩的像素值，虽然该方法插值速度快，但它容像分类中。P.Rosin]认为局部区域的灰度值分布易出现棋盘格效应。且在池化操作中，中心矩与最相对于其中心具有偏移性，因此他利用图像中心到大值像素位置非常接近，最近邻插值法几乎等价于中心矩的向量来表示局部区域的主方向。E. 极大池化法。 Rublee[]在提取二值特征时，将矩特征应用于估计双线性插值法[o]用待插入点的2×2区域的4 主方向以提高特征的鲁棒性。本文将中心矩与随机个邻近像素的值通过加权平均计算得到。其核心思选择结合起来，将其应用于CNN的池化操作中，为想是在x、y方向上分别进行一次线性插值，距离待了不增加CNN模型的计算复杂性，本文采用一插入点越近，权值越高。在池化操作中双线性内插阶矩。算法不会出现像素值不连续的情况，然而此算法和灰度矩定义如下：平均池化类似，具有低通滤波器的性质，使高频分量 mm=∑y1(x,y） (4) 受损，所以可能会使轮廓信息在一定程度上变得模 I.Y 糊。除此之外，双线性插值法要分别在2个方向上式中：I(x,y)表示图像位置(x,y)处的灰度值，P、q 取值为1. 插值，增加了模型的计算复杂度。中心矩定义如下：本文在2个方向上以概率PxP,随机选择x、y, 式(7)、(8)所示距离中心矩越近，被选择的可能性 c= mio mo (5) 越大。最后根据选择的(x,y)坐标从四邻域中选择 moo moo 池化区域的响应值。矩池化的随机性使每次选择都根据式(4)、(5)计算池化区域的中心矩 c(x,y),一般情况下c为浮点值，不指向任何一个确不相同，因此可以有效地达到预防过抑合的效果。在计算复杂度上，该策略只需要随机生成2个概率，定的离散值，如图2所示，其上下边界具有4个确定位置(Q,Q2,Q2,Q),称其为c的四邻域。在远小于双线性插值法，与最近邻插值法接近。图像放大中采用插值法计算插入点的像素值，本文 P1=（x2-x) 借鉴该思想通过中心矩的四邻域计算其响应值。 P2=（y2-y) (7) x1Px≤P1 y x= 0. R 0 (x2 p:>Pi y1P≤P1 (8) (y2 P,P 3实验实验部分将矩池化、极大池化、平均池化分别在 MNIST,CIFAR-10,CIFAR-1O0数据集上进行比较，图3代表3个数据集的部分数据。实验采用深度学习框架cafe】,cafe是一个清晰而高效的深度学习框架，它具有上手快、速度快、模块化、开放性及社区好的特点，并且支持命令行、python和matlab接 x 口，可以在CPU和GPU间无缝切换，大大提高了模图2矩池化选择方法型的学习效率。 Fig.2 The moment pooling's selection strategy 50 x1=(int)x y=(int)y x2=x1+1y2=y1+1 Q1=(x1,y1) Q2=(x2y1)） Q3=(x2,y2) (a)mnist (b)cifar10 (c)cifar100 Q4=（x1,y2) (6) 图3实验中用到的部分数据式中x1x2分别表示xy向下取整。 Fig.3 The part experiments data矩特征具有平移不变性、相似变换不变性、旋转不变性以及正交变换不变性，因此它被成功地应用于图像分类中。Ｐ．Ｒｏｓｉｎ［７］认为局部区域的灰度值分布相对于其中心具有偏移性，因此他利用图像中心到中心矩的向量来表示局部区域的主方向。Ｅ．Ｒｕｂｌｅｅ［８］在提取二值特征时，将矩特征应用于估计主方向以提高特征的鲁棒性。本文将中心矩与随机选择结合起来，将其应用于ＣＮＮ的池化操作中，为了不增加ＣＮＮ模型的计算复杂性，本文采用一阶矩。灰度矩定义如下：ｍｐｑ＝ ∑ｘ，ｙｘｐｙｑＩ（ｘ，ｙ）（４）式中：Ｉ（ｘ，ｙ）表示图像位置（ｘ，ｙ）处的灰度值，ｐ、ｑ取值为１．中心矩定义如下：ｃ＝ｍ１０ｍ００ｍ０１ｍ００ é ë ê ê ù û ú ú （５）根据式（４）、（５）计算池化区域的中心矩ｃ（ｘ，ｙ），一般情况下ｃ为浮点值，不指向任何一个确定的离散值，如图２所示，其上下边界具有４个确定位置（Ｑ１１，Ｑ１２，Ｑ２２，Ｑ２１），称其为ｃ的四邻域。在图像放大中采用插值法计算插入点的像素值，本文借鉴该思想通过中心矩的四邻域计算其响应值。图２矩池化选择方法Ｆｉｇ．２Ｔｈｅｍｏｍｅｎｔｐｏｏｌｉｎｇ’ｓｓｅｌｅｃｔｉｏｎｓｔｒａｔｅｇｙｘ１＝（ｉｎｔ）ｘｙ１＝（ｉｎｔ）ｙｘ２＝ｘ１＋１ｙ２＝ｙ１＋１Ｑ１＝（ｘ１，ｙ１）Ｑ２＝（ｘ２，ｙ１）Ｑ３＝（ｘ２，ｙ２）Ｑ４＝（ｘ１，ｙ２）（６）式中ｘ１、ｘ２分别表示ｘ、ｙ向下取整。最近邻插值法［９］选择与插入点最近的像素作为中心矩的像素值，虽然该方法插值速度快，但它容易出现棋盘格效应。且在池化操作中，中心矩与最大值像素位置非常接近，最近邻插值法几乎等价于极大池化法。双线性插值法［１０］用待插入点的２×２区域的４个邻近像素的值通过加权平均计算得到。其核心思想是在ｘ、ｙ方向上分别进行一次线性插值，距离待插入点越近，权值越高。在池化操作中双线性内插算法不会出现像素值不连续的情况，然而此算法和平均池化类似，具有低通滤波器的性质，使高频分量受损，所以可能会使轮廓信息在一定程度上变得模糊。除此之外，双线性插值法要分别在２个方向上插值，增加了模型的计算复杂度。本文在２个方向上以概率ｐｘ、ｐｙ随机选择ｘ、ｙ，式（７）、（８）所示距离中心矩越近，被选择的可能性越大。最后根据选择的（ｘ，ｙ）坐标从四邻域中选择池化区域的响应值。矩池化的随机性使每次选择都不相同，因此可以有效地达到预防过抑合的效果。在计算复杂度上，该策略只需要随机生成２个概率，远小于双线性插值法，与最近邻插值法接近。ｐ１＝（ｘ２－ｘ）ｐ２＝（ｙ２－ｙ）（７）ｘ＝ｘ１ｐｘ ≤ ｐ１ｘ２ｐｘ＞ｐ１ { ｙ＝ｙ１ｐｙ ≤ ｐ１ｙ２ｐｙ＞ｐ１ { （８）３实验实验部分将矩池化、极大池化、平均池化分别在ＭＮＩＳＴ，ＣＩＦＡＲ⁃１０，ＣＩＦＡＲ⁃１００数据集上进行比较，图３代表３个数据集的部分数据。实验采用深度学习框架ｃａｆｆｅ［１１］，ｃａｆｆｅ是一个清晰而高效的深度学习框架，它具有上手快、速度快、模块化、开放性及社区好的特点，并且支持命令行、ｐｙｔｈｏｎ和ｍａｔｌａｂ接口，可以在ＣＰＵ和ＧＰＵ间无缝切换，大大提高了模型的学习效率。（ａ）ｍｎｉｓｔ（ｂ）ｃｉｆａｒ１０（ｃ）ｃｉｆａｒ１００图３实验中用到的部分数据Ｆｉｇ．３Ｔｈｅｐａｒｔｅｘｐｅｒｉｍｅｎｔｓｄａｔａ第１期殷瑞，等：一种卷积神经网络的图像矩正则化策略 ·４５·

<<向上翻页向下翻页>>

点击下载：【智能系统】一种卷积神经网络的图像矩正则化策略编辑部