型结构，以深度学习的核心模型结构而展开。文献［７］从深度学习结构进行展

点击下载：《期智能系统学报》：深度学习方法研究新进展（长春工业大学：刘帅师，程曦，郭文燕，陈奇）

正在加载图片...

·568 智能系统学报第11卷型结构，以深度学习的核心模型结构而展开。文献使用。 [7]从深度学习结构进行展开，本文大量增加了近3 首先，为了降低网络的复杂性，卷积神经网络采年新的研究成果，因此能够更准确地反映该领域的用权重共享方式，即同一个特征图，卷积核是一样最新研究进展。的11：其次，对得到的特征输入给一个非线性函数，本文依据模型结构，着重介绍4种典型的深度比如RLU等；最后，再采取下采样方法，比如最大学习模型，即卷积神经网络、深度信念网络、深度玻池化等。下采样的作用是把语义上相似的特征合并尔兹曼机、堆叠自动编码器。下面对这些模型进行起来，这是因为形成一个主题的特征的相对位置不描述。太一样。 1.1.3训练方式 1深度学习典型模型卷积神经网络的训练采用有监督训练方式。首 1.1卷积神经网络先是向前传播，即输入X经过卷积神经网路后变为 1.1.1历史输出0，再将0与标签进行比较，然后以向后传播的卷积神经网络(convolutional neural networks,. 方式，到将所得误差传播到每个节点，根据权值更新 CNN)最早在20世纪80年代就已被提出，是由于在公式，更新相应的卷积核权值4.6。研究猫脑皮层时受到的启发。它的典型模型LeNet- 此外，以卷积神经网络为核心的深度学习网络 5[8]系统，在MNIST上得到了0.9%的错误率，并在还有3-D卷积神经网络(3-D convolutional neural 20世纪90年代就已用于银行的手写支票识别)。 networks,3D-CNN)[,光谱网络(spectral net-- 但是，由于在大尺寸图像上没有好的效果，一度被人 works,SN)Ia),金字塔卷积神经网络(pyramid conv- 忽视。随着高效的GPU计算的兴起，直到2012年 olutional neural networks,PCNN)[],多级金字塔卷 Hinton在ImageNet问题的成功，才使它在近几年流积神经网络(multi level pyamid convolutional neural 行起来[)。如今卷积神经网络已经成为众多科学 networks,MLPCNN)[4等。领域的研究热点之一，特别是在图像识别领域。由 12受限制玻尔兹曼机为核心的深度网络于该网络避免了对图像的复杂前期预处理，可以直受限制玻尔兹曼机为核心的深度网络有2种：接输入原始图像，因而得到了广泛的应用。深度信念网和深度玻尔兹曼机。现简要分析二者的 1.1.2结构区别卷积神经网络是前馈神经网络的一种。卷积神 1.2.1受限制玻尔兹曼机经网络的模型如图1所示，它是一个多层的神经网受限制玻尔兹曼机(restricted Boltzmann ma- 络，每层由多个二维平面组成，而每个平面由多个独 chine,RBM)是一类无向图模型[a],由可视层和隐含立神经元组成。传统的神经网络层与层之间神经元层组成，与玻尔兹曼机(Boltzmann machine,BM)不采取全连接方式，而卷积神经网络采用稀疏连接方同，层内无连接，层间有连接。这种结构更易于计算式，即每个特征图上的神经元只连接上一层的一个隐含层单元与可视层单元的条件分布)。受限制小区域的神经元连接。玻尔兹曼机的训练方式通常采用对比散度方(cot- C,特征 ,特征层 rastive divergence,.CD)。常见的玻尔兹曼机的演变 C,特征层输入层特征层特征层特征层输出层模型如图2所示。输 BM 卷莲类卷积下采样L卷积下采样1接1器 RBM 图1卷积神经网络模型 CRBM SRBM SGRBM CRBM Fig.1 Convolutional neural network model 卷积神经网络的低隐含层是由卷积层和最大池图2玻尔兹曼机演变模型采样层交替组成，高层通常是全连接层作为分类器 Fig.2 The evolution model of boltzmann machine型结构，以深度学习的核心模型结构而展开。文献［７］从深度学习结构进行展开，本文大量增加了近３年新的研究成果，因此能够更准确地反映该领域的最新研究进展。本文依据模型结构，着重介绍４种典型的深度学习模型，即卷积神经网络、深度信念网络、深度玻尔兹曼机、堆叠自动编码器。下面对这些模型进行描述。１深度学习典型模型１．１卷积神经网络１．１．１历史卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＣＮＮ）最早在２０世纪８０年代就已被提出，是由于在研究猫脑皮层时受到的启发。它的典型模型ＬｅＮｅｔ⁃ ５［８］系统，在ＭＮＩＳＴ上得到了０．９％的错误率，并在２０世纪９０年代就已用于银行的手写支票识别［７］。但是，由于在大尺寸图像上没有好的效果，一度被人忽视。随着高效的ＧＰＵ计算的兴起，直到２０１２年Ｈｉｎｔｏｎ在ＩｍａｇｅＮｅｔ问题的成功，才使它在近几年流行起来［９］。如今卷积神经网络已经成为众多科学领域的研究热点之一，特别是在图像识别领域。由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了广泛的应用。１．１．２结构卷积神经网络是前馈神经网络的一种。卷积神经网络的模型如图１所示，它是一个多层的神经网络，每层由多个二维平面组成，而每个平面由多个独立神经元组成。传统的神经网络层与层之间神经元采取全连接方式，而卷积神经网络采用稀疏连接方式，即每个特征图上的神经元只连接上一层的一个小区域的神经元连接。图１卷积神经网络模型Ｆｉｇ．１Ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｍｏｄｅｌ卷积神经网络的低隐含层是由卷积层和最大池采样层交替组成，高层通常是全连接层作为分类器使用。首先，为了降低网络的复杂性，卷积神经网络采用权重共享方式，即同一个特征图，卷积核是一样的［１０］；其次，对得到的特征输入给一个非线性函数，比如ＲｅＬＵ等；最后，再采取下采样方法，比如最大池化等。下采样的作用是把语义上相似的特征合并起来，这是因为形成一个主题的特征的相对位置不太一样［１］。１．１．３训练方式卷积神经网络的训练采用有监督训练方式。首先是向前传播，即输入Ｘ经过卷积神经网路后变为输出Ｏ，再将Ｏ与标签进行比较，然后以向后传播的方式，到将所得误差传播到每个节点，根据权值更新公式，更新相应的卷积核权值［４，６］。此外，以卷积神经网络为核心的深度学习网络还有３⁃Ｄ卷积神经网络（３⁃Ｄｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ，３Ｄ⁃ＣＮＮ））［１１］，光谱网络（ｓｐｅｃｔｒａｌｎｅｔ⁃ ｗｏｒｋｓ，ＳＮ）［１２］，金字塔卷积神经网络（ｐｙｒａｍｉｄｃｏｎｖ⁃ ｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＰＣＮＮ）［１３］，多级金字塔卷积神经网络（ｍｕｌｔｉｌｅｖｅｌｐｙａｍｉｄｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＭＬＰＣＮＮ）［１４］等。１．２受限制玻尔兹曼机为核心的深度网络受限制玻尔兹曼机为核心的深度网络有２种：深度信念网和深度玻尔兹曼机。现简要分析二者的区别。１．２．１受限制玻尔兹曼机受限制玻尔兹曼机（ｒｅｓｔｒｉｃｔｅｄＢｏｌｔｚｍａｎｎｍａ⁃ ｃｈｉｎｅ，ＲＢＭ）是一类无向图模型［４］，由可视层和隐含层组成，与玻尔兹曼机（Ｂｏｌｔｚｍａｎｎｍａｃｈｉｎｅ，ＢＭ）不同，层内无连接，层间有连接。这种结构更易于计算隐含层单元与可视层单元的条件分布［５］。受限制玻尔兹曼机的训练方式通常采用对比散度方（ｃｏｎｔ⁃ ｒａｓｔｉｖｅｄｉｖｅｒｇｅｎｃｅ，ＣＤ）。常见的玻尔兹曼机的演变模型如图２所示。图２玻尔兹曼机演变模型Ｆｉｇ．２Ｔｈｅｅｖｏｌｕｔｉｏｎｍｏｄｅｌｏｆｂｏｌｔｚｍａｎｎｍａｃｈｉｎｅ ·５６８· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：《期智能系统学报》：深度学习方法研究新进展（长春工业大学：刘帅师，程曦，郭文燕，陈奇）