间与隐藏节点个数成指数关系。因此，Ｈｉｎｔｏｎ等［２２］提出了ＣＤ

正在加载图片...

·196 智能系统学报第10卷间与隐藏节点个数成指数关系。因此，Hinton等[2) 2.2RBM学习算法提出了CD,(contrastive divergence)方法来模拟梯度整个RBM的训练过程如下，这里用到了CD1。的计算，整个算法过程如图3。一层的RBM模型训练完毕后，固定其权值W 负例样本对和正例样本对及偏置值b、c:,隐藏层的输出h:作为原输入信息负例样本对和正例样本对负例样本对的第1个表达，将隐藏层的输出h,作为其上层RBM 负例样本对的输入，同样训练RBM模型，就会得到第2层的参 ,:+■ 阈值theta 正例样本对数及其输出，其输出就作为原输入信息的第2个表正例样本对红达a]。如此不断往上叠加RBM,就得到了DBN的相似性度量预处理i 初步模型。特征表示正例样本对以上在DBN模型的构建中统称为预训练阶段。 IFr18 工红幻 IEEEEEEE1E I,幻预训练将网络参数训练到一组合适的初始值，从这正例样本对 0上：0卫组初始值出发会令代价函数达到一个更低的值2。 1 、”I8010 DBN模型经过这种方式的训练后，再根据重构误差，使用传统的全局学习算法，比如BP算法对整个模型进行微预训练 BP微调 DBN 调，从而使模型收敛到局部最优点。模型 RBM训练算法符号说明：可视节点j,可视节点预处理 50张视屏图像+ 的偏置b,可视节点值为1的条件概率 1张二代证图像 P(x2=1h,),sign为S型函数，W为连接权值，隐藏节点i,隐藏节点的偏置c:,隐藏节点值为1的条件概率Q(h:=1x,)、Q(h2=1x2)。图3系统框架算法过程 Fig.3 System framework 输入：可视节点值x1, 实验证明，CD,是一种很好的求解对数似然函输出：隐藏节点值h2o 数关于未知参数梯度的近似的方法。 for所有隐藏节点ido CDk算法 1)计算Q(h.=1x,)(若为二值单元，则Q值输人：RBM(V1,2,…,VmH1,2,…,Hn), 输出：梯度估计△w,.△b,△c:。即为sign(c:+∑，Wrxy) forj=1,2,…,m,i=1,2,…,n, 2)从Q(h:lx,)中采样h:∈{0,1 初始化△0g=Ab,=△c:=0forj=1,2,…,m, end for i=1,2,…,n。 for所有可视节点jdo for所有的vdo 3)计算P(xg=1h,)(若为二值单元，则Q值 (o)←U 即为sign(6,+∑，Wgh)) for t=0,...-1do 4)从P(x=1h)中采样x2∈{0,1} fori=1,2,…,ndo采样h(t) end for p(h:v) for所有隐藏节点ido forj=1,2,…,mdo采样“)~p(yh0) 5)计算Q(h2=1x2)(若为二值单元，则Q值 forj=1,2,…,m,i=1,2,…,ndo 即为sign(c:+∑W*)） △0g←-△wg+p(h:-1o)o-p(h,= end for 1) 6)W←-W+E(h1x1'-Q(h2=1x2)x2') 46,←46+@- 7)b←-b+ε(x1-x2) △c:←△c:+p(h=1vo)-p(h,=1v) 8)c←-c+e(h1-Q(h2=1x2))间与隐藏节点个数成指数关系。因此，Ｈｉｎｔｏｎ等［２２］提出了ＣＤｋ（ｃｏｎｔｒａｓｔｉｖｅｄｉｖｅｒｇｅｎｃｅ）方法来模拟梯度的计算，整个算法过程如图３。图３系统框架Ｆｉｇ．３Ｓｙｓｔｅｍｆｒａｍｅｗｏｒｋ实验证明，ＣＤｋ是一种很好的求解对数似然函数关于未知参数梯度的近似的方法。ＣＤｋ算法输入：ＲＢＭ（Ｖ１，２，…，Ｖｍ，Ｈ１，２，…，Ｈｎ），输出：梯度估计 Δｗｉｊ，Δｂｊ，Δｃｉ。ｆｏｒｊ＝１，２，…，ｍ，ｉ＝１，２，…，ｎ，初始化 Δｗｉｊ＝ Δｂｊ＝ Δｃｉ＝０ｆｏｒｊ＝１，２，…，ｍ，ｉ＝１，２，…，ｎ。ｆｏｒ所有的ｖｄｏｖ（０） ← ｖｆｏｒｔ＝０，．．．ｋ－１ｄｏｆｏｒｉ＝１，２，…，ｎｄｏ采样ｈｉ（ｔ）～ｐ（ｈｉｖ（ｔ））ｆｏｒｊ＝１，２，…，ｍｄｏ采样ｖ（ｔ＋１）ｊ～ｐ（ｖｊｈ（ｔ））ｆｏｒｊ＝１，２，…，ｍ，ｉ＝１，２，…，ｎｄｏ Δｗｉｊ ← Δｗｉｊ＋ｐ（ｈｉ＝１ｖ（０））ｖ（０）ｊ－ｐ（ｈｉ＝１ｖ（ｋ））ｖ（ｋ）ｊ Δｂｊ ← Δｂｊ＋ｖ（０）ｊ－ｖ（ｋ）ｊ Δｃｉ ←Δｃｉ＋ｐ（ｈｉ＝１ｖ（０））－ｐ（ｈｉ＝１ｖ（ｋ））２．２ＲＢＭ学习算法整个ＲＢＭ的训练过程如下，这里用到了ＣＤ１。一层的ＲＢＭ模型训练完毕后，固定其权值Ｗｉｊ及偏置值ｂｊ、ｃｉ，隐藏层的输出ｈｉ作为原输入信息的第１个表达，将隐藏层的输出ｈｉ作为其上层ＲＢＭ的输入，同样训练ＲＢＭ模型，就会得到第２层的参数及其输出，其输出就作为原输入信息的第２个表达［２３］。如此不断往上叠加ＲＢＭ，就得到了ＤＢＮ的初步模型。以上在ＤＢＮ模型的构建中统称为预训练阶段。预训练将网络参数训练到一组合适的初始值，从这组初始值出发会令代价函数达到一个更低的值［２４］。经过这种方式的训练后，再根据重构误差，使用传统的全局学习算法，比如ＢＰ算法对整个模型进行微调，从而使模型收敛到局部最优点。ＲＢＭ训练算法符号说明：可视节点ｊ，可视节点的偏置ｂｊ，可视节点值为１的条件概率Ｐ（ｘ２ｊ＝１ｈ１），ｓｉｇｎ为Ｓ型函数，Ｗｉｊ为连接权值，隐藏节点ｉ，隐藏节点的偏置ｃｉ，隐藏节点值为１的条件概率Ｑ（ｈ１ｉ＝１ｘ１）、Ｑ（ｈ２ｉ＝１ｘ２）。算法过程输入：可视节点值ｘ１，输出：隐藏节点值ｈ２。ｆｏｒ所有隐藏节点ｉｄｏ１）计算Ｑ（ｈ１ｉ＝１ｘ１）（若为二值单元，则Ｑ值即为ｓｉｇｎ（ｃｉ＋ ∑ｊＷｉｊｘ１ｊ））２）从Ｑ（ｈ１ｉｘ１）中采样ｈ１ｉ ∈ ｛０，１｝ｅｎｄｆｏｒｆｏｒ所有可视节点ｊｄｏ３）计算Ｐ（ｘ２ｊ＝１ｈ１）（若为二值单元，则Ｑ值即为ｓｉｇｎ（ｂｊ＋ ∑ｊＷｉｊｈ１ｉ））４）从Ｐ（ｘ２ｊ＝１ｈ１）中采样ｘ２ｊ ∈ ｛０，１｝ｅｎｄｆｏｒｆｏｒ所有隐藏节点ｉｄｏ５）计算Ｑ（ｈ２ｉ＝１ｘ２）（若为二值单元，则Ｑ值即为ｓｉｇｎ（ｃｉ＋ ∑ｊＷｉｊｘ２ｊ））ｅｎｄｆｏｒ６）Ｗ ← Ｗ＋ ε（ｈ１ｘ１ ′ －Ｑ（ｈ２＝１ｘ２）ｘ２ ′）７）ｂ ← ｂ＋ ε（ｘ１－ｘ２）８）ｃ ← ｃ＋ ε（ｈ１－Ｑ（ｈ２＝１ｘ２）） ·１９６· 智能系统学报第１０卷

<<向上翻页向下翻页>>

点击下载：机器感知与模式识别：深度信念网络的二代身份证异构人脸核实算法