【机器感知与模式识别】一种特征加权融合人脸识别方法编辑部

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：741.08KB

第10卷第6期智能系统学报 Vol.10 No.6 2015年12月 CAAI Transactions on Intelligent Systems Dec.2015 D0I:10.11992.tis.201509025 一种特征加权融合人脸识别方法孙劲光2，孟凡宇2 (1.辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛125000：2.辽宁省数字化矿山装备工程技术研究中心，辽宁阜新123000) 摘要：针对传统人脸识别算法在非限制条件下识别准确率不高的问题，提出了一种特征加权融合人脸识别方法 (DLWF)。根据人脸面部左眼、右眼、鼻子，嘴、下巴等5个器官位置，将人脸图像划分成5个局部采样区域：将得到的5个局部采样区域和整幅人脸图像分别输入到对应的神经网络中进行网络权值调整，完成子网络的构建：利用 softmax回归求出6个相似度向量并组成相似度矩阵与权向量相乘得出最终的识别结果。经ORL和WFL人脸库上进行实验验证，识别准确率分别达到97%和91.63%。实验结果表明：该算法能够有效提高人脸识别能力，与传统识别算法相比在限制条件和非限制条件下都具有较高的识别准确率。关键词：人脸识别：非限制条件：深度自信网络：局部特征：特征融合：全局特征中图分类号：TN911.73文献标志码：A文章编号：1673-4785(2015)06-0912-09 中文引用格式：孙劲光，孟凡宇.一种特征加权融合人脸识别方法[J].智能系统学报，2015,10(6)：912-920. 英文引用格式：SUN Jinguang,MENG Fanyu.Face recognition by weighted fusion of facial features[J].CAAI Transactions on In- telligent Systems,2015,10(6):912-920. Face recognition by weighted fusion of facial features SUN Jinguang'2,MENG Fanyu2 (1.School of Electronics and Information Engineering,Liaoniing Technical University,Huludao 125000,China;2.LiaoNing Digital Mining Equipment Engineering Technology Research Center,Fuxin 123000,China) Abstract:The accuracy of face recognition is low under unconstrained conditions.To solve this problem,we pro- pose a new method based on deep learning and the weighted fusion of facial features.First,we divide facial feature points into five regions using an active shape model and then sample different facial components corresponding to those facial feature points.A corresponding deep belief network (DBN)was then trained based on these regional samples to obtain optimal network parameters.The five regional sampling regions and entire facial image obtained were then inputted into a corresponding neural network to adjust the network weight and complete the construction of sub-networks.Finally,using softmax regression,we obtained six similarity vectors of different components.These six similarity vectors comprise a similarity matrix,which is then multiplied by the weight vector to derive the final recognition result.Recognition accuracy was 97%and 91.63%on the ORL and WFL face databases,respectively. Compared with traditional recognition algorithms such as SVM,DBN,PCA,and FIP+LDA,recognition rates for both databases were improved in both constrained and unconstrained conditions.On the basis of these experimental results,we conclude that the proposed algorithm demonstrates high efficiency in face recognition. Keywords:face recognition;unconstrained condition;deep belief networks;local feature;feature fusion;overall feature 收稿日期：2015-09-17. 人脸识别一直是模式识别和计算机视觉领域的基金项目：国家科技支撑计划资助项目(2013BAH12F02) 通信作者：孟凡字.E-mail:mengfanyul991@163.com

第１０卷第６期智能系统学报Ｖｏｌ．１０ №．６２０１５年１２月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＤｅｃ．２０１５ＤＯＩ：１０．１１９９２．ｔｉｓ．２０１５０９０２５一种特征加权融合人脸识别方法孙劲光１，２，孟凡宇２（１．辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛１２５０００；２．辽宁省数字化矿山装备工程技术研究中心，辽宁阜新１２３０００）摘要：针对传统人脸识别算法在非限制条件下识别准确率不高的问题，提出了一种特征加权融合人脸识别方法（ＤＬＷＦ＋）。根据人脸面部左眼、右眼、鼻子、嘴、下巴等５个器官位置，将人脸图像划分成５个局部采样区域；将得到的５个局部采样区域和整幅人脸图像分别输入到对应的神经网络中进行网络权值调整，完成子网络的构建；利用ｓｏｆｔｍａｘ回归求出６个相似度向量并组成相似度矩阵与权向量相乘得出最终的识别结果。经ＯＲＬ和ＷＦＬ人脸库上进行实验验证，识别准确率分别达到９７％和９１．６３％。实验结果表明：该算法能够有效提高人脸识别能力，与传统识别算法相比在限制条件和非限制条件下都具有较高的识别准确率。关键词：人脸识别；非限制条件；深度自信网络；局部特征；特征融合；全局特征中图分类号：ＴＮ９１１．７３文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１５）０６⁃０９１２⁃０９中文引用格式：孙劲光，孟凡宇．一种特征加权融合人脸识别方法［Ｊ］．智能系统学报，２０１５，１０（６）：９１２⁃９２０．英文引用格式：ＳＵＮＪｉｎｇｕａｎｇ，ＭＥＮＧＦａｎｙｕ．Ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｂｙｗｅｉｇｈｔｅｄｆｕｓｉｏｎｏｆｆａｃｉａｌｆｅａｔｕｒｅｓ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎ⁃ ｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１５，１０（６）：９１２⁃９２０．ＦａｃｅｒｅｃｏｇｎｉｔｉｏｎｂｙｗｅｉｇｈｔｅｄｆｕｓｉｏｎｏｆｆａｃｉａｌｆｅａｔｕｒｅｓＳＵＮＪｉｎｇｕａｎｇ１，２，ＭＥＮＧＦａｎｙｕ２（１．ＳｃｈｏｏｌｏｆＥｌｅｃｔｒｏｎｉｃｓａｎｄＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＬｉａｏｎｉｉｎｇＴｅｃｈｎｉｃａｌＵｎｉｖｅｒｓｉｔｙ，Ｈｕｌｕｄａｏ１２５０００，Ｃｈｉｎａ；２．ＬｉａｏＮｉｎｇＤｉｇｉｔａｌＭｉｎｉｎｇＥｑｕｉｐｍｅｎｔＥｎｇｉｎｅｅｒｉｎｇＴｅｃｈｎｏｌｏｇｙＲｅｓｅａｒｃｈＣｅｎｔｅｒ，Ｆｕｘｉｎ１２３０００，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｈｅａｃｃｕｒａｃｙｏｆｆａｃｅｒｅｃｏｇｎｉｔｉｏｎｉｓｌｏｗｕｎｄｅｒｕｎｃｏｎｓｔｒａｉｎｅｄｃｏｎｄｉｔｉｏｎｓ．Ｔｏｓｏｌｖｅｔｈｉｓｐｒｏｂｌｅｍ，ｗｅｐｒｏ⁃ ｐｏｓｅａｎｅｗｍｅｔｈｏｄｂａｓｅｄｏｎｄｅｅｐｌｅａｒｎｉｎｇａｎｄｔｈｅｗｅｉｇｈｔｅｄｆｕｓｉｏｎｏｆｆａｃｉａｌｆｅａｔｕｒｅｓ．Ｆｉｒｓｔ，ｗｅｄｉｖｉｄｅｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｓｉｎｔｏｆｉｖｅｒｅｇｉｏｎｓｕｓｉｎｇａｎａｃｔｉｖｅｓｈａｐｅｍｏｄｅｌａｎｄｔｈｅｎｓａｍｐｌｅｄｉｆｆｅｒｅｎｔｆａｃｉａｌｃｏｍｐｏｎｅｎｔｓｃｏｒｒｅｓｐｏｎｄｉｎｇｔｏｔｈｏｓｅｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｓ．Ａｃｏｒｒｅｓｐｏｎｄｉｎｇｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋ（ＤＢＮ）ｗａｓｔｈｅｎｔｒａｉｎｅｄｂａｓｅｄｏｎｔｈｅｓｅｒｅｇｉｏｎａｌｓａｍｐｌｅｓｔｏｏｂｔａｉｎｏｐｔｉｍａｌｎｅｔｗｏｒｋｐａｒａｍｅｔｅｒｓ．Ｔｈｅｆｉｖｅｒｅｇｉｏｎａｌｓａｍｐｌｉｎｇｒｅｇｉｏｎｓａｎｄｅｎｔｉｒｅｆａｃｉａｌｉｍａｇｅｏｂｔａｉｎｅｄｗｅｒｅｔｈｅｎｉｎｐｕｔｔｅｄｉｎｔｏａｃｏｒｒｅｓｐｏｎｄｉｎｇｎｅｕｒａｌｎｅｔｗｏｒｋｔｏａｄｊｕｓｔｔｈｅｎｅｔｗｏｒｋｗｅｉｇｈｔａｎｄｃｏｍｐｌｅｔｅｔｈｅｃｏｎｓｔｒｕｃｔｉｏｎｏｆｓｕｂ⁃ｎｅｔｗｏｒｋｓ．Ｆｉｎａｌｌｙ，ｕｓｉｎｇｓｏｆｔｍａｘｒｅｇｒｅｓｓｉｏｎ，ｗｅｏｂｔａｉｎｅｄｓｉｘｓｉｍｉｌａｒｉｔｙｖｅｃｔｏｒｓｏｆｄｉｆｆｅｒｅｎｔｃｏｍｐｏｎｅｎｔｓ．Ｔｈｅｓｅｓｉｘｓｉｍｉｌａｒｉｔｙｖｅｃｔｏｒｓｃｏｍｐｒｉｓｅａｓｉｍｉｌａｒｉｔｙｍａｔｒｉｘ，ｗｈｉｃｈｉｓｔｈｅｎｍｕｌｔｉｐｌｉｅｄｂｙｔｈｅｗｅｉｇｈｔｖｅｃｔｏｒｔｏｄｅｒｉｖｅｔｈｅｆｉｎａｌｒｅｃｏｇｎｉｔｉｏｎｒｅｓｕｌｔ．Ｒｅｃｏｇｎｉｔｉｏｎａｃｃｕｒａｃｙｗａｓ９７％ａｎｄ９１．６３％ｏｎｔｈｅＯＲＬａｎｄＷＦＬｆａｃｅｄａｔａｂａｓｅｓ，ｒｅｓｐｅｃｔｉｖｅｌｙ．ＣｏｍｐａｒｅｄｗｉｔｈｔｒａｄｉｔｉｏｎａｌｒｅｃｏｇｎｉｔｉｏｎａｌｇｏｒｉｔｈｍｓｓｕｃｈａｓＳＶＭ，ＤＢＮ，ＰＣＡ，ａｎｄＦＩＰ＋ＬＤＡ，ｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｓｆｏｒｂｏｔｈｄａｔａｂａｓｅｓｗｅｒｅｉｍｐｒｏｖｅｄｉｎｂｏｔｈｃｏｎｓｔｒａｉｎｅｄａｎｄｕｎｃｏｎｓｔｒａｉｎｅｄｃｏｎｄｉｔｉｏｎｓ．Ｏｎｔｈｅｂａｓｉｓｏｆｔｈｅｓｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓ，ｗｅｃｏｎｃｌｕｄｅｔｈａｔｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍｄｅｍｏｎｓｔｒａｔｅｓｈｉｇｈｅｆｆｉｃｉｅｎｃｙｉｎｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ．Ｋｅｙｗｏｒｄｓ：ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ；ｕｎｃｏｎｓｔｒａｉｎｅｄｃｏｎｄｉｔｉｏｎ；ｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋｓ；ｌｏｃａｌｆｅａｔｕｒｅ；ｆｅａｔｕｒｅｆｕｓｉｏｎ；ｏｖｅｒａｌｌｆｅａｔｕｒｅ收稿日期：２０１５⁃０９⁃１７．基金项目：国家科技支撑计划资助项目（２０１３ＢＡＨ１２Ｆ０２）．通信作者：孟凡宇．Ｅ⁃ｍａｉｌ：ｍｅｎｇｆａｎｙｕ１９９１＠１６３．ｃｏｍ．人脸识别一直是模式识别和计算机视觉领域的

第6期孙劲光，等：一种特征加权融合人脸识别方法 ·913· 研究热点。人脸图像像素矩阵较大同时特征维数也 1.2基本思想较高，进行识别难度较大，因此设计出高效的特征提为建立人脸面部局部特征深度学习模型，首先取器成为人脸识别的关键。其中最典型方法为主成利用人脸面部的主要特征点将人脸分成若干子区分分析法(principal components analysis,PCA)[),其域：然后将这些小的子区域和整幅人脸经归一化处思想首先，把一副图像按行或列拉直成一个高维列理，输入到对应的DBN网络进行训练，得到各个子向量，然后，求取整个训练样本集高维列向量的协方区域和整幅人脸的相似度概率向量：最后将左眼、右差矩阵，求此协方差矩阵的特征向量和特征值得到眼、鼻子、嘴、下巴等器官和整个面部的相似度向量投影变换矩阵，最后，把人脸图像高维特征通过投影加权后进行分类。DLWF+分为以下4个主要阶段：变换矩阵映射到低维空间中，得到人脸的低维表示 1)人脸面部区域划分特征：在人脸识别研究中，利用PCA方法对高维特利用haar方法进行人脸检测，提取出人脸面部征进行降维处理，获得了良好的效果，是最为成功的主要区域，并根据人脸面部主要器官左眼、右眼、鼻线性鉴别分析方法之一。但实际的应用中，PCA方子、嘴巴、下巴等进行子区域的划分。法进行线性鉴别分析通常会产生小样本问题（即样 2)网络模型的构建并确定权值本个数远小于特征维数)：被识别人脸图像是在非利用上一步求取得到的各个区域和整幅人脸图限制条件下提取时，应用PCA算法提取的特征并不像分别输入到对应的子网络中，进行权值的调整，完适合作为分类的特征。成网络模型的构建。对各个子区域分别进行识别得人们利用深度神经网络进行人脸识别主要分为出识别率作为各自的权重。 2类：1)利用深度神经网络特征提取后再应用其他 3)求取面部隶属度矩阵分类器进行识别26：2)直接在深度神经网络增加通过将测试集不同区域的采样块分别输入到对分类层进行识别。汤晓鸥9]等利用卷积神经网应的子网络中，取出个区域的相似度向量，并利用求络进行人脸验证取得了良好的效果，在LFW人脸库得的各个相似度向量组成相似度矩阵。上的识别率已经达到99.15%：解决了人脸识别问题 4)加权求和得出识别结果。中的二分类问题。将相似度矩阵进行加权得出测试图像对应于每为了解决传统人脸识别方法在复杂背景下和人个类别的综合评分，评分最高的类别即作为最终的脸多姿态条件下进行识别时，识别率不高的问题，本识别结果。文提出了一种特征加权融合人脸识别方法。本文的 1.3基本原理主要贡献是通过将人脸面部进行区域划分提取得到 1.3.1主动形状模型了人脸面部的局部特征，并结合整幅人脸的全局特主动形状模型是由Cootes等B1]在1995年提出。征进行相似度矩阵的求取，通过各部分的贡献度不同进行加权得出最终判别结果，提出了基于相似度该模型主要由全局形状模型和局部纹理模型构成。矩阵加权的深度网络模型(deep learning and weigh- 1)全局形状模型 ted fusion,DLWF)人脸识别方法。 ASM利用点分布模型表示人脸形状S:,S:= [x1y1x2y2…x。yn](n为特征点数 1 基于相似度加权评分深度网络模型目)，其中具有N个训练样本的训练集表示为2= 1.1问题描述 {S,S2,…,Sw}。利用传统深度信念网络[11进行人脸识别，将训练样本对齐完成后，采用主成分分析输入的是整张人脸的像素级特征，忽略了人脸图 (PCA)方法建立形状模型，过程如下：像局部结构特征，网络难以学习得到人脸局部特 ①计算对齐完成后训练样本平均形状：征[]：在自然条件下，所获得的人脸图像通常受 (1) 到背景、光照等外界因素的影响，很难确定哪些面部器官在识别过程中所起到的比重大，哪些器 ②计算形状向量的协方差矩阵：官起的比重小，使得在实际研究过程中对相似度 c= ∑(s.-5)(s-5) (2) 加权的权值确定变得复杂。因此本文重点解决提取人脸局部特征的深度学习模型及多特征加 ③对C进行特征分解，得到特征值入（入≥ 权识别方法权值确定2个问题。入+1，入k≠0，k=1,2,…,2n)和特征向量P4o

研究热点。人脸图像像素矩阵较大同时特征维数也较高，进行识别难度较大，因此设计出高效的特征提取器成为人脸识别的关键。其中最典型方法为主成分分析法（ｐｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｎｔｓａｎａｌｙｓｉｓ，ＰＣＡ）［１］，其思想首先，把一副图像按行或列拉直成一个高维列向量，然后，求取整个训练样本集高维列向量的协方差矩阵，求此协方差矩阵的特征向量和特征值得到投影变换矩阵，最后，把人脸图像高维特征通过投影变换矩阵映射到低维空间中，得到人脸的低维表示特征；在人脸识别研究中，利用ＰＣＡ方法对高维特征进行降维处理，获得了良好的效果，是最为成功的线性鉴别分析方法之一。但实际的应用中，ＰＣＡ方法进行线性鉴别分析通常会产生小样本问题（即样本个数远小于特征维数）；被识别人脸图像是在非限制条件下提取时，应用ＰＣＡ算法提取的特征并不适合作为分类的特征。人们利用深度神经网络进行人脸识别主要分为２类：１）利用深度神经网络特征提取后再应用其他分类器进行识别［２⁃６］；２）直接在深度神经网络增加分类层进行识别［７⁃８］。汤晓鸥［９］等利用卷积神经网络进行人脸验证取得了良好的效果，在ＬＦＷ人脸库上的识别率已经达到９９．１５％；解决了人脸识别问题中的二分类问题。为了解决传统人脸识别方法在复杂背景下和人脸多姿态条件下进行识别时，识别率不高的问题，本文提出了一种特征加权融合人脸识别方法。本文的主要贡献是通过将人脸面部进行区域划分提取得到了人脸面部的局部特征，并结合整幅人脸的全局特征进行相似度矩阵的求取，通过各部分的贡献度不同进行加权得出最终判别结果，提出了基于相似度矩阵加权的深度网络模型（ｄｅｅｐｌｅａｒｎｉｎｇａｎｄｗｅｉｇｈ⁃ ｔｅｄｆｕｓｉｏｎ，ＤＬＷＦ＋）人脸识别方法。１基于相似度加权评分深度网络模型１．１问题描述利用传统深度信念网络［１０⁃１１］进行人脸识别，输入的是整张人脸的像素级特征，忽略了人脸图像局部结构特征，网络难以学习得到人脸局部特征［１２］；在自然条件下，所获得的人脸图像通常受到背景、光照等外界因素的影响，很难确定哪些面部器官在识别过程中所起到的比重大，哪些器官起的比重小，使得在实际研究过程中对相似度加权的权值确定变得复杂。因此本文重点解决提取人脸局部特征的深度学习模型及多特征加权识别方法权值确定２个问题。１．２基本思想为建立人脸面部局部特征深度学习模型，首先利用人脸面部的主要特征点将人脸分成若干子区域；然后将这些小的子区域和整幅人脸经归一化处理，输入到对应的ＤＢＮ网络进行训练，得到各个子区域和整幅人脸的相似度概率向量；最后将左眼、右眼、鼻子、嘴、下巴等器官和整个面部的相似度向量加权后进行分类。ＤＬＷＦ＋分为以下４个主要阶段：１）人脸面部区域划分利用ｈａａｒ方法进行人脸检测，提取出人脸面部主要区域，并根据人脸面部主要器官左眼、右眼、鼻子、嘴巴、下巴等进行子区域的划分。２）网络模型的构建并确定权值利用上一步求取得到的各个区域和整幅人脸图像分别输入到对应的子网络中，进行权值的调整，完成网络模型的构建。对各个子区域分别进行识别得出识别率作为各自的权重。３）求取面部隶属度矩阵通过将测试集不同区域的采样块分别输入到对应的子网络中，取出个区域的相似度向量，并利用求得的各个相似度向量组成相似度矩阵。４）加权求和得出识别结果。将相似度矩阵进行加权得出测试图像对应于每个类别的综合评分，评分最高的类别即作为最终的识别结果。１．３基本原理１．３．１主动形状模型主动形状模型是由Ｃｏｏｔｅｓ等［１３⁃１５］在１９９５年提出。该模型主要由全局形状模型和局部纹理模型构成。１）全局形状模型ＡＳＭ利用点分布模型表示人脸形状Ｓｉ，Ｓｉ＝［ｘ１ｙ１ｘ２ｙ２ … ｘｎｙｎ］Ｔ（ｎ为特征点数目），其中具有Ｎ个训练样本的训练集表示为 Ω ＝｛Ｓ１，Ｓ２，…，ＳＮ｝。将训练样本对齐完成后，采用主成分分析（ＰＣＡ）方法建立形状模型，过程如下： ①计算对齐完成后训练样本平均形状：Ｓ＿＝１Ｎ∑ ｎｉ＝１Ｓｉ (１) ②计算形状向量的协方差矩阵：Ｃ＝１Ｎ－１ ∑ Ｎｉ＝１（Ｓｉ－Ｓ＿）（Ｓｉ－Ｓ＿）Ｔ (２) ③对Ｃ进行特征分解，得到特征值 λｋ（ λｋ ≥ λｋ＋１，λｋ≠０，ｋ＝１，２，…，２ｎ）和特征向量Ｐｋ。第６期孙劲光，等：一种特征加权融合人脸识别方法 ·９１３·

·914. 智能系统学报第10卷 ④提取前t个特征值[入，入2…入，]，令如图1所示。 -≥ (3) 式中：7为所选特征占总特征比例，一般为95%~ 98%。求得特征向量P=[p1P2…p],最终求得全局形状模型： S=S+Pb (4) 式中：b为主分量参数，控制前t个模式系数，且 b,取值：图1人脸面部特征点 -3√八：≤b:≤3√八 (5) Fig.1 Facial feature points 全局形状模型的作用，在搜索更新过程中，通过改变 1.3.2深度信念网络(DBN) 形状参数，找到最佳的匹配模型，将形状变化约束在 DBN模拟人大脑的组织结构，由低级到高级地模型允许范围内。提取数据的抽象特征I6。DBN由多个RBM堆叠 2)局部纹理模型而成，RBM被当做是一个动力学系统在给定一组状局部纹理模型构建过程如下：态(v,h)下的能量定义为 ①以第i个样本第j个标定点为中心，与相邻2 点连线垂直方向一定长度范围（也称Profile邻域）， E(m,h/0)=-】内外各取k个点的灰度值作为该点灰度信息： (12) 8=[8.1g.2…8i.2k+1门 (6) 式中：n,n分别为可见层和隐含层中神经元数目。 ②求g,梯度dg: ,为可见层第i个神经元状态，h为隐含层第j个神 dg可=[g.2-g,1…g,2站+1-g.24] (7) 经元状态，α：为可见层中第i个神经元偏置，b为隐对dg归一化处理得含层第j个神经元偏置，w,为可见层第i个神经元 G= dg可 (8) 与隐含层第j广个神经元之间连接权重，0表示需要训 2k |dgl 练调整模型参数0={a,b,w。用向量形式表示为式中：dg.1=8.(41)-8,1。 E(v,h/0)=-a"v-b"h -h"wv (13) 对训练样本集所有图像的第j个特征点进行相同操作，求得第j个特征点的N个局部纹理G,G, 当给定模型参数0={a,b,w}时，利用式(12) 定义的能量函数，可以求出可视层v和隐含层h联 …,Gy° 合概率分布： ③得到标记点j对应的平均纹理G,和协方差矩阵C。,即为该点的局部纹理模型。 p(,h/0)=ew0 14) (9) Z。=∑eo (15) c.h c*片26，-G6,-6 式中：Z(0)为归一化因子。 (10) 当给定可视层节点时，隐含层节点h:为0或1 局部纹理模型作用是在搜索过程中，确定每个的条件概率分布为特征点最佳候选点。其中，马氏距离d(G';)最小的 p(h=1/w)=o(a,+∑0g:) (16) 点，就是该特征点的最佳候选点。 p(h:=0/m)=1-p(h=1/m) (17) d(G)=(G,-G)'CG(G,-G)(11) 当给定隐含层节点时，可视层节点：为0或1 式中：G'是在j点附近采样得到，经过归一化处理的条件概率分布为纹理向量。 p(u:=1/h)=(6,+∑0gh) (18) 利用上述模型方法提取到的77个面部特征点

④提取前ｔ个特征值［λ１ λ２ … λｔ］，令 ∑ ｔｉ＝１ λｉ ∑ ２ｎｉ＝１ λｉ ≥ η (３) 式中：η 为所选特征占总特征比例，一般为９５％～９８％。求得特征向量Ｐ＝［ｐ１ｐ２ … ｐｔ］，最终求得全局形状模型：Ｓ＝Ｓ＿＋Ｐｂ (４) 式中：ｂ为主分量参数，控制前ｔ个模式系数，且ｂｉ取值：－３ λｉ ≤ ｂｉ ≤ ３ λｉ (５) 全局形状模型的作用，在搜索更新过程中，通过改变形状参数，找到最佳的匹配模型，将形状变化约束在模型允许范围内。２）局部纹理模型局部纹理模型构建过程如下： ①以第ｉ个样本第ｊ个标定点为中心，与相邻２点连线垂直方向一定长度范围（也称Ｐｒｏｆｉｌｅ邻域），内外各取ｋ个点的灰度值作为该点灰度信息：ｇｉｊ＝［ｇｉｊ，１ｇｉｊ，２ … ｇｉｊ，２ｋ＋１］ (６) ②求ｇｉｊ梯度ｄｇｉｊ：ｄｇｉｊ＝［ｇｉｊ，２－ｇｉｊ，１ … ｇｉｊ，２ｋ＋１－ｇｉｊ，２ｋ］ (７) 对ｄｇｉｊ归一化处理得Ｇｉｊ＝１ ∑ ２ｋｌ＝１｜ｄｇｉｊ，ｌ｜ｄｇｉｊ (８) 式中：ｄｇｉｊ，ｌ＝ｇｉｊ，（ｌ＋１）－ｇｉｊ，ｌ。对训练样本集所有图像的第ｊ个特征点进行相同操作，求得第ｊ个特征点的Ｎ个局部纹理Ｇ１ｊ，Ｇ２ｊ， …，ＧＮｊ。 ③得到标记点ｊ对应的平均纹理Ｇｊ和协方差矩阵Ｃｇｊ，即为该点的局部纹理模型。Ｇ＿ｊ＝１Ｎ∑ Ｎｉ＝１Ｇｉｊ (９) Ｃｇｊ＝１Ｎ ∑ Ｎｉ＝１（Ｇｉｊ－Ｇｊ＿）（Ｇｉｊ－Ｇｊ＿）Ｔ (１０) 局部纹理模型作用是在搜索过程中，确定每个特征点最佳候选点。其中，马氏距离ｄ（Ｇ′ｊ）最小的点，就是该特征点的最佳候选点。ｄ（Ｇ′ｊ）＝（Ｇ′ｊ－Ｇｊ＿）ＴＣ－１Ｇｊ（Ｇ′ｊ－Ｇｊ＿） (１１) 式中：Ｇ′ｉｊ是在ｊ点附近采样得到，经过归一化处理纹理向量。利用上述模型方法提取到的７７个面部特征点如图１所示。图１人脸面部特征点Ｆｉｇ．１Ｆａｃｉａｌｆｅａｔｕｒｅｐｏｉｎｔｓ１．３．２深度信念网络（ＤＢＮ）ＤＢＮ模拟人大脑的组织结构，由低级到高级地提取数据的抽象特征［１６］。ＤＢＮ由多个ＲＢＭ堆叠而成，ＲＢＭ被当做是一个动力学系统在给定一组状态（ｖ，ｈ）下的能量定义为Ｅ（ｖ，ｈ／ θ）＝－ ∑ ｎｖｉ＝１ａｉｖｉ－ ∑ ｎｈｊ＝１ｂｊｈｊ－ ∑ ｎｖｉ＝１ ∑ ｎｈｊ＝１ｈｊｗｉ，ｊｖｉ (１２) 式中：ｎｖ、ｎｋ分别为可见层和隐含层中神经元数目。ｖｉ为可见层第ｉ个神经元状态，ｈｊ为隐含层第ｊ个神经元状态，ａｉ为可见层中第ｉ个神经元偏置，ｂｊ为隐含层第ｊ个神经元偏置，ωｉ，ｊ为可见层第ｉ个神经元与隐含层第ｊ个神经元之间连接权重，θ 表示需要训练调整模型参数 θ＝｛ａ，ｂ，ｗ｝。用向量形式表示为Ｅ（ｖ，ｈ／ θ）＝－ａＴｖ－ｂＴｈ－ｈＴｗｖ (１３) 当给定模型参数 θ ＝｛ａ，ｂ，ｗ｝时，利用式（１２）定义的能量函数，可以求出可视层ｖ和隐含层ｈ联合概率分布：ｐ（ｖ，ｈ／ θ）＝１Ｚθ ｅ－Ｅ（ｖ，ｈ／ θ） (１４) Ｚθ ＝ ∑ｖ，ｈｅ－Ｅ（ｖ，ｈ／ θ） (１５) 式中：Ｚ（θ）为归一化因子。当给定可视层节点时，隐含层节点ｈｉ为０或１的条件概率分布为ｐ（ｈｉ＝１／ｖ）＝ σ（ａｉ＋ ∑ｉｗｉｊｖｉ） (１６) ｐ（ｈｉ＝０／ｖ）＝１－ｐ（ｈｊ＝１／ｖ） (１７) 当给定隐含层节点时，可视层节点ｖｉ为０或１的条件概率分布为ｐ（ｖｉ＝１／ｈ）＝ σ（ｂｊ＋ ∑ ｊｗｉｊｈｊ） (１８) ·９１４· 智能系统学报第１０卷

第6期孙劲光，等：一种特征加权融合人脸识别方法 915· p(:=0/h)=1-p(:=1/h) (19) J(0)=- e 第k和k+1层隐含单元满足： p(h因Ih+)=Πp(h)I+)) (20) (24) p(h=11h+)=(b+∑Wh+) 式中：1{·}表示指示函数，花括号中表达式为真， (21) 那么函数值为1，否则函数值为0。加号后面部分为式中：w(x)=1/(1+e),b,为第k层的偏置，W) 了防止模型过拟合所加的权衰减项。其中，入为模为第k和k+1层之间权值，在DBN中将(h-),hD) 型参数，在实验部分确定。分析可知无法直接求取看作为为一个RBM模型。结构如图2。可以使J(0)最小的0的解析解，通过迭代优化算法输出数据标准标注信息求解。计算代价函数梯度公式为 (●】 ●) RBM 反向传播 ,89= V ●● H p(y0=jlx0:0))]+A0 (25) RBM 微调 1.4本文研究方法(DLFW) 7 ●● 。。。DH 本文研究重点内容如下： RBM 微调 1)面部区域划分利用主动形状模型确定人脸面部主要特征点，对输入数据) 于每张人脸面部图像能得到一个特征点位置向量：图2DBN结构模型 x2=（x,0,y.0,x,1y,1,…,x,a-1).(a-1） ①左眼子区域划分 Fig.2 DBN structure model 左眼区域采样框确定，根据左眼眼角确定采样 1.3.3 Softmax回归框长，眉毛轮廓线最高点与眼晴轮廓线最低点确定 Softmax回归将只能够解决二分类问题的Logis- 采样框宽。为了获取左眼区域更多细节特征，长和 tic回归扩展至能够解决多分类问题。宽同时向外延伸L个像素。左眼区域长宽计算公假定Softmax回归模型训练样本来自k个不同式如下：的类别，共有m个，那么这m个训练样本组成的训 Wleye=-+Lleye (27) 练样本集为{(x0,y9),…,(x,ym)},则So hleve =y36-yn Llere (28) mar回归的假设函数为式中：0为左眼区域宽，h为左眼区域长，I为「p(yo=1xo;0)1 从原始图像矩阵I上截取的左眼区域矩阵。 ho(x())= p(y0=2x0:0) ②右眼子区域划分右眼区域采样框确定，根据右眼眼角确定采样框 Lp(yo=kx⊙：0) 长，眉毛轮廓线最高点及眼晴轮廓线最低，点确定采样「e7 框宽。为获取右眼区域更多细节特征，长和宽同时向 e( 外延伸L个像素。此区域长宽计算公式为 (22) ∑e( W reye=Lme (29) j= Le) hrye =y46-y2+L (30) 式中：假设向量h,(x))的每个元素p(y0=jlx; 式中：w为右眼区域宽，h为右眼区域长。 0)表示样本x0属于类别j的概率。0,02，…，0为 ③鼻子子区域划分鼻子区域采样框确定，根据鼻子轮廓线最低点模型参数，其中0，∈R1,将这些向量写成矩阵：及眉毛轮廓线最前端特征点确定鼻子区域采样框 -01 长。根据鼻子轮廓线最左边特征点及最右边特征点 (23) 确定采样框的宽。长和宽同时向外延伸L个像素。鼻子区域长宽计算公式如下：则模型代价函数定义： W nose =xs4 -x58 Lnose (31)

ｐ（ｖｉ＝０／ｈ）＝１－ｐ（ｖｉ＝１／ｈ） (１９) 第ｋ和ｋ＋１层隐含单元满足：ｐ（ｈ（ｋ）｜ｈ（ｋ＋１）＝ Π ｉｐ（ｈ（ｋ）ｉ｜ｈ（ｋ＋１）） (２０) ｐ（ｈ（ｋ）ｉ＝１｜ｈ（ｋ＋１））＝ σ（ｂ（ｋ）ｉ＋ ∑ ｊＷ（ｋ）ｉｊｈ（ｋ＋１）ｊ） (２１) 式中：σ（ｘ）＝１／（１＋ｅ－ｘ），ｂｉ（ｋ）为第ｋ层的偏置，Ｗｉｊ（ｋ）为第ｋ和ｋ＋１层之间权值，在ＤＢＮ中将ｐ（ｈ（ｌ－１），ｈ（ｌ））看作为为一个ＲＢＭ模型。结构如图２。图２ＤＢＮ结构模型Ｆｉｇ．２ＤＢＮｓｔｒｕｃｔｕｒｅｍｏｄｅｌ１．３．３Ｓｏｆｔｍａｘ回归Ｓｏｆｔｍａｘ回归将只能够解决二分类问题的Ｌｏｇｉｓ⁃ ｔｉｃ回归扩展至能够解决多分类问题。假定Ｓｏｆｔｍａｘ回归模型训练样本来自ｋ个不同的类别，共有ｍ个，那么这ｍ个训练样本组成的训练样本集为｛（ｘ（１），ｙ（１）），…，（ｘ（ｍ），ｙ（ｍ））｝，则Ｓｏｆｔ⁃ ｍａｘ回归的假设函数为ｈθ（ｘ（ｉ））＝ｐ（ｙ（ｉ）＝１ｘ（ｉ）；θ）ｐ（ｙ（ｉ）＝２ｘ（ｉ）；θ） ︙ ｐ（ｙ（ｉ）＝ｋｘ（ｉ）；θ） é ë ê ê ê ê ê ù û ú ú ú ú ú ＝１ ∑ ｋｊ＝１ｅ ϑＴｊｘ（ｉ）ｅ ϑＴ１ｘ（ｉ）ｅ ϑＴ２ｘ（ｉ） ︙ ｅ ϑＴｋｘ（ｉ） é ë ê ê ê ê êê ù û ú ú ú ú úú (２２) 式中：假设向量ｈθ（ｘ（ｉ））的每个元素ｐ（ｙ（ｉ）＝ｊ｜ｘ（ｉ）； θ）表示样本ｘ（ｉ）属于类别ｊ的概率。 θ１， θ２，…，θｋ为模型参数，其中 θｉ∈Ｒｎ＋１，将这些向量写成矩阵： θ ＝－ θ Ｔ１－－ θ Ｔ２－－ θ Ｔ３－ é ë ê ê ê ê ù û ú ú ú ú (２３) 则模型代价函数定义：Ｊ（θ）＝－１ｍ［∑ ｍｉ＝１ ∑ ｋｊ＝１１｛ｙ（ｉ）＝ｊ｝ｌｏｇｅ θＴｊｘ（ｉ） Σ ｋｌ＝１ｅ θＴｌｘ（ｉ）］＋ λ ２ ∑ ｋｉ＝１ ∑ ｎｊ＝０ θ ２ｉｊ (２４) 式中：１｛ ·｝表示指示函数，花括号中表达式为真，那么函数值为１，否则函数值为０。加号后面部分为了防止模型过拟合所加的权衰减项。其中， λ 为模型参数，在实验部分确定。分析可知无法直接求取可以使Ｊ（θ）最小的 θ 的解析解，通过迭代优化算法求解。计算代价函数梯度公式为 Ñθｊ＝－１ｍ∑ ｍｉ＝１［ｘ（ｉ）（１｛ｙ（ｉ）＝ｊ｝－ｐ（ｙ（ｉ）＝ｊ｜ｘ（ｉ）；θ））］＋ λθｊ (２５) １．４本文研究方法（ＤＬＦＷ＋）本文研究重点内容如下：１）面部区域划分利用主动形状模型确定人脸面部主要特征点，对于每张人脸面部图像能得到一个特征点位置向量：ｘｉ＝（ｘｉ，０，ｙｉ，０，ｘｉ，１，ｙｉ，１，…，ｘｉ，（ｎ－１），ｙｉ，（ｎ－１）） ①左眼子区域划分左眼区域采样框确定，根据左眼眼角确定采样框长，眉毛轮廓线最高点与眼睛轮廓线最低点确定采样框宽。为了获取左眼区域更多细节特征，长和宽同时向外延伸Ｌｌｅｙｅ个像素。左眼区域长宽计算公式如下：ｗｌｅｙｅ＝ｘ３０－ｘ３４＋Ｌｌｅｙｅ (２７) ｈｌｅｙｅ＝ｙ３６－ｙ１７＋Ｌｌｅｙｅ (２８) 式中：ｗｌｅｙｅ为左眼区域宽，ｈｌｅｙｅ为左眼区域长，Ｉｌｅｙｅ为从原始图像矩阵Ｉ上截取的左眼区域矩阵。 ②右眼子区域划分右眼区域采样框确定，根据右眼眼角确定采样框长，眉毛轮廓线最高点及眼睛轮廓线最低点确定采样框宽。为获取右眼区域更多细节特征，长和宽同时向外延伸Ｌｒｅｙｅ个像素。此区域长宽计算公式为ｗｒｅｙｅ＝ｘ４４－ｘ４０＋Ｌｒｅｙｅ (２９) ｈｒｅｙｅ＝ｙ４６－ｙ２４＋Ｌｒｅｙｅ (３０) 式中：ｗｒｅｙｅ为右眼区域宽，ｈｒｅｙｅ为右眼区域长。 ③鼻子子区域划分鼻子区域采样框确定，根据鼻子轮廓线最低点及眉毛轮廓线最前端特征点确定鼻子区域采样框长。根据鼻子轮廓线最左边特征点及最右边特征点确定采样框的宽。长和宽同时向外延伸Ｌｎｏｓｅ个像素。鼻子区域长宽计算公式如下：ｗｎｏｓｅ＝ｘ５４－ｘ５８＋Ｌｎｏｓｅ (３１) 第６期孙劲光，等：一种特征加权融合人脸识别方法 ·９１５·

·916· 智能系统学报第10卷 h aose =ys6 -y22 +Lmowe (32) 样本隶属相似度向量生成式中：W鼻子区域宽，h为鼻子区域长。 ④嘴子区域划分 softmax 嘴部区域采样框确定，根据嘴部特征点的左右嘴角确定采样框长。根据嘴部轮廓最上面特征点及 RBM 最下面特征点位置确定采样框宽。并且长和宽同时 RBM 向外延伸L个像素。嘴部区域长宽计算公式为： b∈R t0 mouth=mouth (33) W∈R RBM hmouth =y4-62 Lmouth (34) a∈R" 式中：wmuh为嘴部区域宽，hh为嘴部区域长。图4子区域网络结构 ⑤下巴子区域划分 Fig.4 Sub region network structure 下巴区域采样框确定，根据与嘴角连线平齐的表1不同区域网络结点数下巴轮廓线上2个特征点确定下巴采样框长，根据 Tablel Different area network node number 这2个特征点及下巴轮廓线最低点确定下巴采样框宽。长和宽同时向外延伸L个像素。下巴区域长结点数目左眼右眼鼻子嘴巴下巴人脸宽计算公式如下：输人层”X机neX0×”a×超×用大 Wehin=x-x3+Lchin (35) hae h oouth hdin htee hchin =y6-y14 Lchin (36) 隐含层11 e×Boe×Bn×Bh×Bin×βie× 式中：whn为下巴区域宽，hhn为下巴区域长。 L L 将一个m×n的图像矩阵I按上述长宽截取5 隐含层2民XE×民×民×民×B院× 个子区域并和整幅人脸图像组成训练集即 2 L22 (leye,Inove,Imouth Ichin II (37) 隐含层3民×民×民×R×R风x民× 式中：Lee,Le,lc,Ih,ldin表示截取得到的5个子区域像素矩阵，l表示整幅人脸图像像素矩阵。其中，B为各层神经元的缩放系数，用来决定特应用双线性内插法将上述区域归一化到固定大征的降维尺度，同时也决定了特征损耗的多少。小，经过上述步骤截取得到的5个不同区域的采样为第i层的神经元个数。块与整幅人脸图像一起构成了网络的训练样本集，输出层神经元个数为将要识别的类别数。如图3所示。将提取得到的5个区域采样块及整个人脸分别输入到对应的DBN网络，经过自下而上逐层提取得到更抽象特征，输出层利用Softmax分类器求取各区域特征属于各类别的隶属度。求得的隶属度向量为P(PP…P。)T。将各区域求出的隶属度向量进行组合便得到隶属度矩阵P。 P1.1P1,2P1.3P1,4P1,5P1,6 P2.1P2,2P2.3P2,4P2.5P2,6 P= (38) 图3子区域划分 Fig.3 Sub region division Pn.1 Pn.2 Pn,3 Pn.4 Pa.s Pn.6 2)构造区域网络模型式中：6列代表6个区域，行数n代表n个类别。由于截取得到的人脸面部5个子区域及整幅人 3)隶属度加权融合方法脸图像大小不同，因此输人层结点个数也不相同，需利用在上一步骤中构建的DBN网络，求出各区要分别为5个人脸面部区域及整幅人脸图像构建相域的正确识别率，识别率越高说明进行人脸识别时应的DBN网络，网络结构如图4所示。此区域起到的作用越大，识别率越低说明此区域起隶属度求取网络是一个5层DBN网络，由1个到的作用越小。将此识别率作为各区域权值系数确输入层、1个输出层和3个隐含层构成。如表1所示。定依据。具体计算公式为

ｈｎｏｓｅ＝ｙ５６－ｙ２２＋Ｌｎｏｓｅ (３２) 式中：ｗｎｏｓｅ鼻子区域宽，ｈｎｏｓｅ为鼻子区域长。 ④嘴子区域划分嘴部区域采样框确定，根据嘴部特征点的左右嘴角确定采样框长。根据嘴部轮廓最上面特征点及最下面特征点位置确定采样框宽。并且长和宽同时向外延伸Ｌｍｏｕｔｈ个像素。嘴部区域长宽计算公式为：ｗｍｏｕｔｈ＝ｘ６５－ｘ５９＋Ｌｍｏｕｔｈ (３３) ｈｍｏｕｔｈ＝ｙ７４－ｙ６２＋Ｌｍｏｕｔｈ (３４) 式中：ｗｍｏｕｔｈ为嘴部区域宽，ｈｍｏｕｔｈ为嘴部区域长。 ⑤下巴子区域划分下巴区域采样框确定，根据与嘴角连线平齐的下巴轮廓线上２个特征点确定下巴采样框长，根据这２个特征点及下巴轮廓线最低点确定下巴采样框宽。长和宽同时向外延伸Ｌｃｈｉｎ个像素。下巴区域长宽计算公式如下：ｗｃｈｉｎ＝ｘ９－ｘ３＋Ｌｃｈｉｎ (３５) ｈｃｈｉｎ＝ｙ６－ｙ７４＋Ｌｃｈｉｎ (３６) 式中：ｗｃｈｉｎ为下巴区域宽，ｈｃｈｉｎ为下巴区域长。将一个ｍ×ｎ的图像矩阵Ｉ按上述长宽截取５个子区域并和整幅人脸图像组成训练集即Ｉｌｅｙｅ，Ｉｒｅｙｅ，Ｉｎｏｓｅ，Ｉｍｏｕｔｈ，Ｉｃｈｉｎ，Ｉｆａｃｅ { } ∈ Ｉ (３７) 式中：Ｉｌｅｙｅ，Ｉｒｅｙｅ，Ｉｎｏｓｅ，Ｉｍｏｕｔｈ，Ｉｃｈｉｎ表示截取得到的５个子区域像素矩阵，Ｉｆａｃｅ表示整幅人脸图像像素矩阵。应用双线性内插法将上述区域归一化到固定大小，经过上述步骤截取得到的５个不同区域的采样块与整幅人脸图像一起构成了网络的训练样本集，如图３所示。图３子区域划分Ｆｉｇ．３Ｓｕｂｒｅｇｉｏｎｄｉｖｉｓｉｏｎ２）构造区域网络模型由于截取得到的人脸面部５个子区域及整幅人脸图像大小不同，因此输入层结点个数也不相同，需要分别为５个人脸面部区域及整幅人脸图像构建相应的ＤＢＮ网络，网络结构如图４所示。隶属度求取网络是一个５层ＤＢＮ网络，由１个输入层、１个输出层和３个隐含层构成。如表１所示。图４子区域网络结构Ｆｉｇ．４Ｓｕｂｒｅｇｉｏｎｎｅｔｗｏｒｋｓｔｒｕｃｔｕｒｅ表１不同区域网络结点数Ｔａｂｌｅ１Ｄｉｆｆｅｒｅｎｔａｒｅａｎｅｔｗｏｒｋｎｏｄｅｎｕｍｂｅｒ结点数目左眼右眼鼻子嘴巴下巴人脸输入层ｗｌｅｙｅ × ｈｌｅｙｅｗｒｅｙｅ × ｈｒｅｙｅｗｎｏｓｅ × ｈｎｏｓｅｗｍｏｕｔｈ × ｈｍｏｕｔｈｗｃｈｉｎ × ｈｃｈｉｎＷｆａｃｅ × ｈｆａｃｅ隐含层１ β １ｌｅｙｅ × Ｌ１ β １ｒｅｙｅ × Ｌ１ β １ｎｏｓｅ × Ｌ１ β １ｍｏｕｔｈ × Ｌ１ β １ｃｈｉｎ × Ｌ１ β １ｆａｃｅ × Ｌ１隐含层２ β ２ｌｅｙｅ × Ｌ２ β ２ｒｅｙｅ × Ｌ２ β ２ｎｏｓｅ × Ｌ２ β ２ｍｏｕｔｈ × Ｌ２ β ２ｃｈｉｎ × Ｌ２ β ２ｆａｃｅ × Ｌ２隐含层３ β ３ｌｅｙｅ × Ｌ３ β ３ｒｅｙｅ × Ｌ３ β ３ｎｏｓｅ × Ｌ３ β ３ｍｏｕｔｈ × Ｌ３ β ３ｃｈｉｎ × Ｌ３ β ３ｆａｃｅ × Ｌ３其中，β 为各层神经元的缩放系数，用来决定特征的降维尺度，同时也决定了特征损耗的多少。Ｌｉ为第ｉ层的神经元个数。输出层神经元个数为将要识别的类别数。将提取得到的５个区域采样块及整个人脸分别输入到对应的ＤＢＮ网络，经过自下而上逐层提取得到更抽象特征，输出层利用Ｓｏｆｔｍａｘ分类器求取各区域特征属于各类别的隶属度。求得的隶属度向量为Ｐｉ（Ｐ１，ｉＰ２，ｉ … Ｐｎ，ｉ）Ｔ。将各区域求出的隶属度向量进行组合便得到隶属度矩阵Ｐ。Ｐ＝ｐ１，１ｐ１，２ｐ１，３ｐ１，４ｐ１，５ｐ１，６ｐ２，１ｐ２，２ｐ２，３ｐ２，４ｐ２，５ｐ２，６ ︙ ︙ ︙ ︙ ︙ ︙ ｐｎ，１ｐｎ，２ｐｎ，３ｐｎ，４ｐｎ，５ｐｎ，６ é ë ê ê ê ê ê ù û ú ú ú ú ú (３８) 式中：６列代表６个区域，行数ｎ代表ｎ个类别。３）隶属度加权融合方法利用在上一步骤中构建的ＤＢＮ网络，求出各区域的正确识别率，识别率越高说明进行人脸识别时此区域起到的作用越大，识别率越低说明此区域起到的作用越小。将此识别率作为各区域权值系数确定依据。具体计算公式为 ·９１６· 智能系统学报第１０卷

第6期孙劲光，等：一种特征加权融合人脸识别方法 .917· Pi DBN网络各层权值矩阵W,及偏置矩阵B精调。 (39) p p2 +p3 +ps +ps +p6 8)训练完成后，将各层权值矩阵W,及偏置矩阵使得w1+w2+w3+w4+w5+w6=1,对人脸图像进行识 B保存，供识别时使用。别时，利用求得的权值矩阵P与隶属度向量ω相算法2分类算法乘，计算公式如下： 1)对于一张给定的待识别人脸图像，利用ASM 01 模型提取出人脸面部特征点向量： P1,1P1,2P1,3 P1.4P1,5 P1.6 91 02 x=[x0y0x1为1…xa-)ya-)] P2,1 P2,2 P2,3 P2.4 P2.5 P2.6 q42 2)根据面部特征点向量x,确定5个采样区域位 P3,1P3.2P33P3.4 P3.5 P3.6 93 04 置，并计算5采样框的长和宽weh1e、0ee、he、 .· Ws mosehpose、Imouth、moth、2 chin,h chin o Pn.2 Pn.3 Pn.4 Pn.s Pn.6] 3)在原图像I中根据上步求出的采样框大小， ⊙6J 进行采样得到5个子区域Iie,Ie,Isc,Iuib, (40) 从而求得此待识别人脸图像隶属于各类别的综 Ichin}∈lo 4)将5个子区域及整幅人脸图像利用双线性合评分向量Q=[9192… qn]。其中评分最高内插法归一化到规定大小。而后进行灰度化、灰度的类别，即为最终识别结果。拉伸等预处理操作。 1.5算法描述 5)将4)中得到的子区域拉直成列向量，输入到特征加权融合的人脸识别方法具体算法实现过由训练完成的权值矩阵W及偏置矩阵B构造的程如下： DBN网络中，求出隶属度矩阵P。算法1训练算法。 1)利用ASM模型标注LFW人脸库中全部 6)将隶属度矩阵P与权值向量ω（ω1，ω2，ω3， 13233幅图像，人脸面部特征点向量x:=(x0,y.0, ω4，ω5，ω6)相乘求出此待识别人脸图像隶属于各个类别的综合评分向量Q=[9192…9.]。 x,1y,1,光.(a-1)y,(a-)）0 2)根据面部特征点向量x,确定5个采样区域 7)找出评分向量Q中获得评分最高的类，作为位置，并计算5采样框的长和宽0e、h、0e 分类结果。 heye、0mse、hpose、i0 moathhmoth、W chin、hchin 2实验结果及分析 3)在灰度化后原图像I中根据上步求出的采样框大小，进行采样得到5个子区域Le,I,Ic 本文算法分别在LFW(Labeled Faces in the Inmh,Ihin}∈I,以眼睛区域为例： Wild Database)人脸库和ORL(Olivetti research labo- ratory)人脸库上进行仿真实验，证明了本文算法的 x11 X12 有效性。在LFW人脸库实验目的是为了验证本文 x21 x22 (41) 算法在非限制条件下识别的有效性，同时，由于 LFW人脸库中有13233幅人脸图像为DBN预训练 _hieye:1 Xhiege:2 提供了充足的训练样本，保证DBN参数能够趋近全式中：x表示采样后子区域内像素值。局最优)。为了进一步评估本文算法通用性，在 4)将5个子区域及整幅人脸图像利用双线性 OL人脸库上同样进行了比较和测试。进行本文内插法归一化到规定大小，并拉直成列向量：实验硬件环境为：3.50GHz的Intel(R)Core(TM) 1e=[xix2…h,] (42) i5-4690CPU,8.00GB内存。 5)对5个子区域及整幅人脸图像进行灰度 2.1LFW人脸库上的实验化、灰度拉伸等预处理操作，形成初调训练样本 LFW人脸库包含5749人的13233幅人脸图集，从将要用于测试的类别中选取一部分作为精像。其中，1680人包含2幅及以上人脸图像，4069 调训练样本集。人只有一幅人脸图像。图像分辨率为250×250，以 6)利用得到的6个初调训练样本集分别对6个 JPEG格式存储，绝大多数为彩色图像，少数为灰度 DBN网络应用对比散度方法[)进行预训练调整各图像。LFW主要用于在非限制条件下人脸识别研层权值矩阵W,及偏置矩阵B:。式中：i表示第i层。究，以成为学术界和工业界识别性能评价基准。 7)应用反向传播方法，在精调训练样本集上对 LFW人脸库能充分表现自然条件下人脸图像的变

ωｉ＝ｐｉｐ１＋ｐ２＋ｐ３＋ｐ４＋ｐ５＋ｐ６ (３９) 使得 ω１＋ω２＋ω３＋ω４＋ω５＋ω６＝１，对人脸图像进行识别时，利用求得的权值矩阵Ｐ与隶属度向量 ω 相乘，计算公式如下：ｐ１，１ｐ１，２ｐ１，３ｐ１，４ｐ１，５ｐ１，６ｐ２，１ｐ２，２ｐ２，３ｐ２，４ｐ２，５ｐ２，６ｐ３，１ｐ３，２ｐ３，３ｐ３，４ｐ３，５ｐ３，６ ︙ ︙ ︙ ︙ ︙ ︙ ｐｎ，１ｐｎ，２ｐｎ，３ｐｎ，４ｐｎ，５ｐｎ，６ é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ω１ ω２ ω３ ω４ ω５ ω６ é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú ＝ｑ１ｑ２ｑ３ ︙ ｑｎ é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú (４０) 从而求得此待识别人脸图像隶属于各类别的综合评分向量Ｑ＝［ｑ１ｑ２ … ｑｎ］。其中评分最高的类别，即为最终识别结果。１．５算法描述特征加权融合的人脸识别方法具体算法实现过程如下：算法１训练算法。１）利用ＡＳＭ模型标注ＬＦＷ人脸库中全部１３２３３幅图像，人脸面部特征点向量ｘｉ＝（ｘｉ，０，ｙｉ，０，ｘｉ，１，ｙｉ，１，…ｘｉ，（ｎ－１），ｙｉ，（ｎ－１））。２）根据面部特征点向量ｘｉ，确定５个采样区域位置，并计算５采样框的长和宽ｗｌｅｙｅ、ｈｌｅｙｅ、ｗｒｅｙｅ、ｈｒｅｙｅ、ｗｎｏｓｅ、ｈｎｏｓｅ、ｗｍｏｕｔｈ、ｈｍｏｔｈ、ｗｃｈｉｎ、ｈｃｈｉｎ。３）在灰度化后原图像Ｉ中根据上步求出的采样框大小，进行采样得到５个子区域Ｉｌｅｙｅ，Ｉｒｅｙｅ，Ｉｎｏｓｅ，Ｉｍｏｕｔｈ，Ｉｃｈｉｎ｝∈Ｉ，以眼睛区域为例：Ｉｌｅｙｅ＝ｘ１１ｘ１２ … ｘ１，ｗｌｅｙｅｘ２１ｘ２２ … ｘ２，ｗｌｅｙｅ ︙ ︙ ︙ ｘｈｌｅｙｅ，１ｘｈｌｅｙｅ，２ … ｘｈｌｅｙｅ，ｗｌｅｙｅ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú (４１) 式中：ｘｉｊ表示采样后子区域内像素值。４）将５个子区域及整幅人脸图像利用双线性内插法归一化到规定大小，并拉直成列向量：Ｉｌｅｙｅ＝ｘ１１ｘ１２ … ｘｈｌｅｙｅｗｌｅｙｅ [ ] Ｔ (４２) ５）对５个子区域及整幅人脸图像进行灰度化、灰度拉伸等预处理操作，形成初调训练样本集，从将要用于测试的类别中选取一部分作为精调训练样本集。６）利用得到的６个初调训练样本集分别对６个ＤＢＮ网络应用对比散度方法［１７］进行预训练调整各层权值矩阵Ｗｉ及偏置矩阵Ｂｉ。式中：ｉ表示第ｉ层。７）应用反向传播方法，在精调训练样本集上对ＤＢＮ网络各层权值矩阵Ｗｉ及偏置矩阵Ｂｉ精调。８）训练完成后，将各层权值矩阵Ｗｉ及偏置矩阵Ｂｉ保存，供识别时使用。算法２分类算法１）对于一张给定的待识别人脸图像，利用ＡＳＭ模型提取出人脸面部特征点向量：ｘ＝［ｘ０ｙ０ｘ１ｙ１ … ｘ（ｎ－１）ｙ（ｎ－１）］２）根据面部特征点向量ｘ，确定５个采样区域位置，并计算５采样框的长和宽ｗｌｅｙｅ、ｈｌｅｙｅ、ｗｒｅｙｅ、ｈｒｅｙｅ、ｗｎｏｓｅ、ｈｎｏｓｅ、ｗｍｏｕｔｈ、ｈｍｏｔｈ、ｗｃｈｉｎ、ｈｃｈｉｎ。３）在原图像Ｉ中根据上步求出的采样框大小，进行采样得到５个子区域Ｉｌｅｙｅ，Ｉｒｅｙｅ，Ｉｎｏｓｅ，Ｉｍｏｕｔｈ，Ｉｃｈｉｎ｝∈Ｉ。４）将５个子区域及整幅人脸图像利用双线性内插法归一化到规定大小。而后进行灰度化、灰度拉伸等预处理操作。５）将４）中得到的子区域拉直成列向量，输入到由训练完成的权值矩阵Ｗｉ及偏置矩阵Ｂｉ构造的ＤＢＮ网络中，求出隶属度矩阵Ｐ。６）将隶属度矩阵Ｐ与权值向量 ω（ω１，ω２，ω３， ω４，ω５，ω６）相乘求出此待识别人脸图像隶属于各个类别的综合评分向量Ｑ＝［ｑ１ｑ２ … ｑｎ］。７）找出评分向量Ｑ中获得评分最高的类，作为分类结果。２实验结果及分析本文算法分别在ＬＦＷ（ＬａｂｅｌｅｄＦａｃｅｓｉｎｔｈｅＷｉｌｄＤａｔａｂａｓｅ）人脸库和ＯＲＬ（Ｏｌｉｖｅｔｔｉｒｅｓｅａｒｃｈｌａｂｏ⁃ ｒａｔｏｒｙ）人脸库上进行仿真实验，证明了本文算法的有效性。在ＬＦＷ人脸库实验目的是为了验证本文算法在非限制条件下识别的有效性，同时，由于ＬＦＷ人脸库中有１３２３３幅人脸图像为ＤＢＮ预训练提供了充足的训练样本，保证ＤＢＮ参数能够趋近全局最优［１８］。为了进一步评估本文算法通用性，在ＯＲＬ人脸库上同样进行了比较和测试。进行本文实验硬件环境为：３．５０ＧＨｚ的Ｉｎｔｅｌ（Ｒ）Ｃｏｒｅ（ＴＭ）ｉ５⁃４６９０ＣＰＵ，８．００ＧＢ内存。２．１ＬＦＷ人脸库上的实验ＬＦＷ人脸库包含５７４９人的１３２３３幅人脸图像。其中，１６８０人包含２幅及以上人脸图像，４０６９人只有一幅人脸图像。图像分辨率为２５０×２５０，以ＪＰＥＧ格式存储，绝大多数为彩色图像，少数为灰度图像。ＬＦＷ主要用于在非限制条件下人脸识别研究，以成为学术界和工业界识别性能评价基准。ＬＦＷ人脸库能充分表现自然条件下人脸图像的变第６期孙劲光，等：一种特征加权融合人脸识别方法 ·９１７·

·918 智能系统学报第10卷化，如光照、姿态、表情、背景、性别等。表3不同训练样本数正确识别率本文选取人脸库中包含图像数目大于或等于 Table 3 Recognition rate of different training samples 25幅的人作为实验对象，包括29人共2458幅图微调阶段训练样本数/% 方法像。每人随机选取5幅人脸图像作为训练样本，其 10 15 余图像作为测试样本。将这些图像首先根据人脸面 PCA 23 27 29 部五官的位置进行区域的划分，然后归一化到固定 SWM 35.5 44 55 大小（下巴区域88×33、嘴部区域51×34、左眼和右 DBN 82.5 83.5 86 眼区域44×31、鼻子区域32×46)，由此生成训练、测 FIP+LDA 83 85.5 86 试样本。 DLWF 85.25 87.5 88 1)隐含层单元设置压缩比不同时对比实验 DLWE 86.5 88.25 89.5 DBN的分类能力主要取决于自下向上、多层提取得到特征的有效性。为了能够获得更多细节特由表3可知，本文提出算法经过非监督的预训征，5个区域长和宽分别向外扩大了Liege LeL 练，为DBN参数提供了较好的初始化值，再经过少 LhLn,它们的取值为各区域长的0.2倍。在构量有标签的训练样本有监督的微调，便能达到较好建DBN时，确定各隐含层神经元个数至关重要。因的识别效果。随着训练样本数不断增加开始时识别为LFW人脸库中图像都是在没有限制的自然条件准确率明显上升，而后趋于不变，表明本文算法在非下采集的，所以人脸图像特征较为复杂，并且含有较限制条件下进行识别具有良好的鲁棒性。同时，表多噪声，为了能够有效提取人脸图像抽象特征，首先 3也表明了本文算法比直接输入整张人脸图像像素应该讨论网络构建问题中，不同隐含层神经元个数级特征的DBN识别准确率更高。传统的人脸识别对网络识别性能的影响。实验结果如表2所示。算法如PCA、SVM等在训练样本个数较少时，所提表2不同网络结构的正确识别率取的底维特征分类能力并不强。随着训练样本个数 Table 2 Recognition rate of different network structures 增加，提取的特征分类能力有所增强，但在非限制条隐含层 DBN DLWF DLWF 件下算法的识别精度并不高。缩放系数识别率/% 识别率/% 识别率/% 3)类别数不同时对比实验 0.70 55.75 56.25 58.45 实验3目的是为了验证本文算法在非限制条件下的普适性和有效性。从LFW中选择拥有人脸图 0.75 64.50 66.75 69.35 像数目大于或等于25幅图像的39个人作为实验的 0.80 68.25 70.25 73.85 候选样本，从其中随机挑选出10、20、30人作为实验 0.85 71.10 74.50 79.25 对象，每人随机挑选出5幅人脸图像作为训练样本， 0.90 82.50 85.25 88.55 其余图像作为测试样本。每次随机选择不同人脸图由表2可知，随着隐含层神经元缩放系数增加，像进行实验，求取平均值作为最终结果。本次实验深度神经网络能够更好地提取得到适合于分类的人采用的DBN网络隐含层缩放系数与实验2相同，实脸图像抽象特征，但计算量也随之增大。同时，隐含验结果如表4所示。层神经元数目相同时，本文提出算法的识别率均高表4类别数不同时不同算法正确识别率于只输入整张人脸图像像素级特征的传统深度神经 Table 4 Recognition rate of different algorithms 网络算法。类别数/% 2)训练样本数不同时对比实验方法 10 20 30 实验2的目的是为了测试本文算法在不同数 PCA 27.32 25.74 24.63 量训练样本的情况下，与传统人脸识别算法在识 SVM 41.65 38.23 36.46 别率方面所表现的优劣程度。由于在实际应用 DBN 83.71 84.05 85.21 环境中很难采集得到大量有标签的训练样本，所 FIP+LDA 84.61 86.72 87.51 以在具有较低的训练样本个数条件下，能取得较好的识别效果就变得尤为重要。表3为深度神 DLWF 85.93 87.16 88.76 经网络隐含层结点数目的缩放系数为0.9时，在 DLWF 86.72 87.84 91.63 不同训练样本数目的条件下，与传统人脸识别方经过在LFW人脸库上实验可知，本文提出的人法进行比较的结果。脸识别算法在非限制条件下的鲁棒性和准确率均高

化，如光照、姿态、表情、背景、性别等。本文选取人脸库中包含图像数目大于或等于２５幅的人作为实验对象，包括２９人共２４５８幅图像。每人随机选取５幅人脸图像作为训练样本，其余图像作为测试样本。将这些图像首先根据人脸面部五官的位置进行区域的划分，然后归一化到固定大小（下巴区域８８×３３、嘴部区域５１×３４、左眼和右眼区域４４×３１、鼻子区域３２×４６），由此生成训练、测试样本。１）隐含层单元设置压缩比不同时对比实验ＤＢＮ的分类能力主要取决于自下向上、多层提取得到特征的有效性。为了能够获得更多细节特征，５个区域长和宽分别向外扩大了Ｌｌｅｙｅ、Ｌｒｅｙｅ、Ｌｎｏｓｅ、Ｌｍｏｕｔｈ、Ｌｃｈｉｎ，它们的取值为各区域长的０．２倍。在构建ＤＢＮ时，确定各隐含层神经元个数至关重要。因为ＬＦＷ人脸库中图像都是在没有限制的自然条件下采集的，所以人脸图像特征较为复杂，并且含有较多噪声，为了能够有效提取人脸图像抽象特征，首先应该讨论网络构建问题中，不同隐含层神经元个数对网络识别性能的影响。实验结果如表２所示。表２不同网络结构的正确识别率Ｔａｂｌｅ２Ｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｏｆｄｉｆｆｅｒｅｎｔｎｅｔｗｏｒｋｓｔｒｕｃｔｕｒｅｓ隐含层缩放系数ＤＢＮ识别率／％ＤＬＷＦ识别率／％ＤＬＷＦ＋识别率／％０．７０５５．７５５６．２５５８．４５０．７５６４．５０６６．７５６９．３５０．８０６８．２５７０．２５７３．８５０．８５７１．１０７４．５０７９．２５０．９０８２．５０８５．２５８８．５５由表２可知，随着隐含层神经元缩放系数增加，深度神经网络能够更好地提取得到适合于分类的人脸图像抽象特征，但计算量也随之增大。同时，隐含层神经元数目相同时，本文提出算法的识别率均高于只输入整张人脸图像像素级特征的传统深度神经网络算法。２）训练样本数不同时对比实验实验２的目的是为了测试本文算法在不同数量训练样本的情况下，与传统人脸识别算法在识别率方面所表现的优劣程度。由于在实际应用环境中很难采集得到大量有标签的训练样本，所以在具有较低的训练样本个数条件下，能取得较好的识别效果就变得尤为重要。表３为深度神经网络隐含层结点数目的缩放系数为０．９时，在不同训练样本数目的条件下，与传统人脸识别方法进行比较的结果。表３不同训练样本数正确识别率Ｔａｂｌｅ３Ｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｏｆｄｉｆｆｅｒｅｎｔｔｒａｉｎｉｎｇｓａｍｐｌｅｓ方法微调阶段训练样本数／％５１０１５ＰＣＡ２３２７２９ＳＷＭ３５．５４４５５ＤＢＮ８２．５８３．５８６ＦＩＰ＋ＬＤＡ８３８５．５８６ＤＬＷＦ８５．２５８７．５８８ＤＬＷＦ＋８６．５８８．２５８９．５由表３可知，本文提出算法经过非监督的预训练，为ＤＢＮ参数提供了较好的初始化值，再经过少量有标签的训练样本有监督的微调，便能达到较好的识别效果。随着训练样本数不断增加开始时识别准确率明显上升，而后趋于不变，表明本文算法在非限制条件下进行识别具有良好的鲁棒性。同时，表３也表明了本文算法比直接输入整张人脸图像像素级特征的ＤＢＮ识别准确率更高。传统的人脸识别算法如ＰＣＡ、ＳＶＭ等在训练样本个数较少时，所提取的底维特征分类能力并不强。随着训练样本个数增加，提取的特征分类能力有所增强，但在非限制条件下算法的识别精度并不高。３）类别数不同时对比实验实验３目的是为了验证本文算法在非限制条件下的普适性和有效性。从ＬＦＷ中选择拥有人脸图像数目大于或等于２５幅图像的３９个人作为实验的候选样本，从其中随机挑选出１０、２０、３０人作为实验对象，每人随机挑选出５幅人脸图像作为训练样本，其余图像作为测试样本。每次随机选择不同人脸图像进行实验，求取平均值作为最终结果。本次实验采用的ＤＢＮ网络隐含层缩放系数与实验２相同，实验结果如表４所示。表４类别数不同时不同算法正确识别率Ｔａｂｌｅ４Ｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｏｆｄｉｆｆｅｒｅｎｔａｌｇｏｒｉｔｈｍｓ方法类别数／％１０２０３０ＰＣＡ２７．３２２５．７４２４．６３ＳＶＭ４１．６５３８．２３３６．４６ＤＢＮ８３．７１８４．０５８５．２１ＦＩＰ＋ＬＤＡ８４．６１８６．７２８７．５１ＤＬＷＦ８５．９３８７．１６８８．７６ＤＬＷＦ＋８６．７２８７．８４９１．６３经过在ＬＦＷ人脸库上实验可知，本文提出的人脸识别算法在非限制条件下的鲁棒性和准确率均高 ·９１８· 智能系统学报第１０卷

第6期孙劲光，等：一种特征加权融合人脸识别方法 .919. 于传统人脸识别算法。通过将人脸面部进行区域划表6ORL库上不同算法识别率比较分，分别提取局部抽象特征的方法，比传统仅输入整 Table 6 Comparison of different algorithms on ORL 张人脸像素级特征方法更容易学习得到适合于分类方法识别率/% 的局部特征。并通过上述实验证明了本文算法在非 PCA 84.0 限制条件下的有效性。 SVM 88.5 2.20RL人脸库上的实验 DBN 94.0 ORL人脸库又称AT&T人脸库，是剑桥大学历 FIP+LDA 96.0 时2年拍摄完成的，包含40个人，每个人有10幅不 DLWF 97.0 同姿态、表情、光照的图像，共400幅，其中人脸的姿 DLWF 97.0 态和光照变化较小，图像分辨率为112×92，图像背景为黑色，以PGM格式存储。实验过程中，神经网 3 结束语络首先利用LFW人脸库中所有人脸图像进行预训本文提出了一种特征加权融合人脸识别方法，练，然后在ORL人脸库中每人随机选取5幅图像作首先通过提取面部特征点将人脸图像划分成多个局为微调阶段训练样本集，其余的人脸图像作为测试部区域采样区域，然后将采样区域通过归一化处理样本集。后分别输入到对应DBN网络中，求取相似度矩阵， 1)隐含层单元数不同时对比实验最后进行加权求和得出最终判别结果并计算识别准本实验目的是为了验证本文提出算法的通用确率。经过在LFW人脸库上实验证明了本文算法性，以及在ORL人脸库上，不同隐含层缩放系数所在非限制条件下进行人脸识别的有效性，并且能够表现出的识别性能的差异。表5为DBN网络隐含自下而上提取得到适合于分类的抽象人脸特征。识层缩放系数不同时的识别结果。别率达到了91.63%。同时在0RL人脸库上进行的表5OL库上不同网络结构时正确识别率实验充分证明了本文算法的通用性和有效性，识别 Table 5 Recognition rate of different network struc- 率达到了较高的97%，表现出了比传统人脸识别更 tures in ORL 高的优越性。隐含层 DBN DLWF DLWF* 参考文献：缩放系数识别率/% 识别率/%识别率/% 0.70 44 57 61 [1]TURK M,PENTLAND A.Eigenfaces for recognition [J]. 0.75 52 64 67 Journal of Cognitive Neuroscience,1991,3(1):71-86. 0.80 71 77 82 [2]SUN Yi,WANG Xiaogang,TANG Xiaoou.Deep learning face representation from predicting 10,000 classes[C]// 0.85 82 86 89 Proceedings of the 2014 IEEE Conference on Computer Vi- 0.90 94 97 97 sion and Pattern Recognition.Columbus,OH,USA,2014: 从表5可知，当隐含层缩放系数逐渐增加时，网 1891-1898. 络逐层提取得到的人脸图像抽象特征的分类识别能 [3]HU Junlin,LU Jiwen,TAN Y P.Discriminative deep met- 力逐渐增强。当网络隐含层缩放系数为0.9时，获 ric learning for face verification in the wild[C]//Proceed- 得了较高识别率97%。 ings of the 2014 IEEE Conference on Computer Vision and 2)与其他人脸识别方法对比实验 Pattern Recognition.Columbus,OH,USA,2014:1875- 为了验证本文提出算法相对于传统人脸识别算 1882 [4]HUANG G B,LEE H,LEARNED-MILLER E.Learning hi- 法所具有的优越性，分别同PCA、SVM和传统DBN erarchical representations for face verification with convolu- 算法做了对比实验，表6为本文提出算法在OL人 tional deep belief networks[C]//Proceedings of the 2012 脸库上与其他算法进行对比的实验结果。实验结果 IEEE Conference on Computer Vision and Pattern Recogni- 表明本文算法具有较好的通用性，与传统人脸识别 tion.Providence,RI,USA,2012:2518-2525. 方法进行比较，在识别率方面具有较为明显的优势。 [5]ZHU Zhenyao,LUO Ping,WANG Xiaogang,et al.Deep learning identity-preserving face space[C]//Proceedings of

于传统人脸识别算法。通过将人脸面部进行区域划分，分别提取局部抽象特征的方法，比传统仅输入整张人脸像素级特征方法更容易学习得到适合于分类的局部特征。并通过上述实验证明了本文算法在非限制条件下的有效性。２．２ＯＲＬ人脸库上的实验ＯＲＬ人脸库又称ＡＴ＆Ｔ人脸库，是剑桥大学历时２年拍摄完成的，包含４０个人，每个人有１０幅不同姿态、表情、光照的图像，共４００幅，其中人脸的姿态和光照变化较小，图像分辨率为１１２×９２，图像背景为黑色，以ＰＧＭ格式存储。实验过程中，神经网络首先利用ＬＦＷ人脸库中所有人脸图像进行预训练，然后在ＯＲＬ人脸库中每人随机选取５幅图像作为微调阶段训练样本集，其余的人脸图像作为测试样本集。１）隐含层单元数不同时对比实验本实验目的是为了验证本文提出算法的通用性，以及在ＯＲＬ人脸库上，不同隐含层缩放系数所表现出的识别性能的差异。表５为ＤＢＮ网络隐含层缩放系数不同时的识别结果。表５ＯＲＬ库上不同网络结构时正确识别率Ｔａｂｌｅ５Ｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｏｆｄｉｆｆｅｒｅｎｔｎｅｔｗｏｒｋｓｔｒｕｃ⁃ ｔｕｒｅｓｉｎＯＲＬ隐含层缩放系数ＤＢＮ识别率／％ＤＬＷＦ识别率／％ＤＬＷＦ＋识别率／％０．７０４４５７６１０．７５５２６４６７０．８０７１７７８２０．８５８２８６８９０．９０９４９７９７从表５可知，当隐含层缩放系数逐渐增加时，网络逐层提取得到的人脸图像抽象特征的分类识别能力逐渐增强。当网络隐含层缩放系数为０．９时，获得了较高识别率９７％。２）与其他人脸识别方法对比实验为了验证本文提出算法相对于传统人脸识别算法所具有的优越性，分别同ＰＣＡ、ＳＶＭ和传统ＤＢＮ算法做了对比实验，表６为本文提出算法在ＯＲＬ人脸库上与其他算法进行对比的实验结果。实验结果表明本文算法具有较好的通用性，与传统人脸识别方法进行比较，在识别率方面具有较为明显的优势。表６ＯＲＬ库上不同算法识别率比较Ｔａｂｌｅ６ＣｏｍｐａｒｉｓｏｎｏｆｄｉｆｆｅｒｅｎｔａｌｇｏｒｉｔｈｍｓｏｎＯＲＬ方法识别率／％ＰＣＡ８４．０ＳＶＭ８８．５ＤＢＮ９４．０ＦＩＰ＋ＬＤＡ９６．０ＤＬＷＦ９７．０ＤＬＷＦ＋９７．０３结束语本文提出了一种特征加权融合人脸识别方法，首先通过提取面部特征点将人脸图像划分成多个局部区域采样区域，然后将采样区域通过归一化处理后分别输入到对应ＤＢＮ网络中，求取相似度矩阵，最后进行加权求和得出最终判别结果并计算识别准确率。经过在ＬＦＷ人脸库上实验证明了本文算法在非限制条件下进行人脸识别的有效性，并且能够自下而上提取得到适合于分类的抽象人脸特征。识别率达到了９１．６３％。同时在ＯＲＬ人脸库上进行的实验充分证明了本文算法的通用性和有效性，识别率达到了较高的９７％，表现出了比传统人脸识别更高的优越性。参考文献：［１］ＴＵＲＫＭ，ＰＥＮＴＬＡＮＤＡ．Ｅｉｇｅｎｆａｃｅｓｆｏｒｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｏｇｎｉｔｉｖｅＮｅｕｒｏｓｃｉｅｎｃｅ，１９９１，３（１）：７１⁃８６．［２］ＳＵＮＹｉ，ＷＡＮＧＸｉａｏｇａｎｇ，ＴＡＮＧＸｉａｏｏｕ．Ｄｅｅｐｌｅａｒｎｉｎｇｆａｃｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｆｒｏｍｐｒｅｄｉｃｔｉｎｇ１０，０００ｃｌａｓｓｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１４ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉ⁃ ｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｃｏｌｕｍｂｕｓ，ＯＨ，ＵＳＡ，２０１４：１８９１⁃１８９８．［３］ＨＵＪｕｎｌｉｎ，ＬＵＪｉｗｅｎ，ＴＡＮＹＰ．Ｄｉｓｃｒｉｍｉｎａｔｉｖｅｄｅｅｐｍｅｔ⁃ ｒｉｃｌｅａｒｎｉｎｇｆｏｒｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｉｎｔｈｅｗｉｌｄ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆｔｈｅ２０１４ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｃｏｌｕｍｂｕｓ，ＯＨ，ＵＳＡ，２０１４：１８７５⁃ １８８２．［４］ＨＵＡＮＧＧＢ，ＬＥＥＨ，ＬＥＡＲＮＥＤ⁃ＭＩＬＬＥＲＥ．Ｌｅａｒｎｉｎｇｈｉ⁃ ｅｒａｒｃｈｉｃａｌｒｅｐｒｅｓｅｎｔａｔｉｏｎｓｆｏｒｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｗｉｔｈｃｏｎｖｏｌｕ⁃ ｔｉｏｎａｌｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１２ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉ⁃ ｔｉｏｎ．Ｐｒｏｖｉｄｅｎｃｅ，ＲＩ，ＵＳＡ，２０１２：２５１８⁃２５２５．［５］ＺＨＵＺｈｅｎｙａｏ，ＬＵＯＰｉｎｇ，ＷＡＮＧＸｉａｏｇａｎｇ，ｅｔａｌ．Ｄｅｅｐｌｅａｒｎｉｎｇｉｄｅｎｔｉｔｙ⁃ｐｒｅｓｅｒｖｉｎｇｆａｃｅｓｐａｃｅ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ第６期孙劲光，等：一种特征加权融合人脸识别方法 ·９１９·

.920. 智能系统学报第10卷 the 2013 IEEE International Conference on Computer Vi- [14]MILBORROW S,BISHOP T E,NICOLLS F.Multiview sion.Sydney,NSW,Australia,2013:113-120. active shape models with SIFT descriptors for the 300-W [6]SUN Yi,WANG Xiaogang,TANG Xiaoou.Hybrid deep face landmark challenge [C]//Proceedings of the 2013 learning for face verification[C]//Proceedings of the 2013 IEEE International Conference on Computer Vision Work- IEEE International Conference on Computer Vision.Syd- shops.Sydney,NSW,Australia,2013:378-385. ney,NSW,Australia,2013:1489-1496. [15]Bengio Y,Delalleau 0.On the expressive power of deep [7]TAIGMAN Y,YANG Ming,RANZATO M A,et al.Deep- architectures[C]//Proceedings of the 22nd International face:Closing the gap to human-level performance in face Conference.Espoo,Finland,2011:18-36. verification[C]//Proceedings of the 2014 IEEE Conference [16]HINTON G E.Training products of experts by minimizing on Computer Vision and Pattern Recognition.Columbus, contrastive divergence[J].Neural Computation,2002,14 0H,USA,2014:1701-1708. (8):1771-1800. [8]SUN Yi,CHEN Yuheng,WANG Xiaogang,et al.Deep [17]BENGIO Y.Learning deep architectures for AI[J].Foun- learning face representation by joint identification-verifica- dations and Trends in Machine Learning,2009,2(1):1- tion[J].Advances in Neural Information Processing Sys- 127. tems.2014. 作者简介： [9]HINTON G E,OSINDERO S,TEH Y W.A fast learning 孙劲光，女，1962年生，博士，教授 algorithm for deep belief nets[J].Neural Computation, 博士生导师，计算机学会(CCF)会员 2006,18(7):1527-1554. (21314S),主要研究方向为计算机图像 [10]HINTON G E,SALAKHUTDINOV RR.Reducing the di- 处理、计算机图形学、知识工程。 mensionality of data with neural networks[J].Science, 2006.313(5786):504-507. [11]AREL I,ROSE D C,KARNOWSKI T P.Deep machine learning a new frontier in artificial intelligence research 孟凡宇，男，1991年生，硕士研究 [research frontier][J].IEEE Computational Intelligence 生，主要研究方向为计算机图像处理。 Magazine,2010,5(4):13-18. [12]COOTES T F,TAYLOR C J,COOPER D H,et al.Active shape models-their training and application[].Computer Vision and Image Understanding,1995,61(1):38-59. [13]MILBORROW S,NICOLIS F.Active shape models with SIFT descriptors and MARS[J].VISAPP,2014,1(2):5

ｔｈｅ２０１３ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉ⁃ ｓｉｏｎ．Ｓｙｄｎｅｙ，ＮＳＷ，Ａｕｓｔｒａｌｉａ，２０１３：１１３⁃１２０．［６］ＳＵＮＹｉ，ＷＡＮＧＸｉａｏｇａｎｇ，ＴＡＮＧＸｉａｏｏｕ．Ｈｙｂｒｉｄｄｅｅｐｌｅａｒｎｉｎｇｆｏｒｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１３ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ｓｙｄ⁃ ｎｅｙ，ＮＳＷ，Ａｕｓｔｒａｌｉａ，２０１３：１４８９⁃１４９６．［７］ＴＡＩＧＭＡＮＹ，ＹＡＮＧＭｉｎｇ，ＲＡＮＺＡＴＯＭＡ，ｅｔａｌ．Ｄｅｅｐ⁃ ｆａｃｅ：Ｃｌｏｓｉｎｇｔｈｅｇａｐｔｏｈｕｍａｎ⁃ｌｅｖｅｌｐｅｒｆｏｒｍａｎｃｅｉｎｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１４ＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ．Ｃｏｌｕｍｂｕｓ，ＯＨ，ＵＳＡ，２０１４：１７０１⁃１７０８．［８］ＳＵＮＹｉ，ＣＨＥＮＹｕｈｅｎｇ，ＷＡＮＧＸｉａｏｇａｎｇ，ｅｔａｌ．Ｄｅｅｐｌｅａｒｎｉｎｇｆａｃｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｂｙｊｏｉｎｔｉｄｅｎｔｉｆｉｃａｔｉｏｎ⁃ｖｅｒｉｆｉｃａ⁃ ｔｉｏｎ［Ｊ］．ＡｄｖａｎｃｅｓｉｎＮｅｕｒａｌＩｎｆｏｒｍａｔｉｏｎＰｒｏｃｅｓｓｉｎｇＳｙｓ⁃ ｔｅｍｓ．２０１４．［９］ＨＩＮＴＯＮＧＥ，ＯＳＩＮＤＥＲＯＳ，ＴＥＨＹＷ．Ａｆａｓｔｌｅａｒｎｉｎｇａｌｇｏｒｉｔｈｍｆｏｒｄｅｅｐｂｅｌｉｅｆｎｅｔｓ［Ｊ］．ＮｅｕｒａｌＣｏｍｐｕｔａｔｉｏｎ，２００６，１８（７）：１５２７⁃１５５４．［１０］ＨＩＮＴＯＮＧＥ，ＳＡＬＡＫＨＵＴＤＩＮＯＶＲＲ．Ｒｅｄｕｃｉｎｇｔｈｅｄｉ⁃ ｍｅｎｓｉｏｎａｌｉｔｙｏｆｄａｔａｗｉｔｈｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｊ］．Ｓｃｉｅｎｃｅ，２００６，３１３（５７８６）：５０４⁃５０７．［１１］ＡＲＥＬＩ，ＲＯＳＥＤＣ，ＫＡＲＮＯＷＳＫＩＴＰ．Ｄｅｅｐｍａｃｈｉｎｅｌｅａｒｎｉｎｇａｎｅｗｆｒｏｎｔｉｅｒｉｎａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅｒｅｓｅａｒｃｈ［ｒｅｓｅａｒｃｈｆｒｏｎｔｉｅｒ］［Ｊ］．ＩＥＥＥＣｏｍｐｕｔａｔｉｏｎａｌＩｎｔｅｌｌｉｇｅｎｃｅＭａｇａｚｉｎｅ，２０１０，５（４）：１３⁃１８．［１２］ＣＯＯＴＥＳＴＦ，ＴＡＹＬＯＲＣＪ，ＣＯＯＰＥＲＤＨ，ｅｔａｌ．Ａｃｔｉｖｅｓｈａｐｅｍｏｄｅｌｓ⁃ｔｈｅｉｒｔｒａｉｎｉｎｇａｎｄａｐｐｌｉｃａｔｉｏｎ［Ｊ］．ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＩｍａｇｅＵｎｄｅｒｓｔａｎｄｉｎｇ，１９９５，６１（１）：３８⁃５９．［１３］ＭＩＬＢＯＲＲＯＷＳ，ＮＩＣＯＬＬＳＦ．ＡｃｔｉｖｅｓｈａｐｅｍｏｄｅｌｓｗｉｔｈＳＩＦＴｄｅｓｃｒｉｐｔｏｒｓａｎｄＭＡＲＳ［Ｊ］．ＶＩＳＡＰＰ，２０１４，１（２）：５．［１４］ＭＩＬＢＯＲＲＯＷＳ，ＢＩＳＨＯＰＴＥ，ＮＩＣＯＬＬＳＦ．ＭｕｌｔｉｖｉｅｗａｃｔｉｖｅｓｈａｐｅｍｏｄｅｌｓｗｉｔｈＳＩＦＴｄｅｓｃｒｉｐｔｏｒｓｆｏｒｔｈｅ３００⁃Ｗｆａｃｅｌａｎｄｍａｒｋｃｈａｌｌｅｎｇｅ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２０１３ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎＷｏｒｋ⁃ ｓｈｏｐｓ．Ｓｙｄｎｅｙ，ＮＳＷ，Ａｕｓｔｒａｌｉａ，２０１３：３７８⁃３８５．［１５］ＢｅｎｇｉｏＹ，ＤｅｌａｌｌｅａｕＯ．Ｏｎｔｈｅｅｘｐｒｅｓｓｉｖｅｐｏｗｅｒｏｆｄｅｅｐａｒｃｈｉｔｅｃｔｕｒｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２２ｎｄＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ．Ｅｓｐｏｏ，Ｆｉｎｌａｎｄ，２０１１：１８⁃３６．［１６］ＨＩＮＴＯＮＧＥ．Ｔｒａｉｎｉｎｇｐｒｏｄｕｃｔｓｏｆｅｘｐｅｒｔｓｂｙｍｉｎｉｍｉｚｉｎｇｃｏｎｔｒａｓｔｉｖｅｄｉｖｅｒｇｅｎｃｅ［Ｊ］．ＮｅｕｒａｌＣｏｍｐｕｔａｔｉｏｎ，２００２，１４（８）：１７７１⁃１８００．［１７］ＢＥＮＧＩＯＹ．ＬｅａｒｎｉｎｇｄｅｅｐａｒｃｈｉｔｅｃｔｕｒｅｓｆｏｒＡＩ［Ｊ］．Ｆｏｕｎ⁃ ｄａｔｉｏｎｓａｎｄＴｒｅｎｄｓｉｎＭａｃｈｉｎｅＬｅａｒｎｉｎｇ，２００９，２（１）：１⁃ １２７．作者简介：孙劲光，女，１９６２年生，博士，教授，博士生导师，计算机学会（ＣＣＦ）会员（２１３１４Ｓ），主要研究方向为计算机图像处理、计算机图形学、知识工程。孟凡宇，男，１９９１年生，硕士研究生，主要研究方向为计算机图像处理。 ·９２０· 智能系统学报第１０卷

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录