第14卷第2期 智能系统学报 Vol.14 No.2 2019年3月 CAAI Transactions on Intelligent Systems Mar.2019 D0:10.11992/tis.201708015 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180420.1125.008.html 基于正交Log-Gabor滤波二值模式的人脸识别算法 杨恢先,付宇,曾金芳,徐唱 (湘潭大学物理与光电工程学院,湖南湘潭411105) 摘要:为消除可变光照对人脸识别的影响,提出一种基于正交Log-Gabor滤波二值模式(OLGBP)的人脸识别 算法。该算法对样本在正交方向做Log-Gabor变换,然后将所得特征图像进行虚实分解和同尺度多方向二值融 合构成OLGBP特征向量,再将这些特征向量构成协同表征字典D。最后,在字典D下对测试样本采用协同表 征求稀疏系数,并通过误差重构来分类。在AR、Extend Yale B和CAS-PEAL-Rl人脸数据库上的实验结果表 明,OLGBP算法对光照变化的单样本人脸识别具有较好的效果,从而验证了算法的有效性。 关键词:人脸识别;Log-Gabor滤波器;协同表征;正交:稀疏编码;二值模式;单样本;多尺度 中图分类号:TP391.4文献标志码:A 文章编号:1673-4785(2019)02-0330-08 中文引用格式:杨恢先,付宇,曾金芳,等.基于正交Log-Gabor滤波二值模式的人脸识别算法.智能系统学报,2019, 14(2):330-337. 英文引用格式:YANG Huixian,,FUYu,ZENG Jinfang,etal.Face recognition based on orthogonal Log-Gabor binary pattern[J. CAAI transactions on intelligent systems,2019,14(2):330-337. Face recognition based on orthogonal Log-Gabor binary pattern YANG Huixian,FU Yu,ZENG Jinfang,XU Chang (School of Physics and Optoelectronic,Xiangtan University,Xiangtan 411105,China) Abstract:To eliminate the effect of varying illumination on face recognition,a novel method of face recognition based on orthogonal log-Gabor binary pattern(OLGBP)is proposed in this paper.First,the algorithm performs log-Gabor transform on the samples in the orthogonal direction.Then the log-Gabor feature image is decomposed into real and imaginary parts,and the OLGBP feature vectors are constructed by fusing them into a binary pattern in the same scale at different directions.These feature vectors then form a collaboratively representative dictionary D.Finally,sparse coeffi- cients are obtained by collaboratively representing these feature vectors with the test samples based on the dictionary D. and the test samples are classified by reconstruction of errors.The results for experiments performed on AR,Extend Yale B,and CAS-PEAL-RI face databases show that the OLGBP algorithm has good effect on a single sample with il- lumination variation,and the effectiveness of the algorithm is verified. Keywords:face recognition;Log-Gabor filter,collaborative representation;orthogonality;sparse coding;binary pattern; single sample;multi scale 人脸识别因其友好性、无侵害、易获取等特 经典的人脸识别算法有Eigenface)、Fisher-. 点,成为图像处理和计算机视觉中受关注的领域 face、拉普拉斯脸等。2009年,John Wright等 之一。提取区分性好、鲁棒性好的人脸特征,构 提出一种基于稀疏表示分类(sparse representation 建高效可靠的分类器,来提升人脸识别的正确 based classification,SRC)人脸识别算法。SRC算 率,一直是人脸识别研究的难点与重点"。 法首先在训练图像上对未知图像做编码处理,然 收稿日期:2017-08-17.网络出版日期:2018-04-20 后通过计算最小编码误差来估计未知图像属于哪 基金项目:湘潭大学博士启动基金项目(KZ07089):湘潭大学校 级科研项目(16XZX02). 一类,从而达到分类目的。SRC的快捷与高效 通信作者:付字.E-mail:22682322@qq.com 性,使得它广泛用于人脸识别领域。SRC过度强
DOI: 10.11992/tis.201708015 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180420.1125.008.html 基于正交 Log-Gabor 滤波二值模式的人脸识别算法 杨恢先,付宇,曾金芳,徐唱 (湘潭大学 物理与光电工程学院,湖南 湘潭 411105) 摘 要:为消除可变光照对人脸识别的影响,提出一种基于正交 Log-Gabor 滤波二值模式 (OLGBP) 的人脸识别 算法。该算法对样本在正交方向做 Log-Gabor 变换,然后将所得特征图像进行虚实分解和同尺度多方向二值融 合构成 OLGBP 特征向量,再将这些特征向量构成协同表征字典 D。最后,在字典 D 下对测试样本采用协同表 征求稀疏系数,并通过误差重构来分类。在 AR、Extend Yale B 和 CAS-PEAL-R1 人脸数据库上的实验结果表 明,OLGBP 算法对光照变化的单样本人脸识别具有较好的效果,从而验证了算法的有效性。 关键词:人脸识别;Log-Gabor 滤波器;协同表征;正交;稀疏编码;二值模式;单样本;多尺度 中图分类号:TP391.4 文献标志码:A 文章编号:1673−4785(2019)02−0330−08 中文引用格式:杨恢先, 付宇, 曾金芳, 等. 基于正交 Log-Gabor 滤波二值模式的人脸识别算法[J]. 智能系统学报, 2019, 14(2): 330–337. 英文引用格式:YANG Huixian, FU Yu, ZENG Jinfang, et al. Face recognition based on orthogonal Log-Gabor binary pattern[J]. CAAI transactions on intelligent systems, 2019, 14(2): 330–337. Face recognition based on orthogonal Log-Gabor binary pattern YANG Huixian,FU Yu,ZENG Jinfang,XU Chang (School of Physics and Optoelectronic, Xiangtan University, Xiangtan 411105, China) Abstract: To eliminate the effect of varying illumination on face recognition, a novel method of face recognition based on orthogonal log-Gabor binary pattern (OLGBP) is proposed in this paper. First, the algorithm performs log-Gabor transform on the samples in the orthogonal direction. Then the log-Gabor feature image is decomposed into real and imaginary parts, and the OLGBP feature vectors are constructed by fusing them into a binary pattern in the same scale at different directions. These feature vectors then form a collaboratively representative dictionary D. Finally, sparse coefficients are obtained by collaboratively representing these feature vectors with the test samples based on the dictionary D, and the test samples are classified by reconstruction of errors. The results for experiments performed on AR, Extend Yale B, and CAS-PEAL-R1 face databases show that the OLGBP algorithm has good effect on a single sample with illumination variation, and the effectiveness of the algorithm is verified. Keywords: face recognition; Log-Gabor filter; collaborative representation; orthogonality; sparse coding; binary pattern; single sample; multi scale 人脸识别因其友好性、无侵害、易获取等特 点,成为图像处理和计算机视觉中受关注的领域 之一。提取区分性好、鲁棒性好的人脸特征,构 建高效可靠的分类器,来提升人脸识别的正确 率,一直是人脸识别研究的难点与重点[1]。 经典的人脸识别算法有 Eigenface[2] 、Fisherface[3] 、拉普拉斯脸[4]等。2009 年,John Wright 等 [5] 提出一种基于稀疏表示分类 (sparse representation based classification,SRC) 人脸识别算法。SRC 算 法首先在训练图像上对未知图像做编码处理,然 后通过计算最小编码误差来估计未知图像属于哪 一类,从而达到分类目的。SRC 的快捷与高效 性,使得它广泛用于人脸识别领域。SRC 过度强 收稿日期:2017−08−17. 网络出版日期:2018−04−20. 基金项目:湘潭大学博士启动基金项目 (KZ07089);湘潭大学校 级科研项目 (16XZX02). 通信作者:付宇. E-mail: 292682322@qq.com. 第 14 卷第 2 期 智 能 系 统 学 报 Vol.14 No.2 2019 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2019
第2期 杨恢先,等:基于正交Log-Gabor滤波二值模式的人脸识别算法 ·331· 调11范数的作用,忽略了用所有类别信息表示测 1相关工作 试样本的协同作用。因此,Zhang等提出协同表 征(collaborative representation,.CR)是稀疏分类的 1.1协同表征 关键和本质,而非强稀疏性,CR便在模式识别中 假定有k类训练样本,每个人脸样本可表示 被广泛采用。如Zhao、Liu图提出核协同用于人 为列向量"。则第i类训练样本可以表示为 脸识别和图像分类等。SRC与CR采用固定字典 D[ViI V12 VinE R"XOn 分类可能缺乏足够的区分信息,因此研究者们对 其中v,表示第i类中的第j个人脸列向量,n,表 带稀疏约束的字典学习算法展开了研究,并取得 示第i类训练样本的总个数,m表示训练样本的 较好的效果。如Yang等提出Fisher区分字典学 维数,n表示样本总数,n=n+n+..+nm。用这些训 习算法(fisher discrimination dictionary learning, 练样本的线性组合构成字典D∈R,则测试样本 FDDL),Chen等uo提出稀疏嵌入字典学习算法 y的协同表征系数à可通过式(1)求得: (1) (sparse embedded dictionary learning,SEDL)等。最 a arg min(ly -Dall-allal) 近,基于深度学习的卷积神经网络在人脸识别也 则系数a为最小二乘解: 取得理想的效果。如Sun等提出DeepID算法、 @=(DD+ADDy (2) Yi等提出的WebFace算法等。上述算法在人 然后进行最小误差重构,误差最小项为测试 脸识别虽然取得明显效果,但它们都采用多样本 样本所对应的项。重构公式为 做训练,与实际应用情况不符合,因此用于单样 identity(y)=argmin y-Da2 (3) 本人脸识别效果将下降。 与字典学习、深度学习相比,SRC与CR算法 1.2正交Log-Gabor滤波器组 使用训练样本少,计算复杂度更低。虽然SRC和 1.2.1Log-Gabor滤波器 CR算法对受污染的待测样本有较好的识别能 Gabor滤波器良好的空间局部性和方向选择 力,但训练样本不受污染是前提。可变光照会改 性,被用于提取人脸多个方向的结构特征和空间 变人脸图像的灰度分布,而传统的主成分分析] 频率,同时对光照和光照变化具有良好的鲁棒 (principal component analysis,PCA)等算法不能很 性。但Gabor滤波器存在两点不足:l)有直流分 好地提取光照不变量,因此Gabor小波被广泛用 量,2)带宽受限。因此,Field提出Log-Gabor滤波 于人脸光照不变特征提取。如文献[14]提出基于 器。Log-Gabor滤波器带宽与人类视觉通道的 Gabor滤波的二值模式方法(histogram sequence of 带宽更接近,更适合对图像编码。二维L0g local Gabor binary patterns,HSLGBP):文献[l5]提 Gabor在频域上定义为 出基于Gabor小波低秩恢复稀疏表示分类法。由 og 于Gabor变换存在直流分量和带宽受限,从而 LG(u,v)=exp 4 Log-Gabor'1变换被提出,刘元等m将其用于人脸 (2.) 2 log 识别。Log-Gabor仍然存在维数高、耗时长的缺 点。为降低特征维数,文献[18]提出正交梯度相 其中: fu=ucos 0+vsin 0 位脸(orthogonal gradient phase face,OGPF),文 v =-usin 0+vcos 0 (5) 献[l9]提出正交梯度二值模式(orthogonal gradient 式中:%代表滤波器的中心频率;k控制滤波器在 binary pattern,.OGBP)。文献[20]在文献[18-19]的 41方向的带宽;σ,控制滤波器在y1方向的带宽; 基础上改进,提出中心对称梯度幅值相位模式 0代表滤波器的方向角度。 (center-symmetric gradient magnitude and phase pat- 幅图像的Log-Gabor特征就是该幅图像与 terns,CSGMP),并取得较好的效果。 Log-Gabor函数做卷积的结果。假定图像为 受文献[6,19]的启发,本文提出一种基于正 I(x,y),则Log-Gabor的特征为 交Log-Gabor滤波二值模式(orthogonal Log-Gabor P(x,y)=I(x,y)⑧LG(x,y) (6) binary pattern,OLGBP)的人脸识别算法。采用正 式中:⑧代表卷积;p,(x,y)代表Log-Gabor特征; 交Log-Gabor滤波器组提取人脸特征并做特征融 LG.(x,y)代表尺度为u、方向为v的Log-Gabor滤 合得到OLGBP特征,将这些特征组合成字典,最 波器。 后采用协同表征分类。 1.2.2正交Log-Gabor滤波器组
调 l1 范数的作用,忽略了用所有类别信息表示测 试样本的协同作用。因此,Zhang 等 [6]提出协同表 征 (collaborative representation,CR) 是稀疏分类的 关键和本质,而非强稀疏性,CR 便在模式识别中 被广泛采用。如 Zhao[7] 、Liu[8]提出核协同用于人 脸识别和图像分类等。SRC 与 CR 采用固定字典 分类可能缺乏足够的区分信息,因此研究者们对 带稀疏约束的字典学习算法展开了研究,并取得 较好的效果。如 Yang 等 [9]提出 Fisher 区分字典学 习算法 (fisher discrimination dictionary learning, FDDL),Chen 等 [10]提出稀疏嵌入字典学习算法 (sparse embedded dictionary learning,SEDL) 等。最 近,基于深度学习的卷积神经网络在人脸识别也 取得理想的效果。如 Sun 等 [11]提出 DeepID 算法、 Yi 等 [12]提出的 WebFace 算法等。上述算法在人 脸识别虽然取得明显效果,但它们都采用多样本 做训练,与实际应用情况不符合,因此用于单样 本人脸识别效果将下降。 与字典学习、深度学习相比,SRC 与 CR 算法 使用训练样本少,计算复杂度更低。虽然 SRC 和 CR 算法对受污染的待测样本有较好的识别能 力,但训练样本不受污染是前提。可变光照会改 变人脸图像的灰度分布,而传统的主成分分析[13] (principal component analysis,PCA) 等算法不能很 好地提取光照不变量,因此 Gabor 小波被广泛用 于人脸光照不变特征提取。如文献[14]提出基于 Gabor 滤波的二值模式方法 (histogram sequence of local Gabor binary patterns,HSLGBP);文献[15]提 出基于 Gabor 小波低秩恢复稀疏表示分类法。由 于 Gabor 变换存在直流分量和带宽受限,从而 Log-Gabor[16]变换被提出,刘元等[17]将其用于人脸 识别。Log-Gabor 仍然存在维数高、耗时长的缺 点。为降低特征维数,文献[18]提出正交梯度相 位脸 (orthogonal gradient phase face,OGPF),文 献[19]提出正交梯度二值模式 (orthogonal gradient binary pattern,OGBP)。文献[20]在文献[18-19]的 基础上改进,提出中心对称梯度幅值相位模式 (center-symmetric gradient magnitude and phase patterns,CSGMP),并取得较好的效果。 受文献[6,19]的启发,本文提出一种基于正 交 Log-Gabor 滤波二值模式 (orthogonal Log-Gabor binary pattern,OLGBP) 的人脸识别算法。采用正 交 Log-Gabor 滤波器组提取人脸特征并做特征融 合得到 OLGBP 特征,将这些特征组合成字典,最 后采用协同表征分类。 1 相关工作 1.1 协同表征 假定有 k 类训练样本,每个人脸样本可表示 为列向量 v。则第 i 类训练样本可以表示为 ∈ R D m×n i=[vi, 1 vi, 2 ··· vi, n] aˆ 其中 vi, j 表示第 i 类中的第 j 个人脸列向量,ni 表 示第 i 类训练样本的总个数,m 表示训练样本的 维数,n 表示样本总数,n=n1+n2+…+nm。用这些训 练样本的线性组合构成字典 D∈R,则测试样本 y 的协同表征系数 可通过式 (1) 求得: aˆ = argmin a {∥y− Da∥ 2 2 −λ∥a∥ 2 2 } (1) 则系数aˆ为最小二乘解: ba = (D T D+λ ·I) −1 D T y (2) 然后进行最小误差重构,误差最小项为测试 样本所对应的项。重构公式为 identity(y) = argmin i y− Dibai 2 ba 2 (3) 1.2 正交 Log-Gabor 滤波器组 1.2.1 Log-Gabor 滤波器 Gabor 滤波器良好的空间局部性和方向选择 性,被用于提取人脸多个方向的结构特征和空间 频率,同时对光照和光照变化具有良好的鲁棒 性。但 Gabor 滤波器存在两点不足:1) 有直流分 量,2) 带宽受限。因此,Field 提出 Log-Gabor 滤波 器 [12]。Log-Gabor 滤波器带宽与人类视觉通道的 带宽更接近,更适合对图像编码。二 维 LogGabor 在频域上定义为 LG(u, v) = exp − ( log( u1 u2 ))2 2 ( log( k u0 ))2 · exp( − v 2 1 (2σv) 2 ) (4) 其中: { u1 = ucos θ+v sin θ v1 = −usin θ+v cos θ (5) 式中:u0 代表滤波器的中心频率;k 控制滤波器在 u1 方向的带宽;σv 控制滤波器在 v1 方向的带宽; θ 代表滤波器的方向角度。 I(x, y) 一幅图像的 Log-Gabor 特征就是该幅图像与 Log-Gabor 函数做卷积的结果。假定图像为 ,则 Log-Gabor 的特征为 φu,v (x, y) = I(x, y)⊗LGu,v (x, y) (6) 式中: ⊗ 代表卷积;φu,v(x,y) 代表 Log-Gabor 特征; LGu,v (x,y) 代表尺度为 u、方向为 v 的 Log-Gabor 滤 波器。 1.2.2 正交 Log-Gabor 滤波器组 第 2 期 杨恢先,等:基于正交 Log-Gabor 滤波二值模式的人脸识别算法 ·331·
·332· 智能系统学报 第14卷 Log-Gabor滤波器组所提取的特征维数过高, 制。二值化模式定义为 从而导致计算机内存占有率高,算法识别耗时 PR(E)= 1, Re(LG())>0 长,效率低下。受文献[19]的启发,提出正交Log 10, Re(LGr(e)≤0 (7) Gabor滤波器组。 1, Im(LG())>0 正交Log-Gabor滤波器组是从Log-Gabor滤 P-e={O.mLGa,e)≤0 (8) 波器组中抽取正交方向的Log-Gabor特征。为了 式中:Re(LG,(z)代表Log-Gabor特征的实部, 防止丢失有用的特征,因此在不同尺度上采取交 Im(LG,(e)代表Log-Gabor特征的虚部。 叉选取正交方向。假定滤波器组选取5个尺度, a-6e 十进制编码模式定义为 8个方向。则全局Log-Gabor滤波器组的幅值特 征如图1所示,正交Log-Gabor滤波器组的幅值 (9) 特征如图2所示。 (10) 醛 Te=∑e6x2 圈冒馨 猛 其中,n为方向的个数,[Te(a),Tm(e为OLGBP特征。 2.2人脸特征匹配 哪 間湖墨夏 荔 關 该算法通过协作表征分类,因此将提取的 M的过 S 三 孤 OLGBP特征组合成稀疏字典D进行稀疏编码,选 取式(3)的最小值所在类作为测试样本的类别。 M N S E 0 0 人脸识别流程如图3所示。 图1全局特征 Fig.1 Global feature 正交 愿 题 Log-Gabor 值融 正交Log-Gabor特征 化合 鑫 串联 题 藏 套 弦 别 N S a OLGBP特征 图3人脸识别流程图 图2正交特征 Fig.3 Face recognition flow chart Fig.2 Orthogonal feature 由图2可以看出,正交Log-Gabor滤波器组所 3正交Log-Gabor滤波二值模式 提取的特征将是全局Log-Gabor滤波器组所提特 征的一半。因此,所提特征维数是全局特征维数 为验证OLGBP算法的有效性,算法在AR人 的一半,从而可实现特征降维。又由于正交特征 脸库、Extend Yale B人脸库和CAS-PEAL-Rl人脸 的方向是正交的,因此所提特征在一定程度上减 库分别进行仿真实验。实验环境为MATLAB R2013a, 少了冗余。由上述分析可知,算法的计算开销将 计算机硬件配置为Windows732位系统,Intel(R) 减少,相比同类算法识别速度有一定的提升。 Pentium(R)B9402.0GHz,2GB运行内存。 AR人脸库包含了126人的4000多幅人脸图 2 OLGBP 像,涵盖表情、光照和遮挡3种变化,原图像的尺 2.1人脸的OLGBP特征 寸为120×165。随机从库中选取50名男性和 OLGBP特征提取过程: 50名女性,每人4幅光照变化的图像进行实验。 1)将样本分别与正交Log-Gabor滤波器组卷 实验中,选择AR人脸库每个人的第1幅图像作 积,得到LG特征。 为训练样本,剩余3幅做测试样本,图像尺寸为 2)首先对LG做虚、实分解,得到LGR和 83×60,部分图像如图4所示。 LG。然后将LGR和LG二值化,并进行同尺度不 Extend Yale B人脸库包含了38人正面姿态 同方向的特征融合。最后,将融合特征转十进 下的2432幅图像,涵盖64种不同光照,原图像
Log-Gabor 滤波器组所提取的特征维数过高, 从而导致计算机内存占有率高,算法识别耗时 长,效率低下。受文献[19]的启发,提出正交 LogGabor 滤波器组。 正交 Log-Gabor 滤波器组是从 Log- Gabor 滤 波器组中抽取正交方向的 Log-Gabor 特征。为了 防止丢失有用的特征,因此在不同尺度上采取交 叉选取正交方向。假定滤波器组选取 5 个尺度, 8 个方向。则全局 Log-Gabor 滤波器组的幅值特 征如图 1 所示,正交 Log-Gabor 滤波器组的幅值 特征如图 2 所示。 图 1 全局特征 Fig. 1 Global feature 图 2 正交特征 Fig. 2 Orthogonal feature 由图 2 可以看出,正交 Log-Gabor 滤波器组所 提取的特征将是全局 Log-Gabor 滤波器组所提特 征的一半。因此,所提特征维数是全局特征维数 的一半,从而可实现特征降维。又由于正交特征 的方向是正交的,因此所提特征在一定程度上减 少了冗余。由上述分析可知,算法的计算开销将 减少,相比同类算法识别速度有一定的提升。 2 OLGBP 2.1 人脸的 OLGBP 特征 OLGBP 特征提取过程: 1) 将样本分别与正交 Log-Gabor 滤波器组卷 积,得到 LG 特征。 2) 首先对 LG 做虚、实分解,得到 LGR 和 LGI。然后将 LGR 和 LGI 二值化,并进行同尺度不 同方向的特征融合。最后,将融合特征转十进 制。二值化模式定义为 P Re u,v (z) = { 1, Re ( LGu,v (z) ) > 0 0, Re ( LGu,v (z) ) ⩽ 0 (7) P Im u,v (z) = { 1, Im( LGu,v (z) ) > 0 0, Im( LGu,v (z) ) ⩽ 0 (8) 式中:Re(LGu,v (z)) 代表 Log-Gabor 特征的实部, Im(LGu,v (z)) 代表 Log-Gabor 特征的虚部。 十进制编码模式定义为 T Re u (z) = ∑n−1 v=0 P Re u,v (z)×2 v (9) T Im u (z) = ∑n−1 v=0 P Im u,v (z)×2 v (10) [ T Re u (z),T Im u (z) ] 其中,n 为方向的个数, 为 OLGBP 特征。 2.2 人脸特征匹配 该算法通过协作表征分类,因此将提取的 OLGBP 特征组合成稀疏字典 D 进行稀疏编码,选 取式 (3) 的最小值所在类作为测试样本的类别。 人脸识别流程如图 3 所示。 Vi, j OLGBP特征 串联 正交Log-Gabor特征 Log-Gabor 正交 二值化 特征融合 分类识别 图 3 人脸识别流程图 Fig. 3 Face recognition flow chart 3 正交 Log-Gabor 滤波二值模式 为验证 OLGBP 算法的有效性,算法在 AR 人 脸库、Extend Yale B 人脸库和 CAS- PEAL-R1 人脸 库分别进行仿真实验。实验环境为 MATLAB R2013a, 计算机硬件配置为 Windows7 32 位系统,Intel(R) Pentium(R) B940 2.0 GHz,2 GB 运行内存。 AR 人脸库包含了 126 人的 4 000 多幅人脸图 像,涵盖表情、光照和遮挡 3 种变化,原图像的尺 寸为 120×165。随机从库中选取 50 名男性和 50 名女性,每人 4 幅光照变化的图像进行实验。 实验中,选择 AR 人脸库每个人的第 1 幅图像作 为训练样本,剩余 3 幅做测试样本,图像尺寸为 83×60,部分图像如图 4 所示。 Extend Yale B 人脸库包含了 38 人正面姿态 下的 2 432 幅图像,涵盖 64 种不同光照,原图像 ·332· 智 能 系 统 学 报 第 14 卷
第2期 杨恢先,等:基于正交Log-Gabor滤波二值模式的人脸识别算法 ·333· 的尺寸为168×192。根据光照入射角度分为5个 像组成,原图像的尺寸为100×100。实验中,采用 子集:子集1的入射角度为0°~12(每人7幅):子 正面图像库的光照变化图像做实验,随机选取其 集2的入射角度为13°25(每人12幅);子集3的 中199人(每人9幅),每人的第i(=1,2,3,4,5)幅作 人射角度为26°~50(每人12幅);子集4的入射角 为训练样本,其余为测试样本,图像尺寸为83×60, 度为51°~77(每人14幅);子集5的入射角度大 部分图像如图6所示。 于77(每人19幅)。实验中,选择子集1每个人的 第1幅图像作为训练样本,其他子集做测试样本, 图像尺寸为96×84,部分图像如图5所示。 (a)训练样本 (b)测试样本 图6CAS-PEAL-R1人脸库部分图像 图4AR人脸库部分图像 Fig.6 Example images in CAS-PEAL-R1 database Fig.4 Example images in AR database 3.1参数对识别率的影响 1)滤波器尺度u与方向v对识别率的影响 多数情况下,在使用Gabor滤波器时均采用 5个尺度、8个方向,为验证滤波器尺度s与方向 (a)子集1 o分别对算法识别率的影响,OLGBP算法将在 AR人脸库和CAS-PEAL-R1人脸库上进行实验。 特征维数设定为90,实验结果如图7、8所示。 (b)子集2 100 80 60 40 20 (c)子集3 8910 2345678910 图7s、0在AR的实验结果 (d子集4 Fig.7 s and o's result in AR 100 (e)子集5 图5 Extend Yale B人脸库部分图像 Fig.5 Example images in Extend Yale B database 0 CAS-PEAL-R1人脸库包含正面图像库和姿 1234567 5 8910 态图像库,由1040名中国人的99450幅人脸图
的尺寸为 168×192。根据光照入射角度分为 5 个 子集:子集 1 的入射角度为 0°~12°(每人 7 幅);子 集 2 的入射角度为 13°~25°(每人 12 幅);子集 3 的 入射角度为 26°~50°(每人 12 幅);子集 4 的入射角 度为 51°~77°(每人 14 幅);子集 5 的入射角度大 于 77°(每人 19 幅)。实验中,选择子集 1 每个人的 第 1 幅图像作为训练样本,其他子集做测试样本, 图像尺寸为 96×84,部分图像如图 5 所示。 (a) 训练样本 (b) 测试样本 图 4 AR 人脸库部分图像 Fig. 4 Example images in AR database (a) 子集1 (b) 子集2 (c) 子集3 (d) 子集4 (e) 子集5 图 5 Extend Yale B 人脸库部分图像 Fig. 5 Example images in Extend Yale B database CAS-PEAL-R1 人脸库包含正面图像库和姿 态图像库,由 1 040 名中国人的 99 450 幅人脸图 像组成,原图像的尺寸为 100×100。实验中,采用 正面图像库的光照变化图像做实验,随机选取其 中 199 人 (每人 9 幅),每人的第 i(i=1,2,3,4,5) 幅作 为训练样本,其余为测试样本,图像尺寸为 83×60, 部分图像如图 6 所示。 图 6 CAS-PEAL-R1 人脸库部分图像 Fig. 6 Example images in CAS-PEAL-R1 database 3.1 参数对识别率的影响 1) 滤波器尺度 u 与方向 v 对识别率的影响 多数情况下,在使用 Gabor 滤波器时均采用 5 个尺度、8 个方向,为验证滤波器尺度 s 与方向 o 分别对算法识别率的影响,OLGBP 算法将在 AR 人脸库和 CAS-PEAL-R1 人脸库上进行实验。 特征维数设定为 90,实验结果如图 7、8 所示。 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 0 20 40 60 80 100 识别率/% s o 图 7 s、o 在 AR 的实验结果 Fig. 7 s and o’s result in AR 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 0 20 40 60 80 100 识别率/% s o 第 2 期 杨恢先,等:基于正交 Log-Gabor 滤波二值模式的人脸识别算法 ·333·
·334· 智能系统学报 第14卷 图8S、o在CAS-PEAL-R1的实验结果 0.4 Fig.8 s and o's result in CAS-PEAL-RI 0.3 0.2 图7和图8中横坐标分别代表滤波器的尺度 0.1 个数s、方向个数o。纵轴代表滤波器的识别率。 0 -01 从图7和图8可以看出,当取小尺度数和较少的 0.2 方向数时,所提取到的人脸信息少,导致识别率 0.3 较低。当取大尺度数和较大的方向数时,所提取 -0.4 -0.5 的人脸信息过多造成冗余,导致有用信息丢失, -0.6 0102030405060708090100 识别率下降。因此,在保证识别率的前提下,算 样本 法的计算开销尽可能小,则Log-Gabor滤波器组 (a)SRC编码系数 的尺度数选3、方向数选2都有较好的识别率。 0.5 2)正交特征和全局特征对识别率的影响 0.4 0.3 为验证正交特征和全局特征对识别率的影 0.2 响,OLGBP算法和LGBP算法将在AR人脸库、 0.1 CAS-PEAL-RI人脸库和Extend Yale B人脸库的 -0.1 S4上进行实验。Log-Gabor滤波器和正交Log- -0.2 -0.3 Gabor滤波器均设定为3个尺度2个方向,特征维 -0.4 数设定为90维,实验结果如表1所示。 -0.5 0 102030405060708090100 样本 表1算法识别结果 (b)CRC编码系数 Table 1 Algorithm's results % 0.25 人脸库 LGBP OLGBP 0.20 AR 98.33 98.00 0.15 0.10 CAS-PEAL-RI 82.22 81.53 0.05 S4 82.86 84.29 0.05 从表1可以看出,在维数降至90的前提下, -0.10 -0.15 AR库上LGBP的识别率比OLGBP高0.33%, 102030405060708090100 样本 CAS-PEAL-R1库上LGBP的识别率比OLGBP高 (c)OLGBP编码系数 0.69%,Extend Yale B的S上LGBP的识别率比 图9各算法编码系数对比 OLGBP低1.43%。由此可知,除S4外OLGBP算 Fig.9 The coding coefficients of algorithms 法的识别率比LGBP算法的识别率稍低,但总 体上相差不大。但LGBP算法产生了12幅LG特 确分类。由此可以说明,OLGBP算法相对SRC 征图像,OLGBP算法只产生了6幅LG特征图 和CRC算法提取的特征更具有区分性。 像,因此OLGBP特征维数是LGBP特征维数的 3.2不同算法的识别性能对比 1/2。说明取正交方向的LG特征,在一定程度 为验证OLGBP算法的有效性,分别与SRC 上可减少特征冗余,实现特征降维,提高算法的 算法、CRC RLS算法、OGPF算法I、OGBP算 效率。 法)、CSGMP算法I进行对比。SRC算法参数 3)编码系数比较 1=0.01。CRC RLS算法中参数1=0.001。在OG- 为验证OLGBP编码系数的有效性,OLGBP P℉算法中,方向数为5,高斯标准差o=0.9。在 算法将与SRC、CRC算法作对比。对比实验将在 OGBP算法中,方向数为8,高斯标准差o=1。在 AR人脸库进行,以AR库第一幅人脸图像为例。 CSGMP算法中,CSLDP尺寸为3×3,高斯标准差 从图9可以看出,相同样本各算法的编码系 =0.6。OLGBP算法中,CRC RLS的参数=O.001, 数各不相同。SRC与CRC编码系数相似,它们将 Log-Gabor的尺度s=3、方向o=2,最小波长为3, 第一类样本归于其他类,而OLGBP算法实现准 缩放因子为2。实验中OLGBP、SRC和CRC RLS
图 8 s、o 在 CAS-PEAL-R1 的实验结果 Fig. 8 s and o’s result in CAS-PEAL-R1 图 7 和图 8 中横坐标分别代表滤波器的尺度 个数 s、方向个数 o。纵轴代表滤波器的识别率。 从图 7 和图 8 可以看出,当取小尺度数和较少的 方向数时,所提取到的人脸信息少,导致识别率 较低。当取大尺度数和较大的方向数时,所提取 的人脸信息过多造成冗余,导致有用信息丢失, 识别率下降。因此,在保证识别率的前提下,算 法的计算开销尽可能小,则 Log-Gabor 滤波器组 的尺度数选 3、方向数选 2 都有较好的识别率。 2) 正交特征和全局特征对识别率的影响 为验证正交特征和全局特征对识别率的影 响,OLGBP 算法和 LGBP 算法将在 AR 人脸库、 CAS-PEAL-R1 人脸库和 Extend Yale B 人脸库的 S4 上进行实验。Log-Gabor 滤波器和正交 LogGabor 滤波器均设定为 3 个尺度 2 个方向,特征维 数设定为 90 维,实验结果如表 1 所示。 表 1 算法识别结果 Table 1 Algorithm’s results % 人脸库 LGBP OLGBP AR 98.33 98.00 CAS-PEAL-R1 82.22 81.53 S4 82.86 84.29 从表 1 可以看出,在维数降至 90 的前提下, AR 库上 LGBP 的识别率比 OLGBP 高 0.33%, CAS-PEAL-R1 库上 LGBP 的识别率比 OLGBP 高 0.69%,Extend Yale B 的 S4 上 LGBP 的识别率比 OLGBP 低 1.43%。由此可知,除 S4 外 OLGBP 算 法的识别率比 LGBP 算法的识别率稍低,但总 体上相差不大。但 LGBP 算法产生了 12 幅 LG 特 征图像,OLGBP 算法只产生了 6 幅 LG 特征图 像,因此 OLGBP 特征维数是 LGBP 特征维数的 1/2。说明取正交方向的 LG 特征,在一定程度 上可减少特征冗余,实现特征降维,提高算法的 效率。 3) 编码系数比较 为验证 OLGBP 编码系数的有效性,OLGBP 算法将与 SRC、CRC 算法作对比。对比实验将在 AR 人脸库进行,以 AR 库第一幅人脸图像为例。 从图 9 可以看出,相同样本各算法的编码系 数各不相同。SRC 与 CRC 编码系数相似,它们将 第一类样本归于其他类,而 OLGBP 算法实现准 确分类。由此可以说明,OLGBP 算法相对 SRC 和 CRC 算法提取的特征更具有区分性。 3.2 不同算法的识别性能对比 为验证 OLGBP 算法的有效性,分别与 SRC 算法[5] 、CRC_RLS 算法[6] 、OGPF 算法[12] 、OGBP 算 法 [13] 、CSGMP 算法[14]进行对比。SRC 算法参数 λ=0.01。CRC_RLS 算法中参数 λ=0.001。在 OGPF 算法中,方向数为 5,高斯标准差 σ=0.9。在 OGBP 算法中,方向数为 8,高斯标准差 σ=1。在 CSGMP 算法中,CSLDP 尺寸为 3×3,高斯标准差 σ=0.6。OLGBP 算法中,CRC_RLS 的参数 λ=0.001, Log-Gabor 的尺度 s=3、方向 o=2,最小波长为 3, 缩放因子为 2。实验中 OLGBP、SRC 和 CRC_RLS 0 10 20 30 40 50 60 70 80 90 100 −0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5 样本 编码系数 (b) CRC 编码系数 0 10 20 30 40 50 60 70 80 90 100 −0.15 −0.10 −0.05 0 0.05 0.10 0.15 0.20 0.25 编码系数 样本 (c) OLGBP 编码系数 0 10 20 30 40 50 60 70 80 90 100 −0.6 −0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 样本 编码系数 (a) SRC 编码系数 图 9 各算法编码系数对比 Fig. 9 The coding coefficients of algorithms ·334· 智 能 系 统 学 报 第 14 卷
第2期 杨恢先,等:基于正交Log-Gabor滤波二值模式的人脸识别算法 ·335· 算法的AR库和CAS-PEAL-R1库人脸尺寸为 CSGMP 78.59 74.16 57.68 74.55 76.35 83×60,Extend Yale B库的人脸尺寸为96×84。其 OLGBP 84.2378.7767.34 78.6485.68 余算法的人脸尺寸为都为100×100。所有实验进 行20次,并对结果取平均值。 表4的复杂光照的实验结果可以看出子集 从表2可以看出,OGPF、OGBP、CSG-MP和 2中人脸光照条件良好,算法识别率都很高;子集 OLGBP各算法都取得了良好的识别率。SRC和 3~5中人脸光照条件越来越差,没有进行特征提 CRC RLS算法只考虑了稀疏表示,并没有对图像 取的SRC、CRC RLS算法和只进行局部特征提取 提取更加显著的特征;OGPF算法提取人脸5个 的CSGMP算法识别率下降最快:OGPF和OG 方向的梯度相位特征,使用于分类的信息更加丰 BP利用梯度信息,识别率下降慢;OLGBP通过提 富;OGBP算法是OGP℉算法的改进,它将梯度相 取多尺度正交方向信息,对虚部和实部分别编码 位进行8个方向的量化并赋予不同的权值;CSGMP 提高了抗干扰的能力,在剧烈的光照下也有较高 算法利用了梯度幅值和梯度相位的互补性,提取 的识别率。 了人脸不变特征。OLGBP算法采用正交Log-Gabor 表4 Extend Yale B人脸库上识别结果 滤波器组提取多尺度下的特征图,并通过对虚部 Table 4 Face recognition results in Extend Yale B % 和实部二值编码充分挖掘了人脸信息,取得了良 子集 好的识别率。 算法 S S Sa 表2AR人脸库上识别结果 SRC 90.00 30.00 30.00 10.00 Table 2 Face recognition results in AR % CRC RLS 100.00 80.00 50.00 10.00 算法 识别率 OGPF 100.00 87.29 58.13 40.05 SRC 88.00 OGBP 100.00 89.55 61.09 41.35 CRC RLS 86.00 CSGMP 100.00 90.76 39.47 33.24 OGPF 96.67 OLGBP 100.00 100.00 84.29 82.63 OGBP 98.33 3.3特征维数与时间复杂度分析 CSGMP 98.33 为对比算法的复杂程度,在AR库的光照集 OLGBP 98.00 进行试验。以AR库每人的第一张人脸作为训练 样本,光照变换人脸作为测试样本,测试算法识 从表3可以看出:CRC RLS算法虽然在第 别一张人脸所花的时间为 1、2、4幅图有很好的效果,但第4、5幅图的识别 t=Ti+T2 (11) 率低,导致算法识别率不稳定,可靠性降低。OLGBP 式中:T,表示提取一幅人脸特征消耗的平均时 算法通过提取多尺度、多方向特征对单样本进行 间,T2表示一张测试样本与多张训练样本匹配消 了细节的扩充,再通过虚实分解和编码使得人脸 耗的平均时间。各算法在AR光照集的特征维数 结果信息更丰富,相比其他算法识别率得到提升 与耗时结果如表5所示。 且稳定性较好。 表5不同算法在光照集的特征维数与耗时 表3 CAS-PEA-R1人脸库上识别结果 Table 5 Different algorithm's dimension and time in different illumination set ms Table 3 Face recognition results in CAS-PEA-R1 算法 维数 T 训练样本号1 算法 SRC 1230 0 235 1 3 5 CRC_RLS 1230 0 5.49 SRC 77.39 77.39 32.63 76.88 57.79 OGPF 50000 78.74 74.25 CRC RLS 90.4592.46 53.27 90.45 53.27 OGBP 80000 139.48 74.19 OGPF 70.1065.6447.55 68.26 69.41 CSGMP 16384 45.56 34.03 OGBP 77.32 72.30 52.89 72.17 74.75 OLGBP 7380 12.96 9.89
算法的 AR 库和 CAS-PEAL-R1 库人脸尺寸为 83×60,Extend Yale B 库的人脸尺寸为 96×84。其 余算法的人脸尺寸为都为 100×100。所有实验进 行 20 次,并对结果取平均值。 从表 2 可以看出,OGPF、OGBP、CSG- MP 和 OLGBP 各算法都取得了良好的识别率。SRC 和 CRC_RLS 算法只考虑了稀疏表示,并没有对图像 提取更加显著的特征;OGPF 算法提取人脸 5 个 方向的梯度相位特征,使用于分类的信息更加丰 富;OGBP 算法是 OGPF 算法的改进,它将梯度相 位进行 8 个方向的量化并赋予不同的权值;CSGMP 算法利用了梯度幅值和梯度相位的互补性,提取 了人脸不变特征。OLGBP 算法采用正交 Log-Gabor 滤波器组提取多尺度下的特征图,并通过对虚部 和实部二值编码充分挖掘了人脸信息,取得了良 好的识别率。 表 2 AR 人脸库上识别结果 Table 2 Face recognition results in AR % 算法 识别率 SRC 88.00 CRC_RLS 86.00 OGPF 96.67 OGBP 98.33 CSGMP 98.33 OLGBP 98.00 从表 3 可以看出:CRC_RLS 算法虽然在第 1、2、4 幅图有很好的效果,但第 4、5 幅图的识别 率低,导致算法识别率不稳定,可靠性降低。OLGBP 算法通过提取多尺度、多方向特征对单样本进行 了细节的扩充,再通过虚实分解和编码使得人脸 结果信息更丰富,相比其他算法识别率得到提升 且稳定性较好。 表 3 CAS-PEA-R1 人脸库上识别结果 Table 3 Face recognition results in CAS-PEA-R1 % 算法 训练样本号 i 1 2 3 4 5 SRC 77.39 77.39 32.63 76.88 57.79 CRC_RLS 90.45 92.46 53.27 90.45 53.27 OGPF 70.10 65.64 47.55 68.26 69.41 OGBP 77.32 72.30 52.89 72.17 74.75 CSGMP 78.59 74.16 57.68 74.55 76.35 OLGBP 84.23 78.77 67.34 78.64 85.68 表 4 的复杂光照的实验结果可以看出子集 2 中人脸光照条件良好,算法识别率都很高;子集 3~5 中人脸光照条件越来越差,没有进行特征提 取的 SRC、CRC_RLS 算法和只进行局部特征提取 的 CSGMP 算法识别率下降最快;OGPF 和 OGBP 利用梯度信息,识别率下降慢;OLGBP 通过提 取多尺度正交方向信息,对虚部和实部分别编码 提高了抗干扰的能力,在剧烈的光照下也有较高 的识别率。 表 4 Extend Yale B 人脸库上识别结果 Table 4 Face recognition results in Extend Yale B % 算法 子集 S2 S3 S4 S5 SRC 90.00 30.00 30.00 10.00 CRC_RLS 100.00 80.00 50.00 10.00 OGPF 100.00 87.29 58.13 40.05 OGBP 100.00 89.55 61.09 41.35 CSGMP 100.00 90.76 39.47 33.24 OLGBP 100.00 100.00 84.29 82.63 3.3 特征维数与时间复杂度分析 为对比算法的复杂程度,在 AR 库的光照集 进行试验。以 AR 库每人的第一张人脸作为训练 样本,光照变换人脸作为测试样本,测试算法识 别一张人脸所花的时间为 t = T1 +T2 (11) 式中:T1 表示提取一幅人脸特征消耗的平均时 间,T2 表示一张测试样本与多张训练样本匹配消 耗的平均时间。各算法在 AR 光照集的特征维数 与耗时结果如表 5 所示。 表 5 不同算法在光照集的特征维数与耗时 Table 5 Different algorithm’s dimension and time in different illumination set ms 算法 维数 T1 T2 SRC 1 230 0 235 CRC_RLS 1 230 0 5.49 OGPF 50 000 78.74 74.25 OGBP 80 000 139.48 74.19 CSGMP 16 384 45.56 34.03 OLGBP 7 380 12.96 9.89 第 2 期 杨恢先,等:基于正交 Log-Gabor 滤波二值模式的人脸识别算法 ·335·
·336· 智能系统学报 第14卷 从表5可以看出:OLGBP算法比OGPF、OG- Journal of cognitive neuroscience,1991,3(1):71-86 BP和CSGMP的特征维数都要小,且OLGBP的 [3]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J. 每一项平均耗时都低于上述3种算法,其原因在 Eigenfaces vs.fisherfaces:recognition using class specific 于OGPF采样了5个方向的特征,OGBP采样了 linear projection[J].IEEE transactions on pattern analysis 8个方向的特征,CSGMP采用CSLDP算子维数 and machine intelligence,1997,19(7):711-720. 相对较小但特征提取时间太长,而OLGBP只采 [4]HE Xiaofei,YAN Shuicheng,HU Yuxiao,et al.Face re- 样2个方向的特征。SRC算法和CRC RLS算法 cognition using laplacianfaces[J].IEEE transactions on 没有提取特征,因此特征提取耗时项为0。由于 pattern analysis and machine intelligence,2005,27(3): 328-340. SRC采取I,来求解稀疏系数,因此特征匹配耗时 [5]WRIGHT J,YANG A Y.GANESH A,et al.Robust face 远远高于其他算法。OLGBP是CRC RLS的改 recognition via sparse representation[J].IEEE transactions 进,因此增加了特征提取、特征匹配的耗时。结 on pattern analysis and machine intelligence,2009,31(2): 合表2~5来看,OLGBP算法不仅识别率高,而且 210-227 算法的时间开销少,可以满足时性的要求。 [6]ZHANG Lei,YANG Meng,FENG Xiangchu.Sparse rep- 4结束语 resentation or collaborative representation:Which helps face recognition?[C]//Proceedings of 2011 IEEE Interna- 正交Log-Gabor滤波二值模式算法首先采用 tional Conference on Computer Vision.Barcelona,Spain, Log-Gabor滤波组提取多尺度正交方向的LG特 2011:471-478 征,然后对LG特征进行虚实分解并编码、融合, [7]ZHAO Jia,WANG Yanjiang,LIU Baodi.Kernel collabor- 最后将OLGBP特征组合成稀疏字典采用协作表 ative representation for face recognition[C]//Proceedings of 示进行分类。实验结果表明:正交方向的LG特 the 12th International Conference on Signal Processing. 征可以减少特征的冗余,降低特征维数。对 Hangzhou,China,2014:1423-1427. LG的虚实分解,可以充分提取人脸所隐藏的信 [8]LIU Weiyang,LU Lijia,LI Hui,et al.A novel kernel col- laborative representation approach for image classification[Cl/ 息。对多尺度多方向LG特征的融合即可以增强 Proceedings of 2014 IEEE International Conference on Im- 特征的判断能力,也可以进一步实现降维。 age Processing.Paris,France,2014:4241-4245 采用正交Log-Gabor滤波器组所提特征数是 [9]YANG Meng,ZHANG Lei,FENG Xiangchu,et al.Fisher 全局Log-Gabor滤波器组所提特征数的一半。因 discrimination dictionary learning for sparse representa- 此,所提特征维数是原来特征维数的一半,从而 tion[C]//Proceedings of 2011 International Conference on 可实现特征降维。又由于OLGBP特征的方向是 Computer Vision.Barcelona,Spain,2011:543-550 正交的,因此所提特征在一定程度上减少了冗 [10]CHEN Yefei,SU Jianbo.Sparse embedded dictionary 余,识别率基本保持不变。由上述分析可知算法 learning on face recognition[J].Pattern recognition,2017, 的计算开销可减少,相比同类算法识别速度得到 64:51-59 提升。在AR、Extend Yale B和CAS-PEAL-RI人 [11]SUN Yi,WANG Xiaogang,TANG Xiaoou.Deep learn- 脸库的实验结果表明:OLGBP算法不仅对光照变 ing face representation from predicting 10,000 classes[Cl// 化的人脸有较高的识别率,而且还降低了识别时 Proceedings of 2014 IEEE Conference on Computer Vis- ion and Pattern Recognition.Columbus,OH,USA.2014: 间,因此说明了该算法对光照的有效性。未来的 1891-1898. 工作将进一步对特征提取做研究分析,通过改进 [12]YI Dong,LEI Zhen,LIAO Shengcai,et al.Learning face 特征提取算法,使得特征维数和识别时间降低并 representation from scratch[J].Computer science,arXiv: 提高算法的识别率。 1411.7923,2014. 参考文献: [13]CANDES E J,LI Xiaodong,MA Yi,et al.Robust prin- cipal component analysis?[J].Journal of the ACM,2011, [1]ADINI Y,MOSES Y,ULLMAN S.Face recognition:the 58(3):11 problem of compensating for changes in illumination direc- [14]ZHANG Wenchao,SHAN Shiguang,GAO Wen,et al. tion[J].IEEE transactions on pattern analysis and machine Local Gabor binary pattern histogram sequence intelligence,1997,19(7):721-732. (LGBPHS):a novel non-statistical model for face repres- [2]TURK M,PENTLAND A.Eigenface for recognition[J]. entation and recognition[C]//Proceedings of the 10th
从表 5 可以看出:OLGBP 算法比 OGPF、OGBP 和 CSGMP 的特征维数都要小,且 OLGBP 的 每一项平均耗时都低于上述 3 种算法,其原因在 于 OGPF 采样了 5 个方向的特征,OGBP 采样了 8 个方向的特征,CSGMP 采用 CSLDP 算子维数 相对较小但特征提取时间太长,而 OLGBP 只采 样 2 个方向的特征。SRC 算法和 CRC_RLS 算法 没有提取特征,因此特征提取耗时项为 0。由于 SRC 采取 l1 来求解稀疏系数,因此特征匹配耗时 远远高于其他算法。OLGBP 是 CRC_RLS 的改 进,因此增加了特征提取、特征匹配的耗时。结 合表 2~5 来看,OLGBP 算法不仅识别率高,而且 算法的时间开销少,可以满足时性的要求。 4 结束语 正交 Log-Gabor 滤波二值模式算法首先采用 Log-Gabor 滤波组提取多尺度正交方向的 LG 特 征,然后对 LG 特征进行虚实分解并编码、融合, 最后将 OLGBP 特征组合成稀疏字典采用协作表 示进行分类。实验结果表明:正交方向的 LG 特 征可以减少特征的冗余,降低特征维数。 对 LG 的虚实分解,可以充分提取人脸所隐藏的信 息。对多尺度多方向 LG 特征的融合即可以增强 特征的判断能力,也可以进一步实现降维。 采用正交 Log-Gabor 滤波器组所提特征数是 全局 Log-Gabor 滤波器组所提特征数的一半。因 此,所提特征维数是原来特征维数的一半,从而 可实现特征降维。又由于 OLGBP 特征的方向是 正交的,因此所提特征在一定程度上减少了冗 余,识别率基本保持不变。由上述分析可知算法 的计算开销可减少,相比同类算法识别速度得到 提升。在 AR、Extend Yale B 和 CAS-PEAL-R1 人 脸库的实验结果表明:OLGBP 算法不仅对光照变 化的人脸有较高的识别率,而且还降低了识别时 间,因此说明了该算法对光照的有效性。未来的 工作将进一步对特征提取做研究分析,通过改进 特征提取算法,使得特征维数和识别时间降低并 提高算法的识别率。 参考文献: ADINI Y, MOSES Y, ULLMAN S. Face recognition: the problem of compensating for changes in illumination direction[J]. IEEE transactions on pattern analysis and machine intelligence, 1997, 19(7): 721–732. [1] [2] TURK M, PENTLAND A. Eigenface for recognition[J]. Journal of cognitive neuroscience, 1991, 3(1): 71–86. BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Eigenfaces vs. fisherfaces: recognition using class specific linear projection[J]. IEEE transactions on pattern analysis and machine intelligence, 1997, 19(7): 711–720. [3] HE Xiaofei, YAN Shuicheng, HU Yuxiao, et al. Face recognition using laplacianfaces[J]. IEEE transactions on pattern analysis and machine intelligence, 2005, 27(3): 328–340. [4] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE transactions on pattern analysis and machine intelligence, 2009, 31(2): 210–227. [5] ZHANG Lei, YANG Meng, FENG Xiangchu. Sparse representation or collaborative representation: Which helps face recognition?[C]//Proceedings of 2011 IEEE International Conference on Computer Vision. Barcelona, Spain, 2011: 471–478. [6] ZHAO Jia, WANG Yanjiang, LIU Baodi. Kernel collaborative representation for face recognition[C]//Proceedings of the 12th International Conference on Signal Processing. Hangzhou, China, 2014: 1423–1427. [7] LIU Weiyang, LU Lijia, LI Hui, et al. A novel kernel collaborative representation approach for image classification[C]// Proceedings of 2014 IEEE International Conference on Image Processing. Paris, France, 2014: 4241–4245. [8] YANG Meng, ZHANG Lei, FENG Xiangchu, et al. Fisher discrimination dictionary learning for sparse representation[C]//Proceedings of 2011 International Conference on Computer Vision. Barcelona, Spain, 2011: 543–550. [9] CHEN Yefei, SU Jianbo. Sparse embedded dictionary learning on face recognition[J]. Pattern recognition, 2017, 64: 51–59. [10] SUN Yi, WANG Xiaogang, TANG Xiaoou. Deep learning face representation from predicting 10,000 classes[C]// Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA, 2014: 1891–1898. [11] YI Dong, LEI Zhen, LIAO Shengcai, et al. Learning face representation from scratch[J]. Computer science, arXiv: 1411.7923, 2014. [12] CANDÈS E J, LI Xiaodong, MA Yi, et al. Robust principal component analysis?[J]. Journal of the ACM, 2011, 58(3): 11. [13] ZHANG Wenchao, SHAN Shiguang, GAO Wen, et al. Local Gabor binary pattern histogram sequence (LGBPHS): a novel non-statistical model for face representation and recognition[C]//Proceedings of the 10th [14] ·336· 智 能 系 统 学 报 第 14 卷
第2期 杨恢先,等:基于正交Log-Gabor滤波二值模式的人脸识别算法 ·337· IEEE International Conference on Computer Vision. [20]杨恢先,翟云龙,蔡勇勇,等基于中心对称梯度幅值相 Beijing,China,,2005,1:786-791. 位模式的单样本人脸识别.光电子·激光,2015,26(5): [l5]杜海顺,张旭东,金勇,等.基于Gabor低秩恢复稀疏表 969-977. 示分类的人脸图像识别方法[J].电子学报,2014, 4212):2386-2393. YANG Huixian,ZHAI Yunlong,CAI Yongyong,et al. DU Haishun,ZHANG Xudong,JIN Yong,et al.Face im- Face recognition based on center-symmetric gradient age recognition method via Gabor low-rank recovery magnitude and phase patterns[.Journal of optoelectron- sparse representation-based classification[J].Acta elec- ics.laser,.2015,26(5):969-977 tronica sinica,2014,42(12:2386-2393. [16]FIELD D J.Relations between the statistics of natural im- 作者简介: ages and the response properties of cortical cells[J]. 杨恢先,男,1963年生,教授,硕 Journal of the optical society of America A,1987,4(12): 士生导师,主要研究方向为图像处理、 2379-2394. 嵌入式系统。曾获湖南省科技厅科学 [17刀刘元,吴小俊.基于Log-Gabor滤波与黎曼流形学习的 技术进步奖三等奖1项,湖南省教育 图像识别算法).模式识别与人工智能,2015,28(10): 厅教学成果奖2项。获得国家发明专 利5项.出版教材2部。 946-952 LIU Yuan,WU Xiaojun.Image recognition algorithm based on Log-Gabor wavelet and Riemannian manifold 付宇,男,1993年生,硕士研究 Learning[J].Pattern recognition and artificial intelligence, 生,主要研究方向为图像处理和模式 2015.28(10:946-952 识别。 [18]CHEN XI.ZHANG Jiashu.Illumination robust single sample face recognition using multi-directional orthogon- al gradient phase faces[J].Neurocomputing,2011, 74(14/15):2291-2298 [19]杨恢先,蔡勇勇,翟云龙,等.基于正交梯度二值模式的 曾金芳,女,1978年生,讲师,博 士,主要研究方向为智能信息处理和 单样本人脸识别J.计算机应用,2014,34(2):546-549. 频谱校正。参与国家自然科学基金面 YANG Huixian,CAI Yongyong,ZHAI Yunlong,et al. 上项目、湖南省自然科学基金等项目 Single sample face recognition based on orthogonal gradi- 多项。 ent binary pattern[.Journal of computer applications, 2014,34(2:546-549
IEEE International Conference on Computer Vision. Beijing, China, 2005, 1: 786–791. 杜海顺, 张旭东, 金勇, 等. 基于 Gabor 低秩恢复稀疏表 示分类的人脸图像识别方法[J]. 电子学报, 2014, 42(12): 2386–2393. DU Haishun, ZHANG Xudong, JIN Yong, et al. Face image recognition method via Gabor low-rank recovery sparse representation-based classification[J]. Acta electronica sinica, 2014, 42(12): 2386–2393. [15] FIELD D J. Relations between the statistics of natural images and the response properties of cortical cells[J]. Journal of the optical society of America A, 1987, 4(12): 2379–2394. [16] 刘元, 吴小俊. 基于 Log-Gabor 滤波与黎曼流形学习的 图像识别算法[J]. 模式识别与人工智能, 2015, 28(10): 946–952. LIU Yuan, WU Xiaojun. Image recognition algorithm based on Log-Gabor wavelet and Riemannian manifold Learning[J]. Pattern recognition and artificial intelligence, 2015, 28(10): 946–952. [17] CHEN XI, ZHANG Jiashu. Illumination robust single sample face recognition using multi-directional orthogonal gradient phase faces[J]. Neurocomputing, 2011, 74(14/15): 2291–2298. [18] 杨恢先, 蔡勇勇, 翟云龙, 等. 基于正交梯度二值模式的 单样本人脸识别[J]. 计算机应用, 2014, 34(2): 546–549. YANG Huixian, CAI Yongyong, ZHAI Yunlong, et al. Single sample face recognition based on orthogonal gradient binary pattern[J]. Journal of computer applications, 2014, 34(2): 546–549. [19] 杨恢先, 翟云龙, 蔡勇勇, 等. 基于中心对称梯度幅值相 位模式的单样本人脸识别[J]. 光电子·激光, 2015, 26(5): 969–977. YANG Huixian, ZHAI Yunlong, CAI Yongyong, et al. Face recognition based on center-symmetric gradient magnitude and phase patterns[J]. Journal of optoelectronics·laser, 2015, 26(5): 969–977. [20] 作者简介: 杨恢先,男,1963 年生,教授,硕 士生导师,主要研究方向为图像处理、 嵌入式系统。曾获湖南省科技厅科学 技术进步奖三等奖 1 项,湖南省教育 厅教学成果奖 2 项。获得国家发明专 利 5 项,出版教材 2 部。 付宇 ,男,1993 年生,硕士研究 生,主要研究方向为图像处理和模式 识别。 曾金芳,女,1978 年生,讲师,博 士,主要研究方向为智能信息处理和 频谱校正。参与国家自然科学基金面 上项目、湖南省自然科学基金等项目 多项。 第 2 期 杨恢先,等:基于正交 Log-Gabor 滤波二值模式的人脸识别算法 ·337·