正在加载图片...
第2期 杨恢先,等:基于正交Log-Gabor滤波二值模式的人脸识别算法 ·331· 调11范数的作用,忽略了用所有类别信息表示测 1相关工作 试样本的协同作用。因此,Zhang等提出协同表 征(collaborative representation,.CR)是稀疏分类的 1.1协同表征 关键和本质,而非强稀疏性,CR便在模式识别中 假定有k类训练样本,每个人脸样本可表示 被广泛采用。如Zhao、Liu图提出核协同用于人 为列向量"。则第i类训练样本可以表示为 脸识别和图像分类等。SRC与CR采用固定字典 D[ViI V12 VinE R"XOn 分类可能缺乏足够的区分信息,因此研究者们对 其中v,表示第i类中的第j个人脸列向量,n,表 带稀疏约束的字典学习算法展开了研究,并取得 示第i类训练样本的总个数,m表示训练样本的 较好的效果。如Yang等提出Fisher区分字典学 维数,n表示样本总数,n=n+n+..+nm。用这些训 习算法(fisher discrimination dictionary learning, 练样本的线性组合构成字典D∈R,则测试样本 FDDL),Chen等uo提出稀疏嵌入字典学习算法 y的协同表征系数à可通过式(1)求得: (1) (sparse embedded dictionary learning,SEDL)等。最 a arg min(ly -Dall-allal) 近,基于深度学习的卷积神经网络在人脸识别也 则系数a为最小二乘解: 取得理想的效果。如Sun等提出DeepID算法、 @=(DD+ADDy (2) Yi等提出的WebFace算法等。上述算法在人 然后进行最小误差重构,误差最小项为测试 脸识别虽然取得明显效果,但它们都采用多样本 样本所对应的项。重构公式为 做训练,与实际应用情况不符合,因此用于单样 identity(y)=argmin y-Da2 (3) 本人脸识别效果将下降。 与字典学习、深度学习相比,SRC与CR算法 1.2正交Log-Gabor滤波器组 使用训练样本少,计算复杂度更低。虽然SRC和 1.2.1Log-Gabor滤波器 CR算法对受污染的待测样本有较好的识别能 Gabor滤波器良好的空间局部性和方向选择 力,但训练样本不受污染是前提。可变光照会改 性,被用于提取人脸多个方向的结构特征和空间 变人脸图像的灰度分布,而传统的主成分分析] 频率,同时对光照和光照变化具有良好的鲁棒 (principal component analysis,PCA)等算法不能很 性。但Gabor滤波器存在两点不足:l)有直流分 好地提取光照不变量,因此Gabor小波被广泛用 量,2)带宽受限。因此,Field提出Log-Gabor滤波 于人脸光照不变特征提取。如文献[14]提出基于 器。Log-Gabor滤波器带宽与人类视觉通道的 Gabor滤波的二值模式方法(histogram sequence of 带宽更接近,更适合对图像编码。二维L0g local Gabor binary patterns,HSLGBP):文献[l5]提 Gabor在频域上定义为 出基于Gabor小波低秩恢复稀疏表示分类法。由 og 于Gabor变换存在直流分量和带宽受限,从而 LG(u,v)=exp 4 Log-Gabor'1变换被提出,刘元等m将其用于人脸 (2.) 2 log 识别。Log-Gabor仍然存在维数高、耗时长的缺 点。为降低特征维数,文献[18]提出正交梯度相 其中: fu=ucos 0+vsin 0 位脸(orthogonal gradient phase face,OGPF),文 v =-usin 0+vcos 0 (5) 献[l9]提出正交梯度二值模式(orthogonal gradient 式中:%代表滤波器的中心频率;k控制滤波器在 binary pattern,.OGBP)。文献[20]在文献[18-19]的 41方向的带宽;σ,控制滤波器在y1方向的带宽; 基础上改进,提出中心对称梯度幅值相位模式 0代表滤波器的方向角度。 (center-symmetric gradient magnitude and phase pat- 幅图像的Log-Gabor特征就是该幅图像与 terns,CSGMP),并取得较好的效果。 Log-Gabor函数做卷积的结果。假定图像为 受文献[6,19]的启发,本文提出一种基于正 I(x,y),则Log-Gabor的特征为 交Log-Gabor滤波二值模式(orthogonal Log-Gabor P(x,y)=I(x,y)⑧LG(x,y) (6) binary pattern,OLGBP)的人脸识别算法。采用正 式中:⑧代表卷积;p,(x,y)代表Log-Gabor特征; 交Log-Gabor滤波器组提取人脸特征并做特征融 LG.(x,y)代表尺度为u、方向为v的Log-Gabor滤 合得到OLGBP特征,将这些特征组合成字典,最 波器。 后采用协同表征分类。 1.2.2正交Log-Gabor滤波器组调 l1 范数的作用,忽略了用所有类别信息表示测 试样本的协同作用。因此,Zhang 等 [6]提出协同表 征 (collaborative representation,CR) 是稀疏分类的 关键和本质,而非强稀疏性,CR 便在模式识别中 被广泛采用。如 Zhao[7] 、Liu[8]提出核协同用于人 脸识别和图像分类等。SRC 与 CR 采用固定字典 分类可能缺乏足够的区分信息,因此研究者们对 带稀疏约束的字典学习算法展开了研究,并取得 较好的效果。如 Yang 等 [9]提出 Fisher 区分字典学 习算法 (fisher discrimination dictionary learning, FDDL),Chen 等 [10]提出稀疏嵌入字典学习算法 (sparse embedded dictionary learning,SEDL) 等。最 近,基于深度学习的卷积神经网络在人脸识别也 取得理想的效果。如 Sun 等 [11]提出 DeepID 算法、 Yi 等 [12]提出的 WebFace 算法等。上述算法在人 脸识别虽然取得明显效果,但它们都采用多样本 做训练,与实际应用情况不符合,因此用于单样 本人脸识别效果将下降。 与字典学习、深度学习相比,SRC 与 CR 算法 使用训练样本少,计算复杂度更低。虽然 SRC 和 CR 算法对受污染的待测样本有较好的识别能 力,但训练样本不受污染是前提。可变光照会改 变人脸图像的灰度分布,而传统的主成分分析[13] (principal component analysis,PCA) 等算法不能很 好地提取光照不变量,因此 Gabor 小波被广泛用 于人脸光照不变特征提取。如文献[14]提出基于 Gabor 滤波的二值模式方法 (histogram sequence of local Gabor binary patterns,HSLGBP);文献[15]提 出基于 Gabor 小波低秩恢复稀疏表示分类法。由 于 Gabor 变换存在直流分量和带宽受限,从而 Log-Gabor[16]变换被提出,刘元等[17]将其用于人脸 识别。Log-Gabor 仍然存在维数高、耗时长的缺 点。为降低特征维数,文献[18]提出正交梯度相 位脸 (orthogonal gradient phase face,OGPF),文 献[19]提出正交梯度二值模式 (orthogonal gradient binary pattern,OGBP)。文献[20]在文献[18-19]的 基础上改进,提出中心对称梯度幅值相位模式 (center-symmetric gradient magnitude and phase pat￾terns,CSGMP),并取得较好的效果。 受文献[6,19]的启发,本文提出一种基于正 交 Log-Gabor 滤波二值模式 (orthogonal Log-Gabor binary pattern,OLGBP) 的人脸识别算法。采用正 交 Log-Gabor 滤波器组提取人脸特征并做特征融 合得到 OLGBP 特征,将这些特征组合成字典,最 后采用协同表征分类。 1 相关工作 1.1 协同表征 假定有 k 类训练样本,每个人脸样本可表示 为列向量 v。则第 i 类训练样本可以表示为 ∈ R D m×n i=[vi, 1 vi, 2 ··· vi, n] aˆ 其中 vi, j 表示第 i 类中的第 j 个人脸列向量,ni 表 示第 i 类训练样本的总个数,m 表示训练样本的 维数,n 表示样本总数,n=n1+n2+…+nm。用这些训 练样本的线性组合构成字典 D∈R,则测试样本 y 的协同表征系数 可通过式 (1) 求得: aˆ = argmin a {∥y− Da∥ 2 2 −λ∥a∥ 2 2 } (1) 则系数aˆ为最小二乘解: ba = (D T D+λ ·I) −1 D T y (2) 然后进行最小误差重构,误差最小项为测试 样本所对应的项。重构公式为 identity(y) = argmin i    y− Dibai 2 ba 2    (3) 1.2 正交 Log-Gabor 滤波器组 1.2.1 Log-Gabor 滤波器 Gabor 滤波器良好的空间局部性和方向选择 性,被用于提取人脸多个方向的结构特征和空间 频率,同时对光照和光照变化具有良好的鲁棒 性。但 Gabor 滤波器存在两点不足:1) 有直流分 量,2) 带宽受限。因此,Field 提出 Log-Gabor 滤波 器 [12]。Log-Gabor 滤波器带宽与人类视觉通道的 带宽更接近,更适合对图像编码。二 维 Log￾Gabor 在频域上定义为 LG(u, v) = exp   − ( log( u1 u2 ))2 2 ( log( k u0 ))2   · exp( − v 2 1 (2σv) 2 ) (4) 其中: { u1 = ucos θ+v sin θ v1 = −usin θ+v cos θ (5) 式中:u0 代表滤波器的中心频率;k 控制滤波器在 u1 方向的带宽;σv 控制滤波器在 v1 方向的带宽; θ 代表滤波器的方向角度。 I(x, y) 一幅图像的 Log-Gabor 特征就是该幅图像与 Log-Gabor 函数做卷积的结果。假定图像为 ,则 Log-Gabor 的特征为 φu,v (x, y) = I(x, y)⊗LGu,v (x, y) (6) 式中: ⊗ 代表卷积;φu,v(x,y) 代表 Log-Gabor 特征; LGu,v (x,y) 代表尺度为 u、方向为 v 的 Log-Gabor 滤 波器。 1.2.2 正交 Log-Gabor 滤波器组 第 2 期 杨恢先,等:基于正交 Log-Gabor 滤波二值模式的人脸识别算法 ·331·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有