正在加载图片...
·262· 智能系统学报 第13卷 响。Kotsia等受Fisher的线性判别分析和支持向 法对随机遮挡表情识别的鲁棒性进行了验证,取得 量机(support vector machine,SVM)的启发,提出了 了较理想的识别效果。 一种新颖的最小类内方差的多类分类器来研究在不 同人脸器官遮挡的情况下对人脸表情识别的影响。 1鲁棒的正则化编码 Tarres等Il提出了基于PCA(principal component 通常情况下,稀疏编码问题可以定义为 analysis)和LDA((linear discriminant analysis),并结 argminllall s.t.lly-Tal <s (1) 合直方图均衡化和均值、方差归一化预处理的方 式中:y是待测的表情图像,T是训练表情图像字典, 法,减少了遮挡部分对人脸识别过程的影响。Kotsia α是待测的表情图像y在训练表情图像字典T上的编 等对遮挡的人脸图像进行Gabor小波滤波提取纹 码向量,并且>0。保真项定义为心y-Ta匠。 理特征,利用监督的判别非负矩阵因子分解(dis 如果事先假设编码残差e=y-Tα服从高斯分 criminant non-negative matrix factorization,DNMF) 布,式(I)的解将变成最大似然估计的解,如果e服 进行图像分解,再采用基于模型的方法来描述特定 从拉普拉斯分布,I,稀疏限制的最大似然估计解变 面部特征的几何位移来完成遮挡图像的特征表征。 为a=arg minllals.tdl心y-Tall≤e。 Zhang等m利用蒙特卡罗算法对表情图像提取Gabor 其实,a=arg minllas.ty-Tal,≤e是式(1)的 特征,并遍历表情图像的每个区域进行模板匹配以 另一种表现形式,因为它们都具有相同的拉格朗日 产生对遮挡具有鲁棒性的特征向量。Wang等利 公式:argmin{lal,+y-Tal,}o 用改进的中心对称局部二值模式和梯度中心对称局 在实际应用中这种假设是不成立的,尤其是当 部方向模式GCS-LDP,利用卡方距离求取测试集图 人脸表情图像y被遮挡时。为了构建一个鲁棒性更 像与训练集图像特征直方图之间的距离。但是,上 强的人脸表情图像的稀疏编码模型,本文提出了一 述方法主要研究眼部遮挡和嘴部遮挡对人脸表情识 个更通用的而且效率更高的鲁棒正则化编码模型。 别效果的影响,没有充分考虑遮挡在现实生活中出 1.1鲁棒的正则化编码模型 现的特点,对随机遮挡情况的适应性较弱。人脸遮 贝叶斯估计的观,点确切地说是从最大后验概率 挡的特点是遮挡可以在人脸的任何地方发生,并且 估计观,点考虑人脸表示的问题。通过字典T对待测 遮挡范围的大小和遮挡的形状都是未知的,没有任 表情图像y进行编码,编码向量α的最大后验概率估 何关于它的先验知识。因此,不能只考虑脸部某 计变成在=argmaxInP(aly)。利用贝叶斯公式得 个区域对人脸表情识别的影响情况,应该根据遮挡 &argmax (In P(yl a)+In P(a)} (2) 的特点来展开研究,并提出一些可以克服这个问题 将式(I)中的字典T改写成T=[r;r2;…;rJ,其 的方法。Wright等ol采用稀疏编码方法完成人脸识 中,r,表示T的第i列,而且e=y-Ta=[e1;e2;…;enJ, 别任务,并提出使用已知类别的训练人脸图像对测 其中,e=y:-ra,i=l,2,…,n。假设元素e是独立同 试人脸图像进行稀疏表示的方法,在随机遮挡人脸 识别系统中取得了较为理想的识别效果。MZhu等四 分布的,并且概率密度函数为f(e,而且P(yla)= Π6 利用稀疏分解求出待测图像的稀疏表示系数,并在 (yi-ria)o 待测图像所在的子空间内实现表情类别判断,该方 与此同时,假设编码向量a=[a1:2;…;am]中的 法使待测图像的分解系数变得更稀疏,同时避免身 元素aj=1,2,…,m是独立同分布的并且概率密度 份特征对表情分类的干扰。 函数为6(a),而且P(a)= 6(a)。从而式(2)中 为了提高稀疏表示的鲁棒性和有效性,本文提 出了基于鲁棒的正则化编码和自动更新权重的随机 α的最大后验概率估计为 遮挡表情识别方法。受鲁棒回归理论的启发,即 d arg ma 通过自适应地不断迭代的方法来给残差分配不同的 o.-rayf1 权重,直到估计过程收敛。本文通过假设编码残差 令pa(e)=-lnf(e)和po(a)=-lnf6(a)式(3)转成: 和编码系数分别是独立同分布的,并基于最大后验 估计的原则来对给定的信号进行鲁棒回归,为了方 arg min 2p,-r+∑na} (4 便实现,正则化编码的最小化问题将转换成一个自 本文把式(4)的模型称为鲁棒的正则编码,由 动更新权重的问题,通过设计合理的权重函数可以 于保真项p%y,-r,a)对遮挡造成的异常值具有鲁棒 鲁棒地识别出遮挡部分从而减小它们对编码过程的 影响。在JAFFE和Cohn-Kanade数据库上,本文方 性,且根据先验概率P(a), ∑P(a,)是正则化项。响。Kotsia 等 [4]受 Fisher 的线性判别分析和支持向 量机 (support vector machine,SVM) 的启发,提出了 一种新颖的最小类内方差的多类分类器来研究在不 同人脸器官遮挡的情况下对人脸表情识别的影响。 Tarrés 等 [5]提出了基于 PCA(principal component analysis) 和 LDA(linear discriminant analysis),并结 合直方图均衡化和均值、方差归一化预处理的方 法,减少了遮挡部分对人脸识别过程的影响。Kotsia 等 [6]对遮挡的人脸图像进行 Gabor 小波滤波提取纹 理特征,利用监督的判别非负矩阵因子分解 (dis￾criminant non-negative matrix factorization,DNMF) 进行图像分解,再采用基于模型的方法来描述特定 面部特征的几何位移来完成遮挡图像的特征表征。 Zhang 等 [7]利用蒙特卡罗算法对表情图像提取 Gabor 特征,并遍历表情图像的每个区域进行模板匹配以 产生对遮挡具有鲁棒性的特征向量。Wang 等 [8]利 用改进的中心对称局部二值模式和梯度中心对称局 部方向模式 GCS-LDP,利用卡方距离求取测试集图 像与训练集图像特征直方图之间的距离。但是,上 述方法主要研究眼部遮挡和嘴部遮挡对人脸表情识 别效果的影响,没有充分考虑遮挡在现实生活中出 现的特点,对随机遮挡情况的适应性较弱。人脸遮 挡的特点是遮挡可以在人脸的任何地方发生,并且 遮挡范围的大小和遮挡的形状都是未知的,没有任 何关于它的先验知识[9]。因此,不能只考虑脸部某 个区域对人脸表情识别的影响情况,应该根据遮挡 的特点来展开研究,并提出一些可以克服这个问题 的方法。Wright 等 [10]采用稀疏编码方法完成人脸识 别任务,并提出使用已知类别的训练人脸图像对测 试人脸图像进行稀疏表示的方法,在随机遮挡人脸 识别系统中取得了较为理想的识别效果。M. Zhu 等 [11] 利用稀疏分解求出待测图像的稀疏表示系数,并在 待测图像所在的子空间内实现表情类别判断,该方 法使待测图像的分解系数变得更稀疏,同时避免身 份特征对表情分类的干扰。 为了提高稀疏表示的鲁棒性和有效性,本文提 出了基于鲁棒的正则化编码和自动更新权重的随机 遮挡表情识别方法。受鲁棒回归理论的启发[10] ,即 通过自适应地不断迭代的方法来给残差分配不同的 权重,直到估计过程收敛。本文通过假设编码残差 和编码系数分别是独立同分布的,并基于最大后验 估计的原则来对给定的信号进行鲁棒回归,为了方 便实现,正则化编码的最小化问题将转换成一个自 动更新权重的问题,通过设计合理的权重函数可以 鲁棒地识别出遮挡部分从而减小它们对编码过程的 影响。在 JAFFE 和 Cohn-Kanade 数据库上,本文方 法对随机遮挡表情识别的鲁棒性进行了验证,取得 了较理想的识别效果。 1 鲁棒的正则化编码 通常情况下,稀疏编码问题可以定义为 αˆ = argmin∥α∥1 s.t.∥y−Tα∥ 2 2 ⩽ ε (1) y T α y T ∥y−Tα∥ 2 2 式中: 是待测的表情图像, 是训练表情图像字典, 是待测的表情图像 在训练表情图像字典 上的编 码向量,并且 ε>0。保真项定义为 。 e = y−Tα e αˆ = argmin∥α∥1 s.t.∥y−Tα∥1 ⩽ ε 如果事先假设编码残差 服从高斯分 布,式 (1) 的解将变成最大似然估计的解,如果 服 从拉普拉斯分布,l1 稀疏限制的最大似然估计解变 为 。 αˆ = argmin∥α∥1 s.t.∥y−Tα∥1 ⩽ ε argmin{ ∥α∥1 +λ∥y−Tα∥1 } 其实, 是式 (1) 的 另一种表现形式,因为它们都具有相同的拉格朗日 公式: 。 y 在实际应用中这种假设是不成立的,尤其是当 人脸表情图像 被遮挡时。为了构建一个鲁棒性更 强的人脸表情图像的稀疏编码模型,本文提出了一 个更通用的而且效率更高的鲁棒正则化编码模型。 1.1 鲁棒的正则化编码模型 T y α αˆ = argmaxlnP(α| y) 贝叶斯估计的观点确切地说是从最大后验概率 估计观点考虑人脸表示的问题。通过字典 对待测 表情图像 进行编码,编码向量 的最大后验概率估 计变成 。利用贝叶斯公式得 αˆ = argmax{lnP(y| α)+lnP(α)} (2) T T = [r1;r2;··· ;rn] ri T i e = y−Tα = [e1; e2;··· ; en] ei = yi − riα,i = 1,2,··· ,n ei fθ (ei) P(y| α) = ∏n i=1 fθ · (yi − riα) 将式 (1) 中的字典 改写成 ,其 中, 表示 的第 列,而且 , 其中, 。假设元素 是独立同 分布的,并且概率密度函数为 ,而且 。 α = [α1;α2;··· ;αm] αj , j = 1,2,··· ,m f0 ( αj ) P(α) = ∏m j=1 f0 ( αj ) α 与此同时,假设编码向量 中的 元素 是独立同分布的并且概率密度 函数为 ,而且 。从而式 (2) 中 的最大后验概率估计为 αˆ = argmax    ∏n i=1 fθ (yi − riα)+ ∏m j=1 f0 ( αj )    (3) ρθ (e) = −ln f 令 θ (e) 和 ρ0 (α) = −ln f0 (α) 式 (3) 转成: αˆ = argmin    ∑n i=1 ρθ (yi − riα)+ ∑m j=1 ρ0 ( αj )    (4) ρθ (yi − riα) P(α) ∑m j=1 ρ0 ( αj ) 本文把式 (4) 的模型称为鲁棒的正则编码,由 于保真项 对遮挡造成的异常值具有鲁棒 性,且根据先验概率 , 是正则化项。 ·262· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有