正在加载图片...
·280· 智能系统学报 第11卷 方法的研究取得了一定的进展,具有代表性的包括 便是SRC的工作原理。各步骤公式如下: 关于稀疏表示中字典学习的研究工作],稀硫表 SRC表示过程: 示的快速优化策略[0,和关于添加对表示系数的 a=arg min lly-Xal+入lai (1) 不同约束的工作-)。其中,Lei Zhang!14指出了在 SRC分类过程: 基于稀疏表示的分类方法中协同性机制的地位,并 identity argmin lly -X (2) 提出了使用更松弛的二范数来约束训练字典表示系 式中:X={X,X2,…,X,…,Xc}为训练样本(字 数的协同表示的分类方法。为了解决小样本情况下 典):X为第i类训练样本(字典)(i=1,2,…,C), 单类训练集字典对类内变化表达不充分的问题,文 其每一列对应该类的一个样本;y为测试样本;α= 献[1]创造性地将补偿字典引入了基于稀疏表示 {a1,a2,…,a,…,ac}为协同表示时各类对应的表 的人脸识别的方法中,在小样本的人脸识别问题中 示系数。 取得了一定的突破,但依然不能彻底分离训练集字 基于稀疏表示的分类方法能够有效利用人脸图 典中类内变化产生的干扰。 像的子空间特性,不需要大量样本进行分类器的学 传统的基于稀疏表示的方法本质上依然基于样 习,对噪声具有较好的鲁棒性。 本的灰度特征,利用稀疏线性表达来实现对类内变 基于稀疏表示的识别方法假设每类训练样本 化分量的分离。但对于实际问题,类内变化相对比 (字典)都必须是完备的,每类训练样本(字典)都有 较复杂,如姿态、表情、复杂的光照,简单依靠线性表 足够的表达能力。这一假设在具有较大干扰(如光 达很难将其分离出来。特别对于训练集字典极欠完 照、姿态、遮挡等)的小样本问题中一般是不成立 备的小样本问题,凭借有限的训练样本更难实现这 的。在小样本且具有较大干扰的人脸识别问题中, 一目标。为了解决这一问题,本文将人脸的灰度特 测试图片常常会被错分为具有相似类内变化的字典 征通过深度神经网络非线性映射到一个特征线性子 的类中,而不是具有相同外貌变化的类中。为了消 空间内,这一映射保留了样本分类相关的主要信息, 除小样本情况下类内变化的干扰,文献1s1]创造性 去除了类内变化信息的干扰,使得映射后的特征对 地将补偿字典引入了基于稀疏表示的人脸识别的方 类内变化具有不变性且更有可区分性。然后,将该 法中,在小样本的人脸识别问题中取得了一定的突 特征利用基于稀疏表示的分类方法进行表达和识 破,但依然不能彻底分离训练集字典中类内变化。 别。实验证明,本文方法在具有较大类内变化的小 1.2较大类内变化干扰下的小样本人脸识别问题 样本问题上效果尤其突出,且对于姿态、表情这类非 为了更好地分析子空间方法中类内变化带来的 线性叠加的类内变化具有更好的鲁棒性。 影响,Tang等[9提出了统一子空间的理论概念。统 本文提出了基于深度学习特征的稀疏表示的人 一子空间理论认为人脸图像由原型成分、类内变化 脸识别方法,将深度学习特征与稀疏表示相互结合, 成分和噪声成分线性组合而成。如式(3)和图1 充分发挥了深度学习在特征学习方面的优点和稀疏 所示。 表示在小样本识别上的优点。通过实验,在一定程 y=u+v +e (3) 度上说明了深度学习所得的特征具有线性子空间特 噪声子空间 性,并对深度学习所得特征进行了较为系统的分析。 人脸子空间 %5覆 1相关工作 酒 1.1基于稀疏表示的人脸识别方法 类内变化子空间 基于稀疏表示的分类方法(sparse representation 图图 based classification,SRC)I)假设人脸图像位于线性 原型子空间 面 t 子空间中,测试样本可以为所有类的训练样本(字 典)协同线性表达,而测试样本所属类别的字典可 以表示得更加稀疏(用较少的字典可以达到更好的 重构)。在对表示系数增加稀疏性的约束后,求解 图1统一人脸子空间示意 所得的稀疏表示系数中非零项应主要为测试样本所 Fig.1 The unified face subspace 属类别字典的对应项,因此便可以根据哪类字典可 式中:μ为与人脸相貌相关的原型成分,”为与人脸 以取得对测试样本更小的重构误差来进行分类,这 图像的类内变化成分(如光照、姿态、遮挡等),ε为方法的研究取得了一定的进展,具有代表性的包括 关于稀疏表示中字典学习的研究工作[5⁃7] ,稀疏表 示的快速优化策略[8⁃10] ,和关于添加对表示系数的 不同约束的工作[11⁃13] 。 其中,Lei Zhang [14]指出了在 基于稀疏表示的分类方法中协同性机制的地位,并 提出了使用更松弛的二范数来约束训练字典表示系 数的协同表示的分类方法。 为了解决小样本情况下 单类训练集字典对类内变化表达不充分的问题,文 献[15⁃18]创造性地将补偿字典引入了基于稀疏表示 的人脸识别的方法中,在小样本的人脸识别问题中 取得了一定的突破,但依然不能彻底分离训练集字 典中类内变化产生的干扰。 传统的基于稀疏表示的方法本质上依然基于样 本的灰度特征,利用稀疏线性表达来实现对类内变 化分量的分离。 但对于实际问题,类内变化相对比 较复杂,如姿态、表情、复杂的光照,简单依靠线性表 达很难将其分离出来。 特别对于训练集字典极欠完 备的小样本问题,凭借有限的训练样本更难实现这 一目标。 为了解决这一问题,本文将人脸的灰度特 征通过深度神经网络非线性映射到一个特征线性子 空间内,这一映射保留了样本分类相关的主要信息, 去除了类内变化信息的干扰,使得映射后的特征对 类内变化具有不变性且更有可区分性。 然后,将该 特征利用基于稀疏表示的分类方法进行表达和识 别。 实验证明,本文方法在具有较大类内变化的小 样本问题上效果尤其突出,且对于姿态、表情这类非 线性叠加的类内变化具有更好的鲁棒性。 本文提出了基于深度学习特征的稀疏表示的人 脸识别方法,将深度学习特征与稀疏表示相互结合, 充分发挥了深度学习在特征学习方面的优点和稀疏 表示在小样本识别上的优点。 通过实验,在一定程 度上说明了深度学习所得的特征具有线性子空间特 性,并对深度学习所得特征进行了较为系统的分析。 1 相关工作 1.1 基于稀疏表示的人脸识别方法 基于稀疏表示的分类方法(sparse representation based classification, SRC) [4]假设人脸图像位于线性 子空间中,测试样本可以为所有类的训练样本(字 典)协同线性表达,而测试样本所属类别的字典可 以表示得更加稀疏(用较少的字典可以达到更好的 重构)。 在对表示系数增加稀疏性的约束后,求解 所得的稀疏表示系数中非零项应主要为测试样本所 属类别字典的对应项,因此便可以根据哪类字典可 以取得对测试样本更小的重构误差来进行分类,这 便是 SRC 的工作原理。 各步骤公式如下: SRC 表示过程: α^ = arg min α y - Xα 2 2 + λ α 1 (1) SRC 分类过程: identity = argmin i y - Xi α^ i 2 2 (2) 式中: X = X1 ,X2 ,…,XI,…,XC { } 为训练样本( 字 典);Xi 为第 i 类训练样本(字典) (i = 1,2,…,C) , 其每一列对应该类的一个样本;y 为测试样本;α = {α1 ,α2 ,…,αi,…,αC } 为协同表示时各类对应的表 示系数。 基于稀疏表示的分类方法能够有效利用人脸图 像的子空间特性,不需要大量样本进行分类器的学 习,对噪声具有较好的鲁棒性。 基于稀疏表示的识别方法假设每类训练样本 (字典)都必须是完备的,每类训练样本(字典)都有 足够的表达能力。 这一假设在具有较大干扰(如光 照、姿态、遮挡等) 的小样本问题中一般是不成立 的。 在小样本且具有较大干扰的人脸识别问题中, 测试图片常常会被错分为具有相似类内变化的字典 的类中,而不是具有相同外貌变化的类中。 为了消 除小样本情况下类内变化的干扰,文献[15⁃18] 创造性 地将补偿字典引入了基于稀疏表示的人脸识别的方 法中,在小样本的人脸识别问题中取得了一定的突 破,但依然不能彻底分离训练集字典中类内变化。 1.2 较大类内变化干扰下的小样本人脸识别问题 为了更好地分析子空间方法中类内变化带来的 影响,Tang 等[19]提出了统一子空间的理论概念。 统 一子空间理论认为人脸图像由原型成分、类内变化 成分和噪声成分线性组合而成。 如式( 3) 和图 1 所示。 y = μ + ν + ε (3) 图 1 统一人脸子空间示意 Fig.1 The unified face subspace 式中:μ 为与人脸相貌相关的原型成分,ν 为与人脸 图像的类内变化成分(如光照、姿态、遮挡等),ε 为 ·280· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有