第2期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·219· 于稀疏表示的图像识别训练简单、对噪声有强鲁 合字典学习方法在人脸识别方面表现良好,然 棒性,逐渐应用在社会安全、经济工程等领域。 而,在对于噪声、异常值和遮挡等干扰情况时处 字典学习的目的是通过训练样本图片,习 理能力较差。 得可以表示给定信号的字典和编码,共分为有 除上述问题以外,由于样本数量受限,传统字 监督和无监督两种情况。经典的无监督字典学 典学习习得的字典鲁棒性差,不能完全表示数据 习如KSVD算法,可以有效解决高维矩阵求解 组成的共性、特殊性、干扰性。针对此种情况,本 问题,广泛应用于图像重建及图像压缩领域。 文提出一种新的稀疏综合字典学习的小样本人脸 而有监督字典学习多应用于图像识别领域,如 识别模型(SCDL)。SCDL模型包括混合特色字 人脸识别、表情识别等。根据字典原子和训练 典、扩充干扰字典以及低秩字典3项。将类共享 标签之间的相关性,有监督字典学习可分为类 字典与类别特色字典以及Fisher准则整合至混合 共享字典学习、类别特色字典学习、混合字典学 特色字典模型中,在提取不同数据特殊性的同时 习3类。 捕捉数据之间的共性,利用扩充干扰字典和低秩 类共享字典学习如文献[5-7]等,字典和稀疏 字典增强模型对异常情况(如遮挡、噪声等)的处 编码由所有训练样本共同构造,单个字典原子可 理能力。最后,本文针对模型提出一种新的分类 表示全体数据类别。Zhang等8以KSVD算法为 策略,并在受限AR人脸数据库、YaleB人脸数据 基础,在保证字典识别能力的基础上引入分类误 库和非受限LFW人脸数据库进行实验,结果表明 差,提高线性分类器的分类能力。Jiang等9在其 本文算法不仅可以取得较高分类率,并且在面对 基础上,增加标签一致性术语,提出标签一致性 遮挡、噪声等异常情况时较其余算法有更好的识 KSVD(LCKSVD)算法。Mairal等o提出了任务 别力和鲁棒性。 驱动的字典学习框架。类共享字典在保留表示数 据共性的同时丢失字典原子和类标签之间的关 1相关工作 系,忽视了类别之间的差异性。 设定训练数据集A: 类别特色字典学习如文献[11-13]等,每个字 A={A1,A2,…,Ax}∈Rmw 典原子对应一类标签信息,通过类特定误差进行 测试数据集合Y: 分类。Wright等a提出基于稀疏表示的分类框 Y=(Y,Y,…,Yx}ERxN (sparse representation based classification,SRC), 式中:A的每列表示一个m维向量;A:∈Rmm为第 自此,类别特色字典广泛应用于人脸分类器设计 K 中。Sprechmann等为每一类分别学习稀疏表 i类训练数据:N=∑m为训练数据集样本总数;y 示字典,Ramirez等u提出了一种结构非相干字 表示单个测试样本。 典学习模型,通过最小化字典的相干项来提高字 1.1扩展稀疏表示 典的学习效率。Yang等m提出了Fisher判别字 稀疏表示(SRC)针对测试集Y,以学习合适 典学习(fisher discrimination dictionary learning, 的字典D为手段,寻找能表达Y的稀疏编码X, FDDL),其中表示残差和表示系数都实现了判别 ESRC算法在此基础上另学习一个类内差异字典 信息。2018年,Wang等1结合字典学习和局部 表示训练集A和测试集Y之间的变化,算法模型 约束思想,提出FDDLLCSRC方法。同年,Li等例 如下: 在FDDL基础上提出IKCFDDL算法,在字典学习 基础上增添K均值聚类思想,提升算法运行 -a&8l 效率。 E$RC模型分为重构误差项与正则项两部 混合字典即结合类共享字典与类别特色字 分,正则化参数>0。稀疏编码a,b的快速求解 典。Deng等o提出了基于扩展稀疏表示的分类 可参考贪婪算法(如压缩感知匹配追踪2)、稀疏 (extended SRC:undersampled face recognition 自适应匹配追踪或凸松弛算法(如最小绝对值 via intraclass variant dictionary,ESRC),在学习类别 收缩选择算法阿、最小角度回归算法。 特色字典的同时构造类内差异字典,即共享字 1.2 类别特色字典学习 典。受ESRC算法启发,2015年Li等2提出SC 类别字典学习为每类数据单独学习一个子字 SDL算法,2017年提出CSICVDL算法四,提取不 典,即习得的字典D={D,D2,…,Dx}由K个子字 同类别样本中数据共性提升字典辨别力。这些混 典组成,算法模型如下:于稀疏表示的图像识别训练简单、对噪声有强鲁 棒性,逐渐应用在社会安全、经济工程等领域。 字典学习的目的是通过训练样本图片,习 得可以表示给定信号的字典和编码,共分为有 监督和无监督两种情况。经典的无监督字典学 习如 KSVD[4] 算法,可以有效解决高维矩阵求解 问题,广泛应用于图像重建及图像压缩领域。 而有监督字典学习多应用于图像识别领域,如 人脸识别、表情识别等。根据字典原子和训练 标签之间的相关性,有监督字典学习可分为类 共享字典学习、类别特色字典学习、混合字典学 习 3 类。 类共享字典学习如文献 [5-7] 等,字典和稀疏 编码由所有训练样本共同构造,单个字典原子可 表示全体数据类别。Zhang 等 [8] 以 KSVD 算法为 基础,在保证字典识别能力的基础上引入分类误 差,提高线性分类器的分类能力。Jiang 等 [9] 在其 基础上,增加标签一致性术语,提出标签一致性 KSVD (LCKSVD) 算法。Mairal 等 [10] 提出了任务 驱动的字典学习框架。类共享字典在保留表示数 据共性的同时丢失字典原子和类标签之间的关 系,忽视了类别之间的差异性。 类别特色字典学习如文献 [11-13] 等,每个字 典原子对应一类标签信息,通过类特定误差进行 分类。Wright 等 [14] 提出基于稀疏表示的分类框 架 (sparse representation based classification,SRC), 自此,类别特色字典广泛应用于人脸分类器设计 中。Sprechmann 等 [15] 为每一类分别学习稀疏表 示字典,Ramirez 等 [16] 提出了一种结构非相干字 典学习模型,通过最小化字典的相干项来提高字 典的学习效率。Yang 等 [17] 提出了 Fisher 判别字 典学习 (fisher discrimination dictionary learning, FDDL),其中表示残差和表示系数都实现了判别 信息。2018 年,Wang 等 [18] 结合字典学习和局部 约束思想,提出 FDDLLCSRC 方法。同年,Li 等 [19] 在 FDDL 基础上提出 IKCFDDL 算法,在字典学习 基础上增 添 K 均值聚类思想,提升算法运行 效率。 混合字典即结合类共享字典与类别特色字 典。Deng 等 [20] 提出了基于扩展稀疏表示的分类 方法 (extended SRC: undersampled face recognition via intraclass variant dictionary,ESRC),在学习类别 特色字典的同时构造类内差异字典,即共享字 典。受 ESRC 算法启发,2015 年 Li 等 [21] 提出 SCSDL 算法,2017 年提出 CSICVDL 算法[22] ,提取不 同类别样本中数据共性提升字典辨别力。这些混 合字典学习方法在人脸识别方面表现良好,然 而,在对于噪声、异常值和遮挡等干扰情况时处 理能力较差。 除上述问题以外,由于样本数量受限,传统字 典学习习得的字典鲁棒性差,不能完全表示数据 组成的共性、特殊性、干扰性。针对此种情况,本 文提出一种新的稀疏综合字典学习的小样本人脸 识别模型 (SCDL)。SCDL 模型包括混合特色字 典、扩充干扰字典以及低秩字典 3 项。将类共享 字典与类别特色字典以及 Fisher 准则整合至混合 特色字典模型中,在提取不同数据特殊性的同时 捕捉数据之间的共性,利用扩充干扰字典和低秩 字典增强模型对异常情况 (如遮挡、噪声等) 的处 理能力。最后,本文针对模型提出一种新的分类 策略,并在受限 AR 人脸数据库、YaleB 人脸数据 库和非受限 LFW 人脸数据库进行实验,结果表明 本文算法不仅可以取得较高分类率,并且在面对 遮挡、噪声等异常情况时较其余算法有更好的识 别力和鲁棒性。 1 相关工作 设定训练数据集 A: A = {A1 ,A2 ,··· ,AK} ∈ R m×N 测试数据集合 Y: Y = {Y1 ,Y2 ,··· ,YK} ∈ R m×N1 A m Ai ∈ R m×ni i N = ∑K i=1 ni y 式中: 的每列表示一个 维向量; 为第 类训练数据; 为训练数据集样本总数; 表示单个测试样本。 1.1 扩展稀疏表示 Y D Y X A Y 稀疏表示 (SRC) 针对测试集 ,以学习合适 的字典 为手段,寻找能表达 的稀疏编码 , ESRC 算法在此基础上另学习一个类内差异字典 表示训练集 和测试集 之间的变化,算法模型 如下: [ aˆ bˆ ] =argmin a,b y−[A,D] [ a b ] 2 2 +λ [ a b ] 1 λ > 0 a,b ESRC 模型分为重构误差项与正则项两部 分,正则化参数 。稀疏编码 的快速求解 可参考贪婪算法 (如压缩感知匹配追踪[23] 、稀疏 自适应匹配追踪[24] ) 或凸松弛算法 (如最小绝对值 收缩选择算法[25] 、最小角度回归算法[26] )。 1.2 类别特色字典学习 D = {D1,D2,··· ,DK} K 类别字典学习为每类数据单独学习一个子字 典,即习得的字典 由 个子字 典组成,算法模型如下: 第 2 期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·219·