第16卷第2期 智能系统学报 Vol.16 No.2 2021年3月 CAAI Transactions on Intelligent Systems Mar.2021 D0:10.11992/tis.201910028 网络出版地址:https:/ns.cnki.net/kcms/detail/23.1538.TP.20200728.1555.008.html 稀疏综合字典学习的小样本人脸识别 狄岚2,矫慧文',梁久祯3 (1.江南大学人工智能与计算机学院,江苏无锡214122:2.道路交通安全公安部重点实验室,江苏无锡 214151:3.常州大学信息科学与工程学院,江苏常州213164) 摘要:传统以字典学习为基础的小样本人脸识别方法存在字典低辨别性、弱鲁棒性等缺点,对此,本文提出 稀疏综合字典学习模型。该模型有效利用和生成人脸变化,以镜像原理及Fisher准则扩充训练样本多样性,通 过构造混合特色字典、扩充干扰字典以及低秩字典原子,提取不同类别数据之间的共性、特殊性和异常情况, 从而提高算法识别率以及对表情变化、姿态变化、遮挡等异常情况的处理能力。在AR、YALEB、LFW等人脸 数据库进行仿真实验,实验结果验证了算法的有效性和可行性。 关键词:综合字典学习;人脸识别:类别特色字典;Fisher准则;小样本;图像扩充;镜像准则:扩充干扰字典;混 合特色字典;低秩字典 中图分类号:TP394文献标志码:A文章编号:1673-4785(2021)02-0218-10 中文引用格式:狄岚,矫慧文,梁久桢.稀疏综合字典学习的小样本人脸识别J.智能系统学报,2021,16(2):218-227. 英文引用格式:DI Lan,JIAO Huiwen,LIANG Jiuzhen..Sparse comprehensive dictionary learning for small--sample face recogni-- tionJI.CAAI transactions on intelligent systems,2021,16(2):218-227. Sparse comprehensive dictionary learning for small-sample face recognition DI Lan'2,JIAO Huiwen',LIANG Jiuzhen (1.School of Artificial Intelligence and Computer Science,Jiangnan University,Wuxi 214122,China;2.Laboratory of Ministry of Public Security for Road Traffic Safety,Wuxi 214151,China;3.School of Information Science and Engineering,Changzhou Uni- versity,Changzhou 213164,China) Abstract:Traditional small-sample face recognition methods based on dictionary learning have disadvantages such as poor dictionary discrimination and lack of robustness.In this paper,we propose a sparse comprehensive dictionary learning model.This model effectively utilizes and generates facial changes,expands the diversity of training samples by the mirror principle and Fisher's criterion,and extracts the commonalities,specialties,and anomalies between differ- ent categories of data by constructing a hybrid feature dictionary,extended interference dictionary,and low-rank diction- ary atoms.This strategy improves the recognition rate of the algorithm and its ability to handle abnormal situations such as expression changes,pose changes,and occlusions.The results of simulation experiments performed on the face data- bases AR,YALEB,and LFW verify the effectiveness and feasibility of the proposed algorithm. Keywords:comprehensive dictionary learning;face recognition;class-specific dictionary learning;Fisher discrimina- tion criterion;small sample;image expansion;mirror principle;extended interference dictionary;hybrid feature diction- ary:low-rank dictionary 近年来,深度学习进入蓬勃发展时代,以深度 收稿日期:2019-10-23.网络出版日期:2020-07-28. 基金项目:江苏省研究生科研与实践创新计划项目 学习为基础的图像识别)虽然识别准确率高,但 (KYCX19_1895,道路交通安全公安部重点实验室开 往往对硬件设备要求严格,具有训练时间长达数 放课题(2020 ZDSYSKFKT03-2,A类). 通信作者:狄岚.E-mail:dilan(@jiangnan.edu.cn. 周、样本量需求过大等不足之处。与之相比,基
DOI: 10.11992/tis.201910028 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20200728.1555.008.html 稀疏综合字典学习的小样本人脸识别 狄岚1,2,矫慧文1 ,梁久祯3 (1. 江南大学 人工智能与计算机学院,江苏 无锡 214122; 2. 道路交通安全公安部重点实验室,江苏 无锡 214151; 3. 常州大学 信息科学与工程学院,江苏 常州 213164) 摘 要:传统以字典学习为基础的小样本人脸识别方法存在字典低辨别性、弱鲁棒性等缺点,对此,本文提出 稀疏综合字典学习模型。该模型有效利用和生成人脸变化,以镜像原理及 Fisher 准则扩充训练样本多样性,通 过构造混合特色字典、扩充干扰字典以及低秩字典原子,提取不同类别数据之间的共性、特殊性和异常情况, 从而提高算法识别率以及对表情变化、姿态变化、遮挡等异常情况的处理能力。在 AR、YALEB、LFW 等人脸 数据库进行仿真实验,实验结果验证了算法的有效性和可行性。 关键词:综合字典学习;人脸识别;类别特色字典;Fisher 准则;小样本;图像扩充;镜像准则;扩充干扰字典;混 合特色字典;低秩字典 中图分类号:TP394 文献标志码:A 文章编号:1673−4785(2021)02−0218−10 中文引用格式:狄岚, 矫慧文, 梁久祯. 稀疏综合字典学习的小样本人脸识别 [J]. 智能系统学报, 2021, 16(2): 218–227. 英文引用格式:DI Lan, JIAO Huiwen, LIANG Jiuzhen. Sparse comprehensive dictionary learning for small-sample face recognition[J]. CAAI transactions on intelligent systems, 2021, 16(2): 218–227. Sparse comprehensive dictionary learning for small-sample face recognition DI Lan1,2 ,JIAO Huiwen1 ,LIANG Jiuzhen3 (1. School of Artificial Intelligence and Computer Science, Jiangnan University, Wuxi 214122, China; 2. Laboratory of Ministry of Public Security for Road Traffic Safety, Wuxi 214151, China; 3. School of Information Science and Engineering, Changzhou University, Changzhou 213164, China) Abstract: Traditional small-sample face recognition methods based on dictionary learning have disadvantages such as poor dictionary discrimination and lack of robustness. In this paper, we propose a sparse comprehensive dictionary learning model. This model effectively utilizes and generates facial changes, expands the diversity of training samples by the mirror principle and Fisher's criterion, and extracts the commonalities, specialties, and anomalies between different categories of data by constructing a hybrid feature dictionary, extended interference dictionary, and low-rank dictionary atoms. This strategy improves the recognition rate of the algorithm and its ability to handle abnormal situations such as expression changes, pose changes, and occlusions. The results of simulation experiments performed on the face databases AR, YALEB, and LFW verify the effectiveness and feasibility of the proposed algorithm. Keywords: comprehensive dictionary learning; face recognition; class-specific dictionary learning; Fisher discrimination criterion; small sample; image expansion; mirror principle; extended interference dictionary; hybrid feature dictionary; low-rank dictionary 近年来,深度学习进入蓬勃发展时代,以深度 学习为基础的图像识别[1-3] 虽然识别准确率高,但 往往对硬件设备要求严格,具有训练时间长达数 周、样本量需求过大等不足之处。与之相比,基 收稿日期:2019−10−23. 网络出版日期:2020−07−28. 基金项目:江苏省研究生科研与实践创新计划项 目 (KYCX19_1895); 道路交通安全公安部重点实验室开 放课题 (2020ZDSYSKFKT03-2, A 类). 通信作者:狄岚. E-mail: dilan@jiangnan.edu.cn. 第 16 卷第 2 期 智 能 系 统 学 报 Vol.16 No.2 2021 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2021
第2期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·219· 于稀疏表示的图像识别训练简单、对噪声有强鲁 合字典学习方法在人脸识别方面表现良好,然 棒性,逐渐应用在社会安全、经济工程等领域。 而,在对于噪声、异常值和遮挡等干扰情况时处 字典学习的目的是通过训练样本图片,习 理能力较差。 得可以表示给定信号的字典和编码,共分为有 除上述问题以外,由于样本数量受限,传统字 监督和无监督两种情况。经典的无监督字典学 典学习习得的字典鲁棒性差,不能完全表示数据 习如KSVD算法,可以有效解决高维矩阵求解 组成的共性、特殊性、干扰性。针对此种情况,本 问题,广泛应用于图像重建及图像压缩领域。 文提出一种新的稀疏综合字典学习的小样本人脸 而有监督字典学习多应用于图像识别领域,如 识别模型(SCDL)。SCDL模型包括混合特色字 人脸识别、表情识别等。根据字典原子和训练 典、扩充干扰字典以及低秩字典3项。将类共享 标签之间的相关性,有监督字典学习可分为类 字典与类别特色字典以及Fisher准则整合至混合 共享字典学习、类别特色字典学习、混合字典学 特色字典模型中,在提取不同数据特殊性的同时 习3类。 捕捉数据之间的共性,利用扩充干扰字典和低秩 类共享字典学习如文献[5-7]等,字典和稀疏 字典增强模型对异常情况(如遮挡、噪声等)的处 编码由所有训练样本共同构造,单个字典原子可 理能力。最后,本文针对模型提出一种新的分类 表示全体数据类别。Zhang等8以KSVD算法为 策略,并在受限AR人脸数据库、YaleB人脸数据 基础,在保证字典识别能力的基础上引入分类误 库和非受限LFW人脸数据库进行实验,结果表明 差,提高线性分类器的分类能力。Jiang等9在其 本文算法不仅可以取得较高分类率,并且在面对 基础上,增加标签一致性术语,提出标签一致性 遮挡、噪声等异常情况时较其余算法有更好的识 KSVD(LCKSVD)算法。Mairal等o提出了任务 别力和鲁棒性。 驱动的字典学习框架。类共享字典在保留表示数 据共性的同时丢失字典原子和类标签之间的关 1相关工作 系,忽视了类别之间的差异性。 设定训练数据集A: 类别特色字典学习如文献[11-13]等,每个字 A={A1,A2,…,Ax}∈Rmw 典原子对应一类标签信息,通过类特定误差进行 测试数据集合Y: 分类。Wright等a提出基于稀疏表示的分类框 Y=(Y,Y,…,Yx}ERxN (sparse representation based classification,SRC), 式中:A的每列表示一个m维向量;A:∈Rmm为第 自此,类别特色字典广泛应用于人脸分类器设计 K 中。Sprechmann等为每一类分别学习稀疏表 i类训练数据:N=∑m为训练数据集样本总数;y 示字典,Ramirez等u提出了一种结构非相干字 表示单个测试样本。 典学习模型,通过最小化字典的相干项来提高字 1.1扩展稀疏表示 典的学习效率。Yang等m提出了Fisher判别字 稀疏表示(SRC)针对测试集Y,以学习合适 典学习(fisher discrimination dictionary learning, 的字典D为手段,寻找能表达Y的稀疏编码X, FDDL),其中表示残差和表示系数都实现了判别 ESRC算法在此基础上另学习一个类内差异字典 信息。2018年,Wang等1结合字典学习和局部 表示训练集A和测试集Y之间的变化,算法模型 约束思想,提出FDDLLCSRC方法。同年,Li等例 如下: 在FDDL基础上提出IKCFDDL算法,在字典学习 基础上增添K均值聚类思想,提升算法运行 -a&8l 效率。 E$RC模型分为重构误差项与正则项两部 混合字典即结合类共享字典与类别特色字 分,正则化参数>0。稀疏编码a,b的快速求解 典。Deng等o提出了基于扩展稀疏表示的分类 可参考贪婪算法(如压缩感知匹配追踪2)、稀疏 (extended SRC:undersampled face recognition 自适应匹配追踪或凸松弛算法(如最小绝对值 via intraclass variant dictionary,ESRC),在学习类别 收缩选择算法阿、最小角度回归算法。 特色字典的同时构造类内差异字典,即共享字 1.2 类别特色字典学习 典。受ESRC算法启发,2015年Li等2提出SC 类别字典学习为每类数据单独学习一个子字 SDL算法,2017年提出CSICVDL算法四,提取不 典,即习得的字典D={D,D2,…,Dx}由K个子字 同类别样本中数据共性提升字典辨别力。这些混 典组成,算法模型如下:
于稀疏表示的图像识别训练简单、对噪声有强鲁 棒性,逐渐应用在社会安全、经济工程等领域。 字典学习的目的是通过训练样本图片,习 得可以表示给定信号的字典和编码,共分为有 监督和无监督两种情况。经典的无监督字典学 习如 KSVD[4] 算法,可以有效解决高维矩阵求解 问题,广泛应用于图像重建及图像压缩领域。 而有监督字典学习多应用于图像识别领域,如 人脸识别、表情识别等。根据字典原子和训练 标签之间的相关性,有监督字典学习可分为类 共享字典学习、类别特色字典学习、混合字典学 习 3 类。 类共享字典学习如文献 [5-7] 等,字典和稀疏 编码由所有训练样本共同构造,单个字典原子可 表示全体数据类别。Zhang 等 [8] 以 KSVD 算法为 基础,在保证字典识别能力的基础上引入分类误 差,提高线性分类器的分类能力。Jiang 等 [9] 在其 基础上,增加标签一致性术语,提出标签一致性 KSVD (LCKSVD) 算法。Mairal 等 [10] 提出了任务 驱动的字典学习框架。类共享字典在保留表示数 据共性的同时丢失字典原子和类标签之间的关 系,忽视了类别之间的差异性。 类别特色字典学习如文献 [11-13] 等,每个字 典原子对应一类标签信息,通过类特定误差进行 分类。Wright 等 [14] 提出基于稀疏表示的分类框 架 (sparse representation based classification,SRC), 自此,类别特色字典广泛应用于人脸分类器设计 中。Sprechmann 等 [15] 为每一类分别学习稀疏表 示字典,Ramirez 等 [16] 提出了一种结构非相干字 典学习模型,通过最小化字典的相干项来提高字 典的学习效率。Yang 等 [17] 提出了 Fisher 判别字 典学习 (fisher discrimination dictionary learning, FDDL),其中表示残差和表示系数都实现了判别 信息。2018 年,Wang 等 [18] 结合字典学习和局部 约束思想,提出 FDDLLCSRC 方法。同年,Li 等 [19] 在 FDDL 基础上提出 IKCFDDL 算法,在字典学习 基础上增 添 K 均值聚类思想,提升算法运行 效率。 混合字典即结合类共享字典与类别特色字 典。Deng 等 [20] 提出了基于扩展稀疏表示的分类 方法 (extended SRC: undersampled face recognition via intraclass variant dictionary,ESRC),在学习类别 特色字典的同时构造类内差异字典,即共享字 典。受 ESRC 算法启发,2015 年 Li 等 [21] 提出 SCSDL 算法,2017 年提出 CSICVDL 算法[22] ,提取不 同类别样本中数据共性提升字典辨别力。这些混 合字典学习方法在人脸识别方面表现良好,然 而,在对于噪声、异常值和遮挡等干扰情况时处 理能力较差。 除上述问题以外,由于样本数量受限,传统字 典学习习得的字典鲁棒性差,不能完全表示数据 组成的共性、特殊性、干扰性。针对此种情况,本 文提出一种新的稀疏综合字典学习的小样本人脸 识别模型 (SCDL)。SCDL 模型包括混合特色字 典、扩充干扰字典以及低秩字典 3 项。将类共享 字典与类别特色字典以及 Fisher 准则整合至混合 特色字典模型中,在提取不同数据特殊性的同时 捕捉数据之间的共性,利用扩充干扰字典和低秩 字典增强模型对异常情况 (如遮挡、噪声等) 的处 理能力。最后,本文针对模型提出一种新的分类 策略,并在受限 AR 人脸数据库、YaleB 人脸数据 库和非受限 LFW 人脸数据库进行实验,结果表明 本文算法不仅可以取得较高分类率,并且在面对 遮挡、噪声等异常情况时较其余算法有更好的识 别力和鲁棒性。 1 相关工作 设定训练数据集 A: A = {A1 ,A2 ,··· ,AK} ∈ R m×N 测试数据集合 Y: Y = {Y1 ,Y2 ,··· ,YK} ∈ R m×N1 A m Ai ∈ R m×ni i N = ∑K i=1 ni y 式中: 的每列表示一个 维向量; 为第 类训练数据; 为训练数据集样本总数; 表示单个测试样本。 1.1 扩展稀疏表示 Y D Y X A Y 稀疏表示 (SRC) 针对测试集 ,以学习合适 的字典 为手段,寻找能表达 的稀疏编码 , ESRC 算法在此基础上另学习一个类内差异字典 表示训练集 和测试集 之间的变化,算法模型 如下: [ aˆ bˆ ] =argmin a,b y−[A,D] [ a b ] 2 2 +λ [ a b ] 1 λ > 0 a,b ESRC 模型分为重构误差项与正则项两部 分,正则化参数 。稀疏编码 的快速求解 可参考贪婪算法 (如压缩感知匹配追踪[23] 、稀疏 自适应匹配追踪[24] ) 或凸松弛算法 (如最小绝对值 收缩选择算法[25] 、最小角度回归算法[26] )。 1.2 类别特色字典学习 D = {D1,D2,··· ,DK} K 类别字典学习为每类数据单独学习一个子字 典,即习得的字典 由 个子字 典组成,算法模型如下: 第 2 期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·219·
·220· 智能系统学报 第16卷 lA:-D,X+Xs.ta儿=l, 数项3部分,其中,>0为正则项参数,2>0为 对于单个测试样本y,求得的稀疏系数为 判别系数项参数。下面依次论述模型每一项原理。 x=,x2,…,xx。其中,D:表示第i类训练样本的 g(A',D,B)表示重构误差项,该项保证字典 的识别力,公式表示为 子字典,由D,重构得到,重构误差为e,= lb心-Dxl2o 8(A',Do.B)=MA-DoBf+lA:-DuBill l.3 Fisher判别准则 式中:B:是A被D。重构的稀疏编码;B是A被 Fisher判别准则以投影思想为核心,目的是 D:重构的稀疏编码:A':-DbB:表示整体字典 使同类样本尽可能集中的同时,异类样本尽可能 针对A;的重构误差;A:-DmB,表示该类字典 疏散。 针对A单独重构误差。 假定为稀疏编码X的中心,4:表示各类稀 为了提高编码识别力,增添编码约束项 疏编码均值向量: r(Sw(B)-Ss(B),将Fisher准则整合到编码约束 项,扩大类间距,减小类内距,进而增强辨别性。 := 为了确保子字典不连贯,提高空间多样性,增添 可定义类内散度矩阵S(X)、类间散度矩阵 字典约束项‖DDr。其中, S(X): Db-=[Db1D2·Dbi-1D+i·Dbk] 表示字典中除了D项之外剩余集合。 sw=∑∑s-u-u) 最终,f(B,D)公式如下: f(B.D.)=tr(Sw(B)-Sw(B))+DwDw- Sa=∑n:(u:-o)u-o) 式中:B引,表示稀疏保证项,确保编码的稀疏项。 目标函数(1)的完整形式为 2稀疏综合字典学习的小样本人脸 J(arg in (A-D.B+A-D 识别算法 (t(Sw(B)-S,(B))+DD) 稀疏综合字典学习分类方法包括训练和测试 2.1.2扩充千扰字典优化 两大步骤,分为扩充干扰字典、混合特色字典、低 式(1)为非凸函数,其优化过程如下所示: 秩字典三大部分,采用分步优化方法求解,充分 1)初始化字典D 提取数据之间的共性、特殊性、干扰性。 将字典原子初始化为训练数据A'={A, 2.1扩充干扰特色字典 A·,Ax}的特征向量,对字典D。的每一类归一 2.11扩充千扰字典模型 化,使其2范数为1。 对于一张图片a,以图片中线为轴,如图1所 2)保证字典D。固定,更新稀疏编码B。 示,分别得出左镜像图片a、右镜像图片2、全镜 目标函数转化为 像图片a0 Q(B)=arg min((A'i,Do,B)+2yllBl)(2) 使用文献[27]中的方法求解稀疏编码B,∈ Rxm,y=/2。 0(A'i,Dh,B:)=llA':-DoBillig+ (a)训练样本(b)右镜像(c)左镜像(d)全镜像 ‖A'-DB,+2f(B,D) 图1镜像图片 3)保证稀疏编码B固定,更新字典D。 Fig.1 Mirror image 本文逐个更新D。中的子字典,即当更新第j 以a为例,对于训练集A,求出左镜像集A1, 个子字典时,保证其他子字典D(i≠)不动,默认 右镜像集A2,全镜像集A3,以Fisher准则为基础, 更新完成。 分别计算出3个集合的类间散布系数与类内散布 目标函数可转化为 系数之比作为权重w=w1,w2,w] Dw=argminA-DX+AD+DD 集合A'=w1A1+w2A2+w3A3。以A'为训练 s.t.IDi (:,j)ll =1,Vi.j 集,提出扩充干扰字典模型如下: Jo=agmi的8A,De:B)+九B+df(B,D。》(( 其中A=A-∑D,B以,B是所有数据A由字典 =1 模型分为重构误差项、稀疏保证项和判别系 D,表示的稀疏编码,因此Q(D)可转换为
min {Di,Xi} { ∥Ai − DiXi∥ 2 F +λ∥Xi∥1 } s.t. dj 2 = 1,∀ j y x = {x1, x2,··· , xK} Di i xi Di ei = ∥y− Dixi∥2 对于单个测试样本 ,求得的稀疏系数为 。其中, 表示第 类训练样本的 子字典, 由 重构得到,重构误差为 。 1.3 Fisher 判别准则 Fisher 判别准则以投影思想为核心,目的是 使同类样本尽可能集中的同时,异类样本尽可能 疏散。 假定 u0 为稀疏编码 X 的中心, ui 表示各类稀 疏编码均值向量: ui = 1 ni ∑ xk∈Xi xk Sw (X) SB (X) 可定义类内散度矩阵 、类间散度矩阵 : SW = ∑K i=1 ∑ xk∈Xi (xk −ui)(xk −ui) T SB = ∑K i=1 ni(ui −u0)(ui −u0) T 2 稀疏综合字典学习的小样本人脸 识别算法 稀疏综合字典学习分类方法包括训练和测试 两大步骤,分为扩充干扰字典、混合特色字典、低 秩字典三大部分,采用分步优化方法求解,充分 提取数据之间的共性、特殊性、干扰性。 2.1 扩充干扰特色字典 2.1.1 扩充干扰字典模型 a a1 a2 a3 对于一张图片 ,以图片中线为轴,如图 1 所 示,分别得出左镜像图片 、右镜像图片 、全镜 像图片 。 (a) 训练样本 (b) 右镜像 (c) 左镜像 (d) 全镜像 图 1 镜像图片 Fig. 1 Mirror image a A A1 A2 A3 w= [w1,w2,w3] 以 为例,对于训练集 ,求出左镜像集 , 右镜像集 ,全镜像集 ,以 Fisher 准则为基础, 分别计算出 3 个集合的类间散布系数与类内散布 系数之比作为权重 。 A ′ = w1A1 +w2A2+w3A3 A 集 合 。 以 ′ 为训练 集,提出扩充干扰字典模型如下: J(Db,B) =arg min (Db,B) {g(A ′ , Db ,B)+λ1∥B∥1+λ2 f (B, Db)} (1) 模型分为重构误差项、稀疏保证项和判别系 数项 3 部分,其中, λ1 > 0 为正则项参数, λ2 > 0 为 判别系数项参数。下面依次论述模型每一项原理。 g(A ′ , Db,B) 表示重构误差项,该项保证字典 的识别力,公式表示为 g(A ′ , Db,B) = ∥A ′ i − DbBi∥ 2 F + A ′ i − DbiBi i 2 F Bi A ′ i Db Bi i A ′ i Dbi ∥A ′ i − DbBi∥ 2 F A ′ i A ′ i − DbiBi i 2 F A ′ i 式中: 是 被 重构的稀疏编码; 是 被 重构的稀疏编码; 表示整体字典 针对 的重构误差; 表示该类字典 针对 单独重构误差。 tr(SW (B)−SB(B)) D T bi Dbi− 2 F 为了提高编码识别力,增添编码约束项 ,将 Fisher 准则整合到编码约束 项,扩大类间距,减小类内距,进而增强辨别性。 为了确保子字典不连贯,提高空间多样性,增添 字典约束项 。其中, Dbi− = [Db1 Db2 ··· Dbi−1 Dbi+1 ··· DbK] 表示字典中除了 Dbi 项之外剩余集合。 最终, f (B, Db) 公式如下: f (B, Db) = tr(SW (B)−SB(B))+ Dbi T Dbi− 2 F 式中: ∥B∥1 表示稀疏保证项,确保编码的稀疏项。 目标函数 (1) 的完整形式为 J(Db ,B) =arg min (Db,B) { ∥A ′ i−DbBi∥ 2 F+ A ′ i−DbiBi i 2 F +λ1∥B∥1+ λ2 ( tr(SW (B)−SB(B))+ Dbi T Dbi− 2 F )} 2.1.2 扩充干扰字典优化 式 (1) 为非凸函数,其优化过程如下所示: 1) 初始化字典 Db。 A ′ = {A ′ 1 , A ′ 2 ,··· , A ′ K } Db l2 将字典原子初始化为训练数据 的特征向量,对字典 的每一类归一 化,使其 范数为 1。 2) 保证字典 Db 固定,更新稀疏编码 B。 目标函数转化为 Q(Bi) = argmin Bi {θ (A ′ i , Dbi,Bi)+2γ∥Bi∥1 } (2) Bi ∈ R N×ni γ=λ1/2 使用文献 [27] 中的方法求解稀疏编码 , 。 θ (A ′ i , Dbi,Bi) = ∥A ′ i − DbBi∥ 2 F + A ′ i − DbiBi i 2 F +λ2 f (B, Db) 3) 保证稀疏编码 B 固定,更新字典 Db。 Db j Dj(i , j) 本文逐个更新 中的子字典,即当更新第 个子字典时,保证其他子字典 不动,默认 更新完成。 目标函数可转化为 Dbi = argmin Dbi Aˆ − DbiXi 2 F + A ′ i − DbiB i i 2 F + D T bi Dbi− 2 F s.t.∥Dbi(:, j)∥2 = 1,∀i, j Aˆ = A ′ − ∑k j=1, j,i Db jB j B j A ′ Db j Q(Dbi) 其中 , 是所有数据 由字典 表示的稀疏编码,因此 可转换为 ·220· 智 能 系 统 学 报 第 16 卷
第2期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·221· Dw=arg minlM:-DZDD- 将训练数据A={41,A2,…,Ax}的特征向量初始 s.t.IDo (j)ll2 1,Vi,j 化为字典的原子,对字典D。归一化,使其2范数 其中A=A,A,Z=[B,B],同理,逐个更新 为1;分别对字典D的每一类归一化,使其2范数 D=[d,d6,…,d]中的原子,当更新d时,保证 为1。 其他原子不动,默认已更新完成。 2)保证字典D固定,更新稀疏编码X;保证 设Z,=[g…2ml,其中独为Z:的第 字典D。固定,更新稀疏编码C。 更新时,目标函数转化为 k行,令i:=A-∑,于是: (X,)=arg min 0 (A:,D.X)+2y (5) =arg min{g (d)=-dizl D (3) 其中, 令)=0,得到: 0(Xi)=A;-D.C;-Dxill+atr(S.(X)-S8(X)) d 更新C时,目标函数转化为 dh =((Du)(D)+)A.z (C)=argminA.-D.C,-D+2yICll (6) 将得到的d规范化:d=d/川d, 3)以章节2.1.2为例,固定稀疏编码X,更新 4)重复2)和3),直到前后两次的函数Q的值 字典D;固定稀疏编码C,更新字典D。 满足判断条件为止。 4)重复2)和3),直到前后两次的函数Q的值 扩充干扰字典算法总体实现步骤如下: 满足判断条件为止。 输入训练样本A',规范化参数y: 混合特色字典算法总体实现步骤如下: 输出字典D。和稀疏编码B及相应的标签。 输入训练样本A,规范化参数Y: 1)初始化字典D。 输出字典D和稀疏编码X,字典D。和稀 2)固定字典D。,更新稀疏编码B。初始化字 疏编码C及相应的标签。 典后,利用式(2)依次求解。 1)初始化字典D和D。 3)固定稀疏编码B,更新字典D。利用式(3) 2)固定字典D,更新稀疏编码X;固定字典 依次更新。 D,更新稀疏编码C;初始化字典后,利用式(⑤) 4)重复2)和3),直到前后两次的函数的值满 (6)依次求解。 足判断条件为止。 3)固定稀疏编码X,更新字典D:固定稀疏编 2.2混合特色字典 码C,更新字典D。 2.2.1混合特色字典模型 4)重复2)和3),直到前后两次的函数的值满 对于训练集A和测试集Y,习得类共享字典 足判断条件为止。 D和由K个子字典组成的类别特色字典D: 2.3低秩字典 D={D,D2,…,Dxl。根据Fisher判别准则,混合特 色字典模型如式(4): 2.3.1低秩字典模型 在人脸识别中,假设扰动分量只占图像特征 J(De,D.C,X)=argmin A.-D.C-D.X+ 的一小部分,即图像的稀疏分量,使用矩阵低秩 D..D.C.X (4) 分解21方法从图像中提取干扰成分(如噪声、孤 (llCll +llXll)+(tr(S..(X)-S8(X))) 立点和遮挡)。 A-DC-DX可分为A:-D.C和 minrank(r)+rEs.t.G,=+E A:-DX两项理解,其中,C;是A:被D.重构 以如图2所示,取图片低秩分量E作为训 的稀疏编码,X,是A,被D重构的稀疏编码。 练集。其中,1>0为正则项参数,提出低秩字典 IA,-D.C提取数据之间的共性,A-DX 模型如下: 根据类标签信息,提取数据之间的特殊性,确保 J(D,P)=arg minE-DP+iPll (7) 每个样本可以由该类字典单独重构,以此提高子 2.3.2低秩字典优化 字典的判别力。其中,1>0为正则项参数,2>0 式(7)为非凸函数,其优化过程如下所示: 稀疏编码参数。 1)初始化字典Dp。 2.2.2混合特色字典优化 将字典原子初始化为训练数据E={E1,E2,…,EH 式(4)为非凸函数,其优化过程如下所示: 的特征向量,对字典D。的每一类归一化,使其2 1)初始化字典D和D。 范数为1
Dbi = argmin Dbi ∥Λi − DbiZi∥ 2 F + D T bi Dbi− 2 F s.t.∥Dbi(:, j)∥2 = 1,∀i, j Λi = [ Aˆ, A ′ i ] , Zi = [ Bi ,B i i ] Dbi = [ d 1 bi,d 2 bi,··· ,d K bi ] d k bi 其 中 ,同理,逐个更新 中的原子,当更新 时,保证 其他原子不动,默认已更新完成。 Zi = [ z(1) z(2) ··· z(m) ] z(k) Zi k Λˆ i = Λi − ∑ j,k d j biz(j) 设 ,其中 为 的第 行,令 ,于是: d k bi = argmin d k bi { g ( d k bi) = Λˆ i − d k biz(k) 2 F + d k T bi Dbi− 2 F } (3) ∂ g ( d k bi ) d k bi 令 = 0 ,得到: d k bi = ( (Dbi−) (Dbi−) T + z(k) 2 2 I )−1 Λˆ iz T (k) d k i d k bi = d k bi/ d k bi 将得到的 规范化: 2 4) 重复 2) 和 3),直到前后两次的函数 Q 的值 满足判断条件为止。 扩充干扰字典算法总体实现步骤如下: A ′ 输入 训练样本 ,规范化参数 γ ; 输出 字典 Db 和稀疏编码 B 及相应的标签。 1) 初始化字典 Db。 2) 固定字典 Db,更新稀疏编码 B 。初始化字 典后,利用式 (2) 依次求解。 3) 固定稀疏编码 B ,更新字典 Db。利用式 (3) 依次更新。 4) 重复 2) 和 3),直到前后两次的函数的值满 足判断条件为止。 2.2 混合特色字典 2.2.1 混合特色字典模型 A Y Dc K D D = {D1,D2,··· ,DK} 对于训练集 和测试集 ,习得类共享字典 和 由 个子字典组成的类别特色字典 : 。根据 Fisher 判别准则,混合特 色字典模型如式 (4): J(Dc , D,C,X) = argmin Dc ,D,C,X { Ai − DcCi − DiX i i 2 F + λ1 (∥C∥1 +∥X∥1 ) } +λ2 (tr(Sw (X)−SB (X))) (4) Ai − DcCi − DiX i i 2 F ∥Ai − DcCi∥ 2 F Ai − DiX i i 2 F Ci Ai Dc Xi i Ai Di 可分为 和 两项理解,其中, 是 被 重构 的稀疏编码, 是 被 重构的稀疏编码。 ∥Ai − DcCi∥ 2 F Ai − DiX i i 2 F λ1 > 0 λ2 > 0 提取数据之间的共性, 根据类标签信息,提取数据之间的特殊性,确保 每个样本可以由该类字典单独重构,以此提高子 字典的判别力。其中, 为正则项参数, 稀疏编码参数。 2.2.2 混合特色字典优化 式 (4) 为非凸函数,其优化过程如下所示: 1) 初始化字典 D 和 Dc。 A = {A1,A2,··· ,AK} Dc l2 D l2 将训练数据 的特征向量初始 化为字典的原子,对字典 归一化,使其 范数 为 1;分别对字典 的每一类归一化,使其 范数 为 1。 D X Dc C 2) 保证字典 固定,更新稀疏编码 ;保证 字典 固定,更新稀疏编码 。 更新 X 时,目标函数转化为 Q ( Xi i ) = argmin Xi { θ1 (Ai , Di ,Xi)+2γ Xi i 1 } (5) 其中, θ1 ( X i i ) = Ai − DcCi − DiX i i 2 F +λ2tr(Sw (X)−SB (X)) 更新 C 时,目标函数转化为 Q(Ci) = argmin Ci { Ai − DcCi − DiX i i 2 F +2γ∥Ci∥1 } (6) X D C Dc 3) 以章节 2.1.2 为例,固定稀疏编码 ,更新 字典 ;固定稀疏编码 ,更新字典 。 4) 重复 2) 和 3),直到前后两次的函数 Q 的值 满足判断条件为止。 混合特色字典算法总体实现步骤如下: 输入 训练样本 A ,规范化参数 γ ; D X Dc C 输出 字典 和稀疏编码 ,字典 和稀 疏编码 及相应的标签。 1) 初始化字典 D 和 Dc。 D X Dc C 2) 固定字典 ,更新稀疏编码 ;固定字典 ,更新稀疏编码 ;初始化字典后,利用式 (5)、 (6) 依次求解。 X D C Dc 3) 固定稀疏编码 ,更新字典 ;固定稀疏编 码 ,更新字典 。 4) 重复 2) 和 3),直到前后两次的函数的值满 足判断条件为止。 2.3 低秩字典 2.3.1 低秩字典模型 在人脸识别中,假设扰动分量只占图像特征 的一小部分,即图像的稀疏分量,使用矩阵低秩 分解[28] 方法从图像中提取干扰成分 (如噪声、孤 立点和遮挡)。 min Γj,Ej rank(Γj)+r Ej 0 s.t.Gj = Γj + Ej Ej λ1 > 0 以如图 2 所示,取图片低秩分量 作为训 练集。其中, 为正则项参数,提出低秩字典 模型如下: J(Dp,P) = argmin{ E− DpPi +λ1∥P∥1 } (7) 2.3.2 低秩字典优化 式 (7) 为非凸函数,其优化过程如下所示: 1) 初始化字典 Dp。 E = {E1,E2,··· ,EH} Dp l2 将字典原子初始化为训练数据 的特征向量,对字典 的每一类归一化,使其 范数为 1。 第 2 期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·221·
·222· 智能系统学报 第16卷 流程图如图3所示。 测试数据 训练数据 辅助数据 扩充干扰字典算法 (a)图片原图 混合特色字典算法 低秩字典算法 字典D 字典D 字典D 字典D, 分类器 (b)图片低秩分量 图2原图及低秩分量 标签 数据流程序流 Fig.2 Original graph and low rank components 2)保证字典D,固定,更新稀疏编码P;更新 图3算法流程 Fig.3 Algorithm flowchart X时,目标函数转化为 (P )arg min(E,-D,Pl+2yPl) 稀疏综合字典学习的小样本人脸识别算法总 体实现步骤如下: 3)以章节2.1.2为例,固定稀疏编码P,更新 输入训练样本A,辅助数据C,测试数据 字典Dpo Y,参数1,2。 4)重复2)和3),直到前后两次的函数的值满 输出分类标签。 足判断条件为止。 1)利用训练数据A构造数据集A,算法1习 低秩字典优化算法总体实现步骤如下: 得扩充干扰字典D6; 输入训练样本E,规范化参数y: 2)利用训练数据A及算法2习得混合特色字 输出字典和稀疏系数P,及相应的标签。 典D,Dc; 1)初始化字典D: 3)利用辅助数据C及算法3习得混合特色字 2)固定字典D,更新稀疏编码P: 3)固定稀疏编码P,更新字典D; 典Dpi 4)利用式(8)、(9)得到样本标签。 4)重复2)和3),直到前后两次的函数的值满 足判断条件为止。 3实验结果及分析 2.4分类策略 本文提出全局分类策略如下: 3.1实验平台和参数设置 本文实验环境为64位Window10操作系统, arg min y-[De.D.Do.I 内存32GB,Intel(R)Xeon(R)CPUE5-2620v4@ e 1红心 2.10GHz,并用MatlabR2016b软件编程实现。 实验选取AR人脸数据库、YaleB人脸数据 测试样本y的重构误差为 库、LFW人脸数据库进行实验,多次实验取平均 y-ID.D.D.D. 值。图像都经过标准化处理,比较算法包括 (8) SRC、FDDL、CRC、ESRC、SVGDL和CSICVDL、 SCSDL、FDDLLCSRC、LKCFDDL 于是y的标签为 3.2AR数据库实验 identify(y)=arg minle, (9) 本文在AR人脸数据库上设计两个实验方 2.5本文整体算法步骤及流程 案,实验1随机选取100人,每人26张图片分为 稀疏综合字典学习的小样本人脸识别算法分 5个集合,训练集合选取两张标准人脸,其余按特 为3个子算法,利用训练数据A、辅助数据C构造 点分为4个集合,作为不同的测试集。如图4所 扩充干扰字典、混合特色字典、低秩字典。算法 示,集合S1为样本内所有表情变化图片;集合S2
(a) 图片原图 (b) 图片低秩分量 图 2 原图及低秩分量 Fig. 2 Original graph and low rank components Dp P X 2) 保证字典 固定,更新稀疏编码 ;更新 时,目标函数转化为 Q(Pi) = argmin Pi { Ei − DpPi 2 F +2γ∥Pi∥1 } P Dp 3) 以章节 2.1.2 为例,固定稀疏编码 ,更新 字典 。 4) 重复 2) 和 3),直到前后两次的函数的值满 足判断条件为止。 低秩字典优化算法总体实现步骤如下: 输入 训练样本 E ,规范化参数 γ ; 输出 字典和稀疏系数 P ,及相应的标签。 1) 初始化字典 Dp; 2) 固定字典 Dp,更新稀疏编码 P ; 3) 固定稀疏编码 P ,更新字典 Dp; 4) 重复 2) 和 3),直到前后两次的函数的值满 足判断条件为止。 2.4 分类策略 本文提出全局分类策略如下: xˆ1 xˆ2 xˆ3 xˆ4 = argmin x1,x2,x3,x4 y− [ Dc , D, Db, Dp ] x1 x2 x3 x4 2 2 +λ1 x1 x2 x3 x4 1 测试样本 y 的重构误差为 ei = y− [ Dc , D, Db, Dp ] xˆ1 xˆ2 xˆ3 xˆ4 2 2 (8) 于是 y 的标签为 identify(y) = argmin i {ei} (9) 2.5 本文整体算法步骤及流程 A C 稀疏综合字典学习的小样本人脸识别算法分 为 3 个子算法,利用训练数据 、辅助数据 构造 扩充干扰字典、混合特色字典、低秩字典。算法 流程图如图 3 所示。 训练数据 字典 D, 字典 Dc , 字典 Db 扩充干扰字典算法 混合特色字典算法 测试数据 辅助数据 低秩字典算法 字典 Dp 分类器 标签 数据流 程序流 图 3 算法流程 Fig. 3 Algorithm flowchart 稀疏综合字典学习的小样本人脸识别算法总 体实现步骤如下: A C Y λ1, λ2 输入 训练样本 ,辅助数据 ,测试数据 ,参数 。 输出 分类标签。 A A ′ Db 1) 利用训练数据 构造数据集 ,算法 1 习 得扩充干扰字典 ; A D, Dc 2) 利用训练数据 及算法 2 习得混合特色字 典 ; C Dp 3) 利用辅助数据 及算法 3 习得混合特色字 典 ; 4) 利用式 (8)、(9) 得到样本标签。 3 实验结果及分析 3.1 实验平台和参数设置 本文实验环境为 64 位 Window 10 操作系统, 内存 32 GB,Intel(R) Xeon(R) CPU E5-2 620 v4 @ 2.10 GHz,并用 MatlabR2016b 软件编程实现。 实验选取 AR 人脸数据库、YaleB 人脸数据 库、LFW 人脸数据库进行实验,多次实验取平均 值。图像都经过标准化处理,比较算法包 括 SRC、FDDL、CRC、ESRC、SVGDL 和 CSICVDL、 SCSDL、FDDLLCSRC、LKCFDDL。 3.2 AR 数据库实验 S 1 S 2 本文在 AR 人脸数据库上设计两个实验方 案,实验 1 随机选取 100 人,每人 26 张图片分为 5 个集合,训练集合选取两张标准人脸,其余按特 点分为 4 个集合,作为不同的测试集。如图 4 所 示,集合 为样本内所有表情变化图片;集合 ·222· 智 能 系 统 学 报 第 16 卷
第2期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·223· 为所有光照变化图片;集合S3为所有眼镜遮挡图 片;集合S4为所有围巾遮挡图片。 (a)训练样本 (a)训练样本 (b)测试样本 图5AR人脸数据库样本(2) (d)S. (e)S Fig.5 Cropped face samples of AR database(2) 图4AR人脸数据库样本(1) 将数据集下采样为60×80,采用PCA将数据 Fig.4 Cropped face samples of AR database(1) 降为{50,150,250,350.4501维。如图6所示,本文 在具体实现过程中,随机选取80人用于训练 算法在不同维度下皆取得最高识别率,在面对遮 扩充干扰字典和混合特色字典,其余20个人用于 挡等异常情况时表现最佳。 训练低秩字典。首先将数据集下采样为60×80, 90 并采用PCA降至100维。各算法在AR数据库的 识别率如表1所示。 80 表1算法在AR库上的实验结果 70 Table 1 Accuracy of different methods on Experi- 60 法 SDI mentl of AR database % CSSVDL FDDLLCSRC 50 FDDL 算法 S S2 S3 S4 40 CRC 78.96 91.86 40.21 35.21 30 0100150200250300350400450 SRC 83.13 61.46 42.08 33.54 维数 FDDL 84.79 87.70 48.75 35.83 图6AR人脸数据库识别率 Fig.6 Accuracy of different methods on Experiment1 of ESRC 86.04 89.17 48.95 40.56 AR database SVGDL 82.90 92.50 51.80 45.80 3.3 YaleB数据库实验 CSSVDL 86.25 99.38 79.16 55.39 本文在The extended Yale B人脸数据库上设 SCSDL 84.46 99.38 77.34 54.29 计两个实验。实验1中,每人随机选取5图片训 FDDLLCSRC 86.25 99.38 69.75 51.75 练,其余图片进行测试。图7表示其中一个训练 IKCFDDL 86.17 98.88 74.08 53.21 样本和部分测试样本。 本文算法 86.46 99.38 84.38 67.29 从表1可知,FDDL算法识别率高于SRC、 CRC算法,说明提取数据特殊性的重要性, (a)训练图片 FDDLLCSRC、IKCFDDL算法在面对光照、表情 变化时实验效果良好,然而对数据存在遮挡异常 时处理效果欠缺。而CSICVDL、SCSDL、本文算 法识别率高于FDDL、LKCFDDL等,说明了在提 取特殊性之外,捕捉数据共性的必要性。本文算 法性能较稳定,混合特色字典提取了数据共性和 b)测试图片 特殊性,低秩字典、扩充干扰字典增强算法鲁棒 性和容错能力,在所有集合都能达到最高识 图7 YaleB人脸数据库样本 别率。 Fig.7 Cropped face samples of YaleB database 为探究本文算法对遮挡、光照、异常等情况 在具体实验时.选取30个人训练扩充干扰字 的综合处理能力,如图5所示,实验2选取每人两 典和混合特色字典,其余8个人用于训练低秩字 张正常状态下的人脸图片作为训练集,将围巾遮 典。将数据分别降维至{150,250,350,450,5501维, 挡、墨镜遮挡作为测试集合。 各算法在各维度上的识别率如表2所示
S 3 S 4 为所有光照变化图片;集合 为所有眼镜遮挡图 片;集合 为所有围巾遮挡图片。 (a) 训练样本 (b) S1 (c) S2 (d) S3 (e) S4 图 4 AR 人脸数据库样本 (1) Fig. 4 Cropped face samples of AR database (1) 60×80 在具体实现过程中,随机选取 80 人用于训练 扩充干扰字典和混合特色字典,其余 20 个人用于 训练低秩字典。首先将数据集下采样为 , 并采用 PCA 降至 100 维。各算法在 AR 数据库的 识别率如表 1 所示。 表 1 算法在 AR 库上的实验结果 Table 1 Accuracy of different methods on Experiment1 of AR database % 算法 S 1 S 2 S 3 S 4 CRC 78.96 91.86 40.21 35.21 SRC 83.13 61.46 42.08 33.54 FDDL 84.79 87.70 48.75 35.83 ESRC 86.04 89.17 48.95 40.56 SVGDL 82.90 92.50 51.80 45.80 CSSVDL 86.25 99.38 79.16 55.39 SCSDL 84.46 99.38 77.34 54.29 FDDLLCSRC 86.25 99.38 69.75 51.75 IKCFDDL 86.17 98.88 74.08 53.21 本文算法 86.46 99.38 84.38 67.29 从表 1 可知,FDDL 算法识别率高于 SRC、 C RC 算法,说明提取数据特殊性的重要性, FDDLLCSRC、IKCFDDL 算法在面对光照、表情 变化时实验效果良好,然而对数据存在遮挡异常 时处理效果欠缺。而 CSICVDL、SCSDL、本文算 法识别率高于 FDDL、LKCFDDL 等,说明了在提 取特殊性之外,捕捉数据共性的必要性。本文算 法性能较稳定,混合特色字典提取了数据共性和 特殊性,低秩字典、扩充干扰字典增强算法鲁棒 性和容错能力,在所有集合都能达到最高识 别率。 为探究本文算法对遮挡、光照、异常等情况 的综合处理能力,如图 5 所示,实验 2 选取每人两 张正常状态下的人脸图片作为训练集,将围巾遮 挡、墨镜遮挡作为测试集合。 (a) 训练样本 (b) 测试样本 图 5 AR 人脸数据库样本 (2) Fig. 5 Cropped face samples of AR database(2) 60×80 {50,150,250,350,450} 将数据集下采样为 ,采用 PCA 将数据 降为 维。如图 6 所示,本文 算法在不同维度下皆取得最高识别率,在面对遮 挡等异常情况时表现最佳。 本文算法 SVGDL CSSVDL ESRC FDDL SRC SCSDL FDDLLCSRC LKCFDDL 90 70 80 50 60 40 30 0 100 150 250 400 200 450 300 350 AR 识别率/% 维数 图 6 AR 人脸数据库识别率 Fig. 6 Accuracy of different methods on Experiment1 of AR database 3.3 YaleB 数据库实验 本文在 The extended Yale B 人脸数据库上设 计两个实验。实验 1 中,每人随机选取 5 图片训 练,其余图片进行测试。图 7 表示其中一个训练 样本和部分测试样本。 (a) 训练图片 (b) 测试图片 图 7 YaleB 人脸数据库样本 Fig. 7 Cropped face samples of YaleB database {150,250,350,450,550} 在具体实验时,选取 30 个人训练扩充干扰字 典和混合特色字典,其余 8 个人用于训练低秩字 典。将数据分别降维至 维, 各算法在各维度上的识别率如表 2 所示。 第 2 期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·223·
·224· 智能系统学报 第16卷 表2算法在Yale B database库上的实验结果 余为测试集。将数据分别将至{50,100,150,200, Table 2 Accuracy of different methods on Experi- 250;维,各算法在各维度上的识别率如表3所示。 mentl of Yale B database % 算法 150维 250维 350维 450维 550维 SRC 52.05 57.99 59.04 58.82 58.57 CRC 51.94 57.10 59.66 61.82 62.26 FDDL 57.88 59.32 59.82 59.82 59.76 SVGDL 59.10 59.66 62.04 67.41 69.63 CSSVDL 60.63 61.59 65.82 69.73 70.57 ESRC 60.10 59.04 62.04 66.94 67.83 SCSDL 60.88 62.10 64.57 68.85 70.57 FDDLLCSRC 59.70 60.66 62.58 64.10 67.89 图9校正LFW人脸数据库 LKCFDDL 64.46 67.10 69.38 70.53 71.46 Fig.9 Correction of LFW Face Database 本文算法 65.6569.5371.8173.3674.41 从表2可以看出,本文算法识别率高于其他 算法,并随着维数增多而增高。 a)训练样本 为探究各算法鲁棒性,实验2赋予算法不同 的参数值,参数1与参数2分别取值{0.001,0.005, (b)测试样本 0.01,0.05},参数1限制正则化项对识别率的影 响,参数2限制稀疏编码对识别率的影响,实验结 图10LFW人脸数据库样本 果如图8所示,本文算法与FDDL算法识别率随 Fig.10 Cropped face samples of LFW database 参数1、2的取值增大而增大,并最终达到稳定, 表3算法在LFW database库上的实验结果 本文算法识别率随参数改变的波动小,趋于平 Table 3 Accuracy of different methods on Experi- mentl of LFW database % 缓,鲁棒性强。 算法 50维 100维 150维 200维250维 72 8 70 SRC 54.90 63.92 61.18 42.74 21.18 。-文本.参数1 68 ·FDDL-参数1 CRC 45.88 60.78 61.96 59.61 59.21 。文本.参数2 .FDDL.参数2 FDDL 45.10 61.57 63.53 70.20 71.76 62 SVGDL 49.10 61.96 64.04 71.18 71.63 CSSVDL 50.63 62.53 66.82 70.73 70.57 54 ESRC 49.92 60.04 63.53 70.14 67.38 0 0.01 0.020.03 0.040.05 参数取值 SCSDL 50.17 59.98 63.92 68.21 68.88 图8参数对YaleB人脸数据库识别率的影响 FDDLLCSRC 49.17 60.71 62.59 65.43 69.94 Fig.8 The parameter analysis on the YaleB database LKCFDDL 53.46 68.79 70.63 71.14 72.21 3.4LFW数据库实验 本文算法 54.5169.80 70.59 72.16 73.33 本文在非受限人脸数据库LFW设计两次实 验,如图9所示,利用3d校正补齐因转向、遮挡 如表3所示,多数情况下算法的识别率随维 而缺失的特征信息。 数增多而升高,本文算法优于其他算法,但识别 实验一,选取单人图片数量大于10张的 率整体不高,这可能是因为前期校正造成的信息 158人作为实验数据。在具体实验时,选取 损失。 148个人训练扩充干扰字典和混合特色字典,其 为验证低秩字典对算法影响,实验2随机挑 余10个人用于训练低秩字典。如图10所示,随 选19、39、59、79个人作为低秩字典训练数据及 机选取每人10张图片,5张图片作为训练集,其 CSSVDL类内差异字典辅助数据,与基础FDDL
表 2 算法在 Yale B database 库上的实验结果 Table 2 Accuracy of different methods on Experiment1 of Yale B database % 算法 150维 250维 350维 450维 550维 SRC 52.05 57.99 59.04 58.82 58.57 CRC 51.94 57.10 59.66 61.82 62.26 FDDL 57.88 59.32 59.82 59.82 59.76 SVGDL 59.10 59.66 62.04 67.41 69.63 CSSVDL 60.63 61.59 65.82 69.73 70.57 ESRC 60.10 59.04 62.04 66.94 67.83 SCSDL 60.88 62.10 64.57 68.85 70.57 FDDLLCSRC 59.70 60.66 62.58 64.10 67.89 LKCFDDL 64.46 67.10 69.38 70.53 71.46 本文算法 65.65 69.53 71.81 73.36 74.41 从表 2 可以看出,本文算法识别率高于其他 算法,并随着维数增多而增高。 为探究各算法鲁棒性,实验 2 赋予算法不同 的参数值,参数 1 与参数 2 分别取值{0.001, 0.005, 0.01, 0.05},参数 1 限制正则化项对识别率的影 响,参数 2 限制稀疏编码对识别率的影响,实验结 果如图 8 所示,本文算法与 FDDL 算法识别率随 参数 1、2 的取值增大而增大,并最终达到稳定, 本文算法识别率随参数改变的波动小,趋于平 缓,鲁棒性强。 文本-参数1 FDDL-参数1 文本-参数2 FDDL-参数2 72 68 70 64 66 60 62 56 58 54 0 0.01 0.02 0.03 0.04 0.05 识别率/% 参数取值 图 8 参数对 YaleB 人脸数据库识别率的影响 Fig. 8 The parameter analysis on the YaleB database 3.4 LFW 数据库实验 本文在非受限人脸数据库 LFW 设计两次实 验,如图 9 所示,利用 3d 校正补齐因转向、遮挡 而缺失的特征信息。 实验一,选取单人图片数量大 于 1 0 张 的 1 5 8 人作为实验数据。在具体实验时,选 取 148 个人训练扩充干扰字典和混合特色字典,其 余 10 个人用于训练低秩字典。如图 10 所示,随 机选取每人 10 张图片,5 张图片作为训练集,其 余为测试集。将数据分别将至{50, 100, 150, 200, 250}维,各算法在各维度上的识别率如表 3 所示。 图 9 校正 LFW 人脸数据库 Fig. 9 Correction of LFW Face Database (a) 训练样本 (b) 测试样本 图 10 LFW 人脸数据库样本 Fig. 10 Cropped face samples of LFW database 表 3 算法在 LFW database 库上的实验结果 Table 3 Accuracy of different methods on Experiment1 of LFW database % 算法 50维 100维 150维 200维 250维 SRC 54.90 63.92 61.18 42.74 21.18 CRC 45.88 60.78 61.96 59.61 59.21 FDDL 45.10 61.57 63.53 70.20 71.76 SVGDL 49.10 61.96 64.04 71.18 71.63 CSSVDL 50.63 62.53 66.82 70.73 70.57 ESRC 49.92 60.04 63.53 70.14 67.38 SCSDL 50.17 59.98 63.92 68.21 68.88 FDDLLCSRC 49.17 60.71 62.59 65.43 69.94 LKCFDDL 53.46 68.79 70.63 71.14 72.21 本文算法 54.51 69.80 70.59 72.16 73.33 如表 3 所示,多数情况下算法的识别率随维 数增多而升高,本文算法优于其他算法,但识别 率整体不高,这可能是因为前期校正造成的信息 损失。 为验证低秩字典对算法影响,实验 2 随机挑 选 19、39、59、79 个人作为低秩字典训练数据及 CSSVDL 类内差异字典辅助数据,与基础 FDDL ·224· 智 能 系 统 学 报 第 16 卷
第2期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·225· 算法、包含辅助字典的CSSVDL算法进行对比, 人前2张人脸图像为训练集,剩余9张为测试图 各算法在各集合上的识别率如图11所示。 像。随机选取5人作为辅助数据,数据库其余人 90 数作为训练和测试数据,算法运行时间及实验结 果如表4所示。 85 80 (a)训练数据 70 -*-CSSVDL 一F)) (b)测试数据 Wo 65 20 3040506070 图13YALE实验 个数 Fig.13 Experiment on YALE 图11LFW人脸数据库识别率 表4AR及YALE库实验 Fig.11 Accuracy of different methods on experimentl of Table 4 Experiment on AR and YALE LFW database AR数据库 YALE数据库 从图11可知,随着构筑类内差异字典的辅助 算法 时间s 识别率% 时间s识别率% 数据增加,CSSVDL算法的识别率大致增加。随 FDDL 1801 84.42 228 85.19 着构筑低秩字典训练数据增加,本文算法识别率 SVGDL 1859 91.56 255 90.42 大致增加。本文算法、CSSVDL算法、FDDL算法 在59人实验中识别率均受个别样本选择影响下 CSSVDL 2202 93.11 292 92.38 降,本文算法和CSSVDL由于辅助数据捕捉数据 SCSDL 2674 92.05 343 90.42 共性,较FDDL算法有更好的鲁棒性。在非受限 LKCFDDL 1879 92.26 244 93.83 人脸数据库LFW上,本文算法分类效果最优, FDDLLCSRC 1864 92.17 239 91.53 3.5算法评价 本文算法 2097 95.19 277 95.78 3.5.1复杂度分析 本文算法复杂度分为扩充干扰字典、混合特 综合表4可以看出,本文算法、CSSVDL算 色字典、低秩字典3个部分计算,每部分又分为 法、SCSDL算法由于辅助数据的构建,虽然算法 更新稀疏编码和更新字典两步骤。 识别率提高,但算法运行时间也随之增加。两实 以扩充干扰字典为例,设训练样本个数为n, 验中本文算法识别率最高,且运行时间小于CS$- 样本特征维数为9,更新稀疏系数的时间复杂度 VDL算法、SCSDL算法,证明本文算法具有更高 为nO(qm),其中,r≥1.2为常数。更新字典的时 的性价比。 间复杂度为∑,n,02mg.其中,m表示D,的原子 4结束语 个数。 扩充干扰字典总复杂度为 本文提出稀疏综合字典模型,加入Fisher判 n0(r)+∑n,02mg) (10) 别准则,学习混合特色字典提取数据共性和特殊 3.5.2运行效率分析 性,学习扩充干扰字典与低秩字典提取数据异 为探究算法运行效率,本文设计实验。如图12 常、干扰性,分别在AR、YaleB、LFW等人脸库上 所示,实验1取AR数据库80人,每人前13张图 进行实验。实验表明,在小样本训练情境下,即 片训练,其余图片进行测试。 使测试样本与训练样本存在较大差异如表情变 化、遮挡等,本文仍能保持较好的性能。在实际 应用中还需进一步探讨算法对训练样本的依赖性 a)训练数据 以及算法的稳定性。 参考文献: (b)测试数据 图12AR实验 [1]OH B S.TOH K A.TEOH A B J,et al.An analytic Gabor Fig.12 Experiment on AR feedforward network for single-sample and pose-invariant 实验2选取YALE数据库,如图13所示,每 face recognition[J].IEEE transactions on image pro-
算法、包含辅助字典的 CSSVDL 算法进行对比, 各算法在各集合上的识别率如图 11 所示。 CSSVDL FDDL wo 90 85 80 75 70 65 20 30 40 50 60 70 识别率/% 个数 图 11 LFW 人脸数据库识别率 Fig. 11 Accuracy of different methods on experiment1 of LFW database 从图 11 可知,随着构筑类内差异字典的辅助 数据增加,CSSVDL 算法的识别率大致增加。随 着构筑低秩字典训练数据增加,本文算法识别率 大致增加。本文算法、CSSVDL 算法、FDDL 算法 在 59 人实验中识别率均受个别样本选择影响下 降,本文算法和 CSSVDL 由于辅助数据捕捉数据 共性,较 FDDL 算法有更好的鲁棒性。在非受限 人脸数据库 LFW 上,本文算法分类效果最优。 3.5 算法评价 3.5.1 复杂度分析 本文算法复杂度分为扩充干扰字典、混合特 色字典、低秩字典 3 个部分计算,每部分又分为 更新稀疏编码和更新字典两步骤。 n q nO(q 2n r ) ∑ r ⩾ 1.2 j njO(2nq) nj Di 以扩充干扰字典为例,设训练样本个数为 , 样本特征维数为 ,更新稀疏系数的时间复杂度 为 ,其中, 为常数。更新字典的时 间复杂度为 ,其中, 表示 的原子 个数。 扩充干扰字典总复杂度为 nO( q 2 n r ) + ∑ j njO(2nq) (10) 3.5.2 运行效率分析 为探究算法运行效率,本文设计实验。如图 12 所示,实验 1 取 AR 数据库 80 人,每人前 13 张图 片训练,其余图片进行测试。 (a) 训练数据 (b) 测试数据 图 12 AR 实验 Fig. 12 Experiment on AR 实验 2 选取 YALE 数据库,如图 13 所示,每 人前 2 张人脸图像为训练集,剩余 9 张为测试图 像。随机选取 5 人作为辅助数据,数据库其余人 数作为训练和测试数据,算法运行时间及实验结 果如表 4 所示。 (a) 训练数据 (b) 测试数据 图 13 YALE 实验 Fig. 13 Experiment on YALE 表 4 AR 及 YALE 库实验 Table 4 Experiment on AR and YALE 算法 AR数据库 YALE数据库 时间/s 识别率/% 时间/s 识别率/% FDDL 1801 84.42 228 85.19 SVGDL 1859 91.56 255 90.42 CSSVDL 2 202 93.11 292 92.38 SCSDL 2 674 92.05 343 90.42 LKCFDDL 1879 92.26 244 93.83 FDDLLCSRC 1864 92.17 239 91.53 本文算法 2 097 95.19 277 95.78 综合表 4 可以看出,本文算法、CSSVDL 算 法、SCSDL 算法由于辅助数据的构建,虽然算法 识别率提高,但算法运行时间也随之增加。两实 验中本文算法识别率最高,且运行时间小于 CSSVDL 算法、SCSDL 算法,证明本文算法具有更高 的性价比。 4 结束语 本文提出稀疏综合字典模型,加入 Fisher 判 别准则,学习混合特色字典提取数据共性和特殊 性,学习扩充干扰字典与低秩字典提取数据异 常、干扰性,分别在 AR、YaleB、LFW 等人脸库上 进行实验。实验表明,在小样本训练情境下,即 使测试样本与训练样本存在较大差异如表情变 化、遮挡等,本文仍能保持较好的性能。在实际 应用中还需进一步探讨算法对训练样本的依赖性 以及算法的稳定性。 参考文献: OH B S, TOH K A, TEOH A B J, et al. An analytic Gabor feedforward network for single-sample and pose-invariant face recognition[J]. IEEE transactions on image pro- [1] 第 2 期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·225·
·226· 智能系统学报 第16卷 cessing,.2018,27(6):2791-2805 ant Dictionary Learning and Salient Feature Extraction[J]. [2]ZHANG Ni,YAN Yan,CHEN Si,et al.Multi-label learn- Journal of Chinese Computer Systems,2017(9). ing based deep transfer neural network for facial attribute [13]YANG Meng,ZHANG Lei,FENG Xiangchu,et al classification[J].Pattern recognition,2018,80:225-240. Sparse representation based fisher discrimination diction- [3]冉鹏,王灵,李昕,等.改进Softmax分类器的深度卷积 ary learning for image classification[J].International 神经网络及其在人脸识别中的应用).上海大学学报 journal of computer vision,2014,109(3):209-232. (自然科学版),2018,243):352-366. [14]WRIGHT J.YANG A Y.GANESH A.et al.Robust face RAN Peng,WANG Ling,LI Xin,et al.Improved Softmax recognition via sparse representation[J].IEEE transac- classifier for deep convolution neural networks and its ap- tions on pattern analysis and machine intelligence,2009, plication in face recognition[J].Journal of Shanghai Uni- 31(2):210-227 versity (Natural Science),2018,24(3):352-366. [15]SPRECHMANN P,SAPIRO G.Dictionary learning and [4]AHARON M.ELAD M.BRUCKSTEIN A.K-SVD:an al- sparse coding for unsupervised clustering[C]//Proceed- gorithm for designing overcomplete dictionaries for sparse ings of 2010 IEEE International Conference on Acoustics. representation[J].IEEE transactions on signal processing, Speech and Signal Processing.Dallas,TX,USA,2010: 2006,5411):4311-4322. 2042-2045. [5]YANG Meng,CHANG Heyou,LUO Weixin.Discriminat- [16]RAMIREZ I,SPRECHMANN P,SAPIRO G.Classifica- ive analysis-synthesis dictionary learning for image classi- tion and clustering via dictionary learning with structured fication[J].Neurocomputing,2017,219:404-411. incoherence and shared features[C]//Proceedings of 2010 [6]SHEKHAR S,PATEL V M,CHELLAPPA R.Analysis IEEE Computer Society Conference on Computer Vision sparse coding models for image-based classification[Cl// and Pattern Recognition.San Francisco,CA,USA,2010. Proceedings of 2014 IEEE International Conference on Im- [17]YANG Meng,ZHANG Lei,FENG Xiangchu,et al.Fish- age Processing.Paris,France,2015. er discrimination dictionary learning for sparse represent- [7]WU Fei,JING Xiaoyuan,YOU Xinge,et al.Multi-view ation[C]//Proceedings of 2011 IEEE International Confer- low-rank dictionary learning for image classification[J]. ence on Computer Vision (ICCV).Barcelona,Spain, Pattern recognition,2016,50:143-154. 2011:543-550. [8]ZHANG Qiang,LI Baoxin.Discriminative K-SVD for dic- [18]王威,朱宗玖,陆俊.基于字典学习和局部约束的稀疏 tionary learning in face recognition[C]//Proceedings of 表示人脸识别[].电脑知识与技术,2018,14(5): 2010 IEEE Computer Society Conference on Computer 200-202. Vision and Pattern Recognition.San Francisco,CA,USA, WANG Wei,ZHU Zongjiu,LU Jun.Sparse representa- 2010. tion for face recognition based on dictionary learning and [9]JIANG Zhuolin,LIN Zhe,DAVIS L S.Label consistent K- locality constraint[J].Computer knowledge and techno- SVD:learning a discriminative dictionary for 1ogy,2018,14(5):200-202 recognition[J].IEEE transactions on pattern analysis and [19]黎明,彭秀姣,王艳.基于改进的字典学习与稀疏表示 machine intelligence,2013,35(11):2651-2664. 的人脸表情识别円.系统仿真学报,2018.30(1少28-35 [10]MAIRAL J,BACH F,PONCE J,et al.Discriminative 44 learned dictionaries for local image analysis[Cl//Proceed- LI Ming,PENG Xiujiao,WANG Yan.Facial expression ings of 2008 IEEE Conference on Computer Vision and recognition based on improved dictionary learning and Pattern Recognition.Anchorage,AK,USA,2008. sparse representation[J].Journal of system simulation, [11]CASTRODAD A,SAPIRO G.Sparse modeling of hu- 2018,30(1):28-35,44. man actions from motion imagery[J].International journ- [20]DENG Weihong,HU Jiani,GUO Jun.Extended SRC:un- al of computer vision,2012,100(1):1-15. dersampled face recognition via intraclass variant diction- [12]王念兵,吴秦,梁久祯,等.变化字典学习与显著特征提 ary[J].IEEE transactions on pattern analysis and machine 取的单样本人脸识别[J】.小型微型计算机系统, intelligence,2012,34(9):1864-1870. 2017(9) [21]LI Wenjing,LIANG Jiuzhen,WU Qin,et al.An efficient WANG Nian-bing,WU Qin,LIANG Jiu-zhen,XU Jie, face classification method based on shared and class-spe- ZHANG Huai.Single Sample Face Recognition via Vari- cific dictionary learning[C]//Proceedings of 2015 IEEE
cessing, 2018, 27(6): 2791–2805. ZHANG Ni, YAN Yan, CHEN Si, et al. Multi-label learning based deep transfer neural network for facial attribute classification[J]. Pattern recognition, 2018, 80: 225–240. [2] 冉鹏, 王灵, 李昕, 等. 改进 Softmax 分类器的深度卷积 神经网络及其在人脸识别中的应用 [J]. 上海大学学报 (自然科学版), 2018, 24(3): 352–366. RAN Peng, WANG Ling, LI Xin, et al. Improved Softmax classifier for deep convolution neural networks and its application in face recognition[J]. Journal of Shanghai University (Natural Science), 2018, 24(3): 352–366. [3] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation[J]. IEEE transactions on signal processing, 2006, 54(11): 4311–4322. [4] YANG Meng, CHANG Heyou, LUO Weixin. Discriminative analysis-synthesis dictionary learning for image classification[J]. Neurocomputing, 2017, 219: 404–411. [5] SHEKHAR S, PATEL V M, CHELLAPPA R. Analysis sparse coding models for image-based classification[C]// Proceedings of 2014 IEEE International Conference on Image Processing. Paris, France, 2015. [6] WU Fei, JING Xiaoyuan, YOU Xinge, et al. Multi-view low-rank dictionary learning for image classification[J]. Pattern recognition, 2016, 50: 143–154. [7] ZHANG Qiang, LI Baoxin. Discriminative K-SVD for dictionary learning in face recognition[C]//Proceedings of 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA, 2010. [8] JIANG Zhuolin, LIN Zhe, DAVIS L S. Label consistent KSVD: learning a discriminative dictionary for recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(11): 2651–2664. [9] MAIRAL J, BACH F, PONCE J, et al. Discriminative learned dictionaries for local image analysis[C]//Proceedings of 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, AK, USA, 2008. [10] CASTRODAD A, SAPIRO G. Sparse modeling of human actions from motion imagery[J]. International journal of computer vision, 2012, 100(1): 1–15. [11] 王念兵, 吴秦, 梁久祯, 等. 变化字典学习与显著特征提 取的单样本人脸识别 [J]. 小型微型计算机系统, 2017(9). WANG Nian-bing, WU Qin, LIANG Jiu-zhen, XU Jie, ZHANG Huai. Single Sample Face Recognition via Vari- [12] ant Dictionary Learning and Salient Feature Extraction[J]. Journal of Chinese Computer Systems, 2017(9). YANG Meng, ZHANG Lei, FENG Xiangchu, et al. Sparse representation based fisher discrimination dictionary learning for image classification[J]. International journal of computer vision, 2014, 109(3): 209–232. [13] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE transactions on pattern analysis and machine intelligence, 2009, 31(2): 210–227. [14] SPRECHMANN P, SAPIRO G. Dictionary learning and sparse coding for unsupervised clustering[C]//Proceedings of 2010 IEEE International Conference on Acoustics, Speech and Signal Processing. Dallas, TX, USA, 2010: 2042−2045. [15] RAMIREZ I, SPRECHMANN P, SAPIRO G. Classification and clustering via dictionary learning with structured incoherence and shared features[C]//Proceedings of 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA, 2010. [16] YANG Meng, ZHANG Lei, FENG Xiangchu, et al. Fisher discrimination dictionary learning for sparse representation[C]//Proceedings of 2011 IEEE International Conference on Computer Vision (ICCV). Barcelona, Spain, 2011: 543−550. [17] 王威, 朱宗玖, 陆俊. 基于字典学习和局部约束的稀疏 表示人脸识别 [J]. 电脑知识与技术, 2018, 14(5): 200–202. WANG Wei, ZHU Zongjiu, LU Jun. Sparse representation for face recognition based on dictionary learning and locality constraint[J]. Computer knowledge and technology, 2018, 14(5): 200–202. [18] 黎明, 彭秀姣, 王艳. 基于改进的字典学习与稀疏表示 的人脸表情识别 [J]. 系统仿真学报, 2018, 30(1): 28–35, 44. LI Ming, PENG Xiujiao, WANG Yan. Facial expression recognition based on improved dictionary learning and sparse representation[J]. Journal of system simulation, 2018, 30(1): 28–35, 44. [19] DENG Weihong, HU Jiani, GUO Jun. Extended SRC: undersampled face recognition via intraclass variant dictionary[J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(9): 1864–1870. [20] LI Wenjing, LIANG Jiuzhen, WU Qin, et al. An efficient face classification method based on shared and class-specific dictionary learning[C]//Proceedings of 2015 IEEE [21] ·226· 智 能 系 统 学 报 第 16 卷
第2期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·227· International Conference on Image Processing(ICIP). linearly correlated images[J].IEEE transactions on pat- Quebec City,QC,Canada,2015. tern analysis and machine intelligence,2012,34(11): [22]LI Wenjing,LIANG Jiuzhen.Adaptive face representa- 2233-2246. tion via class-specific and intra-class variation dictionar- ies for recognition[J].Multimedia tools and applications, 作者简介: 2018,77(12):14783-14802. 狄岚,副教授,中国人工智能学会 粒计算与知识发现专业委员会委员, [23]NEEDELL D,TROPP J A.CoSaMP:iterative signal re- 中国计算机学会会员,江苏省“六大人 covery from incomplete and inaccurate samples[J].Ap- 才高峰”资助对象,主要研究方向为数 plied and computational harmonic analysis,2009,26(3): 字图像处理和计算机仿真。近几年先 301-321 后主持及参与国家级、省部级科研项 目7项,主持校级科研项目4项、企业 [24]DO TT,GAN Lu,NGUYEN N,et al.Sparsity adaptive 合作项目近20项,获省级自然科学学术奖1次,行业联合会 matching pursuit algorithm for practical compressed sens- ing[C]//Proceedings of the 42nd Asilomar Conference on 技术奖3次。发表学术论文50余篇。 Signals,Systems and Computers.Pacific Grove,CA, 矫慧文,硕士研究生,中国计算机 USA,2009 学会会员,主要研究方向为图像处理 和人脸识别。 [25]TIBSHIRANI R.Regression shrinkage and selection via the lasso[J].Journal of the royal statistical society:series B(Methodological),1996,58(1):267-288. [26]EFRON B,HASTIE T,JOHNSTONE I,et al.Least angle regression[J].Annals of statistics,2004,32(2):407-499 梁久祯,教授.博士,中国计算机 [27]MAIRAL J,BACH F,PONCE J.Task-driven dictionary 学会会员,主要研究方向为计算机视 learning[J].IEEE transactions on pattern analysis and ma- 觉和数字图像处理。主持项目10余 项,获得浙江省青年英才奖等。发表 chine intelligence,2012,34(4):791-804. 教材与专著4部,专利成果57项,发 [28]PENG Yigang,GANESH A,WRIGHT J,et al.RASL:ro- 表学术论文160余篇。 bust alignment by sparse and low-rank decomposition for
International Conference on Image Processing (ICIP). Quebec City, QC, Canada, 2015. LI Wenjing, LIANG Jiuzhen. Adaptive face representation via class-specific and intra-class variation dictionaries for recognition[J]. Multimedia tools and applications, 2018, 77(12): 14783–14802. [22] NEEDELL D, TROPP J A. CoSaMP: iterative signal recovery from incomplete and inaccurate samples[J]. Applied and computational harmonic analysis, 2009, 26(3): 301–321. [23] DO T T, GAN Lu, NGUYEN N, et al. Sparsity adaptive matching pursuit algorithm for practical compressed sensing[C]//Proceedings of the 42nd Asilomar Conference on Signals, Systems and Computers. Pacific Grove, CA, USA, 2009. [24] TIBSHIRANI R. Regression shrinkage and selection via the lasso[J]. Journal of the royal statistical society: series B (Methodological), 1996, 58(1): 267–288. [25] EFRON B, HASTIE T, JOHNSTONE I, et al. Least angle regression[J]. Annals of statistics, 2004, 32(2): 407–499. [26] MAIRAL J, BACH F, PONCE J. Task-driven dictionary learning[J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(4): 791–804. [27] PENG Yigang, GANESH A, WRIGHT J, et al. RASL: robust alignment by sparse and low-rank decomposition for [28] linearly correlated images[J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(11): 2233–2246. 作者简介: 狄岚,副教授,中国人工智能学会 粒计算与知识发现专业委员会委员, 中国计算机学会会员,江苏省“六大人 才高峰”资助对象,主要研究方向为数 字图像处理和计算机仿真。近几年先 后主持及参与国家级、省部级科研项 目 7 项,主持校级科研项目 4 项、企业 合作项目近 20 项,获省级自然科学学术奖 1 次,行业联合会 技术奖 3 次。发表学术论文 50 余篇。 矫慧文,硕士研究生,中国计算机 学会会员,主要研究方向为图像处理 和人脸识别。 梁久祯,教授,博士,中国计算机 学会会员,主要研究方向为计算机视 觉和数字图像处理。主持项目 10 余 项,获得浙江省青年英才奖等。发表 教材与专著 4 部,专利成果 57 项,发 表学术论文 160 余篇。 第 2 期 狄岚,等:稀疏综合字典学习的小样本人脸识别 ·227·