第15卷第5期 智能系统学报 Vol.15 No.5 2020年9月 CAAI Transactions on Intelligent Systems Sep.2020 D0:10.11992/tis.201904002 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.tp.20191014.1042.002.html 自适应多阶段线性重构表示分类的人脸识别 钱剑滨,陈秀宏 (江南大学数字媒体学院,江苏无锡214122) 摘要:针对以往基于表示的分类(®BC)方法在类别数较多的数据集上性能不佳的问题,提出了一种自适应多 阶段线性重构表示的分类(MPRBC)方法。在每一阶段,首先得到L,范数或L2范数正则化的重构表示系数,然 后将表示系数按类求和,根据和的大小来选取相似类,并保留相似类中的全部样本作为下一阶段的训练样本。 该策略最终产生具有高分类置信度的稀疏类概率分布,根据类系数的大小自适应选择相似的类,提高了分类计 算的效率。实验结果表明,该方法分类性能优于其他RBC方法,特别是在类别数较多的数据集上性能提升明 显,并且CPU时间保持相对较低水平。 关键词:人脸识别;自适应:多阶段:线性重构;表示系数;分类方法;稀疏表示:协同表示;模式识别 中图分类号:TP391.4文献标志码:A文章编号:1673-4785(2020)05-0964-08 中文引用格式:钱剑滨,陈秀宏.自适应多阶段线性重构表示分类的人脸识别J.智能系统学报,2020,15(5):964-971. 英文引用格式:QIAN Jianbin,CHEN Xiuhong..Self-adaptive multi-phase linear reconstruction representation based classification for face recognition CAAI transactions on intelligent systems,2020,15(5):964-971. Self-adaptive multi-phase linear reconstruction representation based classification for face recognition QIAN Jianbin,CHEN Xiuhong (School of Digital Media,Jiangnan University,Wuxi 214122,China) Abstract:Representation-based classification(RBC)methods have recently been the promising pattern recognition technologies for object recognition.The representation coefficients of RBC as the linear reconstruction measure can be well used for classifying objects.But RBC methods performs very poorly on large-class-databases and in order to solve the problem of poor performance,a self-adaptive multi-phase linear reconstruction representation based classification (MPRBC)method is proposed.In this process,at first,the reconstruction coefficients regularized by L-norm or La-norm are obtained.Then the similar classes are selected according to the sum of the representation coefficients in each class, and all samples of similar classes are retained as training samples for the next stage.This strategy finally produces a sparse class probability distribution with higher classification confidence.The similar classes are selected adaptively ac- cording to the values of class coefficients,which improves the efficiency of the classification.Experimental results show that the proposed method is better than other RBC methods,especially on large-class-databases,and CPU time remains relatively low. Keywords:face recognition;self-adaptive;multi-phase:linear reconstruction:representation coefficient;classification method,sparse representation;collaborative representation;pattern recognition 基于表示的分类(representation based classific-本,进而对查询样本进行分类I。在RBC框架 ation,RBC)方法通过训练样本来近似表示查询样 中,如何准确地计算查询样本和每个类之间的相 收稿日期:2019-04-02.网络出版日期:2019-10-14. 似性,对查询样本的表示和分类起着重要的作用。 基金项目:江苏省研究生科研与实践创新计划项目 KYCX181871). 一般地,RBC方法可以分为基于L,范数的表示方 通信作者:钱剑滨.E-mail:462501979@qq.com 法1和基于L2范数的表示方法2。基于L范
DOI: 10.11992/tis.201904002 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20191014.1042.002.html 自适应多阶段线性重构表示分类的人脸识别 钱剑滨,陈秀宏 (江南大学 数字媒体学院,江苏 无锡 214122) 摘 要:针对以往基于表示的分类 (RBC) 方法在类别数较多的数据集上性能不佳的问题,提出了一种自适应多 阶段线性重构表示的分类 (MPRBC) 方法。在每一阶段,首先得到 L1 范数或 L2 范数正则化的重构表示系数,然 后将表示系数按类求和,根据和的大小来选取相似类,并保留相似类中的全部样本作为下一阶段的训练样本。 该策略最终产生具有高分类置信度的稀疏类概率分布,根据类系数的大小自适应选择相似的类,提高了分类计 算的效率。实验结果表明,该方法分类性能优于其他 RBC 方法,特别是在类别数较多的数据集上性能提升明 显,并且 CPU 时间保持相对较低水平。 关键词:人脸识别;自适应;多阶段;线性重构;表示系数;分类方法;稀疏表示;协同表示;模式识别 中图分类号:TP391.4 文献标志码:A 文章编号:1673−4785(2020)05−0964−08 中文引用格式:钱剑滨, 陈秀宏. 自适应多阶段线性重构表示分类的人脸识别 [J]. 智能系统学报, 2020, 15(5): 964–971. 英文引用格式:QIAN Jianbin, CHEN Xiuhong. Self-adaptive multi-phase linear reconstruction representation based classification for face recognition[J]. CAAI transactions on intelligent systems, 2020, 15(5): 964–971. Self-adaptive multi-phase linear reconstruction representation based classification for face recognition QIAN Jianbin,CHEN Xiuhong (School of Digital Media, Jiangnan University, Wuxi 214122, China) Abstract: Representation-based classification (RBC) methods have recently been the promising pattern recognition technologies for object recognition. The representation coefficients of RBC as the linear reconstruction measure can be well used for classifying objects. But RBC methods performs very poorly on large-class-databases and in order to solve the problem of poor performance, a self-adaptive multi-phase linear reconstruction representation based classification (MPRBC) method is proposed. In this process, at first, the reconstruction coefficients regularized by L1 -norm or L2 -norm are obtained. Then the similar classes are selected according to the sum of the representation coefficients in each class, and all samples of similar classes are retained as training samples for the next stage. This strategy finally produces a sparse class probability distribution with higher classification confidence. The similar classes are selected adaptively according to the values of class coefficients, which improves the efficiency of the classification. Experimental results show that the proposed method is better than other RBC methods, especially on large-class-databases, and CPU time remains relatively low. Keywords: face recognition; self-adaptive; multi-phase; linear reconstruction; representation coefficient; classification method; sparse representation; collaborative representation; pattern recognition 基于表示的分类 (representation based classification,RBC) 方法通过训练样本来近似表示查询样 L1 L2 L1 本,进而对查询样本进行分类[1]。在 RBC 框架 中,如何准确地计算查询样本和每个类之间的相 似性,对查询样本的表示和分类起着重要的作用[2]。 一般地,RBC 方法可以分为基于 范数的表示方 法 [3] 和基于 范数的表示方法[1-2, 4]。基于 范 收稿日期:2019−04−02. 网络出版日期:2019−10−14. 基金项目:江苏省研究生科研与实践创新计划项 目 (KYCX18_1871). 通信作者:钱剑滨. E-mail:462501979@qq.com. 第 15 卷第 5 期 智 能 系 统 学 报 Vol.15 No.5 2020 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2020
第5期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·965· 数表示方法是用L范数对表示系数进行正则化, (self-adaptive multi-phase linear reconstruction repres- 其中最典型的方法是基于稀疏表示的分类(sparse entation based classification,MPRBC)方法。首先, representation based classification.SRC)SRC 用表示系数代替残差来表示查询样本与训练样本 用训练样本的稀疏组合来表示查询样本,并根据 之间的相似性,系数越大表示它们越相似。用近 类的重构残差对查询样本进行分类。当使用L2 邻类代替近邻样本,保留近邻类中的全部样本, 范数对表示系数正则化时,可获得一个闭合解, 保持样本数据的平衡。用多次选择近邻代替单次 提高了算法的稳定性,在分类时具有很好的区分 选择,同时利用自适应的方法控制算法的时间复 性田。最典型的方法是基于协同表示的分类(col- 杂度。在6个人脸数据集上的实验表明,MPRBC laborative representation based classification, 算法优于目前最先进的基于表示的分类方法。 CRC)",它利用训练样本之间的协作来表示查询 样本。受CRC的启发,文献[4]中提出了两阶段 1相关RBC算法 测试样本稀疏表示(two-phase test sample sparse 本节主要回顾已有的一些RBC方法。给定训 representation,TPTSR)方法,该方法通过近邻来重 练样本X=[XX2…X]=[x1x2…xJ∈Rm为 构查询样本并进行分类。 在RBC方法中,表示系数可以用来描述样本 n个属于Mo类的d维样本,X表示属于第i类的 之间的相似性510,在设计分类器时可直接采用这 训练样本子集,其对应的类标签为c:∈(1,2,·,Moo 些表示系数刀。例如,基于线性重构度量的最近 1.1基于线性重构度量的最近邻(LRMNN)分类 般的线性重构度量(LRM)问题可表示为 (linear reconstruction measure nearest neighbor, LRMNN)分类使用L范数或L2范数正则化的 minl心y-Xs (1) 表示系数作为线性重构度量(linear reconstruction 式中:s=[s1s2…snJ∈R"表示线性重构系数,s measure,LRM)来确定查询样本的最近邻.,这里的 代表y与x:的相似性。设3=[⑧132…J'∈R 表示系数也称为线性重构系数。Cheng等提出 是问题()的最优解,则:越大,说明y与x:越相 的稀疏性诱导相似性度量使用了L:范数正则化 似。为了克服奇异值问题并控制过拟合,在LRM 的表示系数作为标签传播和动作识别的相似性度 目标函数中增加正则化项对表示系数进行约束: 量。Li等)将L,范数的表示系数之和(sum of 得到以下正则化LRM模型: coefficient,.SoC)用于分类决策。文献[8]指出类 min lly-Xsl+allsllp (2) 似的样本应该用相似的稀疏表示系数进行编码。 式中:入是平衡参数,用来平衡重建误差项和正 文献[9]将样本权重的表示系数用于数据集的自 则化项之间的贡献;p通常设置为1或2,当p= 动图构建。Ma等o提出了基于L,范数正则化的 1时,s为稀疏表示系数,文献[3]中给出了详细的 稀疏系数k近邻分类。文献[11]则在TPTSR基 求解过程;当p=2时,s为协同表示系数,其最优 础上提出基于两阶段线性重构度量的分类(two- 解为 8=(XTX+D-Xy (3) phase linear reconstruction measure based classifica- 基于表示系数的相似性度量在分类中表现良 tion,TPLRMC)方法,它利用重构系数代替残差来 好B6。如果一个训练样本x,与查询样本y非常 选择近邻,再进行分类。由于表示系数可以保留 相似,那么在重构y时x:会有较大的表示系数。 原始高维数据和潜在分类信息的一些固有几何特 因此,LRMNN认为具有最大表示系数:的样本 性,因此表示系数可应用于降维。这些基于表示 系数的降维方法可以统一到图嵌入框架中回。最 x:与y最相似,从而可利用最相似样本对y进行 分类,分类规则如下: 近,用于线性回归的非负稀疏图学习方法1实现 c=argmax (4) 了标签预测和投影学习,并为基于图的学习提供 式中:i=1,2…,n;c是训练样本x的类标签。 了新的视角。因此,表示系数可以很好地应用于 1.2表示系数之和(SoC)分类 模式分类。 SRC使用L范数正则化约束,通过式(2)得 虽然基于表示系数的分类方法在许多实际的 到最优稀疏表示向量3,然后根据查询样本与训 人脸识别任务中表现良好,但其分类性能会受到 练样本的残差进行分类。SoC算法是在SRC的 人脸图像变化的显著影响),且有些没有考虑过 程中数据非平衡的问题。为了进一步提高对人 基础上用同类样本的表示系数之和对查询样本进 行分类,其分类规则为 脸图像的分类性能,本文提出了一种基于L范数 或L2范数的自适应多阶段线性重构表示的分类 c=argmax.∑6() (5)
L1 L2 数表示方法是用 范数对表示系数进行正则化, 其中最典型的方法是基于稀疏表示的分类 (sparse representation based classification,SRC)[3]。SRC 使 用训练样本的稀疏组合来表示查询样本,并根据 类的重构残差对查询样本进行分类。当使用 范数对表示系数正则化时,可获得一个闭合解, 提高了算法的稳定性,在分类时具有很好的区分 性 [1]。最典型的方法是基于协同表示的分类 (collaborative representation based classification, CRC)[1] ,它利用训练样本之间的协作来表示查询 样本。受 CRC 的启发,文献 [4] 中提出了两阶段 测试样本稀疏表示 (two-phase test sample sparse representation,TPTSR) 方法,该方法通过近邻来重 构查询样本并进行分类。 L1 L2 L1 L1 L1 k 在 RBC 方法中,表示系数可以用来描述样本 之间的相似性[5-10] ,在设计分类器时可直接采用这 些表示系数[5-7]。例如,基于线性重构度量的最近 邻 (linear reconstruction measure nearest neighbor, LRMNN) 分类[5] 使用 范数或 范数正则化的 表示系数作为线性重构度量 (linear reconstruction measure,LRM) 来确定查询样本的最近邻,这里的 表示系数也称为线性重构系数。Cheng 等 [6] 提出 的稀疏性诱导相似性度量使用了 范数正则化 的表示系数作为标签传播和动作识别的相似性度 量。Li 等 [7] 将 范数的表示系数之和 (sum of coefficient,SoC) 用于分类决策。文献 [8] 指出类 似的样本应该用相似的稀疏表示系数进行编码。 文献 [9] 将样本权重的表示系数用于数据集的自 动图构建。Ma 等 [10] 提出了基于 范数正则化的 稀疏系数 近邻分类。文献 [11] 则在 TPTSR 基 础上提出基于两阶段线性重构度量的分类 (twophase linear reconstruction measure based classification,TPLRMC) 方法,它利用重构系数代替残差来 选择近邻,再进行分类。由于表示系数可以保留 原始高维数据和潜在分类信息的一些固有几何特 性,因此表示系数可应用于降维。这些基于表示 系数的降维方法可以统一到图嵌入框架中[12]。最 近,用于线性回归的非负稀疏图学习方法[13] 实现 了标签预测和投影学习,并为基于图的学习提供 了新的视角。因此,表示系数可以很好地应用于 模式分类。 L1 L2 虽然基于表示系数的分类方法在许多实际的 人脸识别任务中表现良好,但其分类性能会受到 人脸图像变化的显著影响[2] ,且有些没有考虑过 程中数据非平衡的问题[14]。为了进一步提高对人 脸图像的分类性能,本文提出了一种基于 范数 或 范数的自适应多阶段线性重构表示的分类 (self-adaptive multi-phase linear reconstruction representation based classification,MPRBC) 方法。首先, 用表示系数代替残差来表示查询样本与训练样本 之间的相似性,系数越大表示它们越相似。用近 邻类代替近邻样本,保留近邻类中的全部样本, 保持样本数据的平衡。用多次选择近邻代替单次 选择,同时利用自适应的方法控制算法的时间复 杂度。在 6 个人脸数据集上的实验表明,MPRBC 算法优于目前最先进的基于表示的分类方法。 1 相关 RBC 算法 X = [ X 1 X 2 ··· X M0 ] = [x1 x2 ··· xn] ∈ R d×n n M0 d X i i ci ∈ {1, 2, ··· , M0} 本节主要回顾已有的一些 RBC 方法。给定训 练样本 为 个属于 类的 维样本, 表示属于第 类的 训练样本子集,其对应的类标签为 。 1.1 基于线性重构度量的最近邻 (LRMNN) 分类 一般的线性重构度量 (LRM) 问题可表示为 min s ∥y− Xs∥ 2 2 (1) s = [s1 s2 ··· sn] T ∈ R n si y xi sˆ = [sˆ1 sˆ2 ··· sˆn] T ∈ R n sˆi y xi 式中: 表示线性重构系数, 代表 与 的相似性。设 是问题 (1) 的最优解,则 越大,说明 与 越相 似。为了克服奇异值问题并控制过拟合,在 LRM 目标函数中增加正则化项对表示系数进行约束, 得到以下正则化 LRM 模型: min s ∥y− Xs∥ 2 2 +λ∥s∥p (2) λ p p = s p = s 式中 : 是平衡参数,用来平衡重建误差项和正 则化项之间的贡献; 通常设置为 1 或 2,当 1 时, 为稀疏表示系数,文献 [3] 中给出了详细的 求解过程;当 2 时, 为协同表示系数,其最优 解为 sˆ = (X TX+λI) −1X T y (3) xi y y xi sˆi xi y y 基于表示系数的相似性度量在分类中表现良 好 [5-6, 8]。如果一个训练样本 与查询样本 非常 相似,那么在重构 时 会有较大的表示系数。 因此,LRMNN 认为具有最大表示系数 的样本 与 最相似,从而可利用最相似样本对 进行 分类,分类规则如下: c = argmaxci ∥sˆi∥ (4) 式中 :i = 1,2,··· ,n; ci 是训练样本 xi 的类标签。 1.2 表示系数之和 (SoC) 分类 L1 sˆ SRC 使用 范数正则化约束,通过式 (2) 得 到最优稀疏表示向量 ,然后根据查询样本与训 练样本的残差进行分类。SoC 算法[9] 是在 SRC 的 基础上用同类样本的表示系数之和对查询样本进 行分类,其分类规则为 c = argmaxci ∑ δ ci (sˆ) (5) 第 5 期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·965·
·966· 智能系统学报 第15卷 式中∑6()为向量中c:类训练类样本的表示 系数之和。 1.3两阶段线性重构度量分类(TPLRMC) TPLRMC方法)分为两个阶段。首先,利用 -0.060.12 140.048 正则化LRM模型获得查询样本的一个粗略的线 性表示,并根据系数的大小依次从所有的训练样 本中选择K个近邻。假设对查询样本y和训练 样本集x,由式(2)得到最优解为,其分量是训 0.04840.0246-0.003 练样本的表示系数。根据“训练样本的表示系数 01548 越大,则该训练样本对重构查询样本的贡献就越 图1部分训练样本表示系数 大”的原则,,将所有训练样本的表示系数按由 Fig.1 Representation coefficients of some training samples 大到小的顺序排序,并选出前K个较大的系数所 若利用类系数则可得到同类训练样本对重构 对应的样本,记为=[配12…x],这些样本所 查询样本的总贡献。在图1中,与查询样本同类 在的类共H个,类集合记为C={G,c2,…,cal,它 的训练样本系数之和(0.3460)最大。此时,利用 是所有样本类别的一个子集,即Cs{c1,c2,…,cMlo 同类中训练样本做整体协同表示,可以捕捉到更 其次,利用先前选出的K个训练样本对查 多的变化,其表示能力比单个样本要强,这有利 询样本进行精细表示,其最优表示系数优化模型为 于对查询样本进行正确分类。该思想类似于集成 min ly-s+sll (6) 学习中投票的方法,它充分利用了训练样本的类 设式(6)的最优解为5,计算中对应于同一 别信息,并且可以抵消表示系数较平均时产生 类训练样本的表示系数之和,那么和最大的一个 的影响,筛选掉系数有较大方差的类,保留的样 所对应的类即为查询样本的类别,分类规则类似 本数据具有平衡性的特点。但是在类别数较多 于式(⑤)。 的数据集上,由于类基数较大,且不同类别训练 样本的类系数之间的差异不太明显,这些都会影 2自适应多阶段线性重构表示分类 响分类的精度。 根据TPLRMC的思想,利用同类样本表示系 运用TPLRMC算法选择近邻样本之后再进 数之和(以下称其为类系数)按由大到小的选择 行重构表示的思想,本文使用了多阶段的方法, 策略,经过对查询样本近邻类的多次选择,逐渐 在每一阶段,利用查询样本重构后类系数的大 缩小训练样本范围,提出一种自适应多阶段线性 小,筛选出与查询样本相似类别的所有训练样 重构表示的分类(MPRBC)方法。 本,这也是熵减小理论的体现。随着过程的进 2.1 MPRBC的基本思想 行,选出的训练样本将集中在少数几类中,这样 在SRC1和TPTSR)中,根据训练样本与查 使得类别之间贡献的区分度更加明显,从而提高 询样本之间的残差来对给定查询样本进行分类或 了分类精度。以Yale人脸数据集为例,从每一类 选择近邻,是不够准确的6”。这是因为残差只能 中选出6张图片作为训练样本,而查询样本来自 反映训练样本与查询样本的相似度,而不能反映 第15类,通过L2范数正则化问题(2)求得各训练 训练样本对查询样本重构的贡献大小和贡献的正 样本的表示系数,各训练样本与查询样本的残差 负属性。 和表示系数及类系数分别如图2(a)(c)所示,而 相比利用残差进行分类,直接通过表示系数 图2(d)则是由MPRBC算法筛选出的5个类的类 进行分类,能很好地还原样本之间的关系,且易 系数。在图2(a)中,两个最小残差之比为1:1.4616, 于实现。LRMNN正是基于此进行分类的,但其 它们对应两个来自不同类的训练样本;图2(b) 也有一定的局限性。例如,当各训练样本的表示 中两个最大表示系数之比为1:1.9259,它们也对 系数比较平均时,LRMNN分类的准确性将显著 应于两个不同类的训练样本;在图2(©)中,两个最 下降。图1给出了重构查询样本时各训练样本的 大的类系数之比为1:3.2087:而图2(d)是在使用 表示系数,由图可见,与查询样本同类的训练样 MPRBC算法经过3个阶段之后,训练样本的类别 本系数相对比较平均,而最大的表示系数(0.2516) 数由原来的15个减小到5个,此时两个最大的类 所对应的训练样本与查询样本是非同类的,此时 系数之比为1:6.3917,这表明,相比以往RBC算 通过LRMNN算法将得到错误的分类结果。 法,MPRBC算法的分类区分度最明显
∑ δ ci 式中 (sˆ) 为向量 sˆ 中 ci 类训练类样本的表示 系数之和。 1.3 两阶段线性重构度量分类 (TPLRMC) K y X sˆ K X¯ = [x¯1 x¯2 ··· x¯K] C¯ = {c¯1, c¯2, ··· , c¯H} C¯ ⊆ {c1, c2, ··· , cM} TPLRMC 方法[7] 分为两个阶段。首先,利用 正则化 LRM 模型获得查询样本的一个粗略的线 性表示,并根据系数的大小依次从所有的训练样 本中选择 个近邻。假设对查询样本 和训练 样本集 ,由式 (2) 得到最优解为 ,其分量是训 练样本的表示系数。根据“训练样本的表示系数 越大,则该训练样本对重构查询样本的贡献就越 大”的原则[9,11] ,将所有训练样本的表示系数按由 大到小的顺序排序,并选出前 个较大的系数所 对应的样本,记为 ,这些样本所 在的类共 H 个,类集合记为 ,它 是所有样本类别的一个子集,即 。 其次,利用先前选出的 K 个训练样本 X¯ 对查 询样本进行精细表示,其最优表示系数优化模型为 min s y− Xs¯ 2 2 +λ∥s∥p (6) 设式 (6) 的最优解为 s¯,计算 s¯ 中对应于同一 类训练样本的表示系数之和,那么和最大的一个 所对应的类即为查询样本的类别,分类规则类似 于式 (5)。 2 自适应多阶段线性重构表示分类 根据 TPLRMC 的思想,利用同类样本表示系 数之和 (以下称其为类系数) 按由大到小的选择 策略,经过对查询样本近邻类的多次选择,逐渐 缩小训练样本范围,提出一种自适应多阶段线性 重构表示的分类 (MPRBC) 方法。 2.1 MPRBC 的基本思想 在 SRC[3] 和 TPTSR[4] 中,根据训练样本与查 询样本之间的残差来对给定查询样本进行分类或 选择近邻,是不够准确的[5-7]。这是因为残差只能 反映训练样本与查询样本的相似度,而不能反映 训练样本对查询样本重构的贡献大小和贡献的正 负属性。 相比利用残差进行分类,直接通过表示系数 进行分类,能很好地还原样本之间的关系,且易 于实现。LRMNN 正是基于此进行分类的,但其 也有一定的局限性。例如,当各训练样本的表示 系数比较平均时,LRMNN 分类的准确性将显著 下降。图 1 给出了重构查询样本时各训练样本的 表示系数,由图可见,与查询样本同类的训练样 本系数相对比较平均,而最大的表示系数 (0.251 6) 所对应的训练样本与查询样本是非同类的,此时 通过 LRMNN 算法将得到错误的分类结果。 0. 154 8 0.346 0 −0.042 0.077 8 0.058 4 0.029 5 0.104 2 −0.016 0.121 4 0.048 1 −0.192 −0.052 0.251 6 0.048 4 0.024 6−0.003 图 1 部分训练样本表示系数 Fig. 1 Representation coefficients of some training samples 若利用类系数则可得到同类训练样本对重构 查询样本的总贡献。在图 1 中,与查询样本同类 的训练样本系数之和 (0.346 0) 最大。此时,利用 同类中训练样本做整体协同表示,可以捕捉到更 多的变化,其表示能力比单个样本要强,这有利 于对查询样本进行正确分类。该思想类似于集成 学习中投票的方法,它充分利用了训练样本的类 别信息[7] ,并且可以抵消表示系数较平均时产生 的影响,筛选掉系数有较大方差的类,保留的样 本数据具有平衡性的特点[14]。但是在类别数较多 的数据集上,由于类基数较大,且不同类别训练 样本的类系数之间的差异不太明显,这些都会影 响分类的精度。 L2 运用 TPLRMC 算法选择近邻样本之后再进 行重构表示的思想,本文使用了多阶段的方法, 在每一阶段,利用查询样本重构后类系数的大 小,筛选出与查询样本相似类别的所有训练样 本,这也是熵减小理论的体现[15]。随着过程的进 行,选出的训练样本将集中在少数几类中,这样 使得类别之间贡献的区分度更加明显,从而提高 了分类精度。以 Yale 人脸数据集为例,从每一类 中选出 6 张图片作为训练样本,而查询样本来自 第 15 类,通过 范数正则化问题 (2) 求得各训练 样本的表示系数,各训练样本与查询样本的残差 和表示系数及类系数分别如图 2(a)~(c) 所示,而 图 2(d) 则是由 MPRBC 算法筛选出的 5 个类的类 系数。在图 2(a) 中,两个最小残差之比为 1∶1.4616, 它们对应两个来自不同类的训练样本;图 2(b) 中两个最大表示系数之比为 1∶1.925 9,它们也对 应于两个不同类的训练样本;在图 2(c)中,两个最 大的类系数之比为 1∶3.208 7;而图 2(d) 是在使用 MPRBC 算法经过 3 个阶段之后,训练样本的类别 数由原来的 15 个减小到 5 个,此时两个最大的类 系数之比为 1∶6.391 7,这表明,相比以往 RBC 算 法,MPRBC 算法的分类区分度最明显。 ·966· 智 能 系 统 学 报 第 15 卷
第5期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·967· 20 0.6 0.4 02 20 40 60 80 0.20 204060 80 100 训练样本编号 训练样本编号 (a)残差 (b)表示系数 10 1.0 0.8 08 0.6 09 0.4 0.4 0.2 0.2 0 0.2 4 6810121416 34 910 15 训练样本类编号 训练样本类编号 (c)类系数 (d)重构后的类系数 图2不同算法的残差或(类)系数 Fig.2 Residuals or (class)coefficients of different algorithms 2.2 MPRBC的实现过程 在算法中有两个参数α与B,α代表所选取 记在第k阶段训练样本集为X,通过以下L 类的类系数之和占所有正类系数总和的比例,取 范数或L2范数正则化的LRM,获得查询样本在 值范围为0<α≤1:B代表算法终止时所选训练样 X上的表示系数向量 本的类别数阈值,取值范围为1≤B≤Mo,其中Mo minlly-Xes匠+lslp (7 是训练样本的总类别数。参数α控制每次选取的 设式(7)的最优解为s,将s的各分量依据 类别数,确定算法进行的阶段数,进而影响算法 类别的不同求出类系数,并筛选出前M个拥有 的时间复杂度,而参数B则控制算法最后进行识 较大类系数的类(M将在2.3节式(9)中给出确定 别时所需要的类别数,其影响算法的识别率。在 方法)。然后,把属于这些类的训练样本重新组成 第k阶段,确定选取类别数的规则为 新的训练样本集X1,继续此过程,直到sk的各 M M:=arg max (9) 分量所对应的类别数不大于预先设定的阈值B为 1M6M-1 止,并输出具有最大类系数的类标签。 式中:SUM表示所有为正的类系数求和;SUM c=argmax.∑or(s) (8) 表示第c:类的类系数。注意,这里的类系数已经 式中:∑(s)为向量s中属于c类的训练样本 按降序排列。找到前M个拥有较大类系数的 类系数。 类,其类系数之和小于阈值α×SUM,并且前 2.3自适应MPRBC算法 M.+1个较大类系数之和不大于阈值a×SUM。 不同于以往的两阶段算法A,川和多阶段算 M的取值范围是1≤M≤Mk-,a控制每次选取 法需要人为确定选取样本的数目,MPRBC算 近邻类的步长,当α=1时,则每次选取类系数为 法可根据类系数的大小自适应地选取样本类别的 正的类。该策略能逐渐缩小查询样本近邻类的范 数目。在前文中已经分析,类系数的大小可以较 围。MPRBC算法的具体过程如算法1I61所示。 准确地反映该类对重构查询样本的贡献。当类系 算法1 MPRBC算法 数为正时,表示该类对查询样本有正面影响,当 输入训练样本集X,查询样本y,类别数 类系数为负时,表示该类对查询样本有负面影 Mo,=0。 响。在每一阶段中只选取类系数为正的类进入到 输出查询样本y的类别c。 下一阶段。 I)While M,大于设定阈值B,通过式(7)得出
2.2 MPRBC 的实现过程 Xk L1 L2 Xk 记在第 k 阶段训练样本集为 ,通过以下 范数或 范数正则化的 LRM,获得查询样本在 上的表示系数向量 min s ∥y− Xk s∥ 2 2 +λ∥s∥p (7) sk sk Mk Mk Xk+1 sk β 设式 (7) 的最优解为 ,将 的各分量依据 类别的不同求出类系数,并筛选出前 个拥有 较大类系数的类 ( 将在 2.3 节式 (9) 中给出确定 方法)。然后,把属于这些类的训练样本重新组成 新的训练样本集 ,继续此过程,直到 的各 分量所对应的类别数不大于预先设定的阈值 为 止,并输出具有最大类系数的类标签。 c = argmaxci ∑ δ ci ∑ (sk) (8) δ ci 式中: (sk) 为向量 sk 中属于 ci 类的训练样本 类系数。 2.3 自适应 MPRBC 算法 不同于以往的两阶段算法[4, 11] 和多阶段算 法 [15] 需要人为确定选取样本的数目,MPRBC 算 法可根据类系数的大小自适应地选取样本类别的 数目。在前文中已经分析,类系数的大小可以较 准确地反映该类对重构查询样本的贡献。当类系 数为正时,表示该类对查询样本有正面影响,当 类系数为负时,表示该类对查询样本有负面影 响。在每一阶段中只选取类系数为正的类进入到 下一阶段。 α β α 0 < α ⩽ 1 β 1 ⩽ β ⩽ M0 M0 α β 在算法中有两个参数 与 , 代表所选取 类的类系数之和占所有正类系数总和的比例,取 值范围为 ; 代表算法终止时所选训练样 本的类别数阈值,取值范围为 ,其中 是训练样本的总类别数。参数 控制每次选取的 类别数,确定算法进行的阶段数,进而影响算法 的时间复杂度,而参数 则控制算法最后进行识 别时所需要的类别数,其影响算法的识别率。在 第 k 阶段,确定选取类别数的规则为 Mk = argmax 1⩽M⩽Mk−1 ∑M i=1 SUMci <α×SUMc + (9) SUMc + SUMci ci Mk α×SUMc + Mk α×SUMc + Mk 1 ⩽ Mk ⩽ MK−1 α α = 1 式中: 表示所有为正的类系数求和; 表示第 类的类系数。注意,这里的类系数已经 按降序排列。找到前 个拥有较大类系数的 类,其类系数之和小于阈值 ,并且前 +1 个较大类系数之和不大于阈值 。 的取值范围是 , 控制每次选取 近邻类的步长,当 时,则每次选取类系数为 正的类。该策略能逐渐缩小查询样本近邻类的范 围。MPRBC 算法的具体过程如算法 1 [16] 所示。 算法 1 MPRBC 算法 X y M0 输入 训练样本集 ,查询样本 ,类别数 ,k=0。 输出 查询样本 y 的类别 c。 1) While Mk 大于设定阈值 β ,通过式 (7) 得出 20 15 10 5 0 20 40 60 80 0 20 40 60 80 100 训练样本编号 训练样本编号 训练样本类编号 训练样本类编号 (a) 残差 残差 表示系数 类系数 重构后的类系数 0.6 0.4 0.2 0 −0.2 (b) 表示系数 (c) 类系数 2 4 6 8 10 12 14 16 1.0 0.8 0.6 0.4 0.2 0 0 −0.2 1.0 0.8 0.6 0.4 0.2 0 −0.2 (d) 重构后的类系数 3 4 9 10 15 图 2 不同算法的残差或 (类) 系数 Fig. 2 Residuals or (class) coefficients of different algorithms 第 5 期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·967·
·968· 智能系统学报 第15卷 训练样本X的表示系数s; 中TPLRMC所表示的平面为TPLRMC算法识别 2)根据式(9)确定M+1 率的参照平面。图4显示了在AR数据集上固定 3)选取与前M+1个较大的SUMs所对应的类 B=10,识别率随α值的变化。当α偏小时,说明 中所有样本,构成训练集X+1 算法选择类的步长较大,算法收敛较快,但识别 4)k=k+1; 率过低,随着α值的增大,其筛选类的过程逐渐 5)End while; 精细化,算法的识别率得到提升。由图3和图4 6)根据式(8)确定查询样本y的类别c。 可知,α值对较高识别精度的表达影响较小,但当 值较小时,随着B值的由小到大,MPRBC算法 3实验结果及分析 的退化速度加快。当a=1时,图5反映了MPRBC 算法在各数据集上识别精度随B值的变化情 为了验证所提出的自适应多阶段线性重构表 况。由此可知,要获得较好的识别性能,B的值不 示的分类(MPRBC)方法的有效性,选择6个人脸 能太小也不能过大。当B值较小时,最后一步用 数据集进行实验,各数据集的规模和特征如表1 来进行识别判断的类的个数就较少;当B值较大 所示。将MPRBC算法的分类精度与RBC方法 (如LRMNN(P=1,p=2)、SoC(p=1)7、SoC(p=2)、 时,算法的阶段数较少,甚至完全退化为SoC算 法,这些都会降低算法的识别精度。 TPLRMC(p=1,p=2)进行比较。对每个数据集, 表2给出了MPRBC与其他算法识别精度 从每类中随机选取L个图像作为训练样本,而余 的比较(MPRBC算法的识别精度由图5中的 下的样本作为查询样本。通过10次运行再求平 最高精度确定)。在所有数据集上,MPRBC算法 均得到每种方法的分类精度。 均具有最好的识别性能。SoC算法要比LRMNN 表1各人脸数据集的属性及特点 算法性能要好,这是因为SoC算法利用了样本的 Table 1 Attributes and characteristics of some face data- 标签,通过同类样本进行协同表示,是一种有监 bases 督的算法,而LRMNN算法只考虑单个样本表示 数据集样本数类别数 特征 的作用。因此根据类系数来进行分类能提高分类 Yale 165 15 有光照和表情变化 精度,这也从侧面说明MPRBC筛选相似类的策 有较大姿态变化 略比TPLRMC筛选相似样本的策略更能提高分 UMIST 575 20 类性能。另外,SoC算法通过一阶段和TPLRMC Bio 550 22 样本较相似 算法通过两阶段筛选近邻样本并进行分类,其本 ORL 400 40 有姿态和表情变化 质上是一种粗糙的筛选方法,且对于不同的查询 AR 2600 100 有光照表情变化,部分图像有遮挡 样本,选择近邻的个数没有差异性。而MPRBC FERET 1 400 200 有姿态光照和表情变化 算法通过多阶段进行近邻类的筛选,是一种精细 的筛选方法,且根据查询样本的不同,近邻类的 3.1识别精度的实验与分析 筛选具有差异性。比较MPRBC算法、SoC算法 图3给出了在AR数据集上参数a和B值的 和TPLRMC算法在各数据集上的实验结果,可以 变化对识别率的影响,其中L=7。图3中,随着 观察到多阶段比一阶段和二阶段更能提高分类精 a值由大到小而B值由小到大的变化,MPRBC的 度,并且随着数据集样本类别数的增多其分类精 识别率由较高趋于稳定,且趋于退化为SoC,图 度均有明显地提高。 TPLRMC TPLRMC 0.90 0.95 MPRBC MPRBC 0.88 0.90 0.86 0.85 0.84 0.8 100 0.8 0.6 0.4 40 60 80 0.6 0 0.4 0.2020 0.2020406080100 (a)p=1 (b)p=2 图3AR人脸数据集上的识别率 Fig.3 Recognition rates on AR face database
训练样本 Xk 的表示系数 sk; 2) 根据式 (9) 确定 Mk+1; Mk+1 SUMci Xk+1 3) 选取与前 个较大的 所对应的类 中所有样本,构成训练集 ; 4) k = k+1 ; 5) End while; 6) 根据式 (8) 确定查询样本 y 的类别 c。 3 实验结果及分析 L 为了验证所提出的自适应多阶段线性重构表 示的分类 (MPRBC) 方法的有效性,选择 6 个人脸 数据集进行实验,各数据集的规模和特征如表 1 所示。将 MPRBC 算法的分类精度与 RBC 方法 (如 LRMNN(p=1,p=2)[5] 、SoC(p=1) [7] 、SoC(p=2)、 TPLRMC(p=1,p=2)[11] ) 进行比较。对每个数据集, 从每类中随机选取 个图像作为训练样本,而余 下的样本作为查询样本。通过 10 次运行再求平 均得到每种方法的分类精度。 表 1 各人脸数据集的属性及特点 Table 1 Attributes and characteristics of some face databases 数据集 样本数 类别数 特征 Yale 165 15 有光照和表情变化 UMIST 575 20 有较大姿态变化 Bio 550 22 样本较相似 ORL 400 40 有姿态和表情变化 AR 2 600 100 有光照表情变化,部分图像有遮挡 FERET 1 400 200 有姿态光照和表情变化 3.1 识别精度的实验与分析 α β L = 7 α β 图 3 给出了在 AR 数据集上参数 和 值的 变化对识别率的影响,其中 。图 3 中,随着 值由大到小而 值由小到大的变化,MPRBC 的 识别率由较高趋于稳定,且趋于退化为 SoC,图 β α α α α α β α β β β β 中 TPLRMC 所表示的平面为 TPLRMC 算法识别 率的参照平面。图 4 显示了在 AR 数据集上固定 =10,识别率随 值的变化。当 偏小时,说明 算法选择类的步长较大,算法收敛较快,但识别 率过低,随着 值的增大,其筛选类的过程逐渐 精细化,算法的识别率得到提升。由图 3 和图 4 可知, 值对较高识别精度的表达影响较小,但当 值较小时,随着 值的由小到大,MPRBC 算法 的退化速度加快。当 =1 时,图 5 反映了 MPRBC 算法在各数据集上识别精度随 值的变化情 况。由此可知,要获得较好的识别性能, 的值不 能太小也不能过大。当 值较小时,最后一步用 来进行识别判断的类的个数就较少;当 值较大 时,算法的阶段数较少,甚至完全退化为 SoC 算 法,这些都会降低算法的识别精度。 表 2 给出了 MPRBC 与其他算法识别精度 的比较 (MPRBC 算法的识别精度由图 5 中的 最高精度确定)。在所有数据集上,MPRBC 算法 均具有最好的识别性能。SoC 算法要比 LRMNN 算法性能要好,这是因为 SoC 算法利用了样本的 标签,通过同类样本进行协同表示,是一种有监 督的算法,而 LRMNN 算法只考虑单个样本表示 的作用。因此根据类系数来进行分类能提高分类 精度,这也从侧面说明 MPRBC 筛选相似类的策 略比 TPLRMC 筛选相似样本的策略更能提高分 类性能。另外,SoC 算法通过一阶段和 TPLRMC 算法通过两阶段筛选近邻样本并进行分类,其本 质上是一种粗糙的筛选方法,且对于不同的查询 样本,选择近邻的个数没有差异性。而 MPRBC 算法通过多阶段进行近邻类的筛选,是一种精细 的筛选方法,且根据查询样本的不同,近邻类的 筛选具有差异性。比较 MPRBC 算法、SoC 算法 和 TPLRMC 算法在各数据集上的实验结果,可以 观察到多阶段比一阶段和二阶段更能提高分类精 度,并且随着数据集样本类别数的增多其分类精 度均有明显地提高。 0.90 0.88 0.86 0.84 0.82 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 α β 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 α β 识别率 识别率 TPLRMC MPRBC TPLRMC MPRBC 0.95 0.90 0.85 0.80 (a) p = 1 (b) p = 2 0 0 图 3 AR 人脸数据集上的识别率 Fig. 3 Recognition rates on AR face database ·968· 智 能 系 统 学 报 第 15 卷
第5期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·969 0.90 0.80 1.00 0.75 0.95 0.85 蟹0.70 解0.90 0.65 0.85 0.80 -MPRBC,L=3 0.60 0.80 0 -MPRBC.L=7 0.55 0.75 0.50 0.70 10 5 20 0.70 (a)Yale (b)UMIST 0.65 1.00 1.00 0.6 0.95 0.10.2 0.4 0.6 0.8 1.0 解0.95 =L=12 0.90 0.85 (ap=1 09 0.95 0.75 5 10152025 0.70 0 1020 0.90 -MPRBC,L=3 (c)Bio (d)ORL 0.85 -o-MPRBC.L=7 1.0 09 .6 部0.8 0 0.7 0.4 Q 0.75 0 0 0.70 20406080100 50100150200 0.10.2 0.4 0.6 0.8 1.0 (e)AR (f)FERET (b)p=2 图5 MPRBC算法在各人脸数据集上的识别率 图4参数a的影响 Fig.5 Recognition rates of MPRBC on some face data- Fig.4 Influence of parameter a bases 表2各人脸数据集上的识别精度 Table 2 Recognition accuracy of some face databases % LRMNN LRMNN SoC SoC TPLRMC TPLRMC MPRBC 数据集 MPRBC L 1) =2)问 (p=1)m (p=2) 2 s1)1 =2y1 3 55.75 50.42 68.67 66.67 68.17 67.17 69.50 69.92 Yale 5 60.33 56.00 76.78 74.56 77.67 76.22 79.22 79.44 5 85.12 77.03 83.68 8025 86.78 87.26 87.20 90.34 UMIST 10 94.83 85.07 93.89 93.33 95.89 95.84 96.51 96.91 8 87.03 76.31 87.07 86.20 88.70 90.11 89.4 90.75 Bio 12 91.54 73.74 92.42 90.04 93.22 94.30 93.24 94.69 3 84.32 76.75 87.54 86.79 86.79 88.86 88.68 90.46 ORL 5 91.35 81.50 92.65 93.45 9195 94.80 93.40 96.65 3 55.04 58.95 66.87 75.13 66.17 76.63 69.74 79.89 AR 7 71.42 59.83 84.10 82.26 84.16 91.63 88.41 93.63 2 36.98 25.46 40.49 25.99 42.38 40.90 46.61 51.76 FERET 49.83 19.05 54.40 21.55 57.13 52.12 65.47 63.17 3.2时间复杂度的实验与分析 AR数据集上L=7时参数a和B对算法阶段数 对于每一个查询样本,MPRBC与TPLRMC P和各阶段参与计算的训练样本的数量总和∑T 算法均通过L,范数或L2范数得到表示系数,其 的影响。注意,图7中TPLRMC算法选取样本总 时间复杂度受训练样本数T的影响)。在MPRBC 数为两阶段相加,而MPRBC算法为多阶段相 算法中,每阶段训练样本数随查询样本的不同自 加。图8反映的是不同a和B,MPRBC的CPU时 适应确定,而且MPRBC的阶段数P受T影响,不 间。图6-8中TPLRMC所表示的平面为TPLRMC 同查询样本也有差异。图6和图7分别给出了在 算法达到最高识别精度时,阶段数、参与计算样
0.2 0.4 0.6 0.8 α α MPRBC, L=3 MPRBC, L=7 MPRBC, L=3 MPRBC, L=7 (a) p = 1 (b) p = 2 0.90 0.85 0.80 0.75 0.70 0.90 0.95 0.85 0.80 0.75 0.70 0.65 0.60 识别率 识别率 1.0 0.1 0.2 0.4 0.6 0.8 0.1 1.0 图 4 参数 α 的影响 Fig. 4 Influence of parameter α 5 10 15 0.50 0.55 0.60 0.65 0.70 0.75 0.80 识别率 p=1, L=3 p=1, L=5 p=2, L=3 p=2, L=5 5 10 15 20 0.70 0.75 0.80 0.85 0.90 0.95 1.00 0.70 0.75 0.80 0.85 0.90 0.95 1.00 识别率 p=1, L=5 p=1, L=10 p=2, L=5 p=2, L=10 β β β β β β 5 10 15 20 25 0.90 0.95 1.00 识别率 p=1, L=8 p=1, L=12 p=2, L=8 p=2, L=12 10 20 30 40 识别率 p=1, L=3 p=1, L=5 p=2, L=3 p=2, L=5 20 40 60 80 100 0.4 0.5 0.6 0.7 0.8 0.9 1.0 识别率 p=1, L=3 p=1, L=7 p=2, L=3 p=2, L=7 50 100 150 200 0 0 0.1 0.2 0.3 0.4 0.5 0.6 识别率 p=1, L=2 p=1, L=4 p=2, L=2 p=2, L=4 (a) Yale (b) UMIST (c) Bio (d) ORL (e) AR (f) FERET 0 0 0 0 0 图 5 MPRBC 算法在各人脸数据集上的识别率 Fig. 5 Recognition rates of MPRBC on some face databases 3.2 时间复杂度的实验与分析 L1 L2 对于每一个查询样本,MPRBC 与 TPLRMC 算法均通过 范数或 范数得到表示系数,其 时间复杂度受训练样本数 T 的影响[1, 3]。在 MPRBC 算法中,每阶段训练样本数随查询样本的不同自 适应确定,而且 MPRBC 的阶段数 P 受 T 影响,不 同查询样本也有差异。图 6 和图 7 分别给出了在 L = 7 α β ∑P 1 T α β AR 数据集上 时参数 和 对算法阶段数 P 和各阶段参与计算的训练样本的数量总和 的影响。注意,图 7 中 TPLRMC 算法选取样本总 数为两阶段相加,而 MPRBC 算法为多阶段相 加。图 8 反映的是不同 和 ,MPRBC的 CPU 时 间。图 6~8 中 TPLRMC 所表示的平面为 TPLRMC 算法达到最高识别精度时,阶段数、参与计算样 表 2 各人脸数据集上的识别精度 Table 2 Recognition accuracy of some face databases % 数据集 L LRMNN (p=1)[5] LRMNN (p=2)[5] SoC (p=1)[7] SoC (p=2) TPLRMC (p=1)[11] TPLRMC (p=2)[11] MPRBC (p=1)[16] MPRBC (p=2)[16] Yale 3 55.75 50.42 68.67 66.67 68.17 67.17 69.50 69.92 5 60.33 56.00 76.78 74.56 77.67 76.22 79.22 79.44 UMIST 5 85.12 77.03 83.68 80.25 86.78 87.26 87.20 90.34 10 94.83 85.07 93.89 93.33 95.89 95.84 96.51 96.91 Bio 8 87.03 76.31 87.07 86.20 88.70 90.11 89.44 90.75 12 91.54 73.74 92.42 90.04 93.22 94.30 93.24 94.69 ORL 3 84.32 76.75 87.54 86.79 86.79 88.86 88.68 90.46 5 91.35 81.50 92.65 93.45 91.95 94.80 93.40 96.65 AR 3 55.04 58.95 66.87 75.13 66.17 76.63 69.74 79.89 7 71.42 59.83 84.10 82.26 84.16 91.63 88.41 93.63 FERET 2 36.98 25.46 40.49 25.99 42.38 40.90 46.61 51.76 4 49.83 19.05 54.40 21.55 57.13 52.12 65.47 63.17 第 5 期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·969·
·970· 智能系统学报 第15卷 本总数与CPU时间的参照平面。数据是所有 图7看出,阶段数与选取样本总数之间呈现正 查询样本分别计算10次后的平均值。由图6和 相关。 TPLRMC ☐TPLRMC MPRBC 5 6 MPRBC 4 2 10 0.8 0 100 0.8 100 0.6 60 80 0.6 60 80 0.4 0.2020 40 0.4 40 0.2020 B (ap=1 (b)p=2 图6 IPRBC的阶段数 Fig.6 Phase number of MPRBC T TPLRMC 2000 1400 TPLRMC 1800 MPRBC MPRBC 1600 200 400 200 1000 800 800 1.0 1.0 0.8 100 0.8 0.6 0.4 0.202040 60 80 0.6 60 80100 B 0.4 40. 0.2020 B (a)p=1 (b)p=2 图7 MPRBC各阶段训练样本总数 Fig.7 Total number of training samples of MPRBC at each stage TPLRMC 150 TPLRMC MPRBC 30 MPRBC 100 10 50 10 08 100 0.6 0.8 100 0.4 60 80 0.6 60 80 0.2020 0 0.4 0.2020 40 (a)p=1 (b)p=2 图8 IPRBC的CPU时间 Fig.8 CPU times of MPRBC 当a=1时,MPRBC算法在3个数据集上的最 是因为不同类的训练样本在重构查询样本时其差 高识别精度所对应的CPU时间如表3所示,表中 异性不足,需要通过增加阶段数来提高识别精 数据括号内为MPRBC算法所用平均阶段数。通 度。而由图3和图8可知,减小α值,在识别性能 过实验观察,在L范数约束下,随着样本类别数 优于TPLRMC的情况下,MPRBC仍能减小算法 的增加,MPRBC(p=I)算法的阶段数也增加,算法 的CPU时间。总之,自适应算法在保证较高识别 的CPU时间也呈现递增趋势。在L2范数约束 精度的同时,由于对各查询样本进行差异化地表 下,MPRBC(p=2)算法的CPU时间较高,这可能 示,算法的CPU时间保持相对较低水平
本总数与 CPU 时间的参照平面。数据是所有 查询样本分别计算 10 次后的平均值。由图 6 和 图 7 看出,阶段数与选取样本总数之间呈现正 相关。 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 20 40 60 80 100 α β β 1.0 0.8 0.6 0.4 0.2 α TPLRMC MPRBC TPLRMC MPRBC 7 6 5 4 3 2 1 5 4 3 2 1 阶段数 阶段数 (a) p = 1 (b) p = 2 0 0 图 6 MPRBC 的阶段数 Fig. 6 Phase number of MPRBC 100 选取样本总数 选取样本总数 TPLRMC MPRBC 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 20 40 60 80 100 α β β 1.0 0.8 0.6 0.4 0.2 α TPLRMC MPRBC (a) p = 1 (b) p = 2 2 000 1 800 1 600 1 400 1 200 1 000 800 1 400 1 200 1 000 800 0 0 图 7 MPRBC 各阶段训练样本总数 Fig. 7 Total number of training samples of MPRBC at each stage 50 100 150 TPLRMC MPRBC 0 10 20 30 TPLRMC MPRBC CPU 时间/s CPU 时间/s 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 20 40 60 80 100 α β β 1.0 0.8 0.6 0.4 0.2 α (a) p = 1 (b) p = 2 0 0 图 8 MPRBC 的 CPU 时间 Fig. 8 CPU times of MPRBC α L1 L2 当 =1 时,MPRBC 算法在 3 个数据集上的最 高识别精度所对应的 CPU 时间如表 3 所示,表中 数据括号内为 MPRBC 算法所用平均阶段数。通 过实验观察,在 范数约束下,随着样本类别数 的增加,MPRBC(p=1) 算法的阶段数也增加,算法 的 CPU 时间也呈现递增趋势。在 范数约束 下,MPRBC(p=2) 算法的 CPU 时间较高,这可能 α 是因为不同类的训练样本在重构查询样本时其差 异性不足,需要通过增加阶段数来提高识别精 度。而由图 3 和图 8 可知,减小 值,在识别性能 优于 TPLRMC 的情况下,MPRBC 仍能减小算法 的 CPU 时间。总之,自适应算法在保证较高识别 精度的同时,由于对各查询样本进行差异化地表 示,算法的 CPU 时间保持相对较低水平。 ·970· 智 能 系 统 学 报 第 15 卷
第5期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·971· 表3CPU时间 2016,26(4):613-626 Table 3 CPU times [7]LI Jiang,LU Canyi.A new decision rule for sparse repres- TPLRMC MPRBC entation based classification for face recognition[J].Neuro- 数据集 L (=1)m 0p=2m=p=2 computing,2013,116:265-271 [8]GAO Shenghua,TSANG I W H,CHIA L T.Laplacian 3 2.32 0.11 1.22(1.1)0.27(3.6) ORL sparse coding,hypergraph laplacian sparse coding,and ap- 2.89 0.23 1.83(1.5)0.36(3.4) plications[J].IEEE transactions on pattern analysis and 3 55.64 7.05 49.47(2.2)6.97(2.0) machine intelligence,2013,35(1):92-104 AR > 90.41 13.4699.61(3.1)24.66(3.1) [9]QIAO Lishan,CHEN Songcan,TAN Xiaoyang.Sparsity preserving projections with applications to face recogni- 2 24.00 1.01 30.43(3.7)6.36(4.5) FERET tion[J].Pattern recognition,2010,43(1):331-341 1 27.12 2.25 37.00(3.8)10.47(4.2) [10]MA Hongxing,GOU Jianping,WANG Xili,et al.Sparse coefficient-based k-nearest neighbor classification[J]. 4结束语 IEEE access,.2017,5:16618-16634 [11]GOU Jianping,XU Yong,ZHANG D,et al.Two-phase 本文提出了一种自适应多段线性重构表示的 linear reconstruction measure-based classification for face 分类MPRBC)方法。基于熵减少原则,通过多阶 recognition[J].Information sciences,2018,433-434: 17-36. 段的方法,利用同类训练样本表示系数之和筛选 [12]YAN Shuicheng,XU Dong,ZHANG Benyu,et al.Graph 样本,将分类集中在类别数较少的训练样本上, embedding and extensions:a general framework for di- 使得所选样本在具有较大重构贡献的同时保证了 mensionality reduction[J].IEEE transactions on pattern 样本的稀疏类概率分布,达到了提高训练样本表 analysis and machine intelligence,2007,29(1):40-51. 示能力的目的。其次,算法拥有基于自适应的选 [13]FANG Xiaozhao,XU Yong,LI Xuelong,et al.Learning a 择过程,能对不同查询样本进行差异化表示,并 nonnegative sparse graph for linear regression[J].IEEE 在部分数据集上减小了CPU时间。实验表明,该 transactions on image processing,2015,24(9): 算法性能优于其他RBC算法,且在类别数较多的 2760-2771. [14]叶志飞,文益民,吕宝粮.不平衡分类问题研究综述 数据集上识别精度有明显的提升。 智能系统学报,2009,4(2):148-156. 参考文献: YE Zhifei,WEN Yimin,LV Baoliang.A survey of imbal- anced pattern classification problems[J].CAAI transac- [1]ZHANG Lei,YANG Meng,FENG Xiangchu.Sparse rep- tions on intelligent systems,2009,4(2):148-156. resentation or collaborative representation:which helps [15]LIU Fan,TANG Jinhui,SONG Yan,et al.Local struc- face recognition[Cl//Proceedings of the 2011 International ture based multi-phase collaborative representation for Conference on Computer Vision.Barcelona,Spain,2011: face recognition with single sample per person[J].Inform- 471-478 ation sciences.2016,346-347:198-215. [2]XU Yong,LI Xuelong,YANG Jian,et al.Integrating con- [16]QIAN J B.data[EB/OL].Github,2019(2019-05-30) ventional and inverse representation for face recogni- [2019-05].https://github.com/greatQntgz/MPRBC tion[J].IEEE transactions on cybernetics,2014,44(10): 作者简介: 1738-1746 [3]WRIGHT J,YANG A Y,GANESH A,et al.Robust face 钱剑滨,硕士研究生,主要研究方 recognition via sparse representation[J].IEEE transactions 向为模式识别、图像处理。 on pattern analysis and machine intelligence,2009,31(2): 210-227 [4]XU Yong,ZHANG D,YANG Jian,et al.A two-phase test sample sparse representation method for use with face re- cognition[J].IEEE transactions on circuits and systems for video technology,2011,21(9):1255-1262. 陈秀宏,教授,主要研究方向为数 [5]ZHANG Jian,YANG Jian.Linear reconstruction measure 字图像处理和模式识别、目标检测与 steered nearest neighbor classification framework[J].Pat- 跟踪、优化理论与方法。发表学术论 tern recognition,2014,47(4):1709-1720. 文110余篇。 [6]CHENG H,LIU Zicheng,HOU Lei,et al.Sparsity-in- duced similarity measure and its applications[J].IEEE transactions on circuits and systems for video technology
表 3 CPU 时间 Table 3 CPU times s 数据集 L TPLRMC MPRBC (p=1)[11] (p=2)[11] (p=1)[16] (p=2)[16] ORL 3 2.32 0.11 1.22(1.1) 0.27(3.6) 5 2.89 0.23 1.83(1.5) 0.36(3.4) AR 3 55.64 7.05 49.47(2.2) 6.97(2.0) 7 90.41 13.46 99.61(3.1) 24.66(3.1) FERET 2 24.00 1.01 30.43(3.7) 6.36(4.5) 4 27.12 2.25 37.00(3.8) 10.47(4.2) 4 结束语 本文提出了一种自适应多段线性重构表示的 分类 (MPRBC) 方法。基于熵减少原则,通过多阶 段的方法,利用同类训练样本表示系数之和筛选 样本,将分类集中在类别数较少的训练样本上, 使得所选样本在具有较大重构贡献的同时保证了 样本的稀疏类概率分布,达到了提高训练样本表 示能力的目的。其次,算法拥有基于自适应的选 择过程,能对不同查询样本进行差异化表示,并 在部分数据集上减小了 CPU 时间。实验表明,该 算法性能优于其他 RBC 算法,且在类别数较多的 数据集上识别精度有明显的提升。 参考文献: ZHANG Lei, YANG Meng, FENG Xiangchu. Sparse representation or collaborative representation: which helps face recognition[C]//Proceedings of the 2011 International Conference on Computer Vision. Barcelona, Spain, 2011: 471−478. [1] XU Yong, LI Xuelong, YANG Jian, et al. Integrating conventional and inverse representation for face recognition[J]. IEEE transactions on cybernetics, 2014, 44(10): 1738–1746. [2] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE transactions on pattern analysis and machine intelligence, 2009, 31(2): 210–227. [3] XU Yong, ZHANG D, YANG Jian, et al. A two-phase test sample sparse representation method for use with face recognition[J]. IEEE transactions on circuits and systems for video technology, 2011, 21(9): 1255–1262. [4] ZHANG Jian, YANG Jian. Linear reconstruction measure steered nearest neighbor classification framework[J]. Pattern recognition, 2014, 47(4): 1709–1720. [5] CHENG H, LIU Zicheng, HOU Lei, et al. Sparsity-induced similarity measure and its applications[J]. IEEE transactions on circuits and systems for video technology, [6] 2016, 26(4): 613–626. LI Jiang, LU Canyi. A new decision rule for sparse representation based classification for face recognition[J]. Neurocomputing, 2013, 116: 265–271. [7] GAO Shenghua, TSANG I W H, CHIA L T. Laplacian sparse coding, hypergraph laplacian sparse coding, and applications[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(1): 92–104. [8] QIAO Lishan, CHEN Songcan, TAN Xiaoyang. Sparsity preserving projections with applications to face recognition[J]. Pattern recognition, 2010, 43(1): 331–341. [9] MA Hongxing, GOU Jianping, WANG Xili, et al. Sparse coefficient-based k-nearest neighbor classification[J]. IEEE access, 2017, 5: 16618–16634. [10] GOU Jianping, XU Yong, ZHANG D, et al. Two-phase linear reconstruction measure-based classification for face recognition[J]. Information sciences, 2018, 433–434: 17–36. [11] YAN Shuicheng, XU Dong, ZHANG Benyu, et al. Graph embedding and extensions: a general framework for dimensionality reduction[J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 29(1): 40–51. [12] FANG Xiaozhao, XU Yong, LI Xuelong, et al. Learning a nonnegative sparse graph for linear regression[J]. IEEE transactions on image processing, 2015, 24(9): 2760–2771. [13] 叶志飞, 文益民, 吕宝粮. 不平衡分类问题研究综述 [J]. 智能系统学报, 2009, 4(2): 148–156. YE Zhifei, WEN Yimin, LV Baoliang. A survey of imbalanced pattern classification problems[J]. CAAI transactions on intelligent systems, 2009, 4(2): 148–156. [14] LIU Fan, TANG Jinhui, SONG Yan, et al. Local structure based multi-phase collaborative representation for face recognition with single sample per person[J]. Information sciences, 2016, 346–347: 198–215. [15] QIAN J B. data[EB/OL]. Github, 2019 (2019−05−30) [2019−05]. https://github.com/greatQntgz/MPRBC [16] 作者简介: 钱剑滨,硕士研究生,主要研究方 向为模式识别、图像处理。 陈秀宏,教授,主要研究方向为数 字图像处理和模式识别、目标检测与 跟踪、优化理论与方法。发表学术论 文 110 余篇。 第 5 期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·971·