【机器感知与模式识别】自适应多阶段线性重构表示分类的人脸识别

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：4.24MB

第15卷第5期智能系统学报 Vol.15 No.5 2020年9月 CAAI Transactions on Intelligent Systems Sep.2020 D0:10.11992/tis.201904002 网络出版地址：http:/kns.cnki.net/kcms/detail/23.1538.tp.20191014.1042.002.html 自适应多阶段线性重构表示分类的人脸识别钱剑滨，陈秀宏 (江南大学数字媒体学院，江苏无锡214122) 摘要：针对以往基于表示的分类（®BC)方法在类别数较多的数据集上性能不佳的问题，提出了一种自适应多阶段线性重构表示的分类(MPRBC)方法。在每一阶段，首先得到L,范数或L2范数正则化的重构表示系数，然后将表示系数按类求和，根据和的大小来选取相似类，并保留相似类中的全部样本作为下一阶段的训练样本。该策略最终产生具有高分类置信度的稀疏类概率分布，根据类系数的大小自适应选择相似的类，提高了分类计算的效率。实验结果表明，该方法分类性能优于其他RBC方法，特别是在类别数较多的数据集上性能提升明显，并且CPU时间保持相对较低水平。关键词：人脸识别；自适应：多阶段：线性重构；表示系数；分类方法；稀疏表示：协同表示；模式识别中图分类号：TP391.4文献标志码：A文章编号：1673-4785(2020)05-0964-08 中文引用格式：钱剑滨，陈秀宏.自适应多阶段线性重构表示分类的人脸识别J.智能系统学报，2020,15(5)：964-971. 英文引用格式：QIAN Jianbin,CHEN Xiuhong..Self-adaptive multi-phase linear reconstruction representation based classification for face recognition CAAI transactions on intelligent systems,2020,15(5):964-971. Self-adaptive multi-phase linear reconstruction representation based classification for face recognition QIAN Jianbin,CHEN Xiuhong (School of Digital Media,Jiangnan University,Wuxi 214122,China) Abstract:Representation-based classification(RBC)methods have recently been the promising pattern recognition technologies for object recognition.The representation coefficients of RBC as the linear reconstruction measure can be well used for classifying objects.But RBC methods performs very poorly on large-class-databases and in order to solve the problem of poor performance,a self-adaptive multi-phase linear reconstruction representation based classification (MPRBC)method is proposed.In this process,at first,the reconstruction coefficients regularized by L-norm or La-norm are obtained.Then the similar classes are selected according to the sum of the representation coefficients in each class, and all samples of similar classes are retained as training samples for the next stage.This strategy finally produces a sparse class probability distribution with higher classification confidence.The similar classes are selected adaptively ac- cording to the values of class coefficients,which improves the efficiency of the classification.Experimental results show that the proposed method is better than other RBC methods,especially on large-class-databases,and CPU time remains relatively low. Keywords:face recognition;self-adaptive;multi-phase:linear reconstruction:representation coefficient;classification method,sparse representation;collaborative representation;pattern recognition 基于表示的分类(representation based classific-本，进而对查询样本进行分类I。在RBC框架 ation,RBC)方法通过训练样本来近似表示查询样中，如何准确地计算查询样本和每个类之间的相收稿日期：2019-04-02.网络出版日期：2019-10-14. 似性，对查询样本的表示和分类起着重要的作用。基金项目：江苏省研究生科研与实践创新计划项目 KYCX181871). 一般地，RBC方法可以分为基于L,范数的表示方通信作者：钱剑滨.E-mail:462501979@qq.com 法1和基于L2范数的表示方法2。基于L范

DOI: 10.11992/tis.201904002 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20191014.1042.002.html 自适应多阶段线性重构表示分类的人脸识别钱剑滨，陈秀宏（江南大学数字媒体学院，江苏无锡 214122）摘要：针对以往基于表示的分类 (RBC) 方法在类别数较多的数据集上性能不佳的问题，提出了一种自适应多阶段线性重构表示的分类 (MPRBC) 方法。在每一阶段，首先得到 L1 范数或 L2 范数正则化的重构表示系数，然后将表示系数按类求和，根据和的大小来选取相似类，并保留相似类中的全部样本作为下一阶段的训练样本。该策略最终产生具有高分类置信度的稀疏类概率分布，根据类系数的大小自适应选择相似的类，提高了分类计算的效率。实验结果表明，该方法分类性能优于其他 RBC 方法，特别是在类别数较多的数据集上性能提升明显，并且 CPU 时间保持相对较低水平。关键词：人脸识别；自适应；多阶段；线性重构；表示系数；分类方法；稀疏表示；协同表示；模式识别中图分类号：TP391.4 文献标志码：A 文章编号：1673−4785(2020)05−0964−08 中文引用格式：钱剑滨, 陈秀宏. 自适应多阶段线性重构表示分类的人脸识别 [J]. 智能系统学报, 2020, 15(5): 964–971. 英文引用格式：QIAN Jianbin, CHEN Xiuhong. Self-adaptive multi-phase linear reconstruction representation based classification for face recognition[J]. CAAI transactions on intelligent systems, 2020, 15(5): 964–971. Self-adaptive multi-phase linear reconstruction representation based classification for face recognition QIAN Jianbin，CHEN Xiuhong (School of Digital Media, Jiangnan University, Wuxi 214122, China) Abstract: Representation-based classification (RBC) methods have recently been the promising pattern recognition technologies for object recognition. The representation coefficients of RBC as the linear reconstruction measure can be well used for classifying objects. But RBC methods performs very poorly on large-class-databases and in order to solve the problem of poor performance, a self-adaptive multi-phase linear reconstruction representation based classification (MPRBC) method is proposed. In this process, at first, the reconstruction coefficients regularized by L1 -norm or L2 -norm are obtained. Then the similar classes are selected according to the sum of the representation coefficients in each class, and all samples of similar classes are retained as training samples for the next stage. This strategy finally produces a sparse class probability distribution with higher classification confidence. The similar classes are selected adaptively according to the values of class coefficients, which improves the efficiency of the classification. Experimental results show that the proposed method is better than other RBC methods, especially on large-class-databases, and CPU time remains relatively low. Keywords: face recognition; self-adaptive; multi-phase; linear reconstruction; representation coefficient; classification method; sparse representation; collaborative representation; pattern recognition 基于表示的分类 (representation based classification，RBC) 方法通过训练样本来近似表示查询样 L1 L2 L1 本，进而对查询样本进行分类[1]。在 RBC 框架中，如何准确地计算查询样本和每个类之间的相似性，对查询样本的表示和分类起着重要的作用[2]。一般地，RBC 方法可以分为基于范数的表示方法 [3] 和基于范数的表示方法[1-2, 4]。基于范收稿日期：2019−04−02. 网络出版日期：2019−10−14. 基金项目：江苏省研究生科研与实践创新计划项目 (KYCX18_1871). 通信作者：钱剑滨. E-mail：462501979@qq.com. 第 15 卷第 5 期智能系统学报 Vol.15 No.5 2020 年 9 月 CAAI Transactions on Intelligent Systems Sep. 2020

第5期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·965· 数表示方法是用L范数对表示系数进行正则化， (self-adaptive multi-phase linear reconstruction repres- 其中最典型的方法是基于稀疏表示的分类(sparse entation based classification,MPRBC)方法。首先， representation based classification.SRC)SRC 用表示系数代替残差来表示查询样本与训练样本用训练样本的稀疏组合来表示查询样本，并根据之间的相似性，系数越大表示它们越相似。用近类的重构残差对查询样本进行分类。当使用L2 邻类代替近邻样本，保留近邻类中的全部样本，范数对表示系数正则化时，可获得一个闭合解，保持样本数据的平衡。用多次选择近邻代替单次提高了算法的稳定性，在分类时具有很好的区分选择，同时利用自适应的方法控制算法的时间复性田。最典型的方法是基于协同表示的分类(col- 杂度。在6个人脸数据集上的实验表明，MPRBC laborative representation based classification, 算法优于目前最先进的基于表示的分类方法。 CRC)",它利用训练样本之间的协作来表示查询样本。受CRC的启发，文献[4]中提出了两阶段 1相关RBC算法测试样本稀疏表示(two-phase test sample sparse 本节主要回顾已有的一些RBC方法。给定训 representation,TPTSR)方法，该方法通过近邻来重练样本X=[XX2…X]=[x1x2…xJ∈Rm为构查询样本并进行分类。在RBC方法中，表示系数可以用来描述样本 n个属于Mo类的d维样本，X表示属于第i类的之间的相似性510，在设计分类器时可直接采用这训练样本子集，其对应的类标签为c:∈(1,2，·，Moo 些表示系数刀。例如，基于线性重构度量的最近 1.1基于线性重构度量的最近邻(LRMNN)分类般的线性重构度量(LRM)问题可表示为 (linear reconstruction measure nearest neighbor, LRMNN)分类使用L范数或L2范数正则化的 minl心y-Xs (1) 表示系数作为线性重构度量(linear reconstruction 式中：s=[s1s2…snJ∈R"表示线性重构系数，s measure,LRM)来确定查询样本的最近邻.，这里的代表y与x:的相似性。设3=[⑧132…J'∈R 表示系数也称为线性重构系数。Cheng等提出是问题()的最优解，则：越大，说明y与x:越相的稀疏性诱导相似性度量使用了L:范数正则化似。为了克服奇异值问题并控制过拟合，在LRM 的表示系数作为标签传播和动作识别的相似性度目标函数中增加正则化项对表示系数进行约束：量。Li等)将L,范数的表示系数之和(sum of 得到以下正则化LRM模型： coefficient,.SoC)用于分类决策。文献[8]指出类 min lly-Xsl+allsllp (2) 似的样本应该用相似的稀疏表示系数进行编码。式中：入是平衡参数，用来平衡重建误差项和正文献[9]将样本权重的表示系数用于数据集的自则化项之间的贡献；p通常设置为1或2，当p= 动图构建。Ma等o提出了基于L,范数正则化的 1时，s为稀疏表示系数，文献[3]中给出了详细的稀疏系数k近邻分类。文献[11]则在TPTSR基求解过程；当p=2时，s为协同表示系数，其最优础上提出基于两阶段线性重构度量的分类(two- 解为 8=(XTX+D-Xy (3) phase linear reconstruction measure based classifica- 基于表示系数的相似性度量在分类中表现良 tion,TPLRMC)方法，它利用重构系数代替残差来好B6。如果一个训练样本x,与查询样本y非常选择近邻，再进行分类。由于表示系数可以保留相似，那么在重构y时x:会有较大的表示系数。原始高维数据和潜在分类信息的一些固有几何特因此，LRMNN认为具有最大表示系数：的样本性，因此表示系数可应用于降维。这些基于表示系数的降维方法可以统一到图嵌入框架中回。最 x:与y最相似，从而可利用最相似样本对y进行分类，分类规则如下：近，用于线性回归的非负稀疏图学习方法1实现 c=argmax (4) 了标签预测和投影学习，并为基于图的学习提供式中：i=1,2…,n;c是训练样本x的类标签。了新的视角。因此，表示系数可以很好地应用于 1.2表示系数之和(SoC)分类模式分类。 SRC使用L范数正则化约束，通过式(2)得虽然基于表示系数的分类方法在许多实际的到最优稀疏表示向量3，然后根据查询样本与训人脸识别任务中表现良好，但其分类性能会受到练样本的残差进行分类。SoC算法是在SRC的人脸图像变化的显著影响)，且有些没有考虑过程中数据非平衡的问题。为了进一步提高对人基础上用同类样本的表示系数之和对查询样本进行分类，其分类规则为脸图像的分类性能，本文提出了一种基于L范数或L2范数的自适应多阶段线性重构表示的分类 c=argmax.∑6() (5)

L1 L2 数表示方法是用范数对表示系数进行正则化，其中最典型的方法是基于稀疏表示的分类 (sparse representation based classification，SRC)[3]。SRC 使用训练样本的稀疏组合来表示查询样本，并根据类的重构残差对查询样本进行分类。当使用范数对表示系数正则化时，可获得一个闭合解，提高了算法的稳定性，在分类时具有很好的区分性 [1]。最典型的方法是基于协同表示的分类 (collaborative representation based classification， CRC)[1] ，它利用训练样本之间的协作来表示查询样本。受 CRC 的启发，文献 [4] 中提出了两阶段测试样本稀疏表示 (two-phase test sample sparse representation，TPTSR) 方法，该方法通过近邻来重构查询样本并进行分类。 L1 L2 L1 L1 L1 k 在 RBC 方法中，表示系数可以用来描述样本之间的相似性[5-10] ，在设计分类器时可直接采用这些表示系数[5-7]。例如，基于线性重构度量的最近邻 (linear reconstruction measure nearest neighbor， LRMNN) 分类[5] 使用范数或范数正则化的表示系数作为线性重构度量 (linear reconstruction measure，LRM) 来确定查询样本的最近邻，这里的表示系数也称为线性重构系数。Cheng 等 [6] 提出的稀疏性诱导相似性度量使用了范数正则化的表示系数作为标签传播和动作识别的相似性度量。Li 等 [7] 将范数的表示系数之和 (sum of coefficient，SoC) 用于分类决策。文献 [8] 指出类似的样本应该用相似的稀疏表示系数进行编码。文献 [9] 将样本权重的表示系数用于数据集的自动图构建。Ma 等 [10] 提出了基于范数正则化的稀疏系数近邻分类。文献 [11] 则在 TPTSR 基础上提出基于两阶段线性重构度量的分类 (twophase linear reconstruction measure based classification，TPLRMC) 方法，它利用重构系数代替残差来选择近邻，再进行分类。由于表示系数可以保留原始高维数据和潜在分类信息的一些固有几何特性，因此表示系数可应用于降维。这些基于表示系数的降维方法可以统一到图嵌入框架中[12]。最近，用于线性回归的非负稀疏图学习方法[13] 实现了标签预测和投影学习，并为基于图的学习提供了新的视角。因此，表示系数可以很好地应用于模式分类。 L1 L2 虽然基于表示系数的分类方法在许多实际的人脸识别任务中表现良好，但其分类性能会受到人脸图像变化的显著影响[2] ，且有些没有考虑过程中数据非平衡的问题[14]。为了进一步提高对人脸图像的分类性能，本文提出了一种基于范数或范数的自适应多阶段线性重构表示的分类 (self-adaptive multi-phase linear reconstruction representation based classification，MPRBC) 方法。首先，用表示系数代替残差来表示查询样本与训练样本之间的相似性，系数越大表示它们越相似。用近邻类代替近邻样本，保留近邻类中的全部样本，保持样本数据的平衡。用多次选择近邻代替单次选择，同时利用自适应的方法控制算法的时间复杂度。在 6 个人脸数据集上的实验表明，MPRBC 算法优于目前最先进的基于表示的分类方法。 1 相关 RBC 算法 X = [ X 1 X 2 ··· X M0 ] = [x1 x2 ··· xn] ∈ R d×n n M0 d X i i ci ∈ {1, 2, ··· , M0} 本节主要回顾已有的一些 RBC 方法。给定训练样本为个属于类的维样本，表示属于第类的训练样本子集，其对应的类标签为。 1.1 基于线性重构度量的最近邻 (LRMNN) 分类一般的线性重构度量 (LRM) 问题可表示为 min s ∥y− Xs∥ 2 2 (1) s = [s1 s2 ··· sn] T ∈ R n si y xi sˆ = [sˆ1 sˆ2 ··· sˆn] T ∈ R n sˆi y xi 式中：表示线性重构系数，代表与的相似性。设是问题 (1) 的最优解，则越大，说明与越相似。为了克服奇异值问题并控制过拟合，在 LRM 目标函数中增加正则化项对表示系数进行约束，得到以下正则化 LRM 模型： min s ∥y− Xs∥ 2 2 +λ∥s∥p (2) λ p p = s p = s 式中：是平衡参数，用来平衡重建误差项和正则化项之间的贡献；通常设置为 1 或 2，当 1 时，为稀疏表示系数，文献 [3] 中给出了详细的求解过程；当 2 时，为协同表示系数，其最优解为 sˆ = (X TX+λI) −1X T y (3) xi y y xi sˆi xi y y 基于表示系数的相似性度量在分类中表现良好 [5-6, 8]。如果一个训练样本与查询样本非常相似，那么在重构时会有较大的表示系数。因此，LRMNN 认为具有最大表示系数的样本与最相似，从而可利用最相似样本对进行分类，分类规则如下： c = argmaxci ∥sˆi∥ (4) 式中：i = 1,2,··· ,n； ci 是训练样本 xi 的类标签。 1.2 表示系数之和 (SoC) 分类 L1 sˆ SRC 使用范数正则化约束，通过式 (2) 得到最优稀疏表示向量，然后根据查询样本与训练样本的残差进行分类。SoC 算法[9] 是在 SRC 的基础上用同类样本的表示系数之和对查询样本进行分类，其分类规则为 c = argmaxci ∑ δ ci (sˆ) (5) 第 5 期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·965·

·966· 智能系统学报第15卷式中∑6()为向量中c:类训练类样本的表示系数之和。 1.3两阶段线性重构度量分类(TPLRMC) TPLRMC方法)分为两个阶段。首先，利用 -0.060.12 140.048 正则化LRM模型获得查询样本的一个粗略的线性表示，并根据系数的大小依次从所有的训练样本中选择K个近邻。假设对查询样本y和训练样本集x,由式(2)得到最优解为，其分量是训 0.04840.0246-0.003 练样本的表示系数。根据“训练样本的表示系数 01548 越大，则该训练样本对重构查询样本的贡献就越图1部分训练样本表示系数大”的原则，，将所有训练样本的表示系数按由 Fig.1 Representation coefficients of some training samples 大到小的顺序排序，并选出前K个较大的系数所若利用类系数则可得到同类训练样本对重构对应的样本，记为=[配12…x],这些样本所查询样本的总贡献。在图1中，与查询样本同类在的类共H个，类集合记为C={G,c2,…,cal,它的训练样本系数之和(0.3460)最大。此时，利用是所有样本类别的一个子集，即Cs{c1,c2,…,cMlo 同类中训练样本做整体协同表示，可以捕捉到更其次，利用先前选出的K个训练样本对查多的变化，其表示能力比单个样本要强，这有利询样本进行精细表示，其最优表示系数优化模型为于对查询样本进行正确分类。该思想类似于集成 min ly-s+sll (6) 学习中投票的方法，它充分利用了训练样本的类设式(6)的最优解为5，计算中对应于同一别信息，并且可以抵消表示系数较平均时产生类训练样本的表示系数之和，那么和最大的一个的影响，筛选掉系数有较大方差的类，保留的样所对应的类即为查询样本的类别，分类规则类似本数据具有平衡性的特点。但是在类别数较多于式（⑤）。的数据集上，由于类基数较大，且不同类别训练样本的类系数之间的差异不太明显，这些都会影 2自适应多阶段线性重构表示分类响分类的精度。根据TPLRMC的思想，利用同类样本表示系运用TPLRMC算法选择近邻样本之后再进数之和（以下称其为类系数）按由大到小的选择行重构表示的思想，本文使用了多阶段的方法，策略，经过对查询样本近邻类的多次选择，逐渐在每一阶段，利用查询样本重构后类系数的大缩小训练样本范围，提出一种自适应多阶段线性小，筛选出与查询样本相似类别的所有训练样重构表示的分类(MPRBC)方法。本，这也是熵减小理论的体现。随着过程的进 2.1 MPRBC的基本思想行，选出的训练样本将集中在少数几类中，这样在SRC1和TPTSR)中，根据训练样本与查使得类别之间贡献的区分度更加明显，从而提高询样本之间的残差来对给定查询样本进行分类或了分类精度。以Yale人脸数据集为例，从每一类选择近邻，是不够准确的6”。这是因为残差只能中选出6张图片作为训练样本，而查询样本来自反映训练样本与查询样本的相似度，而不能反映第15类，通过L2范数正则化问题(2)求得各训练训练样本对查询样本重构的贡献大小和贡献的正样本的表示系数，各训练样本与查询样本的残差负属性。和表示系数及类系数分别如图2(a)(c)所示，而相比利用残差进行分类，直接通过表示系数图2(d)则是由MPRBC算法筛选出的5个类的类进行分类，能很好地还原样本之间的关系，且易系数。在图2(a)中，两个最小残差之比为1：1.4616，于实现。LRMNN正是基于此进行分类的，但其它们对应两个来自不同类的训练样本；图2(b) 也有一定的局限性。例如，当各训练样本的表示中两个最大表示系数之比为1：1.9259，它们也对系数比较平均时，LRMNN分类的准确性将显著应于两个不同类的训练样本；在图2（©）中，两个最下降。图1给出了重构查询样本时各训练样本的大的类系数之比为1：3.2087：而图2(d)是在使用表示系数，由图可见，与查询样本同类的训练样 MPRBC算法经过3个阶段之后，训练样本的类别本系数相对比较平均，而最大的表示系数(0.2516) 数由原来的15个减小到5个，此时两个最大的类所对应的训练样本与查询样本是非同类的，此时系数之比为1：6.3917，这表明，相比以往RBC算通过LRMNN算法将得到错误的分类结果。法，MPRBC算法的分类区分度最明显

∑ δ ci 式中 (sˆ) 为向量 sˆ 中 ci 类训练类样本的表示系数之和。 1.3 两阶段线性重构度量分类 (TPLRMC) K y X sˆ K X¯ = [x¯1 x¯2 ··· x¯K] C¯ = {c¯1, c¯2, ··· , c¯H} C¯ ⊆ {c1, c2, ··· , cM} TPLRMC 方法[7] 分为两个阶段。首先，利用正则化 LRM 模型获得查询样本的一个粗略的线性表示，并根据系数的大小依次从所有的训练样本中选择个近邻。假设对查询样本和训练样本集，由式 (2) 得到最优解为，其分量是训练样本的表示系数。根据“训练样本的表示系数越大，则该训练样本对重构查询样本的贡献就越大”的原则[9,11] ，将所有训练样本的表示系数按由大到小的顺序排序，并选出前个较大的系数所对应的样本，记为，这些样本所在的类共 H 个，类集合记为，它是所有样本类别的一个子集，即。其次，利用先前选出的 K 个训练样本 X¯ 对查询样本进行精细表示，其最优表示系数优化模型为 min s y− Xs¯ 2 2 +λ∥s∥p (6) 设式 (6) 的最优解为 s¯，计算 s¯ 中对应于同一类训练样本的表示系数之和，那么和最大的一个所对应的类即为查询样本的类别，分类规则类似于式 (5)。 2 自适应多阶段线性重构表示分类根据 TPLRMC 的思想，利用同类样本表示系数之和 (以下称其为类系数) 按由大到小的选择策略，经过对查询样本近邻类的多次选择，逐渐缩小训练样本范围，提出一种自适应多阶段线性重构表示的分类 (MPRBC) 方法。 2.1 MPRBC 的基本思想在 SRC[3] 和 TPTSR[4] 中，根据训练样本与查询样本之间的残差来对给定查询样本进行分类或选择近邻，是不够准确的[5-7]。这是因为残差只能反映训练样本与查询样本的相似度，而不能反映训练样本对查询样本重构的贡献大小和贡献的正负属性。相比利用残差进行分类，直接通过表示系数进行分类，能很好地还原样本之间的关系，且易于实现。LRMNN 正是基于此进行分类的，但其也有一定的局限性。例如，当各训练样本的表示系数比较平均时，LRMNN 分类的准确性将显著下降。图 1 给出了重构查询样本时各训练样本的表示系数，由图可见，与查询样本同类的训练样本系数相对比较平均，而最大的表示系数 (0.251 6) 所对应的训练样本与查询样本是非同类的，此时通过 LRMNN 算法将得到错误的分类结果。 0. 154 8 0.346 0 −0.042 0.077 8 0.058 4 0.029 5 0.104 2 −0.016 0.121 4 0.048 1 −0.192 −0.052 0.251 6 0.048 4 0.024 6−0.003 图 1 部分训练样本表示系数 Fig. 1 Representation coefficients of some training samples 若利用类系数则可得到同类训练样本对重构查询样本的总贡献。在图 1 中，与查询样本同类的训练样本系数之和 (0.346 0) 最大。此时，利用同类中训练样本做整体协同表示，可以捕捉到更多的变化，其表示能力比单个样本要强，这有利于对查询样本进行正确分类。该思想类似于集成学习中投票的方法，它充分利用了训练样本的类别信息[7] ，并且可以抵消表示系数较平均时产生的影响，筛选掉系数有较大方差的类，保留的样本数据具有平衡性的特点[14]。但是在类别数较多的数据集上，由于类基数较大，且不同类别训练样本的类系数之间的差异不太明显，这些都会影响分类的精度。 L2 运用 TPLRMC 算法选择近邻样本之后再进行重构表示的思想，本文使用了多阶段的方法，在每一阶段，利用查询样本重构后类系数的大小，筛选出与查询样本相似类别的所有训练样本，这也是熵减小理论的体现[15]。随着过程的进行，选出的训练样本将集中在少数几类中，这样使得类别之间贡献的区分度更加明显，从而提高了分类精度。以 Yale 人脸数据集为例，从每一类中选出 6 张图片作为训练样本，而查询样本来自第 15 类，通过范数正则化问题 (2) 求得各训练样本的表示系数，各训练样本与查询样本的残差和表示系数及类系数分别如图 2(a)~(c) 所示，而图 2(d) 则是由 MPRBC 算法筛选出的 5 个类的类系数。在图 2(a) 中，两个最小残差之比为 1∶1.4616，它们对应两个来自不同类的训练样本；图 2(b) 中两个最大表示系数之比为 1∶1.925 9，它们也对应于两个不同类的训练样本；在图 2(c)中，两个最大的类系数之比为 1∶3.208 7；而图 2(d) 是在使用 MPRBC 算法经过 3 个阶段之后，训练样本的类别数由原来的 15 个减小到 5 个，此时两个最大的类系数之比为 1∶6.391 7，这表明，相比以往 RBC 算法，MPRBC 算法的分类区分度最明显。 ·966· 智能系统学报第 15 卷

第5期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·967· 20 0.6 0.4 02 20 40 60 80 0.20 204060 80 100 训练样本编号训练样本编号 (a)残差 (b)表示系数 10 1.0 0.8 08 0.6 09 0.4 0.4 0.2 0.2 0 0.2 4 6810121416 34 910 15 训练样本类编号训练样本类编号 (c)类系数 (d)重构后的类系数图2不同算法的残差或（类）系数 Fig.2 Residuals or (class)coefficients of different algorithms 2.2 MPRBC的实现过程在算法中有两个参数α与B,α代表所选取记在第k阶段训练样本集为X,通过以下L 类的类系数之和占所有正类系数总和的比例，取范数或L2范数正则化的LRM,获得查询样本在值范围为0<α≤1：B代表算法终止时所选训练样 X上的表示系数向量本的类别数阈值，取值范围为1≤B≤Mo,其中Mo minlly-Xes匠+lslp (7 是训练样本的总类别数。参数α控制每次选取的设式(7)的最优解为s,将s的各分量依据类别数，确定算法进行的阶段数，进而影响算法类别的不同求出类系数，并筛选出前M个拥有的时间复杂度，而参数B则控制算法最后进行识较大类系数的类(M将在2.3节式(9)中给出确定别时所需要的类别数，其影响算法的识别率。在方法)。然后，把属于这些类的训练样本重新组成第k阶段，确定选取类别数的规则为新的训练样本集X1,继续此过程，直到sk的各 M M:=arg max (9) 分量所对应的类别数不大于预先设定的阈值B为 1M6M-1 止，并输出具有最大类系数的类标签。式中：SUM表示所有为正的类系数求和；SUM c=argmax.∑or(s) (8) 表示第c:类的类系数。注意，这里的类系数已经式中：∑(s)为向量s中属于c类的训练样本按降序排列。找到前M个拥有较大类系数的类系数。类，其类系数之和小于阈值α×SUM,并且前 2.3自适应MPRBC算法 M.+1个较大类系数之和不大于阈值a×SUM。不同于以往的两阶段算法A,川和多阶段算 M的取值范围是1≤M≤Mk-,a控制每次选取法需要人为确定选取样本的数目，MPRBC算近邻类的步长，当α=1时，则每次选取类系数为法可根据类系数的大小自适应地选取样本类别的正的类。该策略能逐渐缩小查询样本近邻类的范数目。在前文中已经分析，类系数的大小可以较围。MPRBC算法的具体过程如算法1I61所示。准确地反映该类对重构查询样本的贡献。当类系算法1 MPRBC算法数为正时，表示该类对查询样本有正面影响，当输入训练样本集X,查询样本y,类别数类系数为负时，表示该类对查询样本有负面影 Mo,=0。响。在每一阶段中只选取类系数为正的类进入到输出查询样本y的类别c。下一阶段。 I)While M,大于设定阈值B,通过式(7)得出

2.2 MPRBC 的实现过程 Xk L1 L2 Xk 记在第 k 阶段训练样本集为，通过以下范数或范数正则化的 LRM，获得查询样本在上的表示系数向量 min s ∥y− Xk s∥ 2 2 +λ∥s∥p (7) sk sk Mk Mk Xk+1 sk β 设式 (7) 的最优解为，将的各分量依据类别的不同求出类系数，并筛选出前个拥有较大类系数的类 ( 将在 2.3 节式 (9) 中给出确定方法)。然后，把属于这些类的训练样本重新组成新的训练样本集，继续此过程，直到的各分量所对应的类别数不大于预先设定的阈值为止，并输出具有最大类系数的类标签。 c = argmaxci ∑ δ ci ∑ (sk) (8) δ ci 式中： (sk) 为向量 sk 中属于 ci 类的训练样本类系数。 2.3 自适应 MPRBC 算法不同于以往的两阶段算法[4, 11] 和多阶段算法 [15] 需要人为确定选取样本的数目，MPRBC 算法可根据类系数的大小自适应地选取样本类别的数目。在前文中已经分析，类系数的大小可以较准确地反映该类对重构查询样本的贡献。当类系数为正时，表示该类对查询样本有正面影响，当类系数为负时，表示该类对查询样本有负面影响。在每一阶段中只选取类系数为正的类进入到下一阶段。 α β α 0 < α ⩽ 1 β 1 ⩽ β ⩽ M0 M0 α β 在算法中有两个参数与，代表所选取类的类系数之和占所有正类系数总和的比例，取值范围为；代表算法终止时所选训练样本的类别数阈值，取值范围为，其中是训练样本的总类别数。参数控制每次选取的类别数，确定算法进行的阶段数，进而影响算法的时间复杂度，而参数则控制算法最后进行识别时所需要的类别数，其影响算法的识别率。在第 k 阶段，确定选取类别数的规则为 Mk = argmax 1⩽M⩽Mk−1   ∑M i=1 SUMci <α×SUMc +   (9) SUMc + SUMci ci Mk α×SUMc + Mk α×SUMc + Mk 1 ⩽ Mk ⩽ MK−1 α α = 1 式中：表示所有为正的类系数求和；表示第类的类系数。注意，这里的类系数已经按降序排列。找到前个拥有较大类系数的类，其类系数之和小于阈值 ,并且前 +1 个较大类系数之和不大于阈值。的取值范围是，控制每次选取近邻类的步长，当时，则每次选取类系数为正的类。该策略能逐渐缩小查询样本近邻类的范围。MPRBC 算法的具体过程如算法 1 [16] 所示。算法 1 MPRBC 算法 X y M0 输入训练样本集，查询样本，类别数，k=0。输出查询样本 y 的类别 c。 1) While Mk 大于设定阈值 β ，通过式 (7) 得出 20 15 10 5 0 20 40 60 80 0 20 40 60 80 100 训练样本编号训练样本编号训练样本类编号训练样本类编号 (a) 残差残差表示系数类系数重构后的类系数 0.6 0.4 0.2 0 −0.2 (b) 表示系数 (c) 类系数 2 4 6 8 10 12 14 16 1.0 0.8 0.6 0.4 0.2 0 0 −0.2 1.0 0.8 0.6 0.4 0.2 0 −0.2 (d) 重构后的类系数 3 4 9 10 15 图 2 不同算法的残差或 (类) 系数 Fig. 2 Residuals or (class) coefficients of different algorithms 第 5 期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·967·

·968· 智能系统学报第15卷训练样本X的表示系数s; 中TPLRMC所表示的平面为TPLRMC算法识别 2)根据式(9)确定M+1 率的参照平面。图4显示了在AR数据集上固定 3)选取与前M+1个较大的SUMs所对应的类 B=10,识别率随α值的变化。当α偏小时，说明中所有样本，构成训练集X+1 算法选择类的步长较大，算法收敛较快，但识别 4)k=k+1; 率过低，随着α值的增大，其筛选类的过程逐渐 5)End while; 精细化，算法的识别率得到提升。由图3和图4 6)根据式(8)确定查询样本y的类别c。可知，α值对较高识别精度的表达影响较小，但当值较小时，随着B值的由小到大，MPRBC算法 3实验结果及分析的退化速度加快。当a=1时，图5反映了MPRBC 算法在各数据集上识别精度随B值的变化情为了验证所提出的自适应多阶段线性重构表况。由此可知，要获得较好的识别性能，B的值不示的分类(MPRBC)方法的有效性，选择6个人脸能太小也不能过大。当B值较小时，最后一步用数据集进行实验，各数据集的规模和特征如表1 来进行识别判断的类的个数就较少；当B值较大所示。将MPRBC算法的分类精度与RBC方法 (如LRMNN(P=1,p=2)、SoC(p=1)7、SoC(p=2)、时，算法的阶段数较少，甚至完全退化为SoC算法，这些都会降低算法的识别精度。 TPLRMC(p=1,p=2)进行比较。对每个数据集，表2给出了MPRBC与其他算法识别精度从每类中随机选取L个图像作为训练样本，而余的比较(MPRBC算法的识别精度由图5中的下的样本作为查询样本。通过10次运行再求平最高精度确定)。在所有数据集上，MPRBC算法均得到每种方法的分类精度。均具有最好的识别性能。SoC算法要比LRMNN 表1各人脸数据集的属性及特点算法性能要好，这是因为SoC算法利用了样本的 Table 1 Attributes and characteristics of some face data- 标签，通过同类样本进行协同表示，是一种有监 bases 督的算法，而LRMNN算法只考虑单个样本表示数据集样本数类别数特征的作用。因此根据类系数来进行分类能提高分类 Yale 165 15 有光照和表情变化精度，这也从侧面说明MPRBC筛选相似类的策有较大姿态变化略比TPLRMC筛选相似样本的策略更能提高分 UMIST 575 20 类性能。另外，SoC算法通过一阶段和TPLRMC Bio 550 22 样本较相似算法通过两阶段筛选近邻样本并进行分类，其本 ORL 400 40 有姿态和表情变化质上是一种粗糙的筛选方法，且对于不同的查询 AR 2600 100 有光照表情变化，部分图像有遮挡样本，选择近邻的个数没有差异性。而MPRBC FERET 1 400 200 有姿态光照和表情变化算法通过多阶段进行近邻类的筛选，是一种精细的筛选方法，且根据查询样本的不同，近邻类的 3.1识别精度的实验与分析筛选具有差异性。比较MPRBC算法、SoC算法图3给出了在AR数据集上参数a和B值的和TPLRMC算法在各数据集上的实验结果，可以变化对识别率的影响，其中L=7。图3中，随着观察到多阶段比一阶段和二阶段更能提高分类精 a值由大到小而B值由小到大的变化，MPRBC的度，并且随着数据集样本类别数的增多其分类精识别率由较高趋于稳定，且趋于退化为SoC,图度均有明显地提高。 TPLRMC TPLRMC 0.90 0.95 MPRBC MPRBC 0.88 0.90 0.86 0.85 0.84 0.8 100 0.8 0.6 0.4 40 60 80 0.6 0 0.4 0.2020 0.2020406080100 (a)p=1 (b)p=2 图3AR人脸数据集上的识别率 Fig.3 Recognition rates on AR face database

训练样本 Xk 的表示系数 sk； 2) 根据式 (9) 确定 Mk+1； Mk+1 SUMci Xk+1 3) 选取与前个较大的所对应的类中所有样本，构成训练集； 4) k = k+1 ； 5) End while； 6) 根据式 (8) 确定查询样本 y 的类别 c。 3 实验结果及分析 L 为了验证所提出的自适应多阶段线性重构表示的分类 (MPRBC) 方法的有效性，选择 6 个人脸数据集进行实验，各数据集的规模和特征如表 1 所示。将 MPRBC 算法的分类精度与 RBC 方法 (如 LRMNN(p=1，p=2)[5] 、SoC(p=1) [7] 、SoC(p=2)、 TPLRMC(p=1，p=2)[11] ) 进行比较。对每个数据集，从每类中随机选取个图像作为训练样本，而余下的样本作为查询样本。通过 10 次运行再求平均得到每种方法的分类精度。表 1 各人脸数据集的属性及特点 Table 1 Attributes and characteristics of some face databases 数据集样本数类别数特征 Yale 165 15 有光照和表情变化 UMIST 575 20 有较大姿态变化 Bio 550 22 样本较相似 ORL 400 40 有姿态和表情变化 AR 2 600 100 有光照表情变化，部分图像有遮挡 FERET 1 400 200 有姿态光照和表情变化 3.1 识别精度的实验与分析 α β L = 7 α β 图 3 给出了在 AR 数据集上参数和值的变化对识别率的影响，其中。图 3 中，随着值由大到小而值由小到大的变化，MPRBC 的识别率由较高趋于稳定，且趋于退化为 SoC，图 β α α α α α β α β β β β 中 TPLRMC 所表示的平面为 TPLRMC 算法识别率的参照平面。图 4 显示了在 AR 数据集上固定 =10，识别率随值的变化。当偏小时，说明算法选择类的步长较大，算法收敛较快，但识别率过低，随着值的增大，其筛选类的过程逐渐精细化，算法的识别率得到提升。由图 3 和图 4 可知，值对较高识别精度的表达影响较小，但当值较小时，随着值的由小到大，MPRBC 算法的退化速度加快。当 =1 时，图 5 反映了 MPRBC 算法在各数据集上识别精度随值的变化情况。由此可知，要获得较好的识别性能，的值不能太小也不能过大。当值较小时，最后一步用来进行识别判断的类的个数就较少；当值较大时，算法的阶段数较少，甚至完全退化为 SoC 算法，这些都会降低算法的识别精度。表 2 给出了 MPRBC 与其他算法识别精度的比较 (MPRBC 算法的识别精度由图 5 中的最高精度确定)。在所有数据集上，MPRBC 算法均具有最好的识别性能。SoC 算法要比 LRMNN 算法性能要好，这是因为 SoC 算法利用了样本的标签，通过同类样本进行协同表示，是一种有监督的算法，而 LRMNN 算法只考虑单个样本表示的作用。因此根据类系数来进行分类能提高分类精度，这也从侧面说明 MPRBC 筛选相似类的策略比 TPLRMC 筛选相似样本的策略更能提高分类性能。另外，SoC 算法通过一阶段和 TPLRMC 算法通过两阶段筛选近邻样本并进行分类，其本质上是一种粗糙的筛选方法，且对于不同的查询样本，选择近邻的个数没有差异性。而 MPRBC 算法通过多阶段进行近邻类的筛选，是一种精细的筛选方法，且根据查询样本的不同，近邻类的筛选具有差异性。比较 MPRBC 算法、SoC 算法和 TPLRMC 算法在各数据集上的实验结果，可以观察到多阶段比一阶段和二阶段更能提高分类精度，并且随着数据集样本类别数的增多其分类精度均有明显地提高。 0.90 0.88 0.86 0.84 0.82 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 α β 1.0 0.8 0.6 0.4 0.2 20 40 60 80 100 α β 识别率识别率 TPLRMC MPRBC TPLRMC MPRBC 0.95 0.90 0.85 0.80 (a) p = 1 (b) p = 2 0 0 图 3 AR 人脸数据集上的识别率 Fig. 3 Recognition rates on AR face database ·968· 智能系统学报第 15 卷

第5期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·969 0.90 0.80 1.00 0.75 0.95 0.85 蟹0.70 解0.90 0.65 0.85 0.80 -MPRBC,L=3 0.60 0.80 0 -MPRBC.L=7 0.55 0.75 0.50 0.70 10 5 20 0.70 (a)Yale (b)UMIST 0.65 1.00 1.00 0.6 0.95 0.10.2 0.4 0.6 0.8 1.0 解0.95 =L=12 0.90 0.85 (ap=1 09 0.95 0.75 5 10152025 0.70 0 1020 0.90 -MPRBC,L=3 (c)Bio (d)ORL 0.85 -o-MPRBC.L=7 1.0 09 .6 部0.8 0 0.7 0.4 Q 0.75 0 0 0.70 20406080100 50100150200 0.10.2 0.4 0.6 0.8 1.0 (e)AR (f)FERET (b)p=2 图5 MPRBC算法在各人脸数据集上的识别率图4参数a的影响 Fig.5 Recognition rates of MPRBC on some face data- Fig.4 Influence of parameter a bases 表2各人脸数据集上的识别精度 Table 2 Recognition accuracy of some face databases % LRMNN LRMNN SoC SoC TPLRMC TPLRMC MPRBC 数据集 MPRBC L 1) =2)问 (p=1)m (p=2) 2 s1)1 =2y1 3 55.75 50.42 68.67 66.67 68.17 67.17 69.50 69.92 Yale 5 60.33 56.00 76.78 74.56 77.67 76.22 79.22 79.44 5 85.12 77.03 83.68 8025 86.78 87.26 87.20 90.34 UMIST 10 94.83 85.07 93.89 93.33 95.89 95.84 96.51 96.91 8 87.03 76.31 87.07 86.20 88.70 90.11 89.4 90.75 Bio 12 91.54 73.74 92.42 90.04 93.22 94.30 93.24 94.69 3 84.32 76.75 87.54 86.79 86.79 88.86 88.68 90.46 ORL 5 91.35 81.50 92.65 93.45 9195 94.80 93.40 96.65 3 55.04 58.95 66.87 75.13 66.17 76.63 69.74 79.89 AR 7 71.42 59.83 84.10 82.26 84.16 91.63 88.41 93.63 2 36.98 25.46 40.49 25.99 42.38 40.90 46.61 51.76 FERET 49.83 19.05 54.40 21.55 57.13 52.12 65.47 63.17 3.2时间复杂度的实验与分析 AR数据集上L=7时参数a和B对算法阶段数对于每一个查询样本，MPRBC与TPLRMC P和各阶段参与计算的训练样本的数量总和∑T 算法均通过L,范数或L2范数得到表示系数，其的影响。注意，图7中TPLRMC算法选取样本总时间复杂度受训练样本数T的影响)。在MPRBC 数为两阶段相加，而MPRBC算法为多阶段相算法中，每阶段训练样本数随查询样本的不同自加。图8反映的是不同a和B,MPRBC的CPU时适应确定，而且MPRBC的阶段数P受T影响，不间。图6-8中TPLRMC所表示的平面为TPLRMC 同查询样本也有差异。图6和图7分别给出了在算法达到最高识别精度时，阶段数、参与计算样

0.2 0.4 0.6 0.8 α α MPRBC, L=3 MPRBC, L=7 MPRBC, L=3 MPRBC, L=7 (a) p = 1 (b) p = 2 0.90 0.85 0.80 0.75 0.70 0.90 0.95 0.85 0.80 0.75 0.70 0.65 0.60 识别率识别率 1.0 0.1 0.2 0.4 0.6 0.8 0.1 1.0 图 4 参数 α 的影响 Fig. 4 Influence of parameter α 5 10 15 0.50 0.55 0.60 0.65 0.70 0.75 0.80 识别率 p=1, L=3 p=1, L=5 p=2, L=3 p=2, L=5 5 10 15 20 0.70 0.75 0.80 0.85 0.90 0.95 1.00 0.70 0.75 0.80 0.85 0.90 0.95 1.00 识别率 p=1, L=5 p=1, L=10 p=2, L=5 p=2, L=10 β β β β β β 5 10 15 20 25 0.90 0.95 1.00 识别率 p=1, L=8 p=1, L=12 p=2, L=8 p=2, L=12 10 20 30 40 识别率 p=1, L=3 p=1, L=5 p=2, L=3 p=2, L=5 20 40 60 80 100 0.4 0.5 0.6 0.7 0.8 0.9 1.0 识别率 p=1, L=3 p=1, L=7 p=2, L=3 p=2, L=7 50 100 150 200 0 0 0.1 0.2 0.3 0.4 0.5 0.6 识别率 p=1, L=2 p=1, L=4 p=2, L=2 p=2, L=4 (a) Yale (b) UMIST (c) Bio (d) ORL (e) AR (f) FERET 0 0 0 0 0 图 5 MPRBC 算法在各人脸数据集上的识别率 Fig. 5 Recognition rates of MPRBC on some face databases 3.2 时间复杂度的实验与分析 L1 L2 对于每一个查询样本，MPRBC 与 TPLRMC 算法均通过范数或范数得到表示系数，其时间复杂度受训练样本数 T 的影响[1, 3]。在 MPRBC 算法中，每阶段训练样本数随查询样本的不同自适应确定，而且 MPRBC 的阶段数 P 受 T 影响，不同查询样本也有差异。图 6 和图 7 分别给出了在 L = 7 α β ∑P 1 T α β AR 数据集上时参数和对算法阶段数 P 和各阶段参与计算的训练样本的数量总和的影响。注意，图 7 中 TPLRMC 算法选取样本总数为两阶段相加，而 MPRBC 算法为多阶段相加。图 8 反映的是不同和，MPRBC的 CPU 时间。图 6~8 中 TPLRMC 所表示的平面为 TPLRMC 算法达到最高识别精度时，阶段数、参与计算样表 2 各人脸数据集上的识别精度 Table 2 Recognition accuracy of some face databases % 数据集 L LRMNN (p=1)[5] LRMNN (p=2)[5] SoC (p=1)[7] SoC (p=2) TPLRMC (p=1)[11] TPLRMC (p=2)[11] MPRBC (p=1)[16] MPRBC (p=2)[16] Yale 3 55.75 50.42 68.67 66.67 68.17 67.17 69.50 69.92 5 60.33 56.00 76.78 74.56 77.67 76.22 79.22 79.44 UMIST 5 85.12 77.03 83.68 80.25 86.78 87.26 87.20 90.34 10 94.83 85.07 93.89 93.33 95.89 95.84 96.51 96.91 Bio 8 87.03 76.31 87.07 86.20 88.70 90.11 89.44 90.75 12 91.54 73.74 92.42 90.04 93.22 94.30 93.24 94.69 ORL 3 84.32 76.75 87.54 86.79 86.79 88.86 88.68 90.46 5 91.35 81.50 92.65 93.45 91.95 94.80 93.40 96.65 AR 3 55.04 58.95 66.87 75.13 66.17 76.63 69.74 79.89 7 71.42 59.83 84.10 82.26 84.16 91.63 88.41 93.63 FERET 2 36.98 25.46 40.49 25.99 42.38 40.90 46.61 51.76 4 49.83 19.05 54.40 21.55 57.13 52.12 65.47 63.17 第 5 期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·969·

第5期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·971· 表3CPU时间 2016,26(4):613-626 Table 3 CPU times [7]LI Jiang,LU Canyi.A new decision rule for sparse repres- TPLRMC MPRBC entation based classification for face recognition[J].Neuro- 数据集 L (=1)m 0p=2m=p=2 computing,2013,116:265-271 [8]GAO Shenghua,TSANG I W H,CHIA L T.Laplacian 3 2.32 0.11 1.22(1.1)0.27(3.6) ORL sparse coding,hypergraph laplacian sparse coding,and ap- 2.89 0.23 1.83(1.5)0.36(3.4) plications[J].IEEE transactions on pattern analysis and 3 55.64 7.05 49.47(2.2)6.97(2.0) machine intelligence,2013,35(1):92-104 AR > 90.41 13.4699.61(3.1)24.66(3.1) [9]QIAO Lishan,CHEN Songcan,TAN Xiaoyang.Sparsity preserving projections with applications to face recogni- 2 24.00 1.01 30.43(3.7)6.36(4.5) FERET tion[J].Pattern recognition,2010,43(1):331-341 1 27.12 2.25 37.00(3.8)10.47(4.2) [10]MA Hongxing,GOU Jianping,WANG Xili,et al.Sparse coefficient-based k-nearest neighbor classification[J]. 4结束语 IEEE access,.2017,5:16618-16634 [11]GOU Jianping,XU Yong,ZHANG D,et al.Two-phase 本文提出了一种自适应多段线性重构表示的 linear reconstruction measure-based classification for face 分类MPRBC)方法。基于熵减少原则，通过多阶 recognition[J].Information sciences,2018,433-434: 17-36. 段的方法，利用同类训练样本表示系数之和筛选 [12]YAN Shuicheng,XU Dong,ZHANG Benyu,et al.Graph 样本，将分类集中在类别数较少的训练样本上， embedding and extensions:a general framework for di- 使得所选样本在具有较大重构贡献的同时保证了 mensionality reduction[J].IEEE transactions on pattern 样本的稀疏类概率分布，达到了提高训练样本表 analysis and machine intelligence,2007,29(1):40-51. 示能力的目的。其次，算法拥有基于自适应的选 [13]FANG Xiaozhao,XU Yong,LI Xuelong,et al.Learning a 择过程，能对不同查询样本进行差异化表示，并 nonnegative sparse graph for linear regression[J].IEEE 在部分数据集上减小了CPU时间。实验表明，该 transactions on image processing,2015,24(9): 算法性能优于其他RBC算法，且在类别数较多的 2760-2771. [14]叶志飞，文益民，吕宝粮.不平衡分类问题研究综述数据集上识别精度有明显的提升。智能系统学报，2009,4(2)：148-156. 参考文献： YE Zhifei,WEN Yimin,LV Baoliang.A survey of imbal- anced pattern classification problems[J].CAAI transac- [1]ZHANG Lei,YANG Meng,FENG Xiangchu.Sparse rep- tions on intelligent systems,2009,4(2):148-156. resentation or collaborative representation:which helps [15]LIU Fan,TANG Jinhui,SONG Yan,et al.Local struc- face recognition[Cl//Proceedings of the 2011 International ture based multi-phase collaborative representation for Conference on Computer Vision.Barcelona,Spain,2011: face recognition with single sample per person[J].Inform- 471-478 ation sciences.2016,346-347:198-215. [2]XU Yong,LI Xuelong,YANG Jian,et al.Integrating con- [16]QIAN J B.data[EB/OL].Github,2019(2019-05-30) ventional and inverse representation for face recogni- [2019-05].https://github.com/greatQntgz/MPRBC tion[J].IEEE transactions on cybernetics,2014,44(10): 作者简介： 1738-1746 [3]WRIGHT J,YANG A Y,GANESH A,et al.Robust face 钱剑滨，硕士研究生，主要研究方 recognition via sparse representation[J].IEEE transactions 向为模式识别、图像处理。 on pattern analysis and machine intelligence,2009,31(2): 210-227 [4]XU Yong,ZHANG D,YANG Jian,et al.A two-phase test sample sparse representation method for use with face re- cognition[J].IEEE transactions on circuits and systems for video technology,2011,21(9):1255-1262. 陈秀宏，教授，主要研究方向为数 [5]ZHANG Jian,YANG Jian.Linear reconstruction measure 字图像处理和模式识别、目标检测与 steered nearest neighbor classification framework[J].Pat- 跟踪、优化理论与方法。发表学术论 tern recognition,2014,47(4):1709-1720. 文110余篇。 [6]CHENG H,LIU Zicheng,HOU Lei,et al.Sparsity-in- duced similarity measure and its applications[J].IEEE transactions on circuits and systems for video technology

表 3 CPU 时间 Table 3 CPU times s 数据集 L TPLRMC MPRBC (p=1)[11] (p=2)[11] (p=1)[16] (p=2)[16] ORL 3 2.32 0.11 1.22(1.1) 0.27(3.6) 5 2.89 0.23 1.83(1.5) 0.36(3.4) AR 3 55.64 7.05 49.47(2.2) 6.97(2.0) 7 90.41 13.46 99.61(3.1) 24.66(3.1) FERET 2 24.00 1.01 30.43(3.7) 6.36(4.5) 4 27.12 2.25 37.00(3.8) 10.47(4.2) 4 结束语本文提出了一种自适应多段线性重构表示的分类 (MPRBC) 方法。基于熵减少原则，通过多阶段的方法，利用同类训练样本表示系数之和筛选样本，将分类集中在类别数较少的训练样本上，使得所选样本在具有较大重构贡献的同时保证了样本的稀疏类概率分布，达到了提高训练样本表示能力的目的。其次，算法拥有基于自适应的选择过程，能对不同查询样本进行差异化表示，并在部分数据集上减小了 CPU 时间。实验表明，该算法性能优于其他 RBC 算法，且在类别数较多的数据集上识别精度有明显的提升。参考文献： ZHANG Lei, YANG Meng, FENG Xiangchu. Sparse representation or collaborative representation: which helps face recognition[C]//Proceedings of the 2011 International Conference on Computer Vision. Barcelona, Spain, 2011: 471−478. [1] XU Yong, LI Xuelong, YANG Jian, et al. Integrating conventional and inverse representation for face recognition[J]. IEEE transactions on cybernetics, 2014, 44(10): 1738–1746. [2] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE transactions on pattern analysis and machine intelligence, 2009, 31(2): 210–227. [3] XU Yong, ZHANG D, YANG Jian, et al. A two-phase test sample sparse representation method for use with face recognition[J]. IEEE transactions on circuits and systems for video technology, 2011, 21(9): 1255–1262. [4] ZHANG Jian, YANG Jian. Linear reconstruction measure steered nearest neighbor classification framework[J]. Pattern recognition, 2014, 47(4): 1709–1720. [5] CHENG H, LIU Zicheng, HOU Lei, et al. Sparsity-induced similarity measure and its applications[J]. IEEE transactions on circuits and systems for video technology, [6] 2016, 26(4): 613–626. LI Jiang, LU Canyi. A new decision rule for sparse representation based classification for face recognition[J]. Neurocomputing, 2013, 116: 265–271. [7] GAO Shenghua, TSANG I W H, CHIA L T. Laplacian sparse coding, hypergraph laplacian sparse coding, and applications[J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(1): 92–104. [8] QIAO Lishan, CHEN Songcan, TAN Xiaoyang. Sparsity preserving projections with applications to face recognition[J]. Pattern recognition, 2010, 43(1): 331–341. [9] MA Hongxing, GOU Jianping, WANG Xili, et al. Sparse coefficient-based k-nearest neighbor classification[J]. IEEE access, 2017, 5: 16618–16634. [10] GOU Jianping, XU Yong, ZHANG D, et al. Two-phase linear reconstruction measure-based classification for face recognition[J]. Information sciences, 2018, 433–434: 17–36. [11] YAN Shuicheng, XU Dong, ZHANG Benyu, et al. Graph embedding and extensions: a general framework for dimensionality reduction[J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 29(1): 40–51. [12] FANG Xiaozhao, XU Yong, LI Xuelong, et al. Learning a nonnegative sparse graph for linear regression[J]. IEEE transactions on image processing, 2015, 24(9): 2760–2771. [13] 叶志飞, 文益民, 吕宝粮. 不平衡分类问题研究综述 [J]. 智能系统学报, 2009, 4(2): 148–156. YE Zhifei, WEN Yimin, LV Baoliang. A survey of imbalanced pattern classification problems[J]. CAAI transactions on intelligent systems, 2009, 4(2): 148–156. [14] LIU Fan, TANG Jinhui, SONG Yan, et al. Local structure based multi-phase collaborative representation for face recognition with single sample per person[J]. Information sciences, 2016, 346–347: 198–215. [15] QIAN J B. data[EB/OL]. Github, 2019 (2019−05−30) [2019−05]. https://github.com/greatQntgz/MPRBC [16] 作者简介：钱剑滨，硕士研究生，主要研究方向为模式识别、图像处理。陈秀宏，教授，主要研究方向为数字图像处理和模式识别、目标检测与跟踪、优化理论与方法。发表学术论文 110 余篇。第 5 期钱剑滨，等：自适应多阶段线性重构表示分类的人脸识别 ·971·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录