正在加载图片...
第5期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·965· 数表示方法是用L范数对表示系数进行正则化, (self-adaptive multi-phase linear reconstruction repres- 其中最典型的方法是基于稀疏表示的分类(sparse entation based classification,MPRBC)方法。首先, representation based classification.SRC)SRC 用表示系数代替残差来表示查询样本与训练样本 用训练样本的稀疏组合来表示查询样本,并根据 之间的相似性,系数越大表示它们越相似。用近 类的重构残差对查询样本进行分类。当使用L2 邻类代替近邻样本,保留近邻类中的全部样本, 范数对表示系数正则化时,可获得一个闭合解, 保持样本数据的平衡。用多次选择近邻代替单次 提高了算法的稳定性,在分类时具有很好的区分 选择,同时利用自适应的方法控制算法的时间复 性田。最典型的方法是基于协同表示的分类(col- 杂度。在6个人脸数据集上的实验表明,MPRBC laborative representation based classification, 算法优于目前最先进的基于表示的分类方法。 CRC)",它利用训练样本之间的协作来表示查询 样本。受CRC的启发,文献[4]中提出了两阶段 1相关RBC算法 测试样本稀疏表示(two-phase test sample sparse 本节主要回顾已有的一些RBC方法。给定训 representation,TPTSR)方法,该方法通过近邻来重 练样本X=[XX2…X]=[x1x2…xJ∈Rm为 构查询样本并进行分类。 在RBC方法中,表示系数可以用来描述样本 n个属于Mo类的d维样本,X表示属于第i类的 之间的相似性510,在设计分类器时可直接采用这 训练样本子集,其对应的类标签为c:∈(1,2,·,Moo 些表示系数刀。例如,基于线性重构度量的最近 1.1基于线性重构度量的最近邻(LRMNN)分类 般的线性重构度量(LRM)问题可表示为 (linear reconstruction measure nearest neighbor, LRMNN)分类使用L范数或L2范数正则化的 minl心y-Xs (1) 表示系数作为线性重构度量(linear reconstruction 式中:s=[s1s2…snJ∈R"表示线性重构系数,s measure,LRM)来确定查询样本的最近邻.,这里的 代表y与x:的相似性。设3=[⑧132…J'∈R 表示系数也称为线性重构系数。Cheng等提出 是问题()的最优解,则:越大,说明y与x:越相 的稀疏性诱导相似性度量使用了L:范数正则化 似。为了克服奇异值问题并控制过拟合,在LRM 的表示系数作为标签传播和动作识别的相似性度 目标函数中增加正则化项对表示系数进行约束: 量。Li等)将L,范数的表示系数之和(sum of 得到以下正则化LRM模型: coefficient,.SoC)用于分类决策。文献[8]指出类 min lly-Xsl+allsllp (2) 似的样本应该用相似的稀疏表示系数进行编码。 式中:入是平衡参数,用来平衡重建误差项和正 文献[9]将样本权重的表示系数用于数据集的自 则化项之间的贡献;p通常设置为1或2,当p= 动图构建。Ma等o提出了基于L,范数正则化的 1时,s为稀疏表示系数,文献[3]中给出了详细的 稀疏系数k近邻分类。文献[11]则在TPTSR基 求解过程;当p=2时,s为协同表示系数,其最优 础上提出基于两阶段线性重构度量的分类(two- 解为 8=(XTX+D-Xy (3) phase linear reconstruction measure based classifica- 基于表示系数的相似性度量在分类中表现良 tion,TPLRMC)方法,它利用重构系数代替残差来 好B6。如果一个训练样本x,与查询样本y非常 选择近邻,再进行分类。由于表示系数可以保留 相似,那么在重构y时x:会有较大的表示系数。 原始高维数据和潜在分类信息的一些固有几何特 因此,LRMNN认为具有最大表示系数:的样本 性,因此表示系数可应用于降维。这些基于表示 系数的降维方法可以统一到图嵌入框架中回。最 x:与y最相似,从而可利用最相似样本对y进行 分类,分类规则如下: 近,用于线性回归的非负稀疏图学习方法1实现 c=argmax (4) 了标签预测和投影学习,并为基于图的学习提供 式中:i=1,2…,n;c是训练样本x的类标签。 了新的视角。因此,表示系数可以很好地应用于 1.2表示系数之和(SoC)分类 模式分类。 SRC使用L范数正则化约束,通过式(2)得 虽然基于表示系数的分类方法在许多实际的 到最优稀疏表示向量3,然后根据查询样本与训 人脸识别任务中表现良好,但其分类性能会受到 练样本的残差进行分类。SoC算法是在SRC的 人脸图像变化的显著影响),且有些没有考虑过 程中数据非平衡的问题。为了进一步提高对人 基础上用同类样本的表示系数之和对查询样本进 行分类,其分类规则为 脸图像的分类性能,本文提出了一种基于L范数 或L2范数的自适应多阶段线性重构表示的分类 c=argmax.∑6() (5)L1 L2 数表示方法是用 范数对表示系数进行正则化, 其中最典型的方法是基于稀疏表示的分类 (sparse representation based classification,SRC)[3]。SRC 使 用训练样本的稀疏组合来表示查询样本,并根据 类的重构残差对查询样本进行分类。当使用 范数对表示系数正则化时,可获得一个闭合解, 提高了算法的稳定性,在分类时具有很好的区分 性 [1]。最典型的方法是基于协同表示的分类 (col￾laborative representation based classification, CRC)[1] ,它利用训练样本之间的协作来表示查询 样本。受 CRC 的启发,文献 [4] 中提出了两阶段 测试样本稀疏表示 (two-phase test sample sparse representation,TPTSR) 方法,该方法通过近邻来重 构查询样本并进行分类。 L1 L2 L1 L1 L1 k 在 RBC 方法中,表示系数可以用来描述样本 之间的相似性[5-10] ,在设计分类器时可直接采用这 些表示系数[5-7]。例如,基于线性重构度量的最近 邻 (linear reconstruction measure nearest neighbor, LRMNN) 分类[5] 使用 范数或 范数正则化的 表示系数作为线性重构度量 (linear reconstruction measure,LRM) 来确定查询样本的最近邻,这里的 表示系数也称为线性重构系数。Cheng 等 [6] 提出 的稀疏性诱导相似性度量使用了 范数正则化 的表示系数作为标签传播和动作识别的相似性度 量。Li 等 [7] 将 范数的表示系数之和 (sum of coefficient,SoC) 用于分类决策。文献 [8] 指出类 似的样本应该用相似的稀疏表示系数进行编码。 文献 [9] 将样本权重的表示系数用于数据集的自 动图构建。Ma 等 [10] 提出了基于 范数正则化的 稀疏系数 近邻分类。文献 [11] 则在 TPTSR 基 础上提出基于两阶段线性重构度量的分类 (two￾phase linear reconstruction measure based classifica￾tion,TPLRMC) 方法,它利用重构系数代替残差来 选择近邻,再进行分类。由于表示系数可以保留 原始高维数据和潜在分类信息的一些固有几何特 性,因此表示系数可应用于降维。这些基于表示 系数的降维方法可以统一到图嵌入框架中[12]。最 近,用于线性回归的非负稀疏图学习方法[13] 实现 了标签预测和投影学习,并为基于图的学习提供 了新的视角。因此,表示系数可以很好地应用于 模式分类。 L1 L2 虽然基于表示系数的分类方法在许多实际的 人脸识别任务中表现良好,但其分类性能会受到 人脸图像变化的显著影响[2] ,且有些没有考虑过 程中数据非平衡的问题[14]。为了进一步提高对人 脸图像的分类性能,本文提出了一种基于 范数 或 范数的自适应多阶段线性重构表示的分类 (self-adaptive multi-phase linear reconstruction repres￾entation based classification,MPRBC) 方法。首先, 用表示系数代替残差来表示查询样本与训练样本 之间的相似性,系数越大表示它们越相似。用近 邻类代替近邻样本,保留近邻类中的全部样本, 保持样本数据的平衡。用多次选择近邻代替单次 选择,同时利用自适应的方法控制算法的时间复 杂度。在 6 个人脸数据集上的实验表明,MPRBC 算法优于目前最先进的基于表示的分类方法。 1 相关 RBC 算法 X = [ X 1 X 2 ··· X M0 ] = [x1 x2 ··· xn] ∈ R d×n n M0 d X i i ci ∈ {1, 2, ··· , M0} 本节主要回顾已有的一些 RBC 方法。给定训 练样本 为 个属于 类的 维样本, 表示属于第 类的 训练样本子集,其对应的类标签为 。 1.1 基于线性重构度量的最近邻 (LRMNN) 分类 一般的线性重构度量 (LRM) 问题可表示为 min s ∥y− Xs∥ 2 2 (1) s = [s1 s2 ··· sn] T ∈ R n si y xi sˆ = [sˆ1 sˆ2 ··· sˆn] T ∈ R n sˆi y xi 式中: 表示线性重构系数, 代表 与 的相似性。设 是问题 (1) 的最优解,则 越大,说明 与 越相 似。为了克服奇异值问题并控制过拟合,在 LRM 目标函数中增加正则化项对表示系数进行约束, 得到以下正则化 LRM 模型: min s ∥y− Xs∥ 2 2 +λ∥s∥p (2) λ p p = s p = s 式中 : 是平衡参数,用来平衡重建误差项和正 则化项之间的贡献; 通常设置为 1 或 2,当 1 时, 为稀疏表示系数,文献 [3] 中给出了详细的 求解过程;当 2 时, 为协同表示系数,其最优 解为 sˆ = (X TX+λI) −1X T y (3) xi y y xi sˆi xi y y 基于表示系数的相似性度量在分类中表现良 好 [5-6, 8]。如果一个训练样本 与查询样本 非常 相似,那么在重构 时 会有较大的表示系数。 因此,LRMNN 认为具有最大表示系数 的样本 与 最相似,从而可利用最相似样本对 进行 分类,分类规则如下: c = argmaxci ∥sˆi∥ (4) 式中 :i = 1,2,··· ,n; ci 是训练样本 xi 的类标签。 1.2 表示系数之和 (SoC) 分类 L1 sˆ SRC 使用 范数正则化约束,通过式 (2) 得 到最优稀疏表示向量 ,然后根据查询样本与训 练样本的残差进行分类。SoC 算法[9] 是在 SRC 的 基础上用同类样本的表示系数之和对查询样本进 行分类,其分类规则为 c = argmaxci ∑ δ ci (sˆ) (5) 第 5 期 钱剑滨,等:自适应多阶段线性重构表示分类的人脸识别 ·965·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有