工程科学学报,第37卷,第4期:535541,2015年4月 Chinese Journal of Engineering,Vol.37,No.4:535-541,April 2015 DOI:10.13374/j.issn2095-9389.2015.04.020:http://journals.ustb.edu.cn 基于局部特征和稀疏表示的鲁棒人耳识别方法 黄宏博2)四,穆志纯”,张保庆》,陈龙” 1)北京科技大学自动化学院,北京1000832)北京信息科技大学计算中心,北京100192 ☒通信作者,Email:hauck@sohu.com 摘要作为图像局部特征区域的有效描述方法,局部二值模式是目前对二维图像最有效的纹理分析特征之一.本文提出 了基于局部二值模式特征的稀疏表示人耳识别方法.该识别算法首先提取训练人耳图像的局部二值模式特征描述子作为稀 疏表示的字典,然后将测试样本的局部二值模式特征描述子表示为字典中所有局部二值模式原子的稀疏线性组合,最后通过 求解稀疏表示模型得到稀疏编码系数,根据测试人耳图像的重建误差进行识别.在UND-J2人耳库和USTB人耳库上的实验 结果表明,基于局部二值模式特征的稀疏表示人耳识别方法对人耳图像光照变化、姿态变化以及人耳遮挡具有更好的鲁棒 性,实现了更高的识别率. 关键词机器视觉:稀疏表示:二值模式:人耳:模式识别 分类号TP391.4 Robust ear recognition using sparse representation of local features HUANG Hong-bo,MU Zhi-chun,ZHANG Bao-qing,CHEN Long) 1)School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Computing center,Beijing Information Science and Technology University,Beijing 100192.China Corresponding author,E-mail:hauck@sohu.com ABSTRACT As a local image feature description approach,LBP (local binary pattern)is regarded as one of the most effective tex- tural features to describe images.In this paper,a general classification algorithm via sparse representation of LBP features is proposed for ear recognition.This algorithm expresses LBP features of the input ear image as a sparse combination of LBP features extracted from all the training ear images.The recognition performance for salt and pepper noise,Gaussian noise and various levels of random occlu- sion in which the location of occlusion is randomly chosen to simulate real scenario is investigated.Experimental results on USTB ear database reveal that when the test ear image is contaminated by noise or is occluded,the proposed approach exhibits a greater robust- ness and achieves a better recognition performance. KEY WORDS machine vision;sparse representation:binary patterns:ears;pattern recognition 作为一种有效的生物特征识别技术,人耳识别的人脸转为侧面时人耳则恰处于视角正面,这使得人耳 可行性已经得到研究的证明”.人耳是一种近似刚性 信息可以成为人脸识别的有益补充.正是由于这些特 的生物特征体,其本身具有丰富的结构特征,满足身份点,人耳识别近年来得到了越来越多研究者的普遍关 验证的唯一性、稳定性和可靠性:并且,人耳识别不受 注,出现了大量人耳识别的研究工作B. 表情、年龄等因素的影响回.此外,人耳数据的采集与 1国内外研究现状 人脸数据的采集方式类似,均可以实现非打扰式采集, 并且人耳独特的生理位置,与人脸大致呈90°分布,当 根据特征提取方式的不同,人耳识别可以分为基 收稿日期:2014-06-18 基金项目:国家自然科学基金资助项目(61472031,61170116):教有部博士学科专项科研基金资助项目(20100006110014)
工程科学学报,第 37 卷,第 4 期: 535--541,2015 年 4 月 Chinese Journal of Engineering,Vol. 37,No. 4: 535--541,April 2015 DOI: 10. 13374 /j. issn2095--9389. 2015. 04. 020; http: / /journals. ustb. edu. cn 基于局部特征和稀疏表示的鲁棒人耳识别方法 黄宏博1,2) ,穆志纯1) ,张保庆1) ,陈 龙1) 1) 北京科技大学自动化学院,北京 100083 2) 北京信息科技大学计算中心,北京 100192 通信作者,E-mail: hauck@ sohu. com 摘 要 作为图像局部特征区域的有效描述方法,局部二值模式是目前对二维图像最有效的纹理分析特征之一. 本文提出 了基于局部二值模式特征的稀疏表示人耳识别方法. 该识别算法首先提取训练人耳图像的局部二值模式特征描述子作为稀 疏表示的字典,然后将测试样本的局部二值模式特征描述子表示为字典中所有局部二值模式原子的稀疏线性组合,最后通过 求解稀疏表示模型得到稀疏编码系数,根据测试人耳图像的重建误差进行识别. 在 UND--J2 人耳库和 USTB 人耳库上的实验 结果表明,基于局部二值模式特征的稀疏表示人耳识别方法对人耳图像光照变化、姿态变化以及人耳遮挡具有更好的鲁棒 性,实现了更高的识别率. 关键词 机器视觉; 稀疏表示; 二值模式; 人耳; 模式识别 分类号 TP391. 4 Robust ear recognition using sparse representation of local features HUANG Hong-bo1,2) ,MU Zhi-chun1) ,ZHANG Bao-qing1) ,CHEN Long1) 1) School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2) Computing center,Beijing Information Science and Technology University,Beijing 100192,China Corresponding author,E-mail: hauck@ sohu. com ABSTRACT As a local image feature description approach,LBP ( local binary pattern) is regarded as one of the most effective textural features to describe images. In this paper,a general classification algorithm via sparse representation of LBP features is proposed for ear recognition. This algorithm expresses LBP features of the input ear image as a sparse combination of LBP features extracted from all the training ear images. The recognition performance for salt and pepper noise,Gaussian noise and various levels of random occlusion in which the location of occlusion is randomly chosen to simulate real scenario is investigated. Experimental results on USTB ear database reveal that when the test ear image is contaminated by noise or is occluded,the proposed approach exhibits a greater robustness and achieves a better recognition performance. KEY WORDS machine vision; sparse representation; binary patterns; ears; pattern recognition 收稿日期: 2014--06--18 基金项目: 国家自然科学基金资助项目( 61472031,61170116) ; 教育部博士学科专项科研基金资助项目( 20100006110014) 作为一种有效的生物特征识别技术,人耳识别的 可行性已经得到研究的证明[1]. 人耳是一种近似刚性 的生物特征体,其本身具有丰富的结构特征,满足身份 验证的唯一性、稳定性和可靠性; 并且,人耳识别不受 表情、年龄等因素的影响[2]. 此外,人耳数据的采集与 人脸数据的采集方式类似,均可以实现非打扰式采集, 并且人耳独特的生理位置,与人脸大致呈 90°分布,当 人脸转为侧面时人耳则恰处于视角正面,这使得人耳 信息可以成为人脸识别的有益补充. 正是由于这些特 点,人耳识别近年来得到了越来越多研究者的普遍关 注,出现了大量人耳识别的研究工作[3 - 4]. 1 国内外研究现状 根据特征提取方式的不同,人耳识别可以分为基
·536· 工程科学学报,第37卷,第4期 于几何特征的识别方法和基于代数特征的识别方 应用树立了一个良好的开端.基于稀疏表示的分类方 法日.基于几何特征的识别方法一般以人耳轮廓的形 法认为:字典中原子的数量比特征的构成方式更为重 状和关键点为基础,提取指定两点之间的欧氏距离、曲 要,只要字典中原子的数目足够大,并且稀疏解被完全 率、角度等作为识别特征进行识别.代表性的工作有: 的正确恢复,那么无论选择哪一种特征表示方式(即 Burge和Burger圆首先使用分形轮廓进行人耳定位,然 使简单的主成分分析,下采样等特征提取方式)都会 后利用Canny算子进行边缘提取,进而构造边缘曲线 获得同样的分类结果.然而,在实际应用场景,训练样 的Voronoi图,最后提取相邻曲线的关系来构造特征向 本的数量往往是有限的,也就意味着字典中原子的数 量.Mu等切提出了基于外耳轮廓形状特征和内耳结 目不是足够多(稀疏表示的假设失效).并且,人耳图 构特征的提取方法.该方法首先对输入图像进行边缘 像会存在遮挡,光照和姿态变化.这时,字典中原子的 提取,并使用最小二乘方法分别拟合外耳轮廓来构成 特征提取方式会对稀疏表示分类方法的识别性能产生 形状特征,然后寻找外耳轮廓长轴及其中垂线,最后求 重要的影响,特征提取方式的好坏直接影响最后的识 取七个几何量的比值作为结构特征变量.基于几何特 别性能.因此,需要进一步研究有效地字典原子特 征的识别方法虽然操作简单,然而此类方法对于人耳 征提取方式,增强字典中原子的信息表示能力,提高稀 图像的姿态变化和遮挡等比较敏感,特征提取不够稳 疏表示分类方法在图像存在局部变化下的鲁棒性.作 定,影响了最终的识别性能.基于代数特征的识别方 为图像局部特征区域的有效描述方法,局部二值模式 法以统计学理论为背景,通过学习样本内部的统计规 (local binary pattern,LBP)是目前对二维图像最有效 律,将原始数据变换到某一低维空间,得到最能反映分 的纹理分析特征之一四.局部二值模式计算简单,对 类本质的特征.代表性的工作有:Chang等圆将主成分 线性光照变化具有不变性.通过对邻域半径和采样点 分析方法分别用于人脸识别和人耳识别,研究结果表 数目等参数的调整,可以获得对尺度大小较为鲁棒的 明人脸识别率和人耳识别率没有太大差别.王忠礼网 特征.对初始局部二值模式编码进行循环移位,在所 采用高阶不变矩方法对人耳图像进行信息变换和特征 得到的局部二值模式数值中选取最小值作为特征可以 提取,并提出了基于不变矩的改进算法.该方法在一 实现旋转不变的局部二值模式描述.基于局部二值模 定程度上可以克服人耳图像因平移、缩放和旋转等因 式的研究已被广泛应用于模式识别、背景提取、图像检 素对识别结果的影响.田莹和苑玮琦0提出了一种基 索等领域,而基于稀疏表示的方法对图像的遮掩、 于力场转换理论的人耳识别方法,分两次将力场理论 污染有很好的鲁棒性.鉴于此,本文提出基于局部二 运用于人耳图像,该方法在一定程度上解决了人耳图 值模式的稀疏表示人耳识别方法.该识别算法首先提 像由于旋转变化、姿态变化等带来的识别率低的问题. 取训练人耳图像的局部二值模式特征描述子作为稀疏 然而基于代数特征的识别方法通过学习样本的整体规 表示的字典,然后将测试样本的局部二值模式特征描 律来对样本进行表示,因此小样本问题无法从本质上 述子表示为所有训练样本局部二值模式特征描述子的 得以解决.同时此类方法对于图像的局部变化不够鲁 稀疏线性组合,最后根据每一类原子对测试图像的重 棒,当图像发生姿态变化、光照变化或人耳被部分遮挡 建误差来进行身份识别 时,识别率急剧下降.但是,在实际应用场合中,人耳 2 图像的采集受各种外界条件影响很大.图像的采集过 基于局部二值模式描述子的稀疏表示人 程中必然要面对不同的光照条件和拍摄视角以及人耳 耳识别方法 被部分遮挡等情况,这些成像条件的变化会极大影响 2.1局部二值模式描述子 所获取人耳图像的表观,使得绝大多数人耳识别算法 局部二值模式是一种通过局部纹理模式来刻画图 的识别性能大大降低,还需要进一步研究对人耳光照 像局部灰度变化,利用纹理谱直方图对局部纹理结构 变化、姿态变化以及人耳遮挡鲁棒的人耳识别算法,使 进行统计的纹理描述子.局部二值模式算子的编码规 人耳识别真正应用到视频监控以及其他一些商业 则定义如下: 应用 (1) 近年来,稀疏表示理论引起了国内外学者的广泛 LBPR.N (u,0)= s(n:-ne)2 关注,是当前的研究热点与难点.稀疏表示理论在模 s(x)= 1,x≥0: 式识别领域的成功应用源于Wright和Yang@利用模 10,其他. 式间的稀疏性提出的一种基于稀疏表示的分类方法. 式中,n.表示中心像素点(u,)的灰度值,n:表示等间 该方法将待识别图像表示为由所有训练图像构成的字 隔地分布在以(u,)为圆心,R为半径的圆上的N个 典的稀疏线性组合,是一种真正的基于所有训练图像 邻域点的灰度值.由式(1)可以看出,邻域点与中心像 全局信息的识别方法,为稀疏表示理论在模式识别的 素点灰度值的差值被表示为一个N比特的二进制数
工程科学学报,第 37 卷,第 4 期 于几何特征的识别方法和基于代数特征的识别方 法[5]. 基于几何特征的识别方法一般以人耳轮廓的形 状和关键点为基础,提取指定两点之间的欧氏距离、曲 率、角度等作为识别特征进行识别. 代表性的工作有: Burge 和 Burger[6]首先使用分形轮廓进行人耳定位,然 后利用 Canny 算子进行边缘提取,进而构造边缘曲线 的 Voronoi 图,最后提取相邻曲线的关系来构造特征向 量. Mu 等[7]提出了基于外耳轮廓形状特征和内耳结 构特征的提取方法. 该方法首先对输入图像进行边缘 提取,并使用最小二乘方法分别拟合外耳轮廓来构成 形状特征,然后寻找外耳轮廓长轴及其中垂线,最后求 取七个几何量的比值作为结构特征变量. 基于几何特 征的识别方法虽然操作简单,然而此类方法对于人耳 图像的姿态变化和遮挡等比较敏感,特征提取不够稳 定,影响了最终的识别性能. 基于代数特征的识别方 法以统计学理论为背景,通过学习样本内部的统计规 律,将原始数据变换到某一低维空间,得到最能反映分 类本质的特征. 代表性的工作有: Chang 等[8]将主成分 分析方法分别用于人脸识别和人耳识别,研究结果表 明人脸识别率和人耳识别率没有太大差别. 王忠礼[9] 采用高阶不变矩方法对人耳图像进行信息变换和特征 提取,并提出了基于不变矩的改进算法. 该方法在一 定程度上可以克服人耳图像因平移、缩放和旋转等因 素对识别结果的影响. 田莹和苑玮琦[4]提出了一种基 于力场转换理论的人耳识别方法,分两次将力场理论 运用于人耳图像,该方法在一定程度上解决了人耳图 像由于旋转变化、姿态变化等带来的识别率低的问题. 然而基于代数特征的识别方法通过学习样本的整体规 律来对样本进行表示,因此小样本问题无法从本质上 得以解决. 同时此类方法对于图像的局部变化不够鲁 棒,当图像发生姿态变化、光照变化或人耳被部分遮挡 时,识别率急剧下降. 但是,在实际应用场合中,人耳 图像的采集受各种外界条件影响很大. 图像的采集过 程中必然要面对不同的光照条件和拍摄视角以及人耳 被部分遮挡等情况,这些成像条件的变化会极大影响 所获取人耳图像的表观,使得绝大多数人耳识别算法 的识别性能大大降低,还需要进一步研究对人耳光照 变化、姿态变化以及人耳遮挡鲁棒的人耳识别算法,使 人耳识别真正应用到视频监控以及其他一些商业 应用. 近年来,稀疏表示理论引起了国内外学者的广泛 关注,是当前的研究热点与难点. 稀疏表示理论在模 式识别领域的成功应用源于 Wright 和 Yang[10]利用模 式间的稀疏性提出的一种基于稀疏表示的分类方法. 该方法将待识别图像表示为由所有训练图像构成的字 典的稀疏线性组合,是一种真正的基于所有训练图像 全局信息的识别方法,为稀疏表示理论在模式识别的 应用树立了一个良好的开端. 基于稀疏表示的分类方 法认为: 字典中原子的数量比特征的构成方式更为重 要,只要字典中原子的数目足够大,并且稀疏解被完全 的正确恢复,那么无论选择哪一种特征表示方式( 即 使简单的主成分分析,下采样等特征提取方式) 都会 获得同样的分类结果. 然而,在实际应用场景,训练样 本的数量往往是有限的,也就意味着字典中原子的数 目不是足够多( 稀疏表示的假设失效) . 并且,人耳图 像会存在遮挡,光照和姿态变化. 这时,字典中原子的 特征提取方式会对稀疏表示分类方法的识别性能产生 重要的影响,特征提取方式的好坏直接影响最后的识 别性能[11]. 因此,需要进一步研究有效地字典原子特 征提取方式,增强字典中原子的信息表示能力,提高稀 疏表示分类方法在图像存在局部变化下的鲁棒性. 作 为图像局部特征区域的有效描述方法,局部二值模式 ( local binary pattern,LBP) 是目前对二维图像最有效 的纹理分析特征之一[12]. 局部二值模式计算简单,对 线性光照变化具有不变性. 通过对邻域半径和采样点 数目等参数的调整,可以获得对尺度大小较为鲁棒的 特征. 对初始局部二值模式编码进行循环移位,在所 得到的局部二值模式数值中选取最小值作为特征可以 实现旋转不变的局部二值模式描述. 基于局部二值模 式的研究已被广泛应用于模式识别、背景提取、图像检 索等领域[13],而基于稀疏表示的方法对图像的遮掩、 污染有很好的鲁棒性. 鉴于此,本文提出基于局部二 值模式的稀疏表示人耳识别方法. 该识别算法首先提 取训练人耳图像的局部二值模式特征描述子作为稀疏 表示的字典,然后将测试样本的局部二值模式特征描 述子表示为所有训练样本局部二值模式特征描述子的 稀疏线性组合,最后根据每一类原子对测试图像的重 建误差来进行身份识别. 2 基于局部二值模式描述子的稀疏表示人 耳识别方法 2. 1 局部二值模式描述子 局部二值模式是一种通过局部纹理模式来刻画图 像局部灰度变化,利用纹理谱直方图对局部纹理结构 进行统计的纹理描述子. 局部二值模式算子的编码规 则定义如下: LBPR,N ( u,v) = ∑ N -1 i = 0 s( ni - nc ) 2i . ( 1) s( x) = 1, x≥0; {0, 其他. 式中,nc 表示中心像素点( u,v) 的灰度值,ni 表示等间 隔地分布在以( u,v) 为圆心,R 为半径的圆上的 N 个 邻域点的灰度值. 由式( 1) 可以看出,邻域点与中心像 素点灰度值的差值被表示为一个 N 比特的二进制数, · 635 ·
黄宏博等:基于局部特征和稀疏表示的鲁棒人耳识别方法 ·537· 会得到2种不同的模式.也就是说,局部二值模式描 值模式纹理特征组合成一个矩阵D.=d,d,,d]∈ 述子的维数为2'.图1为局部二值模式描述子的编码 R“x”.稀疏表示假设输入图像可以表示为来自同一类 过程. 图像的稀疏线性组合,对属于同一类别i的测试样本y 提取局部二值模式特征,记为y,那么y,就可以表示 LBP= 成同类训练样本局部二值模式纹理特征的线性组合, Sn。-nj2+ 即yp=aada+aad2+…+amd S(n:-n.)21+ S(n,-n)22+ 将全部来自k类的n个训练样本的局部二值模式 Sm,-)2+ 纹理特征连接起来,构成一个新的矩阵D,称为稀疏表 S(n,-n)2*+ Sn,-n)2+ 示的字典,D=D,D2,…,D]=d.,d,…,d.],那 Sn。-nj2+ S(n.-n )27+ 么y,就可以重新表示为字典矩阵原子的一个线性组 合y=Dx.在理想情况下,除了对应于第i类的系数 之外其余位置的元素都为0,即x=0,…,0,a.a.2' 图1局部二值模式编码过程 Fig.1 Basic LBP operator …,a0…,0]T∈R".由此可以看出,若每一类的样 本数目与总的训练样本数目相比所占比例很小,那么 对于大小为W×H的纹理图像,在获得每个像素 所得到的编码系数x将是十分稀疏的.可以通过求解 点对应的编码模式以后,通过统计每种模式出现的次 下列模型获得稀疏表示系数x。: 数生成纹理谱直方图,即可获得相应的描述子.局部 xo=arg min x o'ye=Dx. (3) 二值模式纹理谱直方图的计算公式如下: 在实际应用中,人耳不可避免的会存在噪声和遮 H()= ∑∑f(LBP(u,),k) (2) 挡,因此式(3)的表述将不再适用.这里,我们将假设 噪声或遮挡可由一个误差项e来表示,则 (1, x=y: f(x,y)= 10,其他. yip =yun +e=Dx+e=[ D, =Bw 式中k∈D,2-1].图2为一幅人耳图像的局部二值 模式纹理特征描述子. 其中, 2.2基于局部二值模式特征的稀疏表示方法 近年来,稀疏表示理论已经引起了国内外学者的 B=D,w=[] 普遍关注.Wright和Yango利用模式间的稀疏性设 y,表示被污染的测试人耳图像的局部二值模式特征 计出一种基于稀疏表示的分类方法,该方法将待识别 描述子. 图像表示为所有训练图像的稀疏线性组合.在人脸图 求解式(3)的稀疏解是NP-难问题,由于1。范数 像库上的实验结果表明,该分类方法对人脸的遮掩和 的离散性和不连续性,使得凸分析的算法不能被直接 图像的污染有很好的鲁棒性。借鉴稀疏表示分类方 应用.稀疏表示最新研究理论表明@,如果所求解的 法,设第i个人有n幅训练图像,首先提取每幅训练人 系数足够稀疏,解上述。最小化问题等价于求解下列 耳图像的局部二值模式纹理特征描述子,记为d,d, 最小化问题: ,d:;然后将来自第i个人的n:个训练样本的局部二 x,=arg minx‖1 140 120 100 80 60 20 10 20 局部二值模式值 图2人耳图像的局部二值模式特征描述子 Fig.2 LBP feature descriptor for an ear image
黄宏博等: 基于局部特征和稀疏表示的鲁棒人耳识别方法 会得到 2N 种不同的模式. 也就是说,局部二值模式描 述子的维数为 2N . 图 1 为局部二值模式描述子的编码 过程. 图 1 局部二值模式编码过程 Fig. 1 Basic LBP operator 对于大小为 W × H 的纹理图像,在获得每个像素 点对应的编码模式以后,通过统计每种模式出现的次 数生成纹理谱直方图,即可获得相应的描述子. 局部 二值模式纹理谱直方图的计算公式如下: H( k) = ∑ W u = 1 ∑ H v = 1 f( LBPR,N ( u,v) ,k) . ( 2) f( x,y) = 1, x = y; {0, 其他. 式中 k∈[0,2N - 1]. 图 2 为一幅人耳图像的局部二值 模式纹理特征描述子. 图 2 人耳图像的局部二值模式特征描述子 Fig. 2 LBP feature descriptor for an ear image 2. 2 基于局部二值模式特征的稀疏表示方法 近年来,稀疏表示理论已经引起了国内外学者的 普遍关注. Wright 和 Yang[10]利用模式间的稀疏性设 计出一种基于稀疏表示的分类方法,该方法将待识别 图像表示为所有训练图像的稀疏线性组合. 在人脸图 像库上的实验结果表明,该分类方法对人脸的遮掩和 图像的污染有很好的鲁棒性. 借鉴稀疏表示分类方 法,设第 i 个人有 ni 幅训练图像,首先提取每幅训练人 耳图像的局部二值模式纹理特征描述子,记为 di1 ,di2 , …,di ni ; 然后将来自第 i 个人的 ni 个训练样本的局部二 值模式纹理特征组合成一个矩阵 Di =[di1 ,di2 ,…,di ni ]∈ Rm × ni . 稀疏表示假设输入图像可以表示为来自同一类 图像的稀疏线性组合,对属于同一类别 i 的测试样本 y 提取局部二值模式特征,记为 ylbp,那么 ylbp就可以表示 成同类训练样本局部二值模式纹理特征的线性组合, 即 ylbp = ai1 di1 + ai2 di2 + … + aini dini . 将全部来自 k 类的 n 个训练样本的局部二值模式 纹理特征连接起来,构成一个新的矩阵 D,称为稀疏表 示的字典,D =[D1,D2,…,Dk ]=[d11 ,d12 ,…,dknk ],那 么 ylbp就可以重新表示为字典矩阵原子的一个线性组 合 ylbp = Dx. 在理想情况下,除了对应于第 i 类的系数 之外其余位置的元素都为 0,即 x =[0,…,0,αi,1,αi,2, …,αi,n,0…,0]T ∈Rm . 由此可以看出,若每一类的样 本数目与总的训练样本数目相比所占比例很小,那么 所得到的编码系数 x 将是十分稀疏的. 可以通过求解 下列模型获得稀疏表示系数 x0 : x0 = arg min ‖x‖0,ylbp = Dx. ( 3) 在实际应用中,人耳不可避免的会存在噪声和遮 挡,因此式( 3) 的表述将不再适用. 这里,我们将假设 噪声或遮挡可由一个误差项 e 来表示,则 y1lbp = ylbp + e = Dx + e =[D,I] x [ ] e = Bw. 其中, B =[D,I],w = x [ ] e , y1lbp表示被污染的测试人耳图像的局部二值模式特征 描述子. 求解式( 3) 的稀疏解是 NP--难问题,由于 l0 范数 的离散性和不连续性,使得凸分析的算法不能被直接 应用. 稀疏表示最新研究理论表明[10],如果所求解的 系数足够稀疏,解上述 l0 最小化问题等价于求解下列 最小化问题: x1 = arg min ‖x‖1, · 735 ·
·538· 工程科学学报,第37卷,第4期 s.Lyn=Dr(存在噪声和遮挡时,x→w,D→D,I]). 征归一化矩阵D=[D,D2,…,D]=d,d,…, (4) d,],当人耳存在噪声或遮挡时,字典矩阵为D→D, 本文将所有训练人耳样本的局部二值模式纹理特 门:测试样本的局部二值模式特征描述子》φ 征描述子作为字典,也就是字典D已知,那么上式对 (2)利用原始对偶算法求解下列模型:x,= 于解x和x的可行域而言是凸的.因此,这个优化问 arg min‖x‖,满足yp=Dr(存在噪声或遮挡时,x→ 题不存在局部最小值.全局最优解可以通过二次规 wD→D,I门),得到稀疏系数x. 划,梯度下降等方法求得.文中采用原始对偶算法进 (3)计算余项:r:(y)=‖yp-e-D8(x)l2, 行求解啊,因为该算法拥有更好的线性收敛性能,适 其中i=1,2,…,k,8:(x)为x中保留对应于第i类的系 合于高精度的计算 数而将其余的系数全部赋值为0. 利用原始对偶算法求解凸优化问题(4),就可以 (4)将使余项r:ye)最小的类i作为测试样本y 得到稀疏表示系数向量x和残差向量e,这时得到的 的识别结果,即identity(y)=arg min,J:(p). 稀疏系数x已经包含测试人耳图像的类别信息.在 3 实验结果与分析 此,把最通近测试样本y,的稀疏表示的类信息判定为 测试样本y的类别.即:首先计算余项r:(y)= 本文采用的人耳数据来自UND数据库的一个子 ‖yp-e-D6(x)‖2,其中8(x)为x中保留对应于 集一CollectionJ2,该人耳子集包含415人的1800 第i类的系数而将其余的系数全部赋值为0:然后将测 幅三维人耳数据及其对应的二维人耳图像.图3给出 试样本归为使余项取最小值的那一类, 了UND-J2子库中来自同一个人的人耳图像实例.从 identity(y)=arg min,r:(yme),i=l,2,…,k. 图中可以看出该图像库人耳样本存在明显的光照变化 基于局部二值模式特征的稀疏表示人耳识别算法 和尺度变化,在姿态上不仅存在平面内旋转(绕成像 流程可以归纳如下 平面法线的旋转),也存在平面外旋转(绕与成像平面 算法1基于局部二值模式特征的稀疏表示人耳 平行轴的旋转).并且部分人耳存在头发或耳环等饰 识别算法 物遮挡,比较贴切于实际应用场景,对算法的鲁棒性极 (1)来自k类的n个训练样本的局部二值模式特 具挑战性,可以充分验证所提算法的鲁棒性 图3UND一2人耳样本示例 Fig.3 Ear samples from UND-J2 本文采用的另一个图像库来自北京科技大学 来训练,其他同样角度变化的5幅(79人共79×5= (USTB)人耳库的一个子集a一USTB人耳子库Ⅲ. 395幅)用于测试,这样可以增大测试人耳的数量,更 该人耳图像库采用彩色摄像机拍摄,拍摄距离为1.5 能充分验证所提算法的鲁棒性.图4为利用文献17] m.拍摄对象共79人,每人40幅图像,分人头左转和 所提出的人耳检测算法获得的人耳区域 右转两种情况.向左转情况以5°为间隔,旋转从5°至 3.1光照和姿态变化下的人耳识别 45°,其中每个角度拍摄两幅.向右转情况为正面人 我们选择使用UND-J2来验证所提算法在人耳图 耳,从5°至45以5°为间隔旋转,旋转60°,其中每个角 像存在光照、姿态变化以及几何形变时的识别性能. 度拍摄2幅.该子库被广泛用于人耳识别研究中,主 由于所提的基于局部二值模式特征的稀疏表示人耳识 要用来研究人耳检测、姿态变化下的人耳识别、人耳人 别算法要求训练样本足够多,以至于能准确地判断出 脸多模态融合识别以及遮挡情况下的人耳识别. 人耳的身份.然而,在UND一J2人耳库中,一些人耳样 我们选择使用USTB人耳子库Ⅲ研究文中算法在 本只包含2幅或4幅人耳图像,远远不能达到稀疏表 人耳图像存在遮挡下的识别性能.为了尽量排除角度 示识别算法的样本数量要求.于是,我们首先从415 变化对于人耳识别性能的影响,专门研究噪声和遮挡 人的UND人耳库中选择人耳图片数量大于等于10的 对人耳识别算法的影响,选取0°、5°、10°、15°和20°角 人耳样本,这样有60人满足这种要求.然后,对于这 度变化的人耳图像各一幅(79人共79×5=395幅)用 60人的600个人耳样本,我们从中选取每人5幅人耳
工程科学学报,第 37 卷,第 4 期 s. t. ylbp = Dx( 存在噪声和遮挡时,x→w,D→[D,I]) . ( 4) 本文将所有训练人耳样本的局部二值模式纹理特 征描述子作为字典,也就是字典 D 已知,那么上式对 于解 x 和 x 的可行域而言是凸的. 因此,这个优化问 题不存在局部最小值. 全局最优解可以通过二次规 划,梯度下降等方法求得. 文中采用原始对偶算法进 行求解[14],因为该算法拥有更好的线性收敛性能,适 合于高精度的计算. 利用原始对偶算法求解凸优化问题( 4) ,就可以 得到稀疏表示系数向量 x 和残差向量 e,这时得到的 稀疏系数 x 已经包含测试人耳图像的类别信息. 在 此,把最逼近测试样本 ylbp的稀疏表示的类信息判定为 测试样 本 y 的 类 别. 即: 首 先 计 算 余 项 ri ( ylbp ) = ‖ylbp - e - Dδi ( x) ‖2,其中 δi ( x) 为 x 中保留对应于 第 i 类的系数而将其余的系数全部赋值为 0; 然后将测 试样本归为使余项取最小值的那一类, identity( y) = arg miniri ( ylbp ) ,i = 1,2,…,k. 基于局部二值模式特征的稀疏表示人耳识别算法 流程可以归纳如下. 算法 1 基于局部二值模式特征的稀疏表示人耳 识别算法. ( 1) 来自 k 类的 n 个训练样本的局部二值模式特 征归 一 化 矩 阵 D = [D1,D2,…,Dk]= [d11 ,d12 ,…, dknk ],当人耳存在噪声或遮挡时,字典矩阵为 D→[D, I]; 测试样本的局部二值模式特征描述子 ylbp . ( 2) 利 用 原 始 对 偶 算 法 求 解 下 列 模 型: x1 = arg min ‖x‖1 满足 ylbp = Dx( 存在噪声或遮挡时,x→ wD→[D,I]) ,得到稀疏系数 x. ( 3) 计算余项: ri ( ylbp ) = ‖ylbp - e - Dδi ( x) ‖2, 其中 i = 1,2,…,k,δi ( x) 为 x 中保留对应于第 i 类的系 数而将其余的系数全部赋值为 0. ( 4) 将使余项 ri ( ylbp ) 最小的类 i 作为测试样本 y 的识别结果,即 identity( y) = arg miniri ( ylbp ) . 3 实验结果与分析 本文采用的人耳数据来自 UND 数据库的一个子 集[15]———Collection J2,该人耳子集包含 415 人的 1800 幅三维人耳数据及其对应的二维人耳图像. 图 3 给出 了 UND--J2 子库中来自同一个人的人耳图像实例. 从 图中可以看出该图像库人耳样本存在明显的光照变化 和尺度变化,在姿态上不仅存在平面内旋转( 绕成像 平面法线的旋转) ,也存在平面外旋转( 绕与成像平面 平行轴的旋转) . 并且部分人耳存在头发或耳环等饰 物遮挡,比较贴切于实际应用场景,对算法的鲁棒性极 具挑战性,可以充分验证所提算法的鲁棒性. 图 3 UND--J2 人耳样本示例 Fig. 3 Ear samples from UND--J2 本文采用的另一个图像库来自北京科技大学 ( USTB) 人耳库的一个子集[16]———USTB 人耳子库Ⅲ. 该人耳图像库采用彩色摄像机拍摄,拍摄距离为 1. 5 m. 拍摄对象共 79 人,每人 40 幅图像,分人头左转和 右转两种情况. 向左转情况以 5°为间隔,旋转从 5°至 45°,其中每个角度拍摄两幅. 向右转情况为正面人 耳,从 5°至 45°以 5°为间隔旋转,旋转 60°,其中每个角 度拍摄 2 幅. 该子库被广泛用于人耳识别研究中,主 要用来研究人耳检测、姿态变化下的人耳识别、人耳人 脸多模态融合识别以及遮挡情况下的人耳识别. 我们选择使用 USTB 人耳子库Ⅲ研究文中算法在 人耳图像存在遮挡下的识别性能. 为了尽量排除角度 变化对于人耳识别性能的影响,专门研究噪声和遮挡 对人耳识别算法的影响,选取 0°、5°、10°、15°和 20°角 度变化的人耳图像各一幅( 79 人共 79 × 5 = 395 幅) 用 来训练,其他同样角度变化的 5 幅( 79 人共 79 × 5 = 395 幅) 用于测试,这样可以增大测试人耳的数量,更 能充分验证所提算法的鲁棒性. 图 4 为利用文献[17] 所提出的人耳检测算法获得的人耳区域. 3. 1 光照和姿态变化下的人耳识别 我们选择使用 UND--J2 来验证所提算法在人耳图 像存在光照、姿态变化以及几何形变时的识别性能. 由于所提的基于局部二值模式特征的稀疏表示人耳识 别算法要求训练样本足够多,以至于能准确地判断出 人耳的身份. 然而,在 UND--J2 人耳库中,一些人耳样 本只包含 2 幅或 4 幅人耳图像,远远不能达到稀疏表 示识别算法的样本数量要求. 于是,我们首先从 415 人的 UND 人耳库中选择人耳图片数量大于等于 10 的 人耳样本,这样有 60 人满足这种要求. 然后,对于这 60 人的 600 个人耳样本,我们从中选取每人 5 幅人耳 · 835 ·
黄宏博等:基于局部特征和稀疏表示的鲁棒人耳识别方法 ·539· 图4USTB人耳子库Ⅲ人耳区域检测结果 Fig.4 Ear region detected on USTB ear database 图像作为测试,其余剩余人耳图片作为训练样本 虑了单一样本之间的相似程度,忽略了同一类样本之 图5给出了局部二值模式特征在最近邻分类器和 间邻域结构关系.因此,当测试集样本在姿态和光照 稀疏表示分类方法下的识别率.实验中,局部二值模 条件等方面与训练集样本差异较大或者出现大幅的噪 式纹理特征的邻域N=8,选取半径R的范围为1~20 声及遮挡的条件下,测试图像将不再单一地近似于某 像素 一个训练集图像,那么错识与漏识的情况将不可避免。 100 稀疏表示分类(sparse representation-based classifica- 90 tio)方法是一种真正地基于所有训练图像全局信息 80 的方法,对图像进行了更有效的表达和分类,增强了分 70 类器的鉴别能力,它不仅在一般情况下获得了很高的 60 识别率,并且在有光照和姿态或大幅噪声及遮挡变化 50 的情况下仍能获得较好的实验结果,体现出一种鲁棒 40 的识别性能.从表1中的实验结果看出,基于局部二 30 +一局部二值模式+稀疏表示 值模式特征的稀疏表示人耳识别方法实现了较高的识 20 一日一局部二值模式+最近邻 别率,明显高于其他几种识别方法.这是因为作为一 10 种局部特征描述子,局部二值模式特征对图像的局部 2 4 6 8101214161820 变化更鲁棒,在一定程度了可以克服图像光照变化、姿 半径/像素 态变化、尺寸变化等造成的影响.本文所提出的基于 图5局部二值模式特征在不同分类器下的识别率比较 局部二值模式特征的稀疏表示人耳识别算法在适当的 Fig.5 Recognition performance of LBP using nearest neighbor and sparse representation based classification 邻域半径下,可以实现95%左右的识别率.在图像存 在明显光照、姿态、几何形变以及人耳被遮挡的人耳库 目前,绝大多数基于稀疏表示分类模型的识别 上实现了较高的识别性能 方法通常使用主成分分析、下采样、高斯随机矩阵 3.2随机遮挡下的人耳识别 等@简单的特征降维方式对字典中原子进行降维: 遮挡是人耳识别中一个难以回避的难题园.遮 然而这些方法忽略了原子的信息表示能力,在图像 挡给人耳图像的鲁棒特征提取增加了巨大的麻烦与困 存在光照、姿态变化以及几何形变时,上述简单的特 扰,进而导致绝大多数人耳识别算法的识别性能大大 征提取方式使得原子的信息表示能力较弱,对图像 降低 局部变化的刻画能力不足.表1给出了主成分分析、 在现实应用场景中,遮挡位置和遮挡程度都是未 下采样和高斯随机矩阵在稀疏表示分类方法下的识 知的,我们在测试人耳图像上添加随机位置遮挡图像 别性能 块,遮挡图像块与测试人耳图像块没有任何关联信息, 表1不同字典构造方法在UND-J2上的实验结果 为了更充分地研究遮挡程度对算法识别性能的影响, Table 1 Recognition performance of different dictionary design methods 将遮挡程度从0变化到50%(间隔为5%).图6给出 识别方法 首选识别率/% 了随机遮挡测试人耳图片,遮挡程度依次为10%、 主成分分析+稀疏表示 g 20%、30%、35%、40%和50% 下采样+稀疏表示 70 表2为未添加遮挡时的人耳识别率.从实验结果 高斯随机矩阵+稀疏表示 66 可以看出:当使用最近邻分类器进行识别时,相较于主 成分分析和线性鉴别分析等代数特征方法,局部二值 从图5的实验结果可以看出,基于局部二值模式 模式方法并未体现一定的优势,识别性能甚至低于主 特征的识别方法明显优于局部二值模式特征在最近邻 成分分析和线性鉴别分析方法:然而本文所提的基于 下的识别性能.这是由于最近邻分类器只是孤立地考 局部二值模式特征的稀疏表示人耳识别方法识别率大
黄宏博等: 基于局部特征和稀疏表示的鲁棒人耳识别方法 图 4 USTB 人耳子库Ⅲ人耳区域检测结果 Fig. 4 Ear region detected on USTB ear database Ⅲ 图像作为测试,其余剩余人耳图片作为训练样本. 图 5 给出了局部二值模式特征在最近邻分类器和 稀疏表示分类方法下的识别率. 实验中,局部二值模 式纹理特征的邻域 N = 8,选取半径 R 的范围为 1 ~ 20 像素. 图 5 局部二值模式特征在不同分类器下的识别率比较 Fig. 5 Recognition performance of LBP using nearest neighbor and sparse representation based classification 目前,绝大多数基于稀疏表示分类模型的识别 方法通常 使 用 主 成 分 分 析、下 采 样、高 斯 随 机 矩 阵 等[10]简单的特征降维方式对字典中原子进行降维; 然而这些方法忽略了原子的信息表示能力,在图像 存在光照、姿态变化以及几何形变时,上述简单的特 征提取方式使得原子的信息表示能力较弱,对图像 局部变化的刻画能力不足. 表 1 给出了主成分分析、 下采样和高斯随机矩阵在稀疏表示分类方法下的识 别性能. 表 1 不同字典构造方法在 UND--J2 上的实验结果 Table 1 Recognition performance of different dictionary design methods 识别方法 首选识别率/% 主成分分析 + 稀疏表示 69 下采样 + 稀疏表示 70 高斯随机矩阵 + 稀疏表示 66 从图 5 的实验结果可以看出,基于局部二值模式 特征的识别方法明显优于局部二值模式特征在最近邻 下的识别性能. 这是由于最近邻分类器只是孤立地考 虑了单一样本之间的相似程度,忽略了同一类样本之 间邻域结构关系. 因此,当测试集样本在姿态和光照 条件等方面与训练集样本差异较大或者出现大幅的噪 声及遮挡的条件下,测试图像将不再单一地近似于某 一个训练集图像,那么错识与漏识的情况将不可避免. 稀 疏 表 示 分 类 ( sparse representation-based classification) 方法是一种真正地基于所有训练图像全局信息 的方法,对图像进行了更有效的表达和分类,增强了分 类器的鉴别能力,它不仅在一般情况下获得了很高的 识别率,并且在有光照和姿态或大幅噪声及遮挡变化 的情况下仍能获得较好的实验结果,体现出一种鲁棒 的识别性能. 从表 1 中的实验结果看出,基于局部二 值模式特征的稀疏表示人耳识别方法实现了较高的识 别率,明显高于其他几种识别方法. 这是因为作为一 种局部特征描述子,局部二值模式特征对图像的局部 变化更鲁棒,在一定程度了可以克服图像光照变化、姿 态变化、尺寸变化等造成的影响. 本文所提出的基于 局部二值模式特征的稀疏表示人耳识别算法在适当的 邻域半径下,可以实现 95% 左右的识别率. 在图像存 在明显光照、姿态、几何形变以及人耳被遮挡的人耳库 上实现了较高的识别性能. 3. 2 随机遮挡下的人耳识别 遮挡是人耳识别中一个难以回避的难题[18]. 遮 挡给人耳图像的鲁棒特征提取增加了巨大的麻烦与困 扰,进而导致绝大多数人耳识别算法的识别性能大大 降低. 在现实应用场景中,遮挡位置和遮挡程度都是未 知的,我们在测试人耳图像上添加随机位置遮挡图像 块,遮挡图像块与测试人耳图像块没有任何关联信息. 为了更充分地研究遮挡程度对算法识别性能的影响, 将遮挡程度从 0 变化到 50% ( 间隔为 5% ) . 图 6 给出 了随机 遮 挡 测 试 人 耳 图 片,遮 挡 程 度 依 次 为 10% 、 20% 、30% 、35% 、40% 和 50% . 表 2 为未添加遮挡时的人耳识别率. 从实验结果 可以看出: 当使用最近邻分类器进行识别时,相较于主 成分分析和线性鉴别分析等代数特征方法,局部二值 模式方法并未体现一定的优势,识别性能甚至低于主 成分分析和线性鉴别分析方法; 然而本文所提的基于 局部二值模式特征的稀疏表示人耳识别方法识别率大 · 935 ·
·540· 工程科学学报,第37卷,第4期 幅提高,达到了99.8%的识别率,说明稀疏表示分类 方法有效提高了局部二值模式特征的识别性能. 图6随机遮挡人耳图像 Fig.6 Randomly occluded ear images 表2未添加随机遮挡时的人耳识别率 Table 2 Recognition rate without occlusion 主成分分析+ 线性鉴别分析+ 局部二值模式+ 主成分分析+ 线性鉴别分析+ 局部二值模式+ 最近邻 最近邻 最近邻 稀疏表示 稀疏表示 稀疏表示 98.0 98.2 88.4 98.2 99.2 99.8 我们分别讨论了各特征提取方法在最近邻分 各特征提取方法在最近邻分类器下的识别率:图7 类器和稀疏表示分类器下的识别情况.图7为各识 (b)为各特征提取方法在稀疏表示分类器下的识 别算法在人耳图像被遮挡时的识别率.图7(a)为 别率 100 100 (a) ◆一线性鉴别分析+最近邻 ◆一线性鉴别分析+ 90 随机耳+最近邻 90 稀疏表示 80 局部二值模式+最近邻 随机耳+稀疏表示 主成分分析+最近邻 70 60 60 局部二值模式+ 50 稀疏表示 40 %形 主成分分析+ 稀疏表示 30 30 20 名 10 o D 0 10 2030 40 50 0 10 20 30 40 50 进挡程度修 遮挡程度/% 图7不同遮挡程度下的人耳识别率.(a)最近邻分类法:(b)稀疏表示分类法 Fig.7 Recognition rate under various levels of occlusion:(a)nearest neighbor classification;(b)sparse representation-based classification 从图7(a)中可以看出,人耳图像被遮挡时,其他 示人耳识别方法仍然能实现60%的识别率,而其他几 几种算法的识别率急剧下降.当人耳图像遮挡程度达 种方法的识别率都低于15%. 到10%时,其他几种方法的识别率甚至下降到50%以 表3给出了局部二值模式纹理特征在最近邻分 下,而局部二值模式方法的识别率要高于其他几种方 类器与本文所提的基于局部二值模式的稀疏表示人 法,说明局部二值模式描述子增强了稀疏表示分类方 耳识别方法下的首选识别率.从表3结果可以看出, 法中字典的信息表示能力以及对图像遮掩的鲁棒性 无论图像是否添加遮挡,加入稀疏表示后,局部二值 从图7(b)可以看出,基于局部二值模式的稀疏表示识 模式特征的识别性能都大幅提升.当随机遮挡程度 别方法的识别性能要远高于其他几种方法.加入稀疏 在15%时,本文提出的基于局部二值模式特征的稀 表示后,其他几种方法的识别性能与基于最近邻分类 疏表示人耳识别方法仍然能实现94.4%的识别率, 器的识别率相差无几,而基于局部二值模式特征的稀 远高于最近邻分类器下的74.9%.甚至当遮挡程度 疏表示人耳识别方法的识别率大幅提升,要远高于其 在30%时,本文所提算法仍然能实现70.5%的识别 他几种方法.当遮挡程度为15%时,基于局部二值模 率,高于最近邻分类器下的40.0%.这说明稀疏表 式的稀疏表示人耳识别方法仍然实现了94.9%的识 示增强了局部二值模式纹理特征对遮挡的鲁棒性, 别率,而其他几种方法的识别率都低于30%.甚至当 提升了局部二值模式纹理特征的在人耳遮挡时的识 遮挡程度在35%时,基于局部二值模式特征的稀疏表 别性能
工程科学学报,第 37 卷,第 4 期 幅提高,达到了 99. 8% 的识别率,说明稀疏表示分类 方法有效提高了局部二值模式特征的识别性能. 图 6 随机遮挡人耳图像 Fig. 6 Randomly occluded ear images 表 2 未添加随机遮挡时的人耳识别率 Table 2 Recognition rate without occlusion % 主成分分析 + 最近邻 线性鉴别分析 + 最近邻 局部二值模式 + 最近邻 主成分分析 + 稀疏表示 线性鉴别分析 + 稀疏表示 局部二值模式 + 稀疏表示 98. 0 98. 2 88. 4 98. 2 99. 2 99. 8 我们分别讨论了各特征提取方法在最近邻分 类器和稀疏表示分类器下的识别情况. 图 7 为各识 别算法在人耳图像被遮挡时 的 识 别 率. 图 7 ( a) 为 各特征提取方法在最近邻分类器下的识别率; 图 7 ( b) 为各 特 征 提 取 方 法 在 稀 疏 表 示 分 类 器 下 的 识 别率. 图 7 不同遮挡程度下的人耳识别率. ( a) 最近邻分类法; ( b) 稀疏表示分类法 Fig. 7 Recognition rate under various levels of occlusion: ( a) nearest neighbor classification; ( b) sparse representation-based classification 从图 7( a) 中可以看出,人耳图像被遮挡时,其他 几种算法的识别率急剧下降. 当人耳图像遮挡程度达 到 10% 时,其他几种方法的识别率甚至下降到 50% 以 下,而局部二值模式方法的识别率要高于其他几种方 法,说明局部二值模式描述子增强了稀疏表示分类方 法中字典的信息表示能力以及对图像遮掩的鲁棒性. 从图 7( b) 可以看出,基于局部二值模式的稀疏表示识 别方法的识别性能要远高于其他几种方法. 加入稀疏 表示后,其他几种方法的识别性能与基于最近邻分类 器的识别率相差无几,而基于局部二值模式特征的稀 疏表示人耳识别方法的识别率大幅提升,要远高于其 他几种方法. 当遮挡程度为 15% 时,基于局部二值模 式的稀疏表示人耳识别方法仍然实现了 94. 9% 的识 别率,而其他几种方法的识别率都低于 30% . 甚至当 遮挡程度在 35% 时,基于局部二值模式特征的稀疏表 示人耳识别方法仍然能实现 60% 的识别率,而其他几 种方法的识别率都低于 15% . 表 3 给出了局部二值模式纹理特征在最近邻分 类器与本文所提的基于局部二值模式的稀疏表示人 耳识别方法下的首选识别率. 从表 3 结果可以看出, 无论图像是否添加遮挡,加入稀疏表示后,局部二值 模式特征的识别性能都大幅提升. 当随机遮挡程度 在 15% 时,本文提出的基于局部二值模式特征的稀 疏表示人耳识别方法仍然能实现 94. 4% 的识别率, 远高于最近邻分类器下的 74. 9% . 甚至当遮挡程度 在 30% 时,本文所提算法仍然能实现 70. 5% 的识别 率,高于最近邻分类器下的 40. 0% . 这说明稀疏表 示增强了局部二值模式纹理特征对遮挡的鲁棒性, 提升了局部二值模式纹理特征的在人耳遮挡时的识 别性能. · 045 ·
黄宏博等:基于局部特征和稀疏表示的鲁棒人耳识别方法 541· 表3局部二值模式+最近邻与局部二值模式+稀疏表示的识别率 (田莹,苑玮琦.基于力场转换的人耳特征提取与识别.仪器 比较 仪表学报,2009,30(2):318) Table 3 Performance comparison of LBP nearest neighbor and LBP+ [5]Abaza A,Ross A,Herbert C,et al.A survey on ear biometrics sparse representation ACM Comput Surv,2013,45(2):1 识别率/% [6]Burge M,Burger W.Ear biometrics for machine vision /Pro- 随机遮挡 局部二值模式+ 局部二值模式+ ceedings of the 21th Workshop of the Austrian Association for Pattern 程度/% 最近邻 稀疏表示 Recognition,1997:275 0 88.4 99.8 Mu Z C,Yuan L,Xu Z G.Shape and structural feature based ear recognition//Proceedings of the 5th Chinese Conference on Bio- 86.1 99.5 metric Recognition.Guangzhou,2004:663 % 78.7 98.0 [8]Chang K,Bowyer W,Sarkar S,et al.Comparison and combina- 15 74.9 94.9 tion of ear and face images in appearance-based biometrics.IEEE 20 64.8 86.3 Trans Pattern Anal Mach Intell,2003,25(9)1160 25 Wang ZL,Mu ZC,Wang X Y,et al.Ear recognition based on 54.4 74.4 moment invariants.Pattern Recognit Artif Intell,2004,17 (4): 30 40.0 70.5 502 35 33.4 60.0 (王忠礼,穆志纯,王修岩,等.基于不变矩匹配的人耳识别 40 24.3 32.4 模式识别与人工智能,2004,17(4):502) 50 11.9 [10]Wright J,Yang A,Ganesh A,et al.Robust face recognition via 17.7 sparse representation.IEEE Trans Pattern Anal Mach Intell, 2009,31(2):210 4结论 [11]Yang M,Zhang L,Simon K,et al.Gabor feature based robust representation and classification for face recognition with Gabor 本文重点针对人耳识别应用中不可避免的姿态、 occlusion dictionary.Pattern Recognit,2013,46(7):1865 光照变化以及人耳遮挡问题进行研究,提出了基于局 [12]Wang Y,Mu Z C,Fu D M,et al.Ear recognition based on 部二值模式特征的稀疏表示人耳识别方法.局部二值 wavelet transform and uniform texture descriptors.Acta Electron 模式描述的特征和稀疏表示的分类方法都对光照、姿 Sin,2010,38(1):239 态变化和遮挡情形下的识别具有良好的鲁棒性.在 (王瑜,穆志纯,付冬梅,等.基于小波变换和规范型纹理描 述子的人耳识别.电子学报,2010,38(1):239) UNDJ2子库和北京科技大学人耳库Ⅲ上的实验结果 [13]Zeng H,Mu Z C,Wang X Q.A robust method for local image 表明,基于局部二值模式特征的稀疏表示人耳识别方 feature region description.Acta Autom Sin,2011,37(6):658 法对人耳图像遮挡以及在图像存在光照和姿态变化时 (曾慧,穆志纯,王秀青.一种鲁棒的图像局部特征区域的 具有更好的鲁棒性和更高的识别率.这充分验证了局 描述方法.自动化学报,2011,37(6):658) 部二值模式作为一种有效的字典原子描述方法,提高 [14]Boyd S,Vandenberghe L.Conrex Optimization.Cambridge: 了字典中原子的信息表示能力,进而极大提高稀疏表 Cambridge University Press,2004 示分类模型的识别性能 [15]The Computer Vision Research Laboratory at the University of Notre Dame.University of Notre Dame Biometrics Database Col- lection 2 [dB/OL].University of Notre Dame,2005 [2014- 参考文献 06-18].http://www.cse.nd.edu/evrl/CVRL/Data_Sets.html [1]Kevin B,Yan P.Multi-modal biometrics involving the human ear [16]Mu Z C.USTB Ear Database Ill [DB/OL].University of Sei- 1/Proceedings of the IEEE Conference on Computer Vision and ence and Technology Beijing,2004 [2014-06-18].http:// Pattern Recognition,Minneapolis,2007:1 www1.ustb.edu.cn/resb/en/news/news3.htm Pflug A,Busch C.Ear biometrics:a survey of detection,feature 07] Yuan L,Zhang F.Ear detection based on improved Adaboost al- extraction and recognition.IET Biom,2012,1 (2)114 gorithm /Proceedings of the International Conference on Machine B] Kumar A,Chan TS T.Robust ear identification using sparse rep- Learning and Cybernetics.Baoding,2009:2414 resentation of local texture descriptors.Patern Recognit,2013. [18]Yuan L,Mu Z C.Zeng H.Partially occluded ear recognition 46(1):73 based on local features.J Unie Sci Technol Beijing,2010,32 4]Tian Y,Yuan WQ.Ear feature extraction and recognition based (4):530 on force field transformation.Chin J Sci Instrum,2009,30(2): (袁立,穆志纯,曾慧.基于局部特征的部分遮挡人耳识别 318 北京科技大学学报,2010,32(4):530)
黄宏博等: 基于局部特征和稀疏表示的鲁棒人耳识别方法 表 3 局部二值模式 + 最近邻与局部二值模式 + 稀疏表示的识别率 比较 Table 3 Performance comparison of LBP + nearest neighbor and LBP + sparse representation 随机遮挡 程度/% 识别率/% 局部二值模式 + 最近邻 局部二值模式 + 稀疏表示 0 88. 4 99. 8 5 86. 1 99. 5 10 78. 7 98. 0 15 74. 9 94. 9 20 64. 8 86. 3 25 54. 4 74. 4 30 40. 0 70. 5 35 33. 4 60. 0 40 24. 3 32. 4 50 11. 9 17. 7 4 结论 本文重点针对人耳识别应用中不可避免的姿态、 光照变化以及人耳遮挡问题进行研究,提出了基于局 部二值模式特征的稀疏表示人耳识别方法. 局部二值 模式描述的特征和稀疏表示的分类方法都对光照、姿 态变化和遮挡情形下的识别具有良好的鲁棒性. 在 UND J2 子库和北京科技大学人耳库Ⅲ上的实验结果 表明,基于局部二值模式特征的稀疏表示人耳识别方 法对人耳图像遮挡以及在图像存在光照和姿态变化时 具有更好的鲁棒性和更高的识别率. 这充分验证了局 部二值模式作为一种有效的字典原子描述方法,提高 了字典中原子的信息表示能力,进而极大提高稀疏表 示分类模型的识别性能. 参 考 文 献 [1] Kevin B,Yan P. Multi-modal biometrics involving the human ear / / Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Minneapolis,2007: 1 [2] Pflug A,Busch C. Ear biometrics: a survey of detection,feature extraction and recognition. IET Biom,2012,1( 2) : 114 [3] Kumar A,Chan T S T. Robust ear identification using sparse representation of local texture descriptors. Pattern Recognit,2013, 46( 1) : 73 [4] Tian Y,Yuan W Q. Ear feature extraction and recognition based on force field transformation. Chin J Sci Instrum,2009,30( 2) : 318 ( 田莹,苑玮琦. 基于力场转换的人耳特征提取与识别. 仪器 仪表学报,2009,30( 2) : 318) [5] Abaza A,Ross A,Herbert C,et al. A survey on ear biometrics. ACM Comput Surv,2013,45( 2) : 1 [6] Burge M,Burger W. Ear biometrics for machine vision / / Proceedings of the 21th Workshop of the Austrian Association for Pattern Recognition,1997: 275 [7] Mu Z C,Yuan L,Xu Z G. Shape and structural feature based ear recognition / / Proceedings of the 5th Chinese Conference on Biometric Recognition. Guangzhou,2004: 663 [8] Chang K,Bowyer W,Sarkar S,et al. Comparison and combination of ear and face images in appearance-based biometrics. IEEE Trans Pattern Anal Mach Intell,2003,25( 9) : 1160 [9] Wang Z L,Mu Z C,Wang X Y,et al. Ear recognition based on moment invariants. Pattern Recognit Artif Intell,2004,17 ( 4) : 502 ( 王忠礼,穆志纯,王修岩,等. 基于不变矩匹配的人耳识别. 模式识别与人工智能,2004,17( 4) : 502) [10] Wright J,Yang A,Ganesh A,et al. Robust face recognition via sparse representation. IEEE Trans Pattern Anal Mach Intell, 2009,31( 2) : 210 [11] Yang M,Zhang L,Simon K,et al. Gabor feature based robust representation and classification for face recognition with Gabor occlusion dictionary. Pattern Recognit,2013,46( 7) : 1865 [12] Wang Y,Mu Z C,Fu D M,et al. Ear recognition based on wavelet transform and uniform texture descriptors. Acta Electron Sin,2010,38( 1) : 239 ( 王瑜,穆志纯,付冬梅,等. 基于小波变换和规范型纹理描 述子的人耳识别. 电子学报,2010,38( 1) : 239) [13] Zeng H,Mu Z C,Wang X Q. A robust method for local image feature region description. Acta Autom Sin,2011,37( 6) : 658 ( 曾慧,穆志纯,王秀青. 一种鲁棒的图像局部特征区域的 描述方法. 自动化学报,2011,37( 6) : 658) [14] Boyd S,Vandenberghe L. Convex Optimization. Cambridge: Cambridge University Press,2004 [15] The Computer Vision Research Laboratory at the University of Notre Dame. University of Notre Dame Biometrics Database Collection J2 [dB /OL]. University of Notre Dame,2005 [2014-- 06--18]. http: / /www. cse. nd. edu /cvrl /CVRL /Data_Sets. html [16] Mu Z C. USTB Ear Database Ⅲ[DB /OL]. University of Science and Technology Beijing,2004 [2014--06--18]. http: / / www1. ustb. edu. cn / resb /en / news/ news3. htm [17] Yuan L,Zhang F. Ear detection based on improved Adaboost algorithm / / Proceedings of the International Conference on Machine Learning and Cybernetics. Baoding,2009: 2414 [18] Yuan L,Mu Z C,Zeng H. Partially occluded ear recognition based on local features. J Univ Sci Technol Beijing,2010,32 ( 4) : 530 ( 袁立,穆志纯,曾慧. 基于局部特征的部分遮挡人耳识别. 北京科技大学学报,2010,32( 4) : 530) · 145 ·