D01:10.13374/i.issn1001t63x.2010.04.024 第32卷第4期 北京科技大学学报 Vol 32 No 4 2010年4月 Journal of Un iversity of Science and Technology Beijing Apr 2010 基于局部特征的部分遮挡人耳识别 袁立穆志纯 曾慧 北京科技大学信息工程学院,北京100083 摘要通过对人耳受到部分遮挡时识别的研究,提出了一种基于局部特征的部分遮挡人耳识别方法,即首先利用Gbor小 波对人耳图像进行特征提取,由于该特征维数较高,再使用核Fsh判别分析(KFDA)方法进行有效降维后用于人耳识别.在 逐步分析人耳各个子区域的鉴别能力的基础上,提出了基于分块图像和概率模型的识别方法.在北京科技大学(USTB)人耳 图像库上的实验结果表明:基于Gb0滤波后图像所提取的特征比基于原始图像直接提取的特征具有更高的识别率,基于分 块图像的识别率高于基于整体图像的识别率, 关键词人耳识别:部分遮挡;Gabor特征:核F isher判别分析:局部特征 分类号TP391.4 Partially occluded ear recogn ition based on local features YUAN Li MU Zhi-chun ZENG Hui School of Infomation Engineering University of Science and Technobgy Beijng Beijing 100083 Chna ABSTRACT A beal feature based appmach was proposed for ear recognition under partial occlusion Firstly the Gabor filter is ap- plied for feature extraction Because the Gabor feature vector is ofhigh diension kemel Fisher discri inant analysis(KFDA)is used for dmension reduction as well as class separability enhancement Based on investigations on the different discrm inating ability of sub- regions in ear inages a sub-region and probability based model is proposed for recognition Expermental results on the USTB ear m- age database show that ear recognition based on the features extracted from Gabor filtered inages perfoms better than that based on the features extracted from the original inages and the local featres based strategy gets a higher recognition rate than the whole inage based strategy for recognition KEY W ORDS ear recognition:partial occlusion:Gabor features kemel Fisher discrin inant analysis (KFDA):local features 人耳识别作为一种生物特征识别技术近来受到 Mu等提出的LABSSFE方法在提取外耳轮廓和内 了越来越多的关注,与人脸识别相比,人耳识别具 耳边缘的基础上,寻找基于外耳轮廓的形状特征和 有不受表情、年龄和心理等因素影响的优势,目前 基于长轴短轴线段比例的结构特征,但这种方法适 人耳识别方法可分为基于3D信息的人耳识别和基 用于正面人耳图像,而难于扩展到人耳角度变化的 于D图像的人耳识别.借助特定的3D图像扫描 情况中,且受光照的影响较大,刘嘉敏等]利用基 仪,3D人耳识别可以在不同的光照和姿态条件下得 于灰度形态学梯度和局部阈值分割的边缘检测方法 到较为理想的结果山.但是,在非打扰识别情况下, 提取外耳轮廓边缘:然后用标准方差和边缘线段间 人耳图像通常会经由监控摄像头来获取,这时就得 长度差改进的Hausdorff距离表示人耳特征向量, 采用D图像来进行识别.因此本文主要着重探讨 第2类基于人耳图像整体特征进行识别,如Hurley 2D人耳识别方法 等将图像看作由高斯吸引子组成的阵列,利用力 国内外已有的基于2D图像的人耳识别方法主 场转换(force fiel transfomation)方法提取人耳图像 要有两类.第1类基于人耳局部特征进行识别.如 的势能通道和势能阱,并以势能阱的位置作为人耳 收稿日期:2009-06-23 基金项目:国家自然科学基金资助项目(N。60973064):北京市教育委员会重点学科共建资助项目(N。XK100080537):北京市自然科学基金 资助项目(N。4102039) 作者简介:袁立(1978),女,讲师,博士,Email yuanli5@homail cam
第 32卷 第 4期 2010年 4月 北 京 科 技 大 学 学 报 JournalofUniversityofScienceandTechnologyBeijing Vol.32No.4 Apr.2010 基于局部特征的部分遮挡人耳识别 袁 立 穆志纯 曾 慧 北京科技大学信息工程学院北京 100083 摘 要 通过对人耳受到部分遮挡时识别的研究提出了一种基于局部特征的部分遮挡人耳识别方法即首先利用 Gabor小 波对人耳图像进行特征提取由于该特征维数较高再使用核 Fisher判别分析 (KFDA)方法进行有效降维后用于人耳识别.在 逐步分析人耳各个子区域的鉴别能力的基础上提出了基于分块图像和概率模型的识别方法.在北京科技大学 (USTB)人耳 图像库上的实验结果表明:基于 Gabor滤波后图像所提取的特征比基于原始图像直接提取的特征具有更高的识别率基于分 块图像的识别率高于基于整体图像的识别率. 关键词 人耳识别;部分遮挡;Gabor特征;核 Fisher判别分析;局部特征 分类号 TP391∙4 Partiallyoccludedearrecognitionbasedonlocalfeatures YUANLiMUZhi-chunZENGHui SchoolofInformationEngineeringUniversityofScienceandTechnologyBeijingBeijing100083China ABSTRACT Alocalfeaturebasedapproachwasproposedforearrecognitionunderpartialocclusion.FirstlytheGaborfilterisap- pliedforfeatureextraction.BecausetheGaborfeaturevectorisofhighdimensionkernelFisherdiscriminantanalysis(KFDA) isused fordimensionreductionaswellasclassseparabilityenhancement.Basedoninvestigationsonthedifferentdiscriminatingabilityofsub- regionsinearimagesasub-regionandprobabilitybasedmodelisproposedforrecognition.ExperimentalresultsontheUSTBearim- agedatabaseshowthatearrecognitionbasedonthefeaturesextractedfromGaborfilteredimagesperformsbetterthanthatbasedonthe featuresextractedfromtheoriginalimagesandthelocalfeaturesbasedstrategygetsahigherrecognitionratethanthewholeimage basedstrategyforrecognition. KEYWORDS earrecognition;partialocclusion;Gaborfeature;kernelFisherdiscriminantanalysis(KFDA);localfeatures 收稿日期:2009--06--23 基金项目:国家自然科学基金资助项目 (No.60973064);北京市教育委员会重点学科共建资助项目 (No.XK100080537);北京市自然科学基金 资助项目 (No.4102039) 作者简介:袁 立 (1978— )女讲师博士E-mail:yuanli64@hotmail.com 人耳识别作为一种生物特征识别技术近来受到 了越来越多的关注.与人脸识别相比人耳识别具 有不受表情、年龄和心理等因素影响的优势.目前 人耳识别方法可分为基于 3D信息的人耳识别和基 于 2D图像的人耳识别.借助特定的 3D图像扫描 仪3D人耳识别可以在不同的光照和姿态条件下得 到较为理想的结果 [1].但是在非打扰识别情况下 人耳图像通常会经由监控摄像头来获取这时就得 采用 2D图像来进行识别.因此本文主要着重探讨 2D人耳识别方法. 国内外已有的基于 2D图像的人耳识别方法主 要有两类.第 1类基于人耳局部特征进行识别.如 Mu等 [2]提出的 LABSSFE方法在提取外耳轮廓和内 耳边缘的基础上寻找基于外耳轮廓的形状特征和 基于长轴短轴线段比例的结构特征但这种方法适 用于正面人耳图像而难于扩展到人耳角度变化的 情况中且受光照的影响较大.刘嘉敏等 [3]利用基 于灰度形态学梯度和局部阈值分割的边缘检测方法 提取外耳轮廓边缘;然后用标准方差和边缘线段间 长度差改进的 Hausdorff距离表示人耳特征向量. 第 2类基于人耳图像整体特征进行识别.如 Hurley 等 [4]将图像看作由高斯吸引子组成的阵列利用力 场转换 (forcefieldtransformation)方法提取人耳图像 的势能通道和势能阱并以势能阱的位置作为人耳 DOI :10.13374/j.issn1001-053x.2010.04.024
第4期 袁立等:基于局部特征的部分遮挡人耳识别 ,531. 特征,Chang等提出使用经典的特征脸法,利用 式中,o为与小波频率带宽有关的常数;uv为Gbor 主元分析法对人脸和人耳图像进行识别,在Hman 滤波器的方向和尺度,某个方向和波形尺度上的波 D图像库上进行实验,得到结论为人脸识别率和人 耳识别率没有较大差别,Xie和M利用改进的局 形向量为k=kem(南入k一为采样尺度:◆。 部线性嵌入方法解决姿态变化下的人耳识别,Dum 为采样方向;k为频率最大值;为频域中的内核 和M利用独立成分分析法进行基于人耳和人脸 间隔因子,由于人耳图像的边缘形状信息主要分布 信息融合的多模态识别, 在Q元Ax么3πA四个方向,取中.-平所以参 以上研究工作对于训练和测试人耳图像的控制 条件是比较严格的,如人耳部分是不能被遮挡的 数为∈10,12,长{0,1,23,。=2π,=2 实际上,遮挡问题是不可回避的,即耳部被头发或者 人耳图像I(x)的Gabor变换为其与Gabor内核 其他饰物遮挡的情况.根据统计⑧),除去季节性因 的卷积: 素(帽子围巾)和偶然性因素(耳机)以外,女性中 G..(x)=(*9.,)(x) (2) 比较固定的遮挡率为51.7%.所以有必要研究人耳 图1(b)所示为12个Gabor滤波器的实部, 被部分遮挡情况下的人耳识别方法 图1(c)所示为图1(a)中的人耳图像经滤波后的幅 从本质上讲,目前的多数人耳识别方法都直接 值.人耳图像都归一化为30×54像素.这里采用双 利用了2D图像表观(像素的灰度值)作为人耳表 重卷积,将人耳图像与对应尺度和方向的奇偶对称 示,其缺点是受光照、视角、饰物和遮挡等外界变化 Gabor滤波器分别进行卷积,把两个卷积后图像的 条件的影响比较大,人耳表示的另一思路是对图像 和取平方根,得到对应某个尺度和方向的输出图像, 表观作某种变换,如从空域表示变换到频域表示, 从图1(c)中可见,滤波后的图像中在人耳边缘呈现 Gabor分解可以看作一个对方向和尺度敏感的有方 较多的四个方向上具有较大的系数(表现为灰度值 向性的显微镜.2 D Gaborg函数也类似于增强边缘以 较大) 及峰、谷和脊轮廓等底层图像特征,这相当于增强了 被认为是耳部关键部位如外耳轮廓、内耳沟回等信 息,同时也增强了诸于耳垂、耳屏、对耳屏和三角窝 等位置的局部特征,从而使得在保留总体人耳信息 的同时增强局部特性成为可能.因此本文利用 Gabo小波与人耳图像进行卷积运算提取不同尺度 和方向的特征,由于所得特征的维数往往较高,通 常的降维方法是线性子空间投影法,但线性降维方 b (c) 法不适用于由角度、光照等引起的非线性人耳图像 图1人耳图像Gabor滤波结果.(a)人耳图像示例:(b)Gabor 空间情况下的人耳识别,因此本文采用基于核的 滤波器在三个尺度和四个方向上的实部;(b)Gaho特征的幅值 Fisher鉴别分析来实现非线性识别. Fig 1 Gabor feature of an ear mage (a)ear inage example (b) 当人耳被部分遮挡时,是否可以利用未遮挡部 the real part of the Gabor filter on three scales and in four directions 分来进行有效识别?本文将人耳图像进行分块,利 (c)the magnitde spectnm of the Gabor feature 用Gabor特征提取和核Fishers鉴别分析降维的组合 利用式(2)得到的Gabora系数包括图像不同位 方法(以下简称GaKFDA方法)研究了各子区域对 置、不同尺度和不同空间频率的滤波系数,图像的 识别率的影响,提出了基于概率模型的人耳识别 特征向量由如下方法产生:将某个尺度和方向下的 方法 G.,(x)系数进行采样,采样因数为r×s采样方法 1 Gabor特征提取 是将×邻域内的系数值进行平均.,再将系数归一 化为零均值和单位方差,最后将各个尺度和方向得 2 D Gabor/小波的定义为 到的系数向量X进行连接得到特征向量x: 9.(x)= ‖k2了‖k‖2‖x 2 exp 22 x=((xi0),(xi1),…,(3)T)r (3) 这样若取=330×54像素大小的人耳图像得到的 ep(ikx)一exp2 (1) 特征向量为180维,12幅Gabor?变换图像的特征级
第 4期 袁 立等: 基于局部特征的部分遮挡人耳识别 特征.Chang等 [5]提出使用经典的特征脸法利用 主元分析法对人脸和人耳图像进行识别在Human ID图像库上进行实验得到结论为人脸识别率和人 耳识别率没有较大差别.Xie和 Mu [6]利用改进的局 部线性嵌入方法解决姿态变化下的人耳识别.Dun 和 Mu [7]利用独立成分分析法进行基于人耳和人脸 信息融合的多模态识别. 以上研究工作对于训练和测试人耳图像的控制 条件是比较严格的如人耳部分是不能被遮挡的. 实际上遮挡问题是不可回避的即耳部被头发或者 其他饰物遮挡的情况.根据统计 [8]除去季节性因 素 (帽子/围巾 )和偶然性因素 (耳机 )以外女性中 比较固定的遮挡率为 51∙7%.所以有必要研究人耳 被部分遮挡情况下的人耳识别方法. 从本质上讲目前的多数人耳识别方法都直接 利用了 2D图像表观 (像素的灰度值 )作为人耳表 示其缺点是受光照、视角、饰物和遮挡等外界变化 条件的影响比较大.人耳表示的另一思路是对图像 表观作某种变换如从空域表示变换到频域表示. Gabor分解可以看作一个对方向和尺度敏感的有方 向性的显微镜.2DGabor函数也类似于增强边缘以 及峰、谷和脊轮廓等底层图像特征这相当于增强了 被认为是耳部关键部位如外耳轮廓、内耳沟回等信 息同时也增强了诸于耳垂、耳屏、对耳屏和三角窝 等位置的局部特征从而使得在保留总体人耳信息 的同时增强局部特性成为可能.因此本文利用 Gabor小波与人耳图像进行卷积运算提取不同尺度 和方向的特征.由于所得特征的维数往往较高通 常的降维方法是线性子空间投影法但线性降维方 法不适用于由角度、光照等引起的非线性人耳图像 空间情况下的人耳识别因此本文采用基于核的 Fisher鉴别分析来实现非线性识别. 当人耳被部分遮挡时是否可以利用未遮挡部 分来进行有效识别?本文将人耳图像进行分块利 用 Gabor特征提取和核 Fisher鉴别分析降维的组合 方法 (以下简称 GaKFDA方法 )研究了各子区域对 识别率的影响提出了基于概率模型的人耳识别 方法. 1 Gabor特征提取 2DGabor小波的定义为 [9] φuv(x)= ‖kuv‖ 2 σ 2 exp ‖kuv‖ 2‖x‖ 2 2σ 2 · exp(ikuv·x)—exp — σ 2 2 (1) 式中σ为与小波频率带宽有关的常数;u、v为Gabor 滤波器的方向和尺度某个方向和波形尺度上的波 形向量为 kuv=kvexp(i●u)kv= kmax f v 为采样尺度;●u 为采样方向;kmax为频率最大值;f为频域中的内核 间隔因子.由于人耳图像的边缘形状信息主要分布 在 0、π/4、π/2、3π/4四个方向取 ●u= uπ 4 .所以参 数为 v∈{012}u∈{0123}σ=2πf= 2. 人耳图像 I(x)的 Gabor变换为其与 Gabor内核 的卷积: Guv(x)=(I∗φuv)(x) (2) 图 1(b)所示为 12个 Gabor滤波器的实部 图 1(c)所示为图 1(a)中的人耳图像经滤波后的幅 值.人耳图像都归一化为30×54像素.这里采用双 重卷积将人耳图像与对应尺度和方向的奇偶对称 Gabor滤波器分别进行卷积把两个卷积后图像的 和取平方根得到对应某个尺度和方向的输出图像. 从图 1(c)中可见滤波后的图像中在人耳边缘呈现 较多的四个方向上具有较大的系数 (表现为灰度值 较大 ). 图 1 人耳图像 Gabor滤波结果.(a) 人耳图像示例;(b) Gabor 滤波器在三个尺度和四个方向上的实部;(b) Gabor特征的幅值 Fig.1 Gaborfeatureofanearimage:(a) earimageexample;(b) therealpartoftheGaborfilteronthreescalesandinfourdirections; (c) themagnitudespectrumoftheGaborfeature 利用式 (2)得到的 Gabor系数包括图像不同位 置、不同尺度和不同空间频率的滤波系数.图像的 特征向量由如下方法产生:将某个尺度和方向下的 Guv(x)系数进行采样采样因数为 r×r采样方法 是将 r×r邻域内的系数值进行平均.再将系数归一 化为零均值和单位方差最后将各个尺度和方向得 到的系数向量 x r uv进行连接得到特征向量 x r: x r=((x r 00) T(x r 01) T…(x r 23) T ) T (3) 这样若取 r=330×54像素大小的人耳图像得到的 特征向量为 180维12幅 Gabor变换图像的特征级 ·531·
,532 北京科技大学学报 第32卷 联起来共有2160维.对于这个高维特征,再利用核 实验中,将每个人无遮挡的6幅图像用于训练, Fisher鉴别分析方法提取有效的鉴别信息, 测试图像为遮挡图像库中的三种遮挡程度的人耳图 2基于核F isher判别分析的GaKFDA特征 像.首先直接对源图像采用核F isher鉴别分析法提 取特征,核Fisher鉴别分析中采用RBF核函数,如 提取算法 下式所示: 由于使用上述方法得到的图像特征维数较高, K(x y)=exp(-YIx-yP) (4) 所以本文采用基于全空间的核Fher判别分析算法 再利用基于Cosine距离测度的距离分类器进行识 对特征空间进行降维,同时提取有效的鉴别信息,该 别,如下式所示: 算法在文献[l0]中有详细描述.基于核Fher鉴别 一X 8(心y)Tx.Ty (5) 分析的Gabo特征提取过程如图2所示 式中,x和y为两个特征向量 原始 Gabor变换 图像 3个尺度4个方向 下采样 识别结果如图5所示,其中横轴代表特征向量 人耳图像 核iher 维数,纵轴代表首选识别率。从图中可以看出,随着 级联特征 特征向量 鉴别分析降维 遮挡部分面积的增大,识别率依次下降,特征空间 图2基于核F山her鉴别分析的Gabor特征提取 的维数取80时,三种遮挡程度的首选识别率依次为 Fig 2 Gabor feature extraction based on Kemel Fisher discrim nant 0.780.78和0.52 analysis 0.8 07 3部分遮挡情况下的人耳识别 0.6 3.1人耳子区域对识别的贡献 3.1.1人耳上部分被不同程度遮挡时的识别率 04 这里采用自行构建的北京科技大学人耳遮挡图 。上部15%被遮挡 像库,该库包括24人,每人9幅图像,其中3幅为 +上部25%被遮挡 一上部35%被遮挡 不同程度的遮挡图像,这里将遮挡程度分为三种:小 部分遮挡(上部1%被遮挡)、少部分遮挡(上部 20 40 60 80 100 25%被遮挡)和大部分遮挡(上部35%被遮挡),分 特征向量维数 别如图3(b)、3(c)和3(d)所示,另外6幅为无遮 图5人耳上部分被遮挡时的识别率(KDA特征提取) 挡图像,这些图在同一光照条件,不同转动角度(分 Fig5 Recognition mte with top part occlided inages (KFDA for 别为0两幅、左转5两幅和右转5两幅)条件下拍 feahire extraction) 摄,如图4所示. 图6所示为首先利用Gabori滤波器提取图像的 Gabor特征,再利用核Fisher鉴别分析法提取鉴别 0.9 08 (a国 b (c) 0.7 图3部分遮挡人耳图像.(a)未遮挡:(b)上部1%遮挡; 0.6 (c)上部25%遮挡:(d)上部35%遮挡 05 Fig 3 Ear mage under partial occhision (a)no occlusion (b) 一上部15%被遮挡 0.4 +上部25%被遮挡 top 15%occlded (c)top 25%occluded (b)top 35%occluded 0.3 ◆上部35%被遮挡 02 0 40 60 100 特征向量维数 图6人耳上部分被遮挡时的识别率(GKDA特征提取) 图4未遮挡的人耳图像 Fig6 Recognition rate with top part occluded inages (GaKFDA for Fig 4 Ear imnages w ith no occhision feahire extraction)
北 京 科 技 大 学 学 报 第 32卷 联起来共有 2160维.对于这个高维特征再利用核 Fisher鉴别分析方法提取有效的鉴别信息. 2 基于核 Fisher判别分析的 GaKFDA特征 提取算法 由于使用上述方法得到的图像特征维数较高 所以本文采用基于全空间的核 Fisher判别分析算法 对特征空间进行降维同时提取有效的鉴别信息该 算法在文献 [10]中有详细描述.基于核 Fisher鉴别 分析的 Gabor特征提取过程如图 2所示. 图 2 基于核 Fisher鉴别分析的 Gabor特征提取 Fig.2 GaborfeatureextractionbasedonKernelFisherdiscriminant analysis 3 部分遮挡情况下的人耳识别 3∙1 人耳子区域对识别的贡献 3∙1∙1 人耳上部分被不同程度遮挡时的识别率 这里采用自行构建的北京科技大学人耳遮挡图 像库.该库包括 24人每人 9幅图像其中 3幅为 不同程度的遮挡图像这里将遮挡程度分为三种:小 部分遮挡 (上部 15%被遮挡 )、少部分遮挡 (上部 25%被遮挡 )和大部分遮挡 (上部 35%被遮挡 )分 别如图 3(b)、3(c)和 3(d)所示.另外 6幅为无遮 挡图像这些图在同一光照条件不同转动角度 (分 别为 0°两幅、左转 5°两幅和右转 5°两幅 )条件下拍 摄如图 4所示. 图 3 部分遮挡人耳图像. (a) 未遮挡; (b) 上部 15%遮挡; (c) 上部 25%遮挡;(d) 上部 35%遮挡 Fig.3 Earimageunderpartialocclusion:(a) noocclusion; (b) top15% occluded;(c) top25% occluded;(b) top35% occluded 图 4 未遮挡的人耳图像 Fig.4 Earimageswithnoocclusion 实验中将每个人无遮挡的 6幅图像用于训练 测试图像为遮挡图像库中的三种遮挡程度的人耳图 像.首先直接对源图像采用核 Fisher鉴别分析法提 取特征核 Fisher鉴别分析中采用 RBF核函数如 下式所示: K(xy)=exp(—γ|x—y| 2 ) (4) 再利用基于 Cosine距离测度的距离分类器进行识 别如下式所示: δcos(xy)= —x Ty ‖x‖·‖y‖ (5) 式中x和 y为两个特征向量. 识别结果如图 5所示其中横轴代表特征向量 维数纵轴代表首选识别率.从图中可以看出随着 遮挡部分面积的增大识别率依次下降.特征空间 的维数取 80时三种遮挡程度的首选识别率依次为 0∙78、0∙78和 0∙52. 图 5 人耳上部分被遮挡时的识别率 (KFDA特征提取 ) Fig.5 Recognitionratewithtoppartoccludedimages(KFDAfor featureextraction) 图 6 人耳上部分被遮挡时的识别率 (GaKFDA特征提取 ) Fig.6 Recognitionratewithtoppartoccludedimages(GaKFDAfor featureextraction) 图 6所示为首先利用 Gabor滤波器提取图像的 Gabor特征再利用核 Fisher鉴别分析法提取鉴别 ·532·
第4期 袁立等:基于局部特征的部分遮挡人耳识别 ,533. 向量,最后用距离分类器进行识别得到的结果.横 0.7 轴代表特征向量维数,纵轴代表首选识别率,从图 中可以看出,这种方法的识别率要优于直接利用核 0.6 F isher鉴别分析法对源图像提取特征时的识别率. 特征空间的维数取80时,随着遮挡部分面积的增 0.5 大,三种遮挡程度的首选识别率依次为0.860.85 和0.75.所以,基于局部特征的Gabor特征提取有 一上部/3被遮挡 0.4 助于解决遮挡问题。 中部13被遮挡 女下部13被遮挡 从图5和图6可以看出,与Gabor相关的方法, 遮挡前后识别率的变化小于直接利用KFDA方法提 0302030405060708090100 特征向量维数 取特征的识别率的变化,对这个结果的解释如下: Gbor滤波后的每个特征结浓缩了不同方向和不同 图8人耳上、中和下13被遮挡时的识别率(GaKFDA特征) Fig 8 Recognition rale w ith occluded ear inages on different bca 尺度的多分辨率信息,而且由于采用卷积操作,每个 tions top 1/3 middle 1/3 and bottomn 1/3 occlded (GaKFDA for 特征结的信息都是与图像的整体相关联,当对图像 featire extraction) 进行部分遮挡时,部分特征结的信息损失了,但是其 他特征结仍然包含图像的整体信息,对判决仍然具 有贡献,所以识别性能好一些, 3.1.2人耳上、中、下部分被遮挡时的识别率 图7所示为人耳上、中和下各13部分被遮挡 (a) b 的示意图,其中上13被遮挡是头发自然遮挡,中 图9中间部分左(、右(b遮挡人耳图像 和下13被遮挡是人为添加的.实验的目的是为了 Fig 9 Ear mages with lft m ddle occhsion (a)and right middl 研究人耳哪一部分具有更强的鉴别能力,图8所示 occh血sion(b) 为GaKFDA特征提取得到的识别结果,横轴代表特 0.95 征向量维数,纵轴代表首选识别率,特征空间取80 0.90 维时,上、中和下13被遮挡时的首选识别率分别为 0.85 0.620.52和0.64.可见,中间13被遮挡时对识 腰0.80 别率的影响最大,说明人耳图像的中上部包括了大 雪a75 部分的鉴别信息,而中间13部分的沟回分布又比 粒0.70 上面13部分具有更多的鉴别信息 0.65 ◆一中间左部分遭挡 0.60 *中间右部分遮挡 0550203040,5060708090100 (a) (b) 特征向量维数 图7上(a)、中(b)和下(c)1B部分被遮挡的示意图 图10中间部分左右遮挡时的识别率 Fig 7 Ear mages under occhision on different locations (a)top 1/ Fig 10 Ear recognition mate w ith leftm idle occlusion (a)and right 3 (b)m iddle 1/3:(c)botton 1/3 m iddle occlusion (b) 3.1.3人耳中部被遮挡时的识别率 3.2基于概率模型的人耳识别 由于上一小节得到结论:中间13部分的沟回 根据上面的分析可知人耳的不同子区域对于识 分布具有最优的鉴别信息,所以这里将中间13部 别的贡献是不一样的,类似于人脸识别中认为眼晴 分图像分为左右两部分,如图9所示,其中的黑块为 部位对识别起到最重要的作用,所以,在这里将整 人为添加·本实验的目的在于研究中间部分的左右 个人耳划分为六个子区域,如图11(a)所示,在这 两块对识别结果的重要程度.图1O所示为GaKFDA 六个子区域中,对识别率影响最大的是图11(b)所 特征提取得到的识别结果,横轴代表特征向量维数, 示的子区域, 纵轴代表首选识别率.可见,中间13的右部分 假设图像库中的训练样本为{x:{,=12, (图11(b))对识别率的贡献最大, B=12…,N,其中R为图像库中的人数,N,为
第 4期 袁 立等: 基于局部特征的部分遮挡人耳识别 向量最后用距离分类器进行识别得到的结果.横 轴代表特征向量维数纵轴代表首选识别率.从图 中可以看出这种方法的识别率要优于直接利用核 Fisher鉴别分析法对源图像提取特征时的识别率. 特征空间的维数取 80时随着遮挡部分面积的增 大三种遮挡程度的首选识别率依次为 0∙86、0∙85 和 0∙75.所以基于局部特征的 Gabor特征提取有 助于解决遮挡问题. 从图 5和图 6可以看出与 Gabor相关的方法 遮挡前后识别率的变化小于直接利用 KFDA方法提 取特征的识别率的变化.对这个结果的解释如下: Gabor滤波后的每个特征结浓缩了不同方向和不同 尺度的多分辨率信息而且由于采用卷积操作每个 特征结的信息都是与图像的整体相关联当对图像 进行部分遮挡时部分特征结的信息损失了但是其 他特征结仍然包含图像的整体信息对判决仍然具 有贡献所以识别性能好一些. 3∙1∙2 人耳上、中、下部分被遮挡时的识别率 图 7所示为人耳上、中和下各 1/3部分被遮挡 的示意图.其中上 1/3被遮挡是头发自然遮挡中 和下 1/3被遮挡是人为添加的.实验的目的是为了 研究人耳哪一部分具有更强的鉴别能力.图 8所示 为 GaKFDA特征提取得到的识别结果横轴代表特 征向量维数纵轴代表首选识别率.特征空间取 80 维时上、中和下 1/3被遮挡时的首选识别率分别为 0∙62、0∙52和 0∙64.可见中间 1/3被遮挡时对识 别率的影响最大说明人耳图像的中上部包括了大 部分的鉴别信息而中间 1/3部分的沟回分布又比 上面 1/3部分具有更多的鉴别信息. 图 7 上 (a)、中 (b)和下 (c)1/3部分被遮挡的示意图 Fig.7 Earimagesunderocclusionondifferentlocations:(a) top1/ 3;(b) middle1/3;(c) bottom1/3 3∙1∙3 人耳中部被遮挡时的识别率 由于上一小节得到结论:中间 1/3部分的沟回 分布具有最优的鉴别信息.所以这里将中间 1/3部 分图像分为左右两部分如图 9所示其中的黑块为 人为添加.本实验的目的在于研究中间部分的左右 两块对识别结果的重要程度.图10所示为 GaKFDA 特征提取得到的识别结果横轴代表特征向量维数 纵轴代表首选识别率.可见中间 1/3的右部分 (图 11(b))对识别率的贡献最大. 图 8 人耳上、中和下 1/3被遮挡时的识别率 (GaKFDA特征 ) Fig.8 Recognitionratewithoccludedearimagesondifferentloca- tions:top1/3middle1/3andbottom1/3occluded (GaKFDAfor featureextraction) 图 9 中间部分左 (a)、右 (b)遮挡人耳图像 Fig.9 Earimageswithleftmiddleocclusion (a) andrightmiddle occlusion(b) 图 10 中间部分左右遮挡时的识别率 Fig.10 Earrecognitionratewithleftmiddleocclusion(a) andright middleocclusion(b) 3∙2 基于概率模型的人耳识别 根据上面的分析可知人耳的不同子区域对于识 别的贡献是不一样的类似于人脸识别中认为眼睛 部位对识别起到最重要的作用.所以在这里将整 个人耳划分为六个子区域如图 11(a)所示.在这 六个子区域中对识别率影响最大的是图 11(b)所 示的子区域. 假设图像库中的训练样本为{xri}r=12… Ri=12…Nr.其中 R为图像库中的人数Nr为 ·533·
,534 北京科技大学学报 第32卷 式中,α:为反映每一块子区域的鉴别能力的权值, 六个权植的总和为1。,=户权值系数 越大,表示对应的子区域对识别的贡献率越大,对 应最大总体相似度的训练图像则为识别的对象 3.3实验结果与分析 a b 本实验在包括24人的遮挡图像库上进行.特 图11图像分块示意图,(a)图像等分为六块;(b)鉴别能力最 强的子窗口 征空间、训练图像和测试图像分别如下所述 Fig 11 Sketch map for mage division (a)six subwindows divi 特征空间:采用北京科技大学(USTB)人耳图像 sion (b)the most discrin inating sub w indow 库2该图像库2包括308幅人耳图像,共77人,每 图像分块数.训练样本不存在遮挡,如图4所示,对 人4幅,如图12所示,图12(a)为室内正常光照条 件下的图像,图12(b)为逆时针偏转30的图像,图 每个子区域,可以得到一组归一化训练样本,记为 12(c)为顺时针偏转30的图像,图12(d)为光照变 iy,:.根据这组训练样本iy:,通过GaKFDA方 化条件下的图像 法可以确定一个相应的鉴别特征子空间w,:,设 其维数为dd远小于原始特征的维数,将所有 1y:投影到该特征子空间,得{y:.用高斯模型 来描述其分布状况,参数估计值为: (6) (b) d 图12USB人耳图像库2的人耳图像实例.(a)室内正常光 照;(b)逆时针偏转30°;(c)顺时针偏转30°,(d)光照变化 (7) Fig 12 Ear iages fmm USTB ear database 2:(a)indoor nomal 式中,平均值,为协方差矩阵.设v为特征子空 lightng condition (b)30 counterelckw ise mtation:(c)30 clockw ise motations (d)different lighting conditions 间中任意点,则ⅴ属于相应子区域的概率密度函 数为: 将每人4幅无遮挡图像进行分块,所有308幅 B(v)= 图像相应位置的子图像构成图像子空间,对每一个 1 图像子空间使用GaKFDA方法提取相应的子特征 空间(即得到六个投影矩阵),该过程所用时间用。 表示 (8) 训练图像:遮挡图像库,24人·将每人一幅无 将遮挡子库中的每个训练图像中的每个区域 遮挡图像分块后向上述特征空间投影,得到分块后 {gallery.:,=1,2…,24,=12…,6向相应的鉴 各子图像的特征向量,该过程所用时间用表示, 别特征子空间w:}投影,得到特征向量 测试图像:遮挡图像库,24人·三种遮挡情况 {gallery,:.再将遮挡子库中的每个测试图像中的 下各一幅图像.将受部分遮挡的图像分块后向相应 每个区域probe,:{,r=12…,24,=1,2…,6向 的子特征空间投影,得到各子区域的特征向量后,利 相应的鉴别特征子空间{w,:投影,得到特征向量 用3.2节所述的方法进行识别.这里将识别出全部 pmbe:k.使用式(8)来计算每个子区域发生遮盖 24人的时间用飞表示, 的概率.如果概率值小于设定阈值T,则表明待测 由于Gbo特征维数较高,所以将图像归一化 试子区域发生了遮挡 为30×54像素大小,分成六块后,每块为15×18像 对于每个子区域,计算测试图像pmbe,与训练 素大小.每块经Gbor滤波后采样得到的特征向量 图像gallery.的相似度s这里采用余弦距离测度 为360维,再利用核Fher鉴别分析进行降维,阈 gallery prober Ilgallerya-probe· 则测试图像与训练图 值T设为0.2权值向量a=(0.15,0.15,0.20.3 0.1,0.1)当特征空间维数取60时,识别率如表1 像的总体相似度为: 所示。从该表结果可以看出:(1)在遮挡情况下,基 S= (9) 于概率模型的子区域识别方法在三种遮挡程度下的
北 京 科 技 大 学 学 报 第 32卷 图 11 图像分块示意图.(a) 图像等分为六块;(b) 鉴别能力最 强的子窗口 Fig.11 SketchmapforImagedivision:(a) sixsub-windowsdivi- sion;(b) themostdiscriminatingsub-window 图像分块数.训练样本不存在遮挡如图4所示.对 每个子区域可以得到一组归一化训练样本记为 {yri}.根据这组训练样本{yri}通过 GaKFDA方 法可以确定一个相应的鉴别特征子空间{wri}设 其维数为 dd远小于原始特征的维数.将所有 {yri}投影到该特征子空间得{y′ri}.用高斯模型 来描述其分布状况参数估计值为: u^i= ∑ R r=1 y′ri /R (6) Σ^i= 1 R ∑ R r=1 (y′ri—u^i)(y′ri—u^i) T (7) 式中u^平均值Σ^为协方差矩阵.设 v为特征子空 间中任意点则 v属于相应子区域的概率密度函 数为: pi(v)= 1 (2π) 1/2|Σ^i| 1/2exp — 1 2 (v—u^i) TΣ^ —1 (v—u^i) (8) 将遮挡子库中的每个训练图像中的每个区域 {galleryri}r=12…24i=12…6向相应的鉴 别 特 征 子 空 间 {wri}投 影得 到 特 征 向 量 {gallery′ri}.再将遮挡子库中的每个测试图像中的 每个区域{proberi}r=12…24i=12…6向 相应的鉴别特征子空间{wri}投影得到特征向量 {probe′ri}.使用式 (8)来计算每个子区域发生遮盖 的概率.如果概率值小于设定阈值 Th则表明待测 试子区域发生了遮挡. 对于每个子区域计算测试图像 probe′ri与训练 图像 gallery′ri的相似度 sri这里采用余弦距离测度 sri= —gallery T riproberi ‖galleryri‖·‖proberi‖ .则测试图像与训练图 像的总体相似度为: sr=∑ 6 i=1 αiωisri (9) 式中αi为反映每一块子区域的鉴别能力的权值 六个权值的总和为 1.ωi=pi ∑ 6 i=1 pi权值系数 ωi 越大表示对应的子区域对识别的贡献率越大.对 应最大总体相似度的训练图像则为识别的对象. 3∙3 实验结果与分析 本实验在包括 24人的遮挡图像库上进行.特 征空间、训练图像和测试图像分别如下所述. 特征空间:采用北京科技大学 (USTB)人耳图像 库 2该图像库 2包括 308幅人耳图像共 77人每 人 4幅如图 12所示.图 12(a)为室内正常光照条 件下的图像图 12(b)为逆时针偏转 30°的图像图 12(c)为顺时针偏转 30°的图像图 12(d)为光照变 化条件下的图像. 图 12 USTB人耳图像库 2的人耳图像实例. (a) 室内正常光 照;(b) 逆时针偏转 30°;(c) 顺时针偏转 30°;(d)光照变化 Fig.12 EarimagesfromUSTBeardatabase2:(a) indoornormal lightingcondition; (b) 30°counter-clockwiserotation; (c) 30° clockwiserotation;(d) differentlightingconditions 将每人 4幅无遮挡图像进行分块所有 308幅 图像相应位置的子图像构成图像子空间.对每一个 图像子空间使用 GaKFDA方法提取相应的子特征 空间 (即得到六个投影矩阵 )该过程所用时间用 t1 表示. 训练图像:遮挡图像库24人.将每人一幅无 遮挡图像分块后向上述特征空间投影得到分块后 各子图像的特征向量该过程所用时间用 t2表示. 测试图像:遮挡图像库24人.三种遮挡情况 下各一幅图像.将受部分遮挡的图像分块后向相应 的子特征空间投影得到各子区域的特征向量后利 用 3∙2节所述的方法进行识别.这里将识别出全部 24人的时间用 t3表示. 由于 Gabor特征维数较高所以将图像归一化 为 30×54像素大小分成六块后每块为 15×18像 素大小.每块经 Gabor滤波后采样得到的特征向量 为 360维再利用核 Fisher鉴别分析进行降维.阈 值 Th设为 0∙2权值向量 α=(0∙150∙150∙20∙3 0∙10∙1).当特征空间维数取 60时识别率如表 1 所示.从该表结果可以看出:(1) 在遮挡情况下基 于概率模型的子区域识别方法在三种遮挡程度下的 ·534·
第4期 袁立等:基于局部特征的部分遮挡人耳识别 ,535. 识别率均高于基于整体图像方法的识别率.(2)基 过Gabor滤波后,基于整体图像和分块图像方法的 于分块图像识别方法的、重和,三个时间均长于 识别率均高于NMF识别方法;在时间开销上,本文 基于整体图像的识别方法(实验环境: 方法在获取特征空间投影矩阵的时间。和训练图 1.7 GHz CPU,256M内存,MATLAB6.5)(3)表1 像的特征提取时间b上优于NMF方法,但在识别 中还将本文方法与笔者以前提出的基于一种改进的 时由于图像要经过Gabori滤波,所以测试图像的识 非负矩阵因子方法的人耳识别山进行了比较,经 别时间。长于NMF方法, 表1部分遮挡情况下的人耳识别率 Table 1 Ear recognition rate under partial occlson 遮挡程度 获取特征空间训练图像的 识别 小 中 投影矩阵的 特征提取 大 方法 时间,/s 时间,s 测试图像的识识别 测试图像的 识别 测试图像的 识别 别时间,s 率% 识别时间,/s率%识别时间,/s率% 分块图像识别率(体文方法) 123.4688 8.5938 8.5156 9 10.0000 87 10.4063 80 整体图像识别率(体文方法) 106.2969 7.5938 7.3438 86 7.7188 85 7.7500 76 分块图像识别率(NMF方法) 155.4688 0.4375 0.1875 87 0.2031 14 0.2188 65 整体图像识别率(NMF方法)143.9844 0.3750 0.1406 83 0.1719 67 0.2031 53 识别.计算机轴助设计与图形学学报,200820(3):337) 4结语 [4]Hurley D.N ixon M.Carter J Force fiel feature extraction for ear 本文针对人耳图像被部分遮挡时的识别问题进 bimnetrics Conput Vision mage Understand ing 2005 98.491 [5]Chang K.Bowyer K.SarkarS et al Canparison and combina- 行了研究,提出了一种基于图像分块和概率模型的 tion of ear and face mnages in appearance based bimetrics EEE GaKFDA人耳识别方法,即首先利用Gabori滤波器 Tmans Pattem AnalMach In tell 2003 25(9):1160 提取特征,并将核Fisher判别分析法进行降维后的 [6]Xie Z X.Mu Z C Ear recognition using LLE and DLLE alo- 特征用于人耳识别,在带有部分遮挡的USTB人耳 rithm//Pmoceedings of 19 th Intemational Conference on Pattem 图像库上的实验结果表明基于图像分块和Gabor特 Recognition Fbrida 2008 1 [7] Dun W J MuZC.Multimodal recognition of face and ear inages 征的识别方法有助于解决遮挡问题,由于人耳图像 based on two types of independent camponent analysis J Camput 中各子区域的识别能力不同,所以下一步的工作是 Inf Syst20084(5):1977 研究基于分块图像的最优特征集的人耳识别方法以 [8]Yuan L MuZC Xu ZG.etal Personal recognition with earbi 及缩短识别时间的策略,并在规模更大的人耳库上 anetrics Pattem Recognit Artif Intell 2005.18(3):310 进行实验,提高识别方法的鲁棒性, (袁立,穆志纯,徐正光,等。基于人耳生物特征的身份识别 模式识别与人工智能,2005,18(3):310) 参考文献 [9]LuC J Gaborbased kemelPCA with fmactional power polynan ial [1]Chen H.Bhanu B Efficient recognition of highly sin ilar 3D ob- models for face recognition EEE Trans Pattem AnalM ach Intell jects n range iages IEEE Trans Pattem Anal Mach Intell 200426(5):572 2009,31(1):172 [10]Yuan L Mu Z C.Zeng H.Multinodal mcognition using face [2]Mu ZC.Yuan L Xu ZG.Shape and stnictuml feature based ear and ear JUniv SeiTechnol Beijing 2007,9(Suppl2):190 mcognition Procedings of Advances n Bimmetric Peron Authenti (袁立,穆志纯,曾慧,基于人脸和人耳的多模态生物特征 ca tion Guangzhou 2004:663 识别.北京科技大学学报,2007,.29(增刊2):190) [3]Liu JM.W ang L Lan Y J et al Ear recognition based on he [11]Yuan L Mu ZC Zhang Y.et al Ear recognition with occhision edge in fomation of the auricle contour J Camput Aided Des Cam based on inproved non negative matrix fac torization w ith sparse- put Gmapb200820(3):337 ness constran Pmceedings of 18th Intemational Confernce on (刘嘉敏,王玲,兰逸君,等,基于外耳轮廓边缘信息的人耳 Pattem Recognition Hong Kong 2006.1
第 4期 袁 立等: 基于局部特征的部分遮挡人耳识别 识别率均高于基于整体图像方法的识别率.(2) 基 于分块图像识别方法的 t1、t2 和 t3 三个时间均长于 基 于 整 体 图 像 的 识 别 方 法 (实 验 环 境: 1∙7GHzCPU256M内存MATLAB6∙5).(3) 表 1 中还将本文方法与笔者以前提出的基于一种改进的 非负矩阵因子方法的人耳识别 [11]进行了比较.经 过 Gabor滤波后基于整体图像和分块图像方法的 识别率均高于 INMF识别方法;在时间开销上本文 方法在获取特征空间投影矩阵的时间 t1 和训练图 像的特征提取时间 t2 上优于 INMF方法但在识别 时由于图像要经过 Gabor滤波所以测试图像的识 别时间 t3长于 INMF方法. 表 1 部分遮挡情况下的人耳识别率 Table1 Earrecognitionrateunderpartialocclusion 识别 方法 获取特征空间 投影矩阵的 时间t1/s 训练图像的 特征提取 时间t2/s 遮挡程度 小 中 大 测试图像的识 别时间t3/s 识别 率/% 测试图像的 识别时间t3/s 识别 率/% 测试图像的 识别时间t3/s 识别 率/% 分块图像识别率 (本文方法 ) 123∙4688 8∙5938 8∙5156 91 10∙0000 87 10∙4063 80 整体图像识别率 (本文方法 ) 106∙2969 7∙5938 7∙3438 86 7∙7188 85 7∙7500 76 分块图像识别率 (INMF方法 ) 155∙4688 0∙4375 0∙1875 87 0∙2031 74 0∙2188 65 整体图像识别率 (INMF方法 ) 143∙9844 0∙3750 0∙1406 83 0∙1719 67 0∙2031 53 4 结语 本文针对人耳图像被部分遮挡时的识别问题进 行了研究提出了一种基于图像分块和概率模型的 GaKFDA人耳识别方法即首先利用 Gabor滤波器 提取特征并将核 Fisher判别分析法进行降维后的 特征用于人耳识别.在带有部分遮挡的 USTB人耳 图像库上的实验结果表明基于图像分块和 Gabor特 征的识别方法有助于解决遮挡问题.由于人耳图像 中各子区域的识别能力不同所以下一步的工作是 研究基于分块图像的最优特征集的人耳识别方法以 及缩短识别时间的策略并在规模更大的人耳库上 进行实验提高识别方法的鲁棒性. 参 考 文 献 [1] ChenHBhanuB.Efficientrecognitionofhighlysimilar3Dob- jectsinrangeimages.IEEE TransPatternAnalMachIntell 200931(1):172 [2] MuZCYuanLXuZG.Shapeandstructuralfeaturebasedear recognition∥ProceedingsofAdvancesinBiometricPersonAuthenti- cation.Guangzhou2004:663 [3] LiuJMWangLLanYJetal.Earrecognitionbasedonthe edgeinformationoftheauriclecontour.JComputAidedDesCom- putGraph200820(3):337 (刘嘉敏王玲兰逸君等.基于外耳轮廓边缘信息的人耳 识别.计算机辅助设计与图形学学报200820(3):337) [4] HurleyDNixonMCarterJ.Forcefieldfeatureextractionforear biometrics.ComputVisionImageUnderstanding200598:491 [5] ChangKBowyerKSarkarSetal.Comparisonandcombina- tionofearandfaceimagesinappearance-basedbiometrics.IEEE TransPatternAnalMachIntell200325(9):1160 [6] XieZXMuZC.EarrecognitionusingLLEandIDLLEalgo- rithm∥ Proceedingsof19thInternationalConferenceonPattern Recognition.Florida2008:1 [7] DunW JMuZC.Multi-modalrecognitionoffaceandearimages basedontwotypesofindependentcomponentanalysis.JComput InfSyst20084(5):1977 [8] YuanLMuZCXuZGetal.Personalrecognitionwithearbi- ometrics.PatternRecognitArtifIntell200518(3):310 (袁立穆志纯徐正光等.基于人耳生物特征的身份识别. 模式识别与人工智能200518(3):310) [9] LiuCJ.Gabor-basedkernelPCAwithfractionalpowerpolynomial modelsforfacerecognition.IEEETransPatternAnalMachIntell 200426(5):572 [10] YuanLMuZCZengH.Multimodalrecognitionusingface andear.JUnivSciTechnolBeijing200729(Suppl2):190 (袁立穆志纯曾慧.基于人脸和人耳的多模态生物特征 识别.北京科技大学学报200729(增刊 2):190) [11] YuanLMuZCZhangYetal.Earrecognitionwithocclusion basedonimprovednon-negativematrixfactorizationwithsparse- nessconstraint∥Proceedingsof18thInternationalConferenceon PatternRecognition.HongKong2006:1 ·535·