D0I:10.13374/j.issnl00I63.2006.12.041 第28卷第12期 北京科技大学学报 Vol.28 No.12 2006年12月 Journal of University of Science and Technology Beijing Dec.2006 基于复合结构分类器的人耳识别 张海军2)穆志纯) 1)北京科技大学信息工程学院,北京1000832)沈阳航空工业学院自动控制系,沈阳1101361 摘要在基于独立分量分析的人耳识别方法研究基础上,提出复合结构分类器的人耳识别通用 模型.该模型首先根据人耳的几何特征对人耳进行粗分类:然后应用独立分量分析的方法提取代 数特征,支持向量机进行细分类,最后给出分类结果.这与人类由粗到细的识别过程是相符合的, 能够克服单一独立分量分析识别方法的特征提取时间过长、特征数过多的缺点,同时避免了归一 化过程中丢失比例结构特征的问题。实验结果表明,该模型取得了较高的识别率,尤其适用于规模 大的复杂人耳库. 关键词人耳识别:独立分量分析;支持向量机:结构分类器 分类号TP183:TP391.41 随着网络和信息社会的不断发展,个人身份 在特征提取计算量大,且随着人耳图像库规模的 识别已经成为一个重要问题·虽然在商业领域 扩大,计算量和特征数都相应增加等缺点;同时, 中,传统的身份识别技术大量应用,但是其自身具 由于人耳自身的结构特点,单一的ICA方法在归 有许多难以克服的缺点,生物特征识别可以很容 一化过程中,存在丢失比例结构信息的问题。本 易解决这些缺点,人耳识别是生物特征识别领域 文在对基于ICA的人耳识别方法研究基础上,提 的一个新的课题,也代表了目前一个非常活跃的 出了复合结构分类器的人耳识别(compound 研究方向一基于图像分析的身份鉴别方法,一 structure classifier of ear recognition,CSCER) 般可描述为:给定一静止或动态图像,利用己有 用模型,首先根据人耳的几何特征对人耳进行粗 的人耳数据库来确认图像中的一个或多个人, 分类,然后应用ICA的方法提取代数特征,进行 人耳识别中的一个重要步骤就是精确地提取 细分类,最后给出分类结果,这与人类由粗到细 出那些能充分表征人耳特性的特征矢量,通常, 的识别过程是相符合的,能够克服单一ICA识别 特征矢量的表达主要有两种方式:一种是基于几 方法的特征提取时间长、特征数过多的缺点,同时 何特征的矢量表达,其分量通常包括人耳轮廓或 解决了人耳图像归一化中丢失比例结构特征的问 内部关键点中指定两点间的欧氏距离、曲率、角度 题,尤其适合规模大的复杂人耳库, 等[];另一种是基于代数特征的矢量表达,如主 元分析法3]、不变矩方法等,由于图像的代数 1 CSCER模型 特征反映了图像的本质,尽管它的物理意义并不 基于代数特征的人耳识别方法存在以下两个 十分直观,但是对模式的分类仍起着重要作用. 问题:一是提取特征需要大量的计算,并且随着人 大量研究表明,图像的大部分重要信息是包含在 耳图像库规模的扩大,所需计算量、计算时间和所 图像像素的高阶关系中可.独立分量分析] 提取的特征数量都大量增加,增加了识别误差;二 (ICA)就是基于信号的高阶统计特性的分析方 是基于代数特征的识别方法,都要先将图像归一 法,它更全面地考虑信号的概率密度函数的统计 化到相同大小·由于人耳结构的复杂性,人耳的 独立性,经过ICA分解出的各个分量之间是相互 高宽比例是人耳重要的差异之一,同一人的耳朵 独立的,但是,基于独立分量的人耳识别方法存 在不同情况下高宽比也是不同的,在归一化到相 收稿日期:2005-09-28修回日期:2006-03-27 同大小时,必然会损失人耳比例结构的信息,造成 基金项目:国家自然科学基金资助项目(60375002):北京市教委 人耳特征提取和识别的错误,这种情况在人耳原 重点学科共建项目 作者简介:张海军(1974一),男,博士研究生:穆志纯(1952一), 始结构比例与归一化的结构比例相差较大时尤为 男,教授,博士生导师 明显,针对上述情况,本文提出了基于人耳几何
基于复合结构分类器的人耳识别 张海军12) 穆志纯1) 1) 北京科技大学信息工程学院北京100083 2) 沈阳航空工业学院自动控制系沈阳1101361 摘 要 在基于独立分量分析的人耳识别方法研究基础上提出复合结构分类器的人耳识别通用 模型.该模型首先根据人耳的几何特征对人耳进行粗分类;然后应用独立分量分析的方法提取代 数特征支持向量机进行细分类最后给出分类结果.这与人类由粗到细的识别过程是相符合的 能够克服单一独立分量分析识别方法的特征提取时间过长、特征数过多的缺点同时避免了归一 化过程中丢失比例结构特征的问题.实验结果表明该模型取得了较高的识别率尤其适用于规模 大的复杂人耳库. 关键词 人耳识别;独立分量分析;支持向量机;结构分类器 分类号 TP183;TP391∙41 收稿日期:20050928 修回日期:20060327 基金项目:国家自然科学基金资助项目(60375002);北京市教委 重点学科共建项目 作者简介:张海军(1974—)男博士研究生;穆志纯(1952—) 男教授博士生导师 随着网络和信息社会的不断发展个人身份 识别已经成为一个重要问题.虽然在商业领域 中传统的身份识别技术大量应用但是其自身具 有许多难以克服的缺点.生物特征识别可以很容 易解决这些缺点.人耳识别是生物特征识别领域 的一个新的课题也代表了目前一个非常活跃的 研究方向———基于图像分析的身份鉴别方法一 般可描述为:给定一静止或动态图像利用已有 的人耳数据库来确认图像中的一个或多个人. 人耳识别中的一个重要步骤就是精确地提取 出那些能充分表征人耳特性的特征矢量.通常 特征矢量的表达主要有两种方式:一种是基于几 何特征的矢量表达其分量通常包括人耳轮廓或 内部关键点中指定两点间的欧氏距离、曲率、角度 等[1—2];另一种是基于代数特征的矢量表达如主 元分析法[3]、不变矩方法[4]等.由于图像的代数 特征反映了图像的本质尽管它的物理意义并不 十分直观但是对模式的分类仍起着重要作用. 大量研究表明图像的大部分重要信息是包含在 图像像素的高阶关系中[5].独立分量分析[6] (ICA)就是基于信号的高阶统计特性的分析方 法它更全面地考虑信号的概率密度函数的统计 独立性经过 ICA 分解出的各个分量之间是相互 独立的.但是基于独立分量的人耳识别方法存 在特征提取计算量大且随着人耳图像库规模的 扩大计算量和特征数都相应增加等缺点;同时 由于人耳自身的结构特点单一的 ICA 方法在归 一化过程中存在丢失比例结构信息的问题.本 文在对基于 ICA 的人耳识别方法研究基础上提 出了 复 合 结 构 分 类 器 的 人 耳 识 别 (compound structure classifier of ear recognition简CSCER)通 用模型.首先根据人耳的几何特征对人耳进行粗 分类然后应用 ICA 的方法提取代数特征进行 细分类最后给出分类结果.这与人类由粗到细 的识别过程是相符合的能够克服单一 ICA 识别 方法的特征提取时间长、特征数过多的缺点同时 解决了人耳图像归一化中丢失比例结构特征的问 题尤其适合规模大的复杂人耳库. 1 CSCER 模型 基于代数特征的人耳识别方法存在以下两个 问题:一是提取特征需要大量的计算并且随着人 耳图像库规模的扩大所需计算量、计算时间和所 提取的特征数量都大量增加增加了识别误差;二 是基于代数特征的识别方法都要先将图像归一 化到相同大小.由于人耳结构的复杂性人耳的 高宽比例是人耳重要的差异之一同一人的耳朵 在不同情况下高宽比也是不同的在归一化到相 同大小时必然会损失人耳比例结构的信息造成 人耳特征提取和识别的错误.这种情况在人耳原 始结构比例与归一化的结构比例相差较大时尤为 明显.针对上述情况本文提出了基于人耳几何 第28卷 第12期 2006年 12月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.28No.12 Dec.2006 DOI:10.13374/j.issn1001-053x.2006.12.041
Vol.28o.12 张海军等:基于复合结构分类器的人耳识别 ,1187 特征和代数特征相结合的CSCER通用模型 像,分别是正面1幅,倾斜2幅,光照变化1幅 笔者在三个人耳图像库上进行研究,人耳库 人耳库Ⅲ是Carreira Perpinan建立的)],它包括 I拍摄于2002年,包含60人,每人3幅右耳图 17人,每人6幅,共102幅人耳图像。人耳图像已 像,分别是正面1幅,轻微变化角度1幅,光照变 经经过裁剪和旋转,并进行了轻微的亮化处理,因 化1幅,人耳图像经过旋转和剪切处理.人耳库 此属于比较理想情况下的人耳图像库.图1给出 Ⅱ拍摄于2003年,包含77人,每人4幅右耳图 了三个人耳图像库中的部分人耳图像 (@人耳图像库I (b)人耳图像库Ⅱ (⊙)人耳图像库Ⅲ 图1三个人耳图像库中的部分人耳图像 Fig-1 Examples in three ear libraries 人耳结构中,高宽比例是主要差异特征之一, 宽耳N,R2.0: 范围,个别特殊的人耳会超出这个范围.表1是 其中R为人耳高宽比.各类别的划分是根 对三个人耳图像库中人耳高宽比的统计结果, 据人耳的各类归一化时信息损失尽量少,同时具 表1人耳高宽比统计结果 有足够数量的原则, Table I Statistic results of the rate between ear height and weight 图2给出了CSCER模型结构图.整个模型 人耳图像库最小值 最大值 均值 均方差 由五个子系统组成,每个子系统对应相应的人耳 1.0155 2.3973 1.6575 0.1912 类别,分别归一化到相应的尺寸,独立进行提取特 1.0565 2.600 1.5980 0.2064 征和训练识别,对于训练样本首先计算人耳的高 1.5750 1.6216 1.5977 0.0111 宽比例,根据比例进行粗分类,划分到相应的人耳 类别中;然后对每类分别应用基于代数特征的特 从表中可以看出,人耳主要集中在高宽比 征提取方法(如ICA,PCA等)提取特征,形成五 1.3~2.0范围内.为了避免人耳在归一化过程 类各自的样本特征;设计分类器(如最近邻分类 中结构信息损失过多,影响识别效果,根据人耳结 器,BP神经网络,SVM等),训练网络,进行细分 构特点和分布,把人耳定义为五类: 类。对于测试样本同样根据人耳的高宽比例,先 标准耳I,1.5≤R≤1.8; 划分到五类中;然后提取特征,通过训练好的分类 较宽耳Ⅱ,1.3≤R<1.5; 器精确识别出在子系统中的类别:然后通过解释 较长耳Ⅲ,1.8<≤2.0: 器,给出在整个模型中实际的识别结果 第I类 特征提取 分类器 第类 特征提取 分类器 判断高 像 第Ⅲ类 特征提取 分类器 解释器 输出 宽比 结果 第N类 特征提取 分类器 第V类特征提取 分类器 图2 CSCER模型结构图 Fig-2 Structure of the CSCER model
特征和代数特征相结合的 CSCER 通用模型. 笔者在三个人耳图像库上进行研究.人耳库 Ⅰ拍摄于2002年包含60人每人3幅右耳图 像分别是正面1幅轻微变化角度1幅光照变 化1幅人耳图像经过旋转和剪切处理.人耳库 Ⅱ拍摄于2003年包含77人每人4幅右耳图 像分别是正面1幅倾斜2幅光照变化1幅. 人耳库Ⅲ是 Carreira-Perpinan 建立的[7]它包括 17人每人6幅共102幅人耳图像.人耳图像已 经经过裁剪和旋转并进行了轻微的亮化处理因 此属于比较理想情况下的人耳图像库.图1给出 了三个人耳图像库中的部分人耳图像. 图1 三个人耳图像库中的部分人耳图像 Fig.1 Examples in three ear libraries 人耳结构中高宽比例是主要差异特征之一. 在人耳正面图像中人耳的高宽比例大致在一定 范围个别特殊的人耳会超出这个范围.表1是 对三个人耳图像库中人耳高宽比的统计结果. 表1 人耳高宽比统计结果 Table1 Statistic results of the rate between ear height and weight 人耳图像库 最小值 最大值 均值 均方差 Ⅰ 1∙0155 2∙3973 1∙6575 0∙1912 Ⅱ 1∙0565 2∙600 1∙5980 0∙2064 Ⅲ 1∙5750 1∙6216 1∙5977 0∙0111 从表中可以看出人耳主要集中在高宽比 1∙3~2∙0范围内.为了避免人耳在归一化过程 中结构信息损失过多影响识别效果根据人耳结 构特点和分布把人耳定义为五类: 标准耳Ⅰ1∙5≤ R≤1∙8; 较宽耳Ⅱ1∙3≤ R<1∙5; 较长耳Ⅲ1∙8< R≤2∙0; 宽耳ⅣR<1∙3; 长耳ⅤR>2∙0; 其中 R 为人耳高宽比.各类别的划分是根 据人耳的各类归一化时信息损失尽量少同时具 有足够数量的原则. 图2给出了 CSCER 模型结构图.整个模型 由五个子系统组成每个子系统对应相应的人耳 类别分别归一化到相应的尺寸独立进行提取特 征和训练识别.对于训练样本首先计算人耳的高 宽比例根据比例进行粗分类划分到相应的人耳 类别中;然后对每类分别应用基于代数特征的特 征提取方法(如 ICAPCA 等)提取特征形成五 类各自的样本特征;设计分类器(如最近邻分类 器BP 神经网络SVM 等)训练网络进行细分 类.对于测试样本同样根据人耳的高宽比例先 划分到五类中;然后提取特征通过训练好的分类 器精确识别出在子系统中的类别;然后通过解释 器给出在整个模型中实际的识别结果. 图2 CSCER 模型结构图 Fig.2 Structure of the CSCER model Vol.28No.12 张海军等: 基于复合结构分类器的人耳识别 ·1187·
,1188 北京科技大学学报 2006年第12期 CSCER模型首先根据人耳的几何特征进行 耳特征提取, 粗分类,减少了每类样本的个数:然后根据人耳的 代数特征进行特征提取和细分类,减少了计算量 和特征数,提高了识别率.这与人类由粗到细的 人耳识别过程是相符合的,整个模型是一种通用 模型,可以灵活选用各种特征提取方法和分类器, 达到最好的识别效果 2 CSCER模型实现 采用一种基于负熵的独立性判别准则和分离 图3基于ICA的人耳图像模型 算法一FastICA算法[]一进行代数特征提 Fig.3 Ear images model based on ICA 取,采用SVM进行训练和分类.每类人耳的归一 化比例见表2. 2.2支持向量机分类器 支持向量机(SVM)是Vapnik等]提出的一 表2每类人耳归一化比例 Table 2 Standardization proportion of each ear class 种新型机器学习方法,其在解决小样本、非线性及 人耳分类 ? 高维模式识别问题中表现出许多优势,SVM的 图像尺寸/像素40×6440X5640×7640×4840×84 基本思想是:首先通过非线性变换将输入空间变 归一化比例 1.61.41.91.2 2.1 换到一个高维空间,甚至是一个无限维空间,然后 在这个高维空间求取最优分类面,其中非线性变 2.1基于ICA的人耳特征提取方法 换是通过核函数的方法来实现的,多类SVM的 人耳图像识别应用中,算法处理对象是人耳 分类和识别主要有两种方法:一是根据多类样本 图像矢量,目前绝大多数ICA算法都是针对一维 集直接设计分类器,此时分类器的设计问题可转 信号处理的,为了将ICA用于人耳识别,首先将 化为一个考虑所有样本的优化问题,在样本较多 二维的人耳图像MXN按行排列成一维的行向 时,这种方法求解比较复杂,另一种是分解法,将 量,x=[x(1,1),x:(1,2),x:(1,N),x:(2, 多类样本分类器的设计转化为多个两类问题的分 1),…,x(M,N)],则n幅人耳图像构成一个n 类器设计问题,由于这类方法比直接法求解简 行,MXN列的人耳矩阵X=[x,x,…,x]P. 单,在实际中应用很广,比较有代表性的训练和 假设这n幅人耳图像也是由n个统计独立的基 预测多类sVM的方法有一对一OA0(onea 图像线性混合而成的,即X=AS,其中S的每一 gainst one)方法、一对多OAA(one against all)方 行都代表一幅大小为M×N的基图像,A为混合 法和有向无回路图DAG(directed acyclic graph) 矩阵,用ICA求出分离矩阵W,使得输出Y= 方法、决策树(decisive tree)方法等.本文选用一 WX的行向量尽可能的相互独立,即Y为S的近 对多OAA方法进行分类识别,选择径向基内积 似,如图3所示,中间是原始的人耳图像,左边是 函数作为核函数K(),其中o=1 未知的人耳基图像,右边是用ICA方法分离出的 Ix-Y 12 K(x,y)=exp 22 3) 基图像 由Y可以构成一个子空间,将待识人耳图像 2.3人耳图像数据不足问题 投影到这个子空间,即用这组独立的基图像的线 由于人耳采集情况的复杂性,同一人的人耳 性组合来表示,设F为待识图像,则有: 在不同情况下,图像的高宽比在一定范围内变化, F=aIy1十a2y2十…十ayn (1) 是不固定的,由于实验条件的限制,不可能采集 其中(y1,y2,…yn)为基图像:(a,a2,…,an)为 所有情况下的人耳样本图像,所以存在样本空间 投影系数,根据这个投影系数就可以实现人耳图 不足的问题,在训练模型阶段,对于将训练样本 像的分类,该投影系数可由下式求得: 硬性划分成五类时,必然会在粗分类时产生一些 (a1,a2,..,an)=FXpinv(Y) (2) 错分的情况,使一个人的样本可能划分到相邻的 式中piv(Y)为矩阵的伪逆,经上述处理,将原 两类中.而在识别阶段,由于粗分类将测试样本 来的MXN维的人耳图像降到n维,即实现了人 划到一个类中,如果这类中的同一个人的样本由
CSCER 模型首先根据人耳的几何特征进行 粗分类减少了每类样本的个数;然后根据人耳的 代数特征进行特征提取和细分类减少了计算量 和特征数提高了识别率.这与人类由粗到细的 人耳识别过程是相符合的.整个模型是一种通用 模型可以灵活选用各种特征提取方法和分类器 达到最好的识别效果. 2 CSCER 模型实现 采用一种基于负熵的独立性判别准则和分离 算法———FastICA 算法[8]———进行代数特征提 取采用 SVM 进行训练和分类.每类人耳的归一 化比例见表2. 表2 每类人耳归一化比例 Table2 Standardization proportion of each ear class 人耳分类 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 图像尺寸/像素 40×64 40×56 40×76 40×48 40×84 归一化比例 1∙6 1∙4 1∙9 1∙2 2∙1 2∙1 基于 ICA 的人耳特征提取方法 人耳图像识别应用中算法处理对象是人耳 图像矢量.目前绝大多数 ICA 算法都是针对一维 信号处理的为了将 ICA 用于人耳识别首先将 二维的人耳图像 M× N 按行排列成一维的行向 量xi=[ xi(11)xi(12)…xi(1N)xi(2 1)…xi( MN)]则 n 幅人耳图像构成一个 n 行M× N 列的人耳矩阵 X=[ x T 1x T 2…x T n ] T. 假设这 n 幅人耳图像也是由 n 个统计独立的基 图像线性混合而成的即 X= AS其中 S 的每一 行都代表一幅大小为 M× N 的基图像A 为混合 矩阵.用 ICA 求出分离矩阵 W使得输出 Y = WX 的行向量尽可能的相互独立即 Y 为 S 的近 似.如图3所示中间是原始的人耳图像左边是 未知的人耳基图像右边是用 ICA 方法分离出的 基图像. 由 Y 可以构成一个子空间将待识人耳图像 投影到这个子空间即用这组独立的基图像的线 性组合来表示.设 F 为待识图像则有: F= a1y1+ a2y2+…+ anyn (1) 其中(y1y2…;yn)为基图像;( a1a2…an)为 投影系数根据这个投影系数就可以实现人耳图 像的分类该投影系数可由下式求得: ( a1a2…an)=F×pinv( Y) (2) 式中 pinv( Y)为矩阵的伪逆.经上述处理将原 来的 M× N 维的人耳图像降到 n 维即实现了人 耳特征提取. 图3 基于 ICA 的人耳图像模型 Fig.3 Ear images model based on ICA 2∙2 支持向量机分类器 支持向量机(SVM)是 Vapnik 等[9]提出的一 种新型机器学习方法其在解决小样本、非线性及 高维模式识别问题中表现出许多优势.SVM 的 基本思想是:首先通过非线性变换将输入空间变 换到一个高维空间甚至是一个无限维空间然后 在这个高维空间求取最优分类面其中非线性变 换是通过核函数的方法来实现的.多类 SVM 的 分类和识别主要有两种方法:一是根据多类样本 集直接设计分类器此时分类器的设计问题可转 化为一个考虑所有样本的优化问题.在样本较多 时这种方法求解比较复杂.另一种是分解法将 多类样本分类器的设计转化为多个两类问题的分 类器设计问题.由于这类方法比直接法求解简 单在实际中应用很广.比较有代表性的训练和 预测多类 SVM 的方法有一对一 OAO (one against one)方法、一对多 OAA (one against all)方 法和有向无回路图 DAG (directed acyclic graph) 方法、决策树(decisive tree)方法等.本文选用一 对多 OAA 方法进行分类识别选择径向基内积 函数作为核函数 K(·)其中 σ=1. K( xy)=exp — |x—y|2 2σ2 (3) 2∙3 人耳图像数据不足问题 由于人耳采集情况的复杂性同一人的人耳 在不同情况下图像的高宽比在一定范围内变化 是不固定的.由于实验条件的限制不可能采集 所有情况下的人耳样本图像所以存在样本空间 不足的问题.在训练模型阶段对于将训练样本 硬性划分成五类时必然会在粗分类时产生一些 错分的情况使一个人的样本可能划分到相邻的 两类中.而在识别阶段由于粗分类将测试样本 划到一个类中如果这类中的同一个人的样本由 ·1188· 北 京 科 技 大 学 学 报 2006年第12期
Vol.28 No.12 张海军等:基于复合结构分类器的人耳识别 .1189 于错分而不存在或差异较大,必然会造成特征提 表4 CSCER识别率 取和识别的错误,如果每个人的样本足够多,也 Table 4 CSCER recognition rates 就是样本空间是密布的,这本不是问题,但实际 PCA方法 ICA方法 样本是不足的,因此必须解决人耳图像数据样本 人耳库I 人耳库Ⅱ 人耳库I人耳库Ⅱ 不足问题,因此提出了一种软分类的改进方法: 0.72 0.66 0.82 0.69 设max;和min:是第i类的上限和下限,a是 0.05 0.85 0.78 0.90 0.78 软门限,Rx是样本图像x的高宽比,则当maxi 0.10 0.83 0.81 0.93 0.86 -R.|≤a且|R,-min:l≤a,或min≤R≤ 0.15 0.93 0.86 0.95 0.90 max:时,x属于第i类. 0.20 0.92 0.83 0.95 0.90 这样对于每类的上限和下限以α为邻域的 0.25 0.97 0.84 0.97 0.90 空间内的样本图像可以划分到相邻的两类中,增 0.30 0.97 0.84 0.97 0.91 加了每类的样本数,减少了因粗分类错分而产生 0.35 0.95 0.86 0.95 0.94 的细分类的错误,随着α的增加,边界邻域的扩 0.40 0.93 0.86 0.98 0.94 大,每类样本数也在增加.当α=0时,表示硬门 0.45 0.93 0.87 0.98 0.94 限的情况:当α大于一个极限值时,等同于单分 0.50 0.95 0.86 0.95 0.92 类器的情况, 当α=0时,识别率最低:这是因为这时每类 3实验结果及分析 邻域为0,样本数最少,粗分类产生许多错分的样 3.1单分类器实验结果及分析 本,直接影响了后续的细分类的识别率.随着α 人耳库I选择每人前2幅图像作为训练样 的增大,识别率变高;这是因为每类邻域随着α 本,第3幅作为测试样本;人耳库Ⅱ前3幅图像作 的增大而增大,每类样本数也增加,当α增大到 为训练样本,第4幅作为测试样本;人耳库Ⅲ前5 一定程度,识别率反而下降;这是因为由于邻域的 幅图像作为训练样本,第6幅作为测试样本.分 增加,使高宽比与归一化的高宽比相差较大的人 耳样本也划到了相同的类中,虽然每类的样本数 别应用不变矩方法、PCA方法和ICA方法提取特 征,SVM作为分类器,实验结果见表3.其中 增加了,但却产生很大的形变,从而影响识别的准 PCA选取占整个能量90%的最大的前k个特征 确性,同时,人耳图像库I中,a从0.150.5变 化时识别结果都优于单分类器;而在图像库Ⅱ中, 向量, a从0.35~0.45变化时识别结果优于单分类器. 表3单分类器下三种方法识别率 这是因为人耳图像库Ⅱ比较复杂,每个人的不同 Table 3 Recognition rates in single classifier 人耳图像相差较大,同时训练样本数每人只有3 人耳图像库 特征提取方法 幅,只有当α足够大时,才能使训练样本在粗分 I ◆ M 类时归入与测试样本相同的类别中,因此α的选 不变矩方法 0.88 0.71 0.88 择与人耳图像库密切相关,是下一步研究的重点, PCA方法 0.88 0.82 0.94 ICA方法 0.92 0.92 1.00 4 结论 实验结果表明,三种识别方法都是有效的,在 针对人耳的结构特点,提出了一种结合人耳 三个人耳图像库上都取得了很好的识别效果.尤 几何特征和代数特征的通用识别模型,在几何特 其是在数量少、标准的人耳库Ⅲ上,ICA方法取得 征粗分类的基础上,分别应用PCA和ICA进行 了100%的识别率.其中ICA方法优于PCA方 特征提取,支持向量机进行分类,结果表明,本文 法,而不变矩方法识别效果最差, 的模型是有效的,该模型尤其适合复杂的人耳图 3.2 CSCER实验结果及分析 像库 CSCER的实验条件同3.1,由于人耳库Ⅲ的 参考文献 人耳比较标准,单分类器已经达到很高的识别率, [1]Burge M J.Burger W.Using ear biometrics for passive identi- 因此实验在人耳库I和Ⅱ上进行.选择PCA方 fication//14th International Information Security Conference. 法和ICA方法进行比较,实验结果见表4. Vienna,1998,139
于错分而不存在或差异较大必然会造成特征提 取和识别的错误.如果每个人的样本足够多也 就是样本空间是密布的这本不是问题.但实际 样本是不足的因此必须解决人耳图像数据样本 不足问题.因此提出了一种软分类的改进方法: 设 max i 和mini 是第 i 类的上限和下限α是 软门限Rx 是样本图像 x 的高宽比则当|max i —Rx|≤α且|Rx —mini|≤α或 mini ≤ Rx ≤ max i 时x 属于第 i 类. 这样对于每类的上限和下限以 α为邻域的 空间内的样本图像可以划分到相邻的两类中增 加了每类的样本数减少了因粗分类错分而产生 的细分类的错误.随着 α的增加边界邻域的扩 大每类样本数也在增加.当 α=0时表示硬门 限的情况;当 α大于一个极限值时等同于单分 类器的情况. 3 实验结果及分析 3∙1 单分类器实验结果及分析 人耳库Ⅰ选择每人前2幅图像作为训练样 本第3幅作为测试样本;人耳库Ⅱ前3幅图像作 为训练样本第4幅作为测试样本;人耳库Ⅲ前5 幅图像作为训练样本第6幅作为测试样本.分 别应用不变矩方法、PCA 方法和 ICA 方法提取特 征SVM 作为分类器实验结果见表 3.其中 PCA 选取占整个能量90%的最大的前 k 个特征 向量. 表3 单分类器下三种方法识别率 Table3 Recognition rates in single classifier 特征提取方法 人耳图像库 Ⅰ Ⅱ Ⅲ 不变矩方法 0∙88 0∙71 0∙88 PCA 方法 0∙88 0∙82 0∙94 ICA 方法 0∙92 0∙92 1∙00 实验结果表明三种识别方法都是有效的在 三个人耳图像库上都取得了很好的识别效果.尤 其是在数量少、标准的人耳库Ⅲ上ICA 方法取得 了100%的识别率.其中 ICA 方法优于 PCA 方 法而不变矩方法识别效果最差. 3∙2 CSCER 实验结果及分析 CSCER 的实验条件同3∙1由于人耳库Ⅲ的 人耳比较标准单分类器已经达到很高的识别率 因此实验在人耳库Ⅰ和Ⅱ上进行.选择 PCA 方 法和 ICA 方法进行比较实验结果见表4. 表4 CSCER 识别率 Table4 CSCER recognition rates α PCA 方法 ICA 方法 人耳库Ⅰ 人耳库Ⅱ 人耳库Ⅰ 人耳库Ⅱ 0 0∙72 0∙66 0∙82 0∙69 0∙05 0∙85 0∙78 0∙90 0∙78 0∙10 0∙83 0∙81 0∙93 0∙86 0∙15 0∙93 0∙86 0∙95 0∙90 0∙20 0∙92 0∙83 0∙95 0∙90 0∙25 0∙97 0∙84 0∙97 0∙90 0∙30 0∙97 0∙84 0∙97 0∙91 0∙35 0∙95 0∙86 0∙95 0∙94 0∙40 0∙93 0∙86 0∙98 0∙94 0∙45 0∙93 0∙87 0∙98 0∙94 0∙50 0∙95 0∙86 0∙95 0∙92 当 α=0时识别率最低;这是因为这时每类 邻域为0样本数最少粗分类产生许多错分的样 本直接影响了后续的细分类的识别率.随着 α 的增大识别率变高;这是因为每类邻域随着 α 的增大而增大每类样本数也增加.当 α增大到 一定程度识别率反而下降;这是因为由于邻域的 增加使高宽比与归一化的高宽比相差较大的人 耳样本也划到了相同的类中虽然每类的样本数 增加了但却产生很大的形变从而影响识别的准 确性.同时人耳图像库Ⅰ中α从0∙15~0∙5变 化时识别结果都优于单分类器;而在图像库Ⅱ中 α从0∙35~0∙45变化时识别结果优于单分类器. 这是因为人耳图像库Ⅱ比较复杂每个人的不同 人耳图像相差较大同时训练样本数每人只有3 幅只有当 α足够大时才能使训练样本在粗分 类时归入与测试样本相同的类别中.因此 α的选 择与人耳图像库密切相关是下一步研究的重点. 4 结论 针对人耳的结构特点提出了一种结合人耳 几何特征和代数特征的通用识别模型在几何特 征粗分类的基础上分别应用 PCA 和 ICA 进行 特征提取支持向量机进行分类.结果表明本文 的模型是有效的.该模型尤其适合复杂的人耳图 像库. 参 考 文 献 [1] Burge M JBurger W.Using ear biometrics for passive identification∥14th International Information Security Conference. Vienna1998:139 Vol.28No.12 张海军等: 基于复合结构分类器的人耳识别 ·1189·
,1190 北京科技大学学报 2006年第12期 [2]Hurley DJ.Nixon M S,Carter J N.Force field energy fune- [6]Hyvarinen A.Oja E.A fast fixed-point algorithm for inde- tionals for image feature extraction.Image Vision Comput. pendent component analysis.Neural Comput,1997.9(7): 2002,20(5):311 1483 [3]Chang K.Bowyer K W,Sarkar S,et al.Comparison and [7]Carreira-Perpinan M A.Compression neural networks for fea- combination of ear and face images in appearance-based biomet- ture extraction:application to human recognition from ear im- rics.IEEE Trans Pattern Anal Mach Intell.2003.25(9): ages [Dissertation]Spain:Technical University of Madrid. 1160 1995 [4]王忠礼,穆志纯,王修岩,等.基于不变矩匹配的人耳识别· [8]Hyvarinen A.Fast and robust fixed point algorithms for inde- 模式识别与人工智能,2004,17(4):502 pendent component analysis.IEEE Trans Neural Networks [5]Bartlett M S.Face Image Analysis by Unsupervised Learning 1999,10(3):626 and Redundancy Reduction [Dissertation].University of Cali- [9]Vapnik V N.统计学习论理的本质.张学工,译.北京:清 fornia San Diego.1998 华大学出版社,2000 Ear recognition based on compound structure classifier ZHA NG Haijun,MU Zhichun) 1)Information Engineering School.University of Science and Technology Beijing.Beijing 100083.China 2)Department of automation,Shenyang Institute of Aeronautical Engineering.Shenyang 110136,China ABSTRACI Based on the research of ear recognition with independent component analysis(ICA),a new compound structure classifier(CSCER)ear recognition model was proposed.The model made rough classi- fication to the human ears first according to their geometric features,then ICA was used to extract the alge- bra features and support vector machine (SV M)was for detailed classification,finally the results were achieved,which was in accordance with human natural recognition process.The model overcame the single ICA disadvantages of costing too much time and with too many features,also avoided losing structure fea- ture when ear images were preprocessed.The experiment shows that the model can achieve high recognition rate and is suitable for complex ear image libraries. KEY WORDS ear recognition;independent component analysis;SVM;structure classifier
[2] Hurley D JNixon M SCarter J N.Force field energy functionals for image feature extraction.Image Vision Comput 200220(5):311 [3] Chang KBowyer K WSarkar Set al.Comparison and combination of ear and face images in appearance-based biometrics.IEEE Trans Pattern Anal Mach Intell200325(9): 1160 [4] 王忠礼穆志纯王修岩等.基于不变矩匹配的人耳识别. 模式识别与人工智能200417(4):502 [5] Bartlett M S.Face Image Analysis by Unsupervised Learning and Redundancy Reduction [Dissertation].University of California San Diego1998 [6] Hyvarinen AOja E.A fast fixed—point algorithm for independent component analysis.Neural Comput19979(7): 1483 [7] Carreira-Perpinan M A.Compression neural networks for feature extraction:application to human recognition from ear images [Dissertation ].Spain:Technical University of Madrid 1995 [8] Hyvarinen A.Fast and robust fixed-point algorithms for independent component analysis.IEEE Trans Neural Networks 199910(3):626 [9] Vapnik V N.统计学习论理的本质.张学工译.北京:清 华大学出版社2000 Ear recognition based on compound structure classifier ZHA NG Haijun 12)MU Zhichun 1) 1) Information Engineering SchoolUniversity of Science and Technology BeijingBeijing100083China 2) Department of automationShenyang Institute of Aeronautical EngineeringShenyang110136China ABSTRACT Based on the research of ear recognition with independent component analysis (ICA)a new compound structure classifier (CSCER) ear recognition model was proposed.The model made rough classification to the human ears first according to their geometric featuresthen ICA was used to extract the algebra features and support vector machine (SVM) was for detailed classificationfinally the results were achievedwhich was in accordance with human natural recognition process.The model overcame the single ICA disadvantages of costing too much time and with too many featuresalso avoided losing structure feature when ear images were preprocessed.The experiment shows that the model can achieve high recognition rate and is suitable for complex ear image libraries. KEY WORDS ear recognition;independent component analysis;SVM;structure classifier ·1190· 北 京 科 技 大 学 学 报 2006年第12期