正在加载图片...
Vol.28o.12 张海军等:基于复合结构分类器的人耳识别 ,1187 特征和代数特征相结合的CSCER通用模型 像,分别是正面1幅,倾斜2幅,光照变化1幅 笔者在三个人耳图像库上进行研究,人耳库 人耳库Ⅲ是Carreira Perpinan建立的)],它包括 I拍摄于2002年,包含60人,每人3幅右耳图 17人,每人6幅,共102幅人耳图像。人耳图像已 像,分别是正面1幅,轻微变化角度1幅,光照变 经经过裁剪和旋转,并进行了轻微的亮化处理,因 化1幅,人耳图像经过旋转和剪切处理.人耳库 此属于比较理想情况下的人耳图像库.图1给出 Ⅱ拍摄于2003年,包含77人,每人4幅右耳图 了三个人耳图像库中的部分人耳图像 (@人耳图像库I (b)人耳图像库Ⅱ (⊙)人耳图像库Ⅲ 图1三个人耳图像库中的部分人耳图像 Fig-1 Examples in three ear libraries 人耳结构中,高宽比例是主要差异特征之一, 宽耳N,R<1.3; 在人耳正面图像中,人耳的高宽比例大致在一定 长耳V,R>2.0: 范围,个别特殊的人耳会超出这个范围.表1是 其中R为人耳高宽比.各类别的划分是根 对三个人耳图像库中人耳高宽比的统计结果, 据人耳的各类归一化时信息损失尽量少,同时具 表1人耳高宽比统计结果 有足够数量的原则, Table I Statistic results of the rate between ear height and weight 图2给出了CSCER模型结构图.整个模型 人耳图像库最小值 最大值 均值 均方差 由五个子系统组成,每个子系统对应相应的人耳 1.0155 2.3973 1.6575 0.1912 类别,分别归一化到相应的尺寸,独立进行提取特 1.0565 2.600 1.5980 0.2064 征和训练识别,对于训练样本首先计算人耳的高 1.5750 1.6216 1.5977 0.0111 宽比例,根据比例进行粗分类,划分到相应的人耳 类别中;然后对每类分别应用基于代数特征的特 从表中可以看出,人耳主要集中在高宽比 征提取方法(如ICA,PCA等)提取特征,形成五 1.3~2.0范围内.为了避免人耳在归一化过程 类各自的样本特征;设计分类器(如最近邻分类 中结构信息损失过多,影响识别效果,根据人耳结 器,BP神经网络,SVM等),训练网络,进行细分 构特点和分布,把人耳定义为五类: 类。对于测试样本同样根据人耳的高宽比例,先 标准耳I,1.5≤R≤1.8; 划分到五类中;然后提取特征,通过训练好的分类 较宽耳Ⅱ,1.3≤R<1.5; 器精确识别出在子系统中的类别:然后通过解释 较长耳Ⅲ,1.8<≤2.0: 器,给出在整个模型中实际的识别结果 第I类 特征提取 分类器 第类 特征提取 分类器 判断高 像 第Ⅲ类 特征提取 分类器 解释器 输出 宽比 结果 第N类 特征提取 分类器 第V类特征提取 分类器 图2 CSCER模型结构图 Fig-2 Structure of the CSCER model特征和代数特征相结合的 CSCER 通用模型. 笔者在三个人耳图像库上进行研究.人耳库 Ⅰ拍摄于2002年‚包含60人‚每人3幅右耳图 像‚分别是正面1幅‚轻微变化角度1幅‚光照变 化1幅‚人耳图像经过旋转和剪切处理.人耳库 Ⅱ拍摄于2003年‚包含77人‚每人4幅右耳图 像‚分别是正面1幅‚倾斜2幅‚光照变化1幅. 人耳库Ⅲ是 Carreira-Perpinan 建立的[7]‚它包括 17人‚每人6幅‚共102幅人耳图像.人耳图像已 经经过裁剪和旋转‚并进行了轻微的亮化处理‚因 此属于比较理想情况下的人耳图像库.图1给出 了三个人耳图像库中的部分人耳图像. 图1 三个人耳图像库中的部分人耳图像 Fig.1 Examples in three ear libraries 人耳结构中‚高宽比例是主要差异特征之一. 在人耳正面图像中‚人耳的高宽比例大致在一定 范围‚个别特殊的人耳会超出这个范围.表1是 对三个人耳图像库中人耳高宽比的统计结果. 表1 人耳高宽比统计结果 Table1 Statistic results of the rate between ear height and weight 人耳图像库 最小值 最大值 均值 均方差 Ⅰ 1∙0155 2∙3973 1∙6575 0∙1912 Ⅱ 1∙0565 2∙600 1∙5980 0∙2064 Ⅲ 1∙5750 1∙6216 1∙5977 0∙0111 从表中可以看出‚人耳主要集中在高宽比 1∙3~2∙0范围内.为了避免人耳在归一化过程 中结构信息损失过多‚影响识别效果‚根据人耳结 构特点和分布‚把人耳定义为五类: 标准耳Ⅰ‚1∙5≤ R≤1∙8; 较宽耳Ⅱ‚1∙3≤ R<1∙5; 较长耳Ⅲ‚1∙8< R≤2∙0; 宽耳Ⅳ‚R<1∙3; 长耳Ⅴ‚R>2∙0; 其中 R 为人耳高宽比.各类别的划分是根 据人耳的各类归一化时信息损失尽量少‚同时具 有足够数量的原则. 图2给出了 CSCER 模型结构图.整个模型 由五个子系统组成‚每个子系统对应相应的人耳 类别‚分别归一化到相应的尺寸‚独立进行提取特 征和训练识别.对于训练样本首先计算人耳的高 宽比例‚根据比例进行粗分类‚划分到相应的人耳 类别中;然后对每类分别应用基于代数特征的特 征提取方法(如 ICA‚PCA 等)提取特征‚形成五 类各自的样本特征;设计分类器(如最近邻分类 器‚BP 神经网络‚SVM 等)‚训练网络‚进行细分 类.对于测试样本同样根据人耳的高宽比例‚先 划分到五类中;然后提取特征‚通过训练好的分类 器精确识别出在子系统中的类别;然后通过解释 器‚给出在整个模型中实际的识别结果. 图2 CSCER 模型结构图 Fig.2 Structure of the CSCER model Vol.28No.12 张海军等: 基于复合结构分类器的人耳识别 ·1187·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有