正在加载图片...
Vol.28 No.9 袁立等:基于核主元分析法和支持向量机的人耳识别 ·891。 另一种是基于外耳轮廓的两点标记法,也就是利 的背景信息:通过实验发现带有较少背景信息的 用外耳轮廓的起点和终点即三角窝和耳屏间肌切 图像能够取得更高的识别率.所以采用后者进行 迹如图2(所示.将这两点连线的长度及其方 分割.根据统计得到此方法分割后的人耳长宽比 向作为人耳的大小和方向进行归一化.通过比较 均值为1.97,所以归一化后的图像大小取为50X 可以看出,基于外耳长轴分割出的人耳图像比基 98像素,如图2(d)所示. 于外耳轮廓起点终点分割出的人耳图像带有更多 h4 A h/4 0.77h (a (b) (d) 图2人耳图像中标记点的选择方法.(a三角窝,对耳屏两点标记法:(b)外耳轮南长轴标记法:(c)外耳轮廓起始点标记法:()归 一化后的人耳图像示例 Fig.2 Landmark location on ear images:(a)using triangu ar fossa and antitrags;(b)using the long axis of outer ear contour:(c) using the start point and end point of outer ear contour;(d)example of normal ized ear images 2 基于核主元分析法的人耳特征提 用主元分析(PCA)对人脸和人耳图像进行特征提 取,在包含有人脸和人耳图像的Human ID图像 取 库上进行实验,得到结论为人脸识别率和人耳识 2.1人耳识别研究现状 别率没有较大差别,前者为70.5%,后者为 目前国内外己有的基于二维图像的人耳识别 71.6%.但PCA方法提取的特征向量为正交基, 方法主要有以下几种:Alfred Iannarellil刂提出 所以只考虑了图像数据中的二阶统计信息,而未 “米”字型坐标系统由12个测量段长度构成特征 能利用数据中的高阶统计信息,忽略了图像边缘 向量进行识别,这种方法以人耳解剖学点作为测 或曲线的多个像素间的非线性关系8,而核主元 量系统的基础,所有的测量都取决于原点的精确 分析法(KPCA)则是基于输入数据的高阶统计, 定位,所以不适用于计算机视觉处理;Moreno 它描述了多个像素间的相关性,所以能够捕捉这 等提取外耳轮廓特征点和人耳形状和褶皱信息, 些重要的信息,从而取得更好的识别效果.同时 利用人工神经网络进行识别:Burge和Buge) 其另一个优点是可以把在输入空间不可线性分类 提出的方法首先进行人耳定位以及边缘提取,然 的问题变换到特征空间实现线性分类9,从而使 后建立边缘曲线的Voronoi图,最后使用邻接图 分类器的设计得以简化.KPCA的基本思想是利 描述曲线之间的邻接关系,从而构造特征向量进 用核函数的技巧,通过一个非线性变换把输入数 行识别:Hurley,Nixon和Carter将图像看作由 据映射到一个高维的特征空间中,以求数据在该 高斯吸引子组成的阵列,利用力场转换(force 特征空间中线性可分,然后在特征空间中利用标 field transformation)方法提取人耳图像的势能通 准的主元分析法来提取主元作为特征向量. 道和势能阱,并以势能阱的位置作为人耳特征;王 传统的基于数据二阶统计矩的主元分析法是 忠礼等)采用高阶不变矩方法对人耳图像进行 一种有效的数据特征提取方法,是基于原始特征 信息变换和特征提取.Mu等提出的LABSSFE 的一种线性变换,通过选择样本点分布方差大的 方法在提取外耳轮廓和内耳边缘的基础上,寻找 坐标轴进行投影来降低维数而使信息量损失最 基于外耳轮廓的形状特征和基于长轴短轴线段比 少,从而将问题转化为样本数据协方差矩阵的特 例的结构特征,但这种方法适用于正面人耳图像, 征值问题. 而难于扩展到人耳角度变化的情况中,且受光照 22核主元分析法理论简介 的影响较大 给定一个样本=(x,x2,x),xk∈ Chang等7)提出使用经典的特征脸方法利另一种是基于外耳轮廓的两点标记法, 也就是利 用外耳轮廓的起点和终点即三角窝和耳屏间肌切 迹, 如图 2( c) 所示.将这两点连线的长度及其方 向作为人耳的大小和方向进行归一化.通过比较 可以看出, 基于外耳长轴分割出的人耳图像比基 于外耳轮廓起点终点分割出的人耳图像带有更多 的背景信息;通过实验发现, 带有较少背景信息的 图像能够取得更高的识别率.所以采用后者进行 分割 .根据统计得到此方法分割后的人耳长宽比 均值为 1.97, 所以归一化后的图像大小取为 50 × 98 像素, 如图 2( d)所示. 图2 人耳图像中标记点的选择方法.( a) 三角窝、对耳屏两点标记法;( b) 外耳轮廓长轴标记法;( c) 外耳轮廓起始点标记法;(d) 归 一化后的人耳图像示例 Fig.2 Landmark location on ear images:( a) using triangular fossa and antitragus;( b) using the long axis of outer ear contour;( c) using the start point and end point of outer ear contour ;( d) example of normalized ear images 2 基于核主元分析法的人耳特征提 取 2.1 人耳识别研究现状 目前国内外已有的基于二维图像的人耳识别 方法主要有以下几种 :Alfred Iannarelli [ 1] 提出 “米”字型坐标系统, 由 12 个测量段长度构成特征 向量进行识别, 这种方法以人耳解剖学点作为测 量系统的基础, 所有的测量都取决于原点的精确 定位, 所以不适用于计算机视觉处理;Mo reno [ 2] 等提取外耳轮廓特征点和人耳形状和褶皱信息, 利用人工神经网络进行识别;Burge 和 Burger [ 3] 提出的方法首先进行人耳定位以及边缘提取, 然 后建立边缘曲线的 Voronoi 图, 最后使用邻接图 描述曲线之间的邻接关系, 从而构造特征向量进 行识别;Hurley, Nixon 和 Carter [ 4] 将图像看作由 高斯吸引子组成的阵列, 利用力场转换( force field transformation) 方法提取人耳图像的势能通 道和势能阱, 并以势能阱的位置作为人耳特征 ;王 忠礼等[ 5] 采用高阶不变矩方法对人耳图像进行 信息变换和特征提取 .Mu 等 [ 6] 提出的 LABSSFE 方法在提取外耳轮廓和内耳边缘的基础上, 寻找 基于外耳轮廓的形状特征和基于长轴短轴线段比 例的结构特征, 但这种方法适用于正面人耳图像, 而难于扩展到人耳角度变化的情况中, 且受光照 的影响较大. Chang 等[ 7] 提出使用经典的特征脸方法, 利 用主元分析( PCA) 对人脸和人耳图像进行特征提 取, 在包含有人脸和人耳图像的 Human ID 图像 库上进行实验, 得到结论为人脸识别率和人耳识 别率没 有较大 差别, 前 者为 70.5 %, 后 者为 71.6 %.但 PCA 方法提取的特征向量为正交基, 所以只考虑了图像数据中的二阶统计信息, 而未 能利用数据中的高阶统计信息, 忽略了图像边缘 或曲线的多个像素间的非线性关系 [ 8] .而核主元 分析法( KPCA) 则是基于输入数据的高阶统计, 它描述了多个像素间的相关性, 所以能够捕捉这 些重要的信息, 从而取得更好的识别效果.同时 其另一个优点是可以把在输入空间不可线性分类 的问题变换到特征空间实现线性分类[ 9] , 从而使 分类器的设计得以简化 .KPCA 的基本思想是利 用核函数的技巧, 通过一个非线性变换把输入数 据映射到一个高维的特征空间中, 以求数据在该 特征空间中线性可分, 然后在特征空间中利用标 准的主元分析法来提取主元作为特征向量. 传统的基于数据二阶统计矩的主元分析法是 一种有效的数据特征提取方法, 是基于原始特征 的一种线性变换, 通过选择样本点分布方差大的 坐标轴进行投影来降低维数而使信息量损失最 少, 从而将问题转化为样本数据协方差矩阵的特 征值问题 . 2.2 核主元分析法理论简介 给定一个样本 xk =( xk 1, xk 2, …, xkn ) T , xk ∈ Vol.28 No.9 袁 立等:基于核主元分析法和支持向量机的人耳识别 · 891 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有