正在加载图片...
·620· 智能系统学报 第13卷 警手语、聋哑人交流、远程指挥等方面,起到重要 作用山。特征提取是手势识别的关键环节,即通 过对不同的手势进行数学描述,表示独特的特征 2)长宽比。手所在的最小矩形,长度定义为 关系。常用的特征有几何特征、形状特征、H山矩 L,宽度定义为W,长宽比r定义为 特征等。 r=W/L 国外方面,Davis等2采用不变矩和神经网 3)矩形度。手势所占面积S。与最小外接矩 络,进行数字手势的识别;Miyashita等针对静态 形面积Sm之比。矩形度a表示为 手势具有平移和旋转性问题,采用基于边界信息 a=So/Sm 特征描述的方法;Kapuscinski等提出改进的梯 4)Hu矩特征。Hu矩特征主要描述图像旋转 度直方图方法进行静态手势识别,通过加强图像 的不变性,包含7个分量。对于一幅N×M的图像 坐标系的局部方向,使之能够找到最佳的关键向 fx,y),则其(p+q)阶矩为 量,提高识别率。国内方面,谭台哲等将深度与 肤色信息结合,根据手指和手掌质心判断方向, M= =1=1 从而完成对手势和左右手的识别,鲁棒性强;刘 通过计算函数的重心,得到: 淑萍等6在传统的HOG方法的基础上加入肤色 元=M1o/Moo,j=Mo1/M0 模型和手指检测算法,将识别率提高20%;赵磊 对中心矩进行归一化后,使用二阶和三阶矩 等m对传统DTW算法进行改进,以欧氏距离为元 构造7个h分量矩: 素组成矩阵,结合事先录入的手势模板,实现手 h1=720+7o2 势识别。通过上述国内外研究现状的分析不难发 h2=(720-2)2+47112 现研究问题主要集中于空域特征的提取。实际 h3=(730-3712)2+(321-as)2 上,频谱能在描述纹理特征时体现重要作用⑧。 h4=(730+12)》2+(21+s)月 常用的频域变换主要有傅里叶变换、小波变换 h5=(7a3-3712)(730+712)+(730+3n12)2- 等。前期研究中,大多仅采用空域特征或者仅采 30a1+0os]321-o)21+s) 用小波变换系数特征,但由于传统小波变换在获 [370+22-(z1+a] 取频谱特征时,不具有方向性,因此,拟采用对偶 h6=(2o-z)730+712)2-(21+7as)月+ 树复小波变换提取频域特征,实现-75°、-45°、 4711(730+712)(21+7s) -15°、15°、45°和75°等6个方向的特征度量,最后 h,=(3n21-os)30+712)30+12)2- 为提高特征的完备性,本文将空域特征与频域特 征进行融合。 321+o)+(321-30)(n1+s) 分类器通常采用人工神经网络,常用的有 [30+m2-(a+am] BP神经网络、支持向量机(SVM)等。经过许多 1.2 单位的书写规则 学者研究证实,在图像识别方面,SVM比BP精度 用函数山()和山,()将对偶树复小波定义为 更高,且不易陷入过拟合状态9121。但是,由于 中.(t)=少a(0)+j冰g() SVM在高维空间中计算量远远大于BP,因此,当 且满足希尔伯特变换,即: 样本较多、特征维数较大时,SVM速度较慢。本 -j(ω),w>0 中g(ω)= 文引入BD(best distance)优选SVM训练样本的算 a(w),ω<0 法,一方面减少样本数,提高训练速度,另一方 用树A和树B表示,结构图如图1所示。 面,优化样本质量,提高训练精度。 m→+(2 树A「 h( 1特征提取 h网→2 h,(m) 1.1空域特征 +8网→G2 8o(n) 1)位置。由前面部分手势跟踪,可获取手势 树B 8网→(② 的位置信息,用掌的面积中心表示。设手掌像素 -8→② 的坐标为(x,),其中i=0,1,…,n-1;j=0,1,… 图1对偶树复小波变换结构图 m-1),那么其质心(元,)表示为 Fig.1 Dual tree complex wavelet transform structure警手语、聋哑人交流、远程指挥等方面,起到重要 作用[1]。特征提取是手势识别的关键环节,即通 过对不同的手势进行数学描述,表示独特的特征 关系。常用的特征有几何特征、形状特征、Hu 矩 特征等。 国外方面,Davis 等 [2]采用不变矩和神经网 络,进行数字手势的识别;Miyashita 等 [3]针对静态 手势具有平移和旋转性问题,采用基于边界信息 特征描述的方法;Kapuściński 等 [4]提出改进的梯 度直方图方法进行静态手势识别,通过加强图像 坐标系的局部方向,使之能够找到最佳的关键向 量,提高识别率。国内方面,谭台哲等[5]将深度与 肤色信息结合,根据手指和手掌质心判断方向, 从而完成对手势和左右手的识别,鲁棒性强;刘 淑萍等[6]在传统的 HOG 方法的基础上加入肤色 模型和手指检测算法,将识别率提高 20%;赵磊 等 [7]对传统 DTW 算法进行改进,以欧氏距离为元 素组成矩阵,结合事先录入的手势模板,实现手 势识别。通过上述国内外研究现状的分析不难发 现研究问题主要集中于空域特征的提取。实际 上,频谱能在描述纹理特征时体现重要作用[8]。 常用的频域变换主要有傅里叶变换、小波变换 等。前期研究中,大多仅采用空域特征或者仅采 用小波变换系数特征,但由于传统小波变换在获 取频谱特征时,不具有方向性,因此,拟采用对偶 树复小波变换提取频域特征,实现–75°、–45°、 –15°、15°、45°和 75°等 6 个方向的特征度量,最后 为提高特征的完备性,本文将空域特征与频域特 征进行融合。 分类器通常采用人工神经网络,常用的有 BP 神经网络、支持向量机 (SVM) 等。经过许多 学者研究证实,在图像识别方面,SVM 比 BP 精度 更高,且不易陷入过拟合状态[9-12]。但是,由于 SVM 在高维空间中计算量远远大于 BP,因此,当 样本较多、特征维数较大时,SVM 速度较慢。本 文引入 BD(best distance) 优选 SVM 训练样本的算 法,一方面减少样本数,提高训练速度,另一方 面,优化样本质量,提高训练精度。 1 特征提取 1.1 空域特征 (xi , yi) (i = 0,1,··· ,n−1; j = 0,1,··· , m−1) ( ¯x, y¯) 1) 位置。由前面部分手势跟踪,可获取手势 的位置信息,用掌的面积中心表示。设手掌像素 的坐标为 ,其中 ,那么其质心 表示为 x = 1 mn ∑n−1 i=0 ∑m−1 j=0 xi , y = 1 mn ∑n−1 i=0 ∑m−1 j=0 yj 2) 长宽比。手所在的最小矩形,长度定义为 L,宽度定义为 W,长宽比 r 定义为 r = W/L 3) 矩形度。手势所占面积 S0 与最小外接矩 形面积 Sm 之比。矩形度 a 表示为 a = S 0/S m N × M f(x, y) (p+q) 4) Hu 矩特征。Hu 矩特征主要描述图像旋转 的不变性,包含 7 个分量。对于一幅 的图像 ,则其 阶矩为 Mpq = ∑M x=1 ∑N y=1 x p y q f (x, y) 通过计算函数的重心,得到: x¯ = M10/M00, y¯ = M01/M00 对中心矩进行归一化后,使用二阶和三阶矩 构造 7 个 h 分量矩: h1 = η20 +η02 h2 = (η20 −η02) 2 +4η11 2 h3 = (η30 −3η12) 2 +(3η21 −η03) 2 h4 = (η30 +η12) 2 +(η21 +η03) 2 h5 = (η03 −3η12) (η30 +η12)+ [ (η30 +3η12) 2 − 3(η21 +η03) 2 ] (3η21 −η0) (η21 +η03)· [ 3(η30 +η12) 2 −(η21 +η03) 2 ] h6 = (η20 −η02) [ (η30 +η12) 2 −(η21 +η03) 2 ] + 4η11 (η30 +η12) (η21 +η03) h7 = (3η21 −η03) (η30 +η12) [ (η30 +η12) 2 − 3(η21 +η03) 2 ] +(3η21 −η30) (η21 +η03)· [ 3(η30 +η12) 2 −(η21 +η03) 2 ] 1.2 单位的书写规则 用函数 ψh(t) 和 ψg(t) 将对偶树复小波定义为 ψc (t) = ψh (t)+ jψg (t) 且满足希尔伯特变换,即: ψg (ω) = { −jψh (ω), ω > 0 ψh (ω), ω < 0 用树 A 和树 B 表示,结构图如图 1 所示。 2 2 2 2 2 2 2 2 树A 树B h0(n) h0(n) h1(n) h1(n) g1(n) g1(n) g0(n) g0(n) 图 1 对偶树复小波变换结构图 Fig. 1 Dual tree complex wavelet transform structure ·620· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有