第10卷第3期 智能系统学报 Vol.10 No.3 2015年6月 CAAI Transactions on Intelligent Systems Jun.2015 D0:10.3969/j.issn.1673-4785.201405054 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.tp.20150604.0838.001.html 基于空间金字塔特征包的手势识别算法 余思泉,曹江涛,李平1,姬晓飞2 (1.辽宁石油化工大学信息与控制工程学院,辽宁抚顺113001:2.沈阳航空航天大学自动化学院,辽宁沈阳 110136) 摘要:为了解决基于尺度不变特征变换的特征包(BF-SFT)算法在描述手势图像特征时对特征点分布情况无法 确定的问题,提出了空间金字塔特征包算法提取手势图像特征。该算法通过构造图像金字塔改善了传统的BF ST算法,生成的描述子能有效表征手势图像的局部特征和全局特征,并能表示图像特征点的分布特性。采用直方 图相交核支持向量机进行手势识别。在标准数据库上的测试表明,该算法对于10种手语得到了92.92%的正确识别 率,验证了算法的有效性。 关键词:手势识别:手势图像:尺度不变特征变换;空间金字塔:特征包:直方图相交核:支持向量机 中图分类号:TP319文献标志码:A文章编号:1673-4785(2015)03-0429-07 中文引用格式:余思泉,曹江涛,李平,等.基于空间金字塔特征包的手势识别算法[J].智能系统学报,2015,10(3):429-435. 英文引用格式:YU Siquan,CAO Jiangtao,LI Ping,etal.Hand gesture recognition based on the spatial pyramid bag of features [J].CAAI Transactions on Intelligent Systems,2015,10(3):429-435. Hand gesture recognition based on the spatial pyramid bag of features YU Siquan',CAO Jiangtao',LI Ping',JI Xiaofei2 (1.School of Information and Control Engineering,Liaoning Shihua University,Fushun 113001,China;2.School of Automation, Shenyang Aerospace University,Shenyang 110136,China) Abstract:A novel algorithm based on the spatial pyramid bag of features is proposed to describe the hand im- age.It is proposed in order to solve the problem that the distribution of feature points cannot be ascertained when using the hand gesture descriptor based on bag of feature of scale invariant feature transform BoF- SIFT).The capability of the BoF-SIFT can be improved by generating image spatial pyramid.The descriptor can effectively represent the posture by combining the global features and local features of the gesture image,as well as the distribution character of image feature points.Finally,the hand posture recognition is achieved by using the histogram intersection kernel support vector machine (SVM).The experiment on standard database demonstrates the average recognition rate can reach 92.92%for 10 kinds of gestures recognition,verifying the efficiency and effectiveness of the proposed algorithm. Keywords:hand gesture recognition;hand gesture image;scale invariant feature transform(SIFT);spatial pyra- mid;bag of features;histogram intersection kernel;support vector machines (SVM) 随着计算机和人工智能技术的发展,人机交互 人类能够利用包括自然语言、手势语言、面部表情在 的研究方向正朝实现拟人化的方向发展。目的是使 内的人类自然、直观的方式实现人机交互。手势作 收稿日期:2014-05-26.网络出版日期:2015-06-04 为一种智能的人机交互接口,十分适用于对复杂的 基金项目:国家自然科学基金资助项目(61103123). 交互系统做出反应。基于视觉的手势识别算法研 通信作者:曹江涛.E-mail:jtcao@lpu.cdu.cmn
第 10 卷第 3 期 智 能 系 统 学 报 Vol.10 №.3 2015 年 6 月 CAAI Transactions on Intelligent Systems Jun. 2015 DOI:10.3969 / j.issn.1673⁃4785.201405054 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20150604.0838.001.html 基于空间金字塔特征包的手势识别算法 余思泉1 ,曹江涛1 ,李平1 ,姬晓飞2 (1.辽宁石油化工大学 信息与控制工程学院,辽宁 抚顺 113001;2.沈阳航空航天大学 自动化学院,辽宁 沈阳 110136) 摘 要:为了解决基于尺度不变特征变换的特征包(BoF⁃SIFT)算法在描述手势图像特征时对特征点分布情况无法 确定的问题,提出了空间金字塔特征包算法提取手势图像特征。 该算法通过构造图像金字塔改善了传统的 BoF⁃ SIFT 算法,生成的描述子能有效表征手势图像的局部特征和全局特征,并能表示图像特征点的分布特性。 采用直方 图相交核支持向量机进行手势识别。 在标准数据库上的测试表明,该算法对于 10 种手语得到了 92.92%的正确识别 率,验证了算法的有效性。 关键词:手势识别;手势图像;尺度不变特征变换;空间金字塔;特征包;直方图相交核;支持向量机 中图分类号:TP319 文献标志码:A 文章编号:1673⁃4785(2015)03⁃0429⁃07 中文引用格式:余思泉,曹江涛,李平,等. 基于空间金字塔特征包的手势识别算法[J]. 智能系统学报, 2015, 10(3): 429⁃435. 英文引用格式:YU Siquan, CAO Jiangtao, LI Ping, et al. Hand gesture recognition based on the spatial pyramid bag of features [J]. CAAI Transactions on Intelligent Systems, 2015, 10(3): 429⁃435. Hand gesture recognition based on the spatial pyramid bag of features YU Siquan 1 , CAO Jiangtao 1 , LI Ping 1 , JI Xiaofei 2 (1. School of Information and Control Engineering, Liaoning Shihua University, Fushun 113001, China; 2. School of Automation, Shenyang Aerospace University, Shenyang 110136, China) Abstract:A novel algorithm based on the spatial pyramid bag of features is proposed to describe the hand im⁃ age. It is proposed in order to solve the problem that the distribution of feature points cannot be ascertained when using the hand gesture descriptor based on bag of feature of scale invariant feature transform ( BoF⁃ SIFT) . The capability of the BoF⁃SIFT can be improved by generating image spatial pyramid. The descriptor can effectively represent the posture by combining the global features and local features of the gesture image, as well as the distribution character of image feature points. Finally, the hand posture recognition is achieved by using the histogram intersection kernel support vector machine ( SVM) . The experiment on standard database demonstrates the average recognition rate can reach 92.92% for 10 kinds of gestures recognition, verifying the efficiency and effectiveness of the proposed algorithm. Keywords:hand gesture recognition; hand gesture image; scale invariant feature transform (SIFT); spatial pyra⁃ mid; bag of features; histogram intersection kernel; support vector machines (SVM) 收稿日期:2014⁃05⁃26. 网络出版日期:2015⁃06⁃04. 基金项目:国家自然科学基金资助项目(61103123). 通信作者:曹江涛. E⁃mail: jtcao@ lnpu.edu.cn. 随着计算机和人工智能技术的发展,人机交互 的研究方向正朝实现拟人化的方向发展。 目的是使 人类能够利用包括自然语言、手势语言、面部表情在 内的人类自然、直观的方式实现人机交互。 手势作 为一种智能的人机交互接口,十分适用于对复杂的 交互系统做出反应。 基于视觉的手势识别算法研
·430· 智能系统学报 第10卷 究,已经成为当今图像处理与模式识别领域研究的 1手势识别算法简介 热点问题。基于视觉的单一背景的手势识别主要包 括特征的提取与描述、分类器的选择与训练2个过 手势识别算法如图1所示。该方法主要针对单 程。其中,所选择的特征的好坏将直接影响到手势 一背景下的手势识别,因此无需对手势图像进行分 识别的准确率山。文献[2]采用边缘像素点作为手 割预处理。首先将图像分割成不同的大小的块组成 势特征,并使用Hausdorff距离匹配手势模板。该方 图像金字塔,然后对图像金字塔中的每一层的每一 法较为简单,但所提取的手势特征不具有旋转与缩 块生成BoF-SFT特征描述,最后将图像金字塔各层 放的不变性,而且受光照的影响较大。文献[3]利 特征融合组成手势图像的SPM-BoF特征,并用直方 用切线距离作为手势特征,通过K-means聚类生成 图相交核支持向量机进行特征的分类,实现对未知 匹配模板,利用相似性匹配实现手势识别。文献 手势的识别。 [4]利用图像的Zernike矩和HOG特征构建字典, 并通过求解!范数的最优化问题实现分类识别。以 测试集 SPM算法 测试 特征提取 上2种特征对于图像的缩放具有不变性,但其特征 训练集 SPM算法 训练皮持向量机 识别 提取的计算复杂度较高。文献[5]提出利用局部均 特征提取 结果 值模式描述手势特征,采用gentle-Adaboost分类算 图1基于SPM-BoF算法的支持向量机手势识别框图 法实现手势分类和识别。文献[6]提出利用基于尺 Fig.1 The diagram of posture recognition based on SPM- 度不变特征变换特征包(bag of feature-scale invariant BoF algorithm and SVM feature transformation,BoF-SIFT)模型[)]和支持向量 2 机(support vector machine,SVM)的手势识别。这2 BoF-SIFT算法提取图像特征 种方法对特征提取与描述进行了改善,但BoF-SIFT BoF-SIFT算法描述手势图像特征分为2个步 描述的手势特征丢弃了手势特征点的分布特性,其 骤:1)检测图像特征点并生成特征点的SFT描述子 识别的准确性受到限制。在分类器的选择和设计方 的特征向量形式:2)利用K-means算法对所有手势 面,gentle-Adaboost分类器相对复杂,支持向量机需 图像的SFT特征进行向量聚类,用聚类中心建立视 要选择适当的核函数和参数才能得到有效的识别效 觉词汇表,通过统计每张手势图像的视觉词汇表直 果。文献[8]利用分层的特征包算法提取手势图像 方图作为手势图像的特征表示。 特征描述子,通过比较2幅手势图像特征描述子的 2.1检测图像关键点并生成关键点的SIFT描述子 相似度实现手势识别。这种算法取得了很好的识别 尺度不变特征变换(scale invariant feature trans 率,但算法中可调参数较多,识别效果受参数选择影 fom,SIFT)是D.G.Lowe在2004年首次提出 响较大。 的)。ST特征是一种图像的局部特征,该特征对 综上所述,为了更加有效地进行手势特征的描 旋转、尺度、缩放、亮度变化均具有不变性。获取该 述和识别,本文提出利用空间金字塔(spatial pyra- 特征主要分为特征点检测与生成特征点SFT描述 mid matching,SPM)特征包对手势图像特征进行提 符2个部分。在特征点检测阶段,David提出的构造 取和表示,该特征可以有效地描述手势图像的特征 图像尺度空间金字塔的方法将特征点周围的每个像 点及其分布特性,采用直方图相交核(histogram in 素的梯度模值和方向定义为: tersection kernel,HIK)支持向量机对手势特征进行 m(x,y)= 分类和识别。该手势识别算法的优势在于:1)空间 √(L(x+1y)-(x-1y))2+((xy+)-L(xy-)) 金字塔特征包算法通过构造图像金字塔的方法,对 (1) 每层图像的不同块区域运用BoF-SFT算法来描述 L(x,y+1)-L(x,y-1) a(x,y)=ata L(x+1,y)-L(x-1,y) .(2) 特征点,既能保持BoF-SFT算法特征简单、解决图 像局部特征不一致问题的优点,还在BoF-SIFT的基 式中:(x,y)为特征点的坐标,L(x,y)是图像的高斯 础上,增加了对特征点的分布特性的描述:2)直方 卷积。构造描述子需要计算特征点周围16×16图 图相交核支持向量机可以用于解决高维、小样本、非 像块中各像素的梯度模值和方向。将坐标轴旋转为 关键点的方向,以确保旋转不变性。将16×16图像 线性向量的分类问题,并且不用像其他类型的支持 块平均分成16个4×4的子区域,在每个子区域内 向量机核函数那样需要选择参数。 统计每个采样点的梯度方向,并投影到8个方向上
究,已经成为当今图像处理与模式识别领域研究的 热点问题。 基于视觉的单一背景的手势识别主要包 括特征的提取与描述、分类器的选择与训练 2 个过 程。 其中,所选择的特征的好坏将直接影响到手势 识别的准确率[1] 。 文献[2]采用边缘像素点作为手 势特征,并使用 Hausdorff 距离匹配手势模板。 该方 法较为简单,但所提取的手势特征不具有旋转与缩 放的不变性,而且受光照的影响较大。 文献[3] 利 用切线距离作为手势特征,通过 K⁃means 聚类生成 匹配模板,利用相似性匹配实现手势识别。 文献 [4]利用图像的 Zernike 矩和 HOG 特征构建字典, 并通过求解 l 范数的最优化问题实现分类识别。 以 上 2 种特征对于图像的缩放具有不变性,但其特征 提取的计算复杂度较高。 文献[5]提出利用局部均 值模式描述手势特征,采用 gentle⁃Adaboost 分类算 法实现手势分类和识别。 文献[6]提出利用基于尺 度不变特征变换特征包(bag of feature⁃scale invariant feature transformation, BoF⁃SIFT)模型[7]和支持向量 机(support vector machine,SVM)的手势识别。 这 2 种方法对特征提取与描述进行了改善,但 BoF⁃SIFT 描述的手势特征丢弃了手势特征点的分布特性,其 识别的准确性受到限制。 在分类器的选择和设计方 面,gentle⁃Adaboost 分类器相对复杂,支持向量机需 要选择适当的核函数和参数才能得到有效的识别效 果。 文献[8]利用分层的特征包算法提取手势图像 特征描述子,通过比较 2 幅手势图像特征描述子的 相似度实现手势识别。 这种算法取得了很好的识别 率,但算法中可调参数较多,识别效果受参数选择影 响较大。 综上所述,为了更加有效地进行手势特征的描 述和识别,本文提出利用空间金字塔( spatial pyra⁃ mid matching, SPM)特征包对手势图像特征进行提 取和表示,该特征可以有效地描述手势图像的特征 点及其分布特性,采用直方图相交核( histogram in⁃ tersection kernel, HIK)支持向量机对手势特征进行 分类和识别。 该手势识别算法的优势在于:1)空间 金字塔特征包算法通过构造图像金字塔的方法,对 每层图像的不同块区域运用 BoF⁃SIFT 算法来描述 特征点,既能保持 BoF⁃SIFT 算法特征简单、解决图 像局部特征不一致问题的优点,还在 BoF⁃SIFT 的基 础上,增加了对特征点的分布特性的描述;2) 直方 图相交核支持向量机可以用于解决高维、小样本、非 线性向量的分类问题,并且不用像其他类型的支持 向量机核函数那样需要选择参数。 1 手势识别算法简介 手势识别算法如图 1 所示。 该方法主要针对单 一背景下的手势识别,因此无需对手势图像进行分 割预处理。 首先将图像分割成不同的大小的块组成 图像金字塔,然后对图像金字塔中的每一层的每一 块生成 BoF⁃SIFT 特征描述,最后将图像金字塔各层 特征融合组成手势图像的 SPM⁃BoF 特征,并用直方 图相交核支持向量机进行特征的分类,实现对未知 手势的识别。 图 1 基于 SPM⁃BoF 算法的支持向量机手势识别框图 Fig. 1 The diagram of posture recognition based on SPM⁃ BoF algorithm and SVM 2 BoF⁃SIFT 算法提取图像特征 BoF⁃SIFT 算法描述手势图像特征分为 2 个步 骤:1)检测图像特征点并生成特征点的 SIFT 描述子 的特征向量形式;2)利用 K⁃means 算法对所有手势 图像的 SIFT 特征进行向量聚类,用聚类中心建立视 觉词汇表,通过统计每张手势图像的视觉词汇表直 方图作为手势图像的特征表示。 2.1 检测图像关键点并生成关键点的 SIFT 描述子 尺度不变特征变换(scale invariant feature trans⁃ form, SIFT) 是 D. G. Lowe 在 2004 年 首 次 提 出 的[9] 。 SIFT 特征是一种图像的局部特征,该特征对 旋转、尺度、缩放、亮度变化均具有不变性。 获取该 特征主要分为特征点检测与生成特征点 SIFT 描述 符 2 个部分。 在特征点检测阶段,David 提出的构造 图像尺度空间金字塔的方法将特征点周围的每个像 素的梯度模值和方向定义为: m(x,y) = (L(x +1,y) -L(x -1,y) ) 2 + (L(x,y +1) -L(x,y -1) ) 2 (1) θ(x,y) = atan L(x,y + 1) - L(x,y - 1) L(x + 1,y) - L(x - 1,y) (2) 式中:(x,y)为特征点的坐标,L(x,y)是图像的高斯 卷积。 构造描述子需要计算特征点周围 16×16 图 像块中各像素的梯度模值和方向。 将坐标轴旋转为 关键点的方向,以确保旋转不变性。 将 16×16 图像 块平均分成 16 个 4×4 的子区域,在每个子区域内 统计每个采样点的梯度方向,并投影到 8 个方向上, ·430· 智 能 系 统 学 报 第 10 卷
第3期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·431. 计算其权值。最终得到16×8=128个梯度信息即为 法)聚类。传统的K-means算法由于初始聚类中心 关键点的特征向量。SIFT特征点的SFT描述过程 的不同,迭代次数和聚类结果会有很大差别。为了提 如图2所示。 高算法的稳定性,使用K-means++算法来获得初始聚 类中心。从手势样本库的所有手势图像中提取m个 图密蜜图 特征点,每个特征点的SFT特征描述向量为 图闲快密 x:(i=1,2,,m),则构成的手势样本库的特征向 图图图 量空间为X=[x1x2…xm],确定K-means++ 密粥离 实现步骤如下: ●特征点 4×4×8=128维描述符 a)从特征向量空间X=[x1x2…xm]中, 图2SFT描述子的生成过程 任取一个向量为第1个聚类中心c1。 Fig.2 SIFT descriptor generation process b)根据概率 2.2生成BoF-SIFT描述子 D(x:) p(r:)= D(x) BoF算法是2004年由Csurka引入到图像处理 ∑e…)t)2 领域o。BoF算法叫做作词袋算法,其思想是把一 确定下一个初始聚类中心c:=x,。其中D(x)表示 张图像看作包含若干特征的集合,用这些特征的直 向量x到目前已选出的所有聚类中心中的最近距离。 方图表征图像特征。BoF算法首先要构造视觉词汇 c)重复步骤b),直到选出所有的初始聚类中心 表(vsual vocabulary)。通常采用K-means算法将生 C={c1,c2,,Ck}。 成的SFT描述符进行聚类,选取聚类中心作为视觉 d)确定所有的初始聚类中心后,用K-means算 词汇表,图像的特征点可以利用与其最近邻的视觉 法聚类,得到了最终的K个聚类中心。 词汇表示。通过直方图方式进行量化,得到图像的 4)将得到的K个聚类中心作为视觉词汇表,在 视觉码字就是该图像的BoF-SIFT特征描述子。 步骤1)构造的图像金字塔中的每一层图像的子块中 3空间金字塔特征包手势识别算法 用BoF算法进行特征提取。在图像金字塔中的每一 层子块中生成K个视觉码字的BoF-SFT描述子。 3.1空间金字塔特征包算法提取图像特征 5)将每层的直方图描述子加权组合构造整张 BoF-SIFT算法通过统计整张图像的特征点特 图像的特征描述子。 征生成全局直方图,该方法丢失了图像特征点的分 布信息,因此不能很好地反应图像特征点的分布特 目 性。空间金字塔算法是一种利用空间金字塔进行图 “山L1个K维列向量 像匹配、识别、分类的算法。将空间金字塔思想 … 与BoF算法结合。通过构造空间图像金字塔,对图 的 4个K维列向量 像分层运用BoF-SIFT算法,能在保持BoF-SIFT特 征原有优势的基础上,有效地表征目标图像的局部 16个k维列向量 特征和全局特征,并能更好地表示图像特征点的分 第1层 K个聚类中心,统计K个直方图 生成SFT描述 布特性。SPM-BoF算法框图如图3所示,具体的处 图3空间金字塔特征包算法 理过程如下: Fig.3 The schematic diagram of space pyramid BoF algorithm 1)将原图像分成不同大小的块,构造一个3层 的图像金字塔,第1层将整个图像划分为16个子 3.2直方图相交核支持向量机 块,第2层将整个图像划分为4个子块,第3层为整 支持向量机(SVM)在解决小样本、非线性及高 个图像。 维的模式识别问题中表现出许多特有的优势1。 2)生成图像的SIFT描述子,由于D.G.Lowe提 其解决无法线性分类的样本的关键在于核函数的选 出的检测特征点的方法同时会模糊图像的边缘信 择。直方图相交核支持向量机利用直方图描述的图 息,造成检测到的兴趣点数目较少。本文直接将图 像特征能够很好解决图像分类和识别问题[)。直 像均匀分成若干个像素为16×16的块,以每个小块 方图相交核的定义为 的中心作为特征点生成SFT描述子。 Kim (A,B)= mina,by (3) 3)将所有图像的SIFT描述子用K-means++算 i=1
计算其权值。 最终得到 16×8 = 128 个梯度信息即为 关键点的特征向量。 SIFT 特征点的 SIFT 描述过程 如图 2 所示。 图 2 SIFT 描述子的生成过程 Fig. 2 SIFT descriptor generation process 2.2 生成 BoF⁃SIFT 描述子 BoF 算法是 2004 年由 Csurka 引入到图像处理 领域[10] 。 BoF 算法叫做作词袋算法,其思想是把一 张图像看作包含若干特征的集合,用这些特征的直 方图表征图像特征。 BoF 算法首先要构造视觉词汇 表(vsual vocabulary)。 通常采用 K⁃means 算法将生 成的 SIFT 描述符进行聚类,选取聚类中心作为视觉 词汇表,图像的特征点可以利用与其最近邻的视觉 词汇表示。 通过直方图方式进行量化,得到图像的 视觉码字就是该图像的 BoF⁃SIFT 特征描述子。 3 空间金字塔特征包手势识别算法 3.1 空间金字塔特征包算法提取图像特征 BoF⁃SIFT 算法通过统计整张图像的特征点特 征生成全局直方图,该方法丢失了图像特征点的分 布信息,因此不能很好地反应图像特征点的分布特 性。 空间金字塔算法是一种利用空间金字塔进行图 像匹配、识别、分类的算法[10] 。 将空间金字塔思想 与 BoF 算法结合。 通过构造空间图像金字塔,对图 像分层运用 BoF⁃SIFT 算法,能在保持 BoF⁃SIFT 特 征原有优势的基础上,有效地表征目标图像的局部 特征和全局特征,并能更好地表示图像特征点的分 布特性。 SPM⁃BoF 算法框图如图 3 所示,具体的处 理过程如下: 1)将原图像分成不同大小的块,构造一个 3 层 的图像金字塔,第 1 层将整个图像划分为 16 个子 块,第 2 层将整个图像划分为 4 个子块,第 3 层为整 个图像。 2)生成图像的 SIFT 描述子,由于 D. G. Lowe 提 出的检测特征点的方法同时会模糊图像的边缘信 息,造成检测到的兴趣点数目较少。 本文直接将图 像均匀分成若干个像素为 16×16 的块,以每个小块 的中心作为特征点生成 SIFT 描述子。 3)将所有图像的 SIFT 描述子用 K⁃means++算 法[11]聚类。 传统的 K⁃means 算法由于初始聚类中心 的不同,迭代次数和聚类结果会有很大差别。 为了提 高算法的稳定性,使用 K⁃means++算法来获得初始聚 类中心。 从手势样本库的所有手势图像中提取 m 个 特征 点, 每 个 特 征 点 的 SIFT 特 征 描 述 向 量 为 xi (i = 1,2,...,m) ,则构成的手势样本库的特征向 量空间为 X = x1 x2 [ ... xm ] ,确定 K⁃means++ 实现步骤如下: a)从特征向量空间 X = x1 x2 [ ... xm ] 中, 任取一个向量为第 1 个聚类中心 c1 。 b)根据概率 p xi ( ) = D xi ( ) ∑x′∈ x1 ,x2 { ,...,xm} D (x′) 2 ∝ D(x) 确定下一个初始聚类中心 cj = xj 。 其中 D(x) 表示 向量 x 到目前已选出的所有聚类中心中的最近距离。 c)重复步骤 b),直到选出所有的初始聚类中心 C = c1 ,c2 ,...,ck { } 。 d)确定所有的初始聚类中心后,用 K⁃means 算 法聚类,得到了最终的 K 个聚类中心。 4)将得到的 K 个聚类中心作为视觉词汇表,在 步骤 1)构造的图像金字塔中的每一层图像的子块中 用 BoF 算法进行特征提取。 在图像金字塔中的每一 层子块中生成 K 个视觉码字的 BoF⁃SIFT 描述子。 5)将每层的直方图描述子加权组合构造整张 图像的特征描述子。 图 3 空间金字塔特征包算法 Fig. 3 The schematic diagram of space pyramid BoF algorithm 3.2 直方图相交核支持向量机 支持向量机(SVM)在解决小样本、非线性及高 维的模式识别问题中表现出许多特有的优势[12] 。 其解决无法线性分类的样本的关键在于核函数的选 择。 直方图相交核支持向量机利用直方图描述的图 像特征能够很好解决图像分类和识别问题[13] 。 直 方图相交核的定义为 Kint (A,B) = ∑ m i = 1 min ai,bi { } (3) 第 3 期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·431·
·432. 智能系统学报 第10卷 式中:A和B是图像Am和B的直方图,每个直方图 综合影响,对不同输入样本的情况下变化聚类中心 由m个类组成,a、b.(i=1,2,…,m)是直方图A、B 数,得到的识别率如图5(b)所示。可以看出,在聚类 每个类的值。直方图相交核的优点并不只是能实现 中心数K≥100,训练样本数N=220和N=240时,曲 利用直方图描述图像的分类,更关键的一点是直方 线重合,平均识别率达到最大值。因此确定最优参数 图交叉核不用其他核函数那样选定参数,这样可以 为聚类中心数K=100,训练样本数N=240。 减少分类器设计时的参数设定。 0.91 4 实验结果与分析 0.90 实验通过台湾大学林智仁等开发的SVM模式 录0.89 识别与回归的软件包LIBSVM4建立,并构建了直 0.88 方图相交核函数。利用J.Triesch提供的手势数据 0.87 库]进行了大量实验。该手势库中包含了10个手 0.86 语字母手势,分别为字母A、B、C、D、G、H、I、L、V、Y。 0.85 每种手势包含了24个人分别在单一黑色背景、单一 °120140160180200220240 白色背景和复杂背景的3类图像,总数据量为719 训练样本数 张图像。实验只验证算法在单一背景手势图像识别 (a)不同训练样本数 的有效性,不考虑复杂背景的情况,单一背景图像总 0.91 数为480张。数据库部分手语图像如图4所示。所 0.89 有实验环境为主频3.0GHz,内存2GB的PC、MAT- LAB2009软件。 ≤0.87 ÷0.85 0.83 0.85070 8090100110120 聚类中心数 (b)不同聚类数 图4 Jochen Triesch数据库的部分图像 图5当不同训练样本数和不同聚类数的平均识别率 Fig.4 Some images from Jochen Triesch's database Fig.5 The average recognition rate of different training sample and the number of clustering 4.1参数测试 通过分析算法的执行过程,训练样本数N和 4.2不同特征选择对识别算法的影响 K-means++算法聚类中心数K的选择会影响识别 使用空间金字塔算法描述手势图像特征时,需 结果。在不同参数下进行试验,以最优识别率为 要构建图像金字塔,并对各层特征加权融合得到最 选择参数的标准。 终的特征。所以权值的选取也是一个影响识别率的 1)训练样本数对识别率的影响。 重要因素。在4.1节得到的最优参数下,训练样本 首先确定实验中训练数据和测试数据集的数 和测试样本的图像金字塔各层特征分别采用支持向 目。设计训练样本N分别为120、140、160、180 量机进行训练和识别,得到各层特征的识别率混淆 200、220、240张图像。测试样本为240张图像。初 矩阵如图6所示,平均识别率如表1所示。 始聚类数为K=100。在选择不同数目样本情况下 表1训练集和测试集统计数据 应用直方图相交核支持向量机得到识别率变化曲线 Table 1 Statistical data of training sets and test sets 如图5(a)所示。从图中可以看到,当训练样本数N 层 特征向量维数平均识别率/% 为220时,系统的识别率达到稳定值。 2)不同聚类数对识别的影响。 1600 88.33 设定不同的聚类数,分别为K=60,70,80,90, 2 400 87.92 100,110,120,在相同样本数的情况下测试算法的识 3 100 81.67 别率。另外,为了测试样本数和聚类中心数对系统的
式中:A 和 B 是图像 Aim和 Bim的直方图,每个直方图 由 m 个类组成,ai、bi(i = 1,2,…,m)是直方图 A 、 B 每个类的值。 直方图相交核的优点并不只是能实现 利用直方图描述图像的分类,更关键的一点是直方 图交叉核不用其他核函数那样选定参数,这样可以 减少分类器设计时的参数设定。 4 实验结果与分析 实验通过台湾大学林智仁等开发的 SVM 模式 识别与回归的软件包 LIBSVM [14] 建立,并构建了直 方图相交核函数。 利用 J. Triesch 提供的手势数据 库[15]进行了大量实验。 该手势库中包含了 10 个手 语字母手势,分别为字母 A、B、C、D、G、H、I、L、V、Y。 每种手势包含了 24 个人分别在单一黑色背景、单一 白色背景和复杂背景的 3 类图像,总数据量为 719 张图像。 实验只验证算法在单一背景手势图像识别 的有效性,不考虑复杂背景的情况,单一背景图像总 数为 480 张。 数据库部分手语图像如图 4 所示。 所 有实验环境为主频 3.0 GHz,内存 2 GB 的 PC、MAT⁃ LAB 2009 软件。 图 4 Jochen Triesch 数据库的部分图像 Fig. 4 Some images from Jochen Triesch’s database 4.1 参数测试 通过分析算法的执行过程,训练样本数 N 和 K⁃means++算法聚类中心数 K 的选择会影响识别 结果。 在不同参数下进行试验,以最优识别率为 选择参数的标准。 1)训练样本数对识别率的影响。 首先确定实验中训练数据和测试数据集的数 目。 设计训练样本 N 分别为 120、 140、 160、 180、 200、220、240 张图像。 测试样本为 240 张图像。 初 始聚类数为 K = 100。 在选择不同数目样本情况下 应用直方图相交核支持向量机得到识别率变化曲线 如图 5(a)所示。 从图中可以看到,当训练样本数 N 为 220 时,系统的识别率达到稳定值。 2)不同聚类数对识别的影响。 设定不同的聚类数,分别为 K = 60, 70, 80, 90, 100, 110, 120,在相同样本数的情况下测试算法的识 别率。 另外,为了测试样本数和聚类中心数对系统的 综合影响,对不同输入样本的情况下变化聚类中心 数,得到的识别率如图 5(b)所示。 可以看出,在聚类 中心数 K≥100,训练样本数 N= 220 和 N= 240 时,曲 线重合,平均识别率达到最大值。 因此确定最优参数 为聚类中心数 K= 100,训练样本数 N= 240。 (a)不同训练样本数 (b)不同聚类数 图 5 当不同训练样本数和不同聚类数的平均识别率 Fig. 5 The average recognition rate of different training sample and the number of clustering 4.2 不同特征选择对识别算法的影响 使用空间金字塔算法描述手势图像特征时,需 要构建图像金字塔,并对各层特征加权融合得到最 终的特征。 所以权值的选取也是一个影响识别率的 重要因素。 在 4.1 节得到的最优参数下,训练样本 和测试样本的图像金字塔各层特征分别采用支持向 量机进行训练和识别,得到各层特征的识别率混淆 矩阵如图 6 所示,平均识别率如表 1 所示。 表 1 训练集和测试集统计数据 Table 1 Statistical data of training sets and test sets 层 特征向量维数 平均识别率/ % 1 1 600 88.33 2 400 87.92 3 100 81.67 ·432· 智 能 系 统 学 报 第 10 卷
第3期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·433. A B C D G H I L V Y 描述特征点的分布特性。本文用遍历所有权值组合的 A1.000.000.000.000.000.000.000.000.000.00 方法得到了最佳识别率下的各层权值,具体过程为设 B0.000.920.000.080.000.000.000.000.000.00 权值矩阵为A=[a1a2a3],其中a,∈[0.1,1.0](i=1,2 C0.000.000.960.040.000.000.000.000.000.00 3),变化率为△=0.1,所有权值组合数为103=1000。 D0.000.000.000.960.000.000.040.000.000.00 通过实验,选取各层特征的权值分别为0.5、0.5和0.2, G0.000.000.000.000.710.290.000.000.000.00 此时系统具有最高的识别率。 H0.000.000.000.000.290.710.000.000.000.00 4.3实验结果与其他文献的比较 10.000.040.000.000.000.000.920.040.000.00 利用测试得到的最佳参数,重新从数据库中选 L0.080.000.000.000.000.000.000.920.000.00 取12个人的40张手语图像进行实验。得到各个手 V0.000.040.000.000.000.000.000.080.880.00 语的识别混淆矩阵如图7所示,可以看到,融合后的 0.000.000.000.000.000.000.040.080.000.88 特征的识别率得到进一步改善。 (a)第1层 B CD G H I L V Y A1.000.000.000.000.000.000.000.000.000.0g A B CD GHILVY B0.000.960.000.000.000.000.000.000.040.0g A1.000.000.000.000.000.000.000.000.000.00 C0.000.001.000.000.000.000.000.000.000.0g B0.000.880.000.080.000.000.000.000.040.00 D0.000.000.000.960.000.000.040.000.000.00 C0.000.000.960.040.000.000.000.000.000.00 G 0.000.000.000.000.880.130.000.000.000.0g D0.000.000.000.960.000.000.000.000.040.00 H 0.000.000.000.000.170.830.000.000.000.0g G0.000.000.000.000.710.290.000.000.000.00 0.000.000.000.040.000.000.960.000.000.00 H0.000.000.000.000.330.67 0.000.000.000.00 0.080.000.000.000.000.000.000.920.000.00 0.040.040.000.000.000.000.920.000.000.00 0.000.080.000.000.000.000.000.000.920.00 0.080.000.000.000.000.000.000.920.000.00 0.040.000.000.000.000.000.080.000.000.88 V0.000.040.000.000.000.000.000.000.960.00 图7最佳参数下不同手语手势识别率混淆矩阵 0.040.000.000.040.000.000.040.040.000.83 Fig.7 Recognition confusion matrix with optimal parameters (b)第2层 将本文的手势识别方法与在Jochen Triesch数 A B C D G H I L V Y A0.880.000.000.000.000.000.040.040.040.00 据库中简单背景进行测试的其他方法进行比较,比 B0.000.920.000.000.000.000.040.000.040.00 较结果见表2所示。从实验结果中可以看出,提出 c0.000.000.960.040.000.000.000.000.000.00 的方法识别准确率高于文献[16-17]的手势识别方 D0.000.000.000.920.000.000.040.000.040.00 法。实验结果验证了空间金字塔与直方图相交核支 G0.000.000.000.000.730.250.000.000.000.00 持向量机应用在手势识别系统中的优越性。 H0.000.000.000.000.330.670.000.000.000.00 表2不同方法的识别结果 10.040.040.000.040.000.000.880.000.000.00 Table 2 Comparison results of different methods % 0.130.040.000.000.000.000.000.790.000.04 算法 识别方法 识别结果 0.000.130.000.000.000.000.040.000.830.00 BoF-SIFT特征+ y0.130.000.000.000.000.000.000.040.000.83 张秋余的方法[] 81.67 RBF核支持向量机 (c)第3层 A.Just的方法[o MCT特征+AdaBoost 89.97 图6空间金字塔不同层特征得到的识别率混淆矩阵 Fig.6 Recognition confusion matrix of different image BoF-SIFT特征+ 实验1 86.25 pyramid layers 直方图相交核支持向量机 空间金字塔特征包+ 通过观察图像金字塔各层特征的识别率可以看 实验2 86.67 RBF核支持向量机 到,3层特征的平均识别率呈递减趋势,这是因为图像 金字塔中不同层数的图像分割块数依次变少。图像金 空间金字塔特征包+ 本文方法 92.92 字塔第1层的图像分割块数最多,它比其他2层更能 直方图相交核支持向量机
(a)第 1 层 (b)第 2 层 (c)第 3 层 图 6 空间金字塔不同层特征得到的识别率混淆矩阵 Fig. 6 Recognition confusion matrix of different image pyramid layers 通过观察图像金字塔各层特征的识别率可以看 到,3 层特征的平均识别率呈递减趋势,这是因为图像 金字塔中不同层数的图像分割块数依次变少。 图像金 字塔第 1 层的图像分割块数最多,它比其他 2 层更能 描述特征点的分布特性。 本文用遍历所有权值组合的 方法得到了最佳识别率下的各层权值,具体过程为设 权值矩阵为 A=[a1 a2 a3],其中 ai∈[0.1, 1.0](i =1,2, 3),变化率为 Δ = 0.1,所有权值组合数为 10 3 = 1 000。 通过实验,选取各层特征的权值分别为 0.5、0.5 和 0.2, 此时系统具有最高的识别率。 4.3 实验结果与其他文献的比较 利用测试得到的最佳参数,重新从数据库中选 取 12 个人的 40 张手语图像进行实验。 得到各个手 语的识别混淆矩阵如图 7 所示,可以看到,融合后的 特征的识别率得到进一步改善。 图 7 最佳参数下不同手语手势识别率混淆矩阵 Fig. 7 Recognition confusion matrix with optimal parameters 将本文的手势识别方法与在 Jochen Triesch 数 据库中简单背景进行测试的其他方法进行比较,比 较结果见表 2 所示。 从实验结果中可以看出,提出 的方法识别准确率高于文献[16-17]的手势识别方 法。 实验结果验证了空间金字塔与直方图相交核支 持向量机应用在手势识别系统中的优越性。 表 2 不同方法的识别结果 Table 2 Comparison results of different methods % 算法 识别方法 识别结果 张秋余的方法[17] BoF⁃SIFT 特征+ RBF 核支持向量机 81.67 A. Just 的方法[16] MCT 特征+AdaBoost 89.97 实验 1 BoF⁃SIFT 特征+ 直方图相交核支持向量机 86.25 实验 2 空间金字塔特征包+ RBF 核支持向量机 86.67 本文方法 空间金字塔特征包+ 直方图相交核支持向量机 92.92 第 3 期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·433·
·434 智能系统学报 第10卷 [6]DARDAS N H,GEORGANAS N D.Real-time hand gesture 5 结束语 detection and recognition using bag-of-features and support 本文提出了一种基于空间金字塔特征包的特征 vector machine techniques[J].IEEE Transaction on Instru- 对手势图像进行表示,该方法相比于传统的BoF mentation and Measurement,2011,60(11):3592-3607. SIFT方法的优势在于能同时从局部和全局描述手 [7]JIANG Yugang,NGO C W,YANG Jun.Towards optimal 势图像的特征点,还能描述特征点的分布特性。采 bag-of-features for object categorization and semantic video 用直方图相交核支持向量机对所提取特征进行识 retrieval[C]//Proceedings of the 6th ACM International 别,该方法的优点在于无需选择参数,增加了系统的 Conference on Image and Video Retrieval.New York,USA, 稳定性。实验表明了新方法的有效性。后续工作将 2007:494-501. 考虑与其他识别算法的融合,以进一步提高识别的 [8]CHUANG Yuelong,CHEN Ling,CHEN Gencai.Hierarchi- cal bag-of-features for hand gesture recognition[C]//Pro- 准确率。 ceedings of 18th IEEE International Conference on Image 参考文献: Processing.Brussels,Belgium,2011:1777-1780. [9]LOWE D G.Distinctive image features from scale-invariant [1]隋云衡,郭元术.融合Hu矩与BoF-SURF支持向量机的 keypoints[J].International Journal of Computer Vision, 手势识别[J].计算机应用研究,2013,31(3):953-956, 2004,60(2):91-110. 960 [10]LAZEBNIK S,SCHMID C,PONCE J.Beyond bags of fea- SUI Yunheng,GUO Yuanshu.Hand gesture recognition tures:Spatial pyramid matching for recognizing natural based on combining Hu moments and BoF-SURF support scene categories[C]//Proceedings of the 2006 IEEE Com- vector machine[J].Application Research of Computers, puter Society Conference on Computer Vision and Pattern 2013,31(3):953-956,960. Recognition.New York,USA,2006:2169-2178. [2]张良国,吴江琴,高文,等.基于Hausdorff距离的手势 [11]ARTHER D,VASSILVITSKII S.K-means++:the advan- 识别[J刀.中国图象图形学报,2002,7(11):1144-1150. tages of careful seeding [C]//Proceedings of the Eigh- ZHANG Liangguo,WU Jiangqin,GAO Wen,et al.Hand teenth Annual ACM-SIAM Symposium on Discrete Algo- gesture recognition based on Hausdorff distance[J].Journal rithms.New York,USA,2007:1027-1035. of Image and Graphics,2002,7(11):1144-1150. [12]易晓梅,吴鹏,刘丽娟,等.一种基于改进支持向量机 [3]黄国范,毛红阁.基于切线距离的中国手指语字母手势 的入侵检测方法研究[J].计算机工程与应用,2012, 识别[J].吉林化工学院学报,2013,30(3):79-81. 48(15):74-77. HUANG Guofan,MAO Hongge.Tangent distance-based YI Xiaomei,WU Peng,LIU Lijuan,et al.Intrusion detec- Chinese finger alphabet gesture recognition[J].Journal of tion method based on improved SVM[J].Computer Engi- Jilin Institute of Chemical Technology,2013,30(3):79- neering and Applications,2012,48(15):74-77. 81 [13]BARLA A,ODONE F,VERRI A.Histogram intersection [4]张汗灵,李红英,周敏.融合多特征和压缩感知的手势 kernel for image classification C//Proceedings of Inter- 识别J].湖南大学学报:自然科学版,2013,40(3):87- national Conference on Image Processing.Barcelona, 92 Spain,2003:513-516. ZHANG Hanling,LI Hongying,ZHOU Min.Hand posture [14]CHANG C C,LIN C J.LIBSVM:a library for support vec- recognition based on multi-feature and compressive sensing tor machines[EB/OL].[2014-05-10].http://www.csie. [J].Journal of Hunan University:Natural Sciences,2013, ntu.edu.tw/cjlin/libsvm. 40(3):87-92. [15]TRIESCH J.MALSBURG C,MARCEL S.Hand posture [5]丁友东,庞海波,吴学纯,等.一种用于手势识别的局 and gesture datasets:Jochen Triesch static hand posture 部均值模式纹理描述子[J].应用科学学报,2013,31 database[EB/OL].[2014-05-10].http://www.idiap.ch/ (5):526-532 resources/gestures/. DING Youdong,PANG Haibo,WU Xuechun,et al.Local [16]JUST A,RODRIGUEZ Y,MARCEL S.Hand posture clas- mean pattern texture descriptor for gesture recognition[J]. sification and recognition using the modified census trans- Journal of Applied Sciences,2013,31(5):526-532. form[C]//Proceedings of the IEEE International Confer-
5 结束语 本文提出了一种基于空间金字塔特征包的特征 对手势图像进行表示,该方法相比于传统的 BoF⁃ SIFT 方法的优势在于能同时从局部和全局描述手 势图像的特征点,还能描述特征点的分布特性。 采 用直方图相交核支持向量机对所提取特征进行识 别,该方法的优点在于无需选择参数,增加了系统的 稳定性。 实验表明了新方法的有效性。 后续工作将 考虑与其他识别算法的融合,以进一步提高识别的 准确率。 参考文献: [1]隋云衡, 郭元术. 融合 Hu 矩与 BoF⁃SURF 支持向量机的 手势识别[J]. 计算机应用研究, 2013, 31(3): 953⁃956, 960. SUI Yunheng, GUO Yuanshu. Hand gesture recognition based on combining Hu moments and BoF⁃SURF support vector machine [ J ]. Application Research of Computers, 2013, 31(3): 953⁃956, 960. [2]张良国, 吴江琴, 高文, 等. 基于 Hausdorff 距离的手势 识别[J]. 中国图象图形学报, 2002, 7(11): 1144⁃1150. ZHANG Liangguo, WU Jiangqin, GAO Wen, et al. Hand gesture recognition based on Hausdorff distance[J]. Journal of Image and Graphics, 2002, 7(11): 1144⁃1150. [3]黄国范, 毛红阁. 基于切线距离的中国手指语字母手势 识别[J]. 吉林化工学院学报, 2013, 30(3): 79⁃81. HUANG Guofan, MAO Hongge. Tangent distance⁃based Chinese finger alphabet gesture recognition [ J]. Journal of Jilin Institute of Chemical Technology, 2013, 30( 3): 79⁃ 81. [4]张汗灵, 李红英, 周敏. 融合多特征和压缩感知的手势 识别[J]. 湖南大学学报:自然科学版, 2013, 40(3): 87⁃ 92. ZHANG Hanling, LI Hongying, ZHOU Min. Hand posture recognition based on multi⁃feature and compressive sensing [J]. Journal of Hunan University: Natural Sciences, 2013, 40(3): 87⁃92. [5]丁友东, 庞海波, 吴学纯, 等. 一种用于手势识别的局 部均值模式纹理描述子[ J]. 应用科学学报, 2013, 31 (5): 526⁃532. DING Youdong, PANG Haibo, WU Xuechun, et al. Local mean pattern texture descriptor for gesture recognition[ J]. Journal of Applied Sciences, 2013, 31(5): 526⁃532. [6]DARDAS N H, GEORGANAS N D. Real⁃time hand gesture detection and recognition using bag⁃of⁃features and support vector machine techniques[J]. IEEE Transaction on Instru⁃ mentation and Measurement, 2011, 60(11): 3592⁃3607. [7] JIANG Yugang, NGO C W, YANG Jun. Towards optimal bag⁃of⁃features for object categorization and semantic video retrieval[ C] / / Proceedings of the 6th ACM International Conference on Image and Video Retrieval. New York, USA, 2007: 494⁃501. [8]CHUANG Yuelong, CHEN Ling, CHEN Gencai. Hierarchi⁃ cal bag⁃of⁃features for hand gesture recognition [ C] / / Pro⁃ ceedings of 18th IEEE International Conference on Image Processing. Brussels, Belgium, 2011: 1777⁃1780. [9]LOWE D G. Distinctive image features from scale⁃invariant keypoints [ J ]. International Journal of Computer Vision, 2004, 60(2): 91⁃110. [10]LAZEBNIK S, SCHMID C, PONCE J. Beyond bags of fea⁃ tures: Spatial pyramid matching for recognizing natural scene categories[C] / / Proceedings of the 2006 IEEE Com⁃ puter Society Conference on Computer Vision and Pattern Recognition. New York, USA, 2006: 2169⁃2178. [11]ARTHER D, VASSILVITSKII S. K⁃means++: the advan⁃ tages of careful seeding [ C] / / Proceedings of the Eigh⁃ teenth Annual ACM⁃SIAM Symposium on Discrete Algo⁃ rithms. New York, USA, 2007: 1027⁃1035. [12]易晓梅, 吴鹏, 刘丽娟, 等. 一种基于改进支持向量机 的入侵检测方法研究[ J]. 计算机工程与应用, 2012, 48(15): 74⁃77. YI Xiaomei, WU Peng, LIU Lijuan, et al. Intrusion detec⁃ tion method based on improved SVM[ J]. Computer Engi⁃ neering and Applications, 2012, 48(15): 74⁃77. [13]BARLA A, ODONE F, VERRI A. Histogram intersection kernel for image classification[C] / / Proceedings of Inter⁃ national Conference on Image Processing. Barcelona, Spain, 2003: 513⁃516. [14]CHANG C C, LIN C J. LIBSVM: a library for support vec⁃ tor machines[EB/ OL]. [ 2014⁃05⁃10]. http: / / www. csie. ntu.edu.tw/ cjlin / libsvm. [15] TRIESCH J, MALSBURG C, MARCEL S. Hand posture and gesture datasets: Jochen Triesch static hand posture database[EB/ OL]. [2014⁃05⁃10]. http: / / www.idiap.ch / resources/ gestures/ . [16]JUST A, RODRIGUEZ Y, MARCEL S. Hand posture clas⁃ sification and recognition using the modified census trans⁃ form[C] / / Proceedings of the IEEE International Confer⁃ ·434· 智 能 系 统 学 报 第 10 卷
第3期 余思泉,等:基于空间金字塔特征包的手势识别算法 .435. ence on Automatic Face and Gesture Recognition.South- 曹江涛,男,1978年生,教授、博士, ampton,UK,2006:351-356. 中国自动化学会机器人专业委员会委 [17]张秋余,王道东,张墨逸,等.基于特征包支持向量机 员和青工委委员,主要研究方向为智能 的手势识别[J].计算机应用,2012,32(12):3392 方法及其在工业控制和视频信息处理 3396. 上的应用。承担国家自然科学基金等 ZHANG Qiuyu,WANG Daogdong,ZHANG Moyi,et al. 项目多项,发表学术论文40余篇,其中 被SC检索6篇,EI检索22篇。 Hand gesture recognition based on bag of features and sup- port vector machine[J].Journal of Computer Applications, 2012,32(12):3392-3396. 李平,男,1964年生,教授,博士生 作者简介: 导师,EEE高级会员,中国自动化学会 余思泉,男,1988年生,硕士研究 过程控制专业委员会委员,主要研究方 生,主要研究方向为图像处理、模式识 向为工业过程的先进控制理论及其应 别,申请发明专利2项。 用。承担国家“863”计划项目、国家自 然科学基金等项目多项,发表学术论 文100余篇,其中被SCI,EI检索50余篇。 2015第8届计算智能与设计国际会议(ISCID2015) 2015 8th International Symposium on Computational Intelligence and Design (ISCID 2015) 12-13 December,2015,Hangzhou,China 2015 8th International Symposium on Computational Intelligence and Design(ISCID 2015)will take place in Hangzhou, China,between 12-13 December,2015.This symposium provides an idea-exchange and discussion platform for the world 's engineers and academia to share cutting-edge information,address the hottest issue in computational intelligence and de- sign,explore new technologies,exchange and build upon ideas.We're certain you will find the city of Hangzhou and the surrounding area to be most pleasant and it will be our distinct pleasure to welcome each of you to the ISCID. The proceedings of ISCID 2015 will be published by the IEEE Computer Society's Conference Publishing Service (CPS), and submit to EI.All proceedings of ISCID 2008-2013 have been indexed by EI,and included in the digital libraries (CSDL,IEEE Xplore,IEEE IEL). Important Dates: Full paper submission:July 10,2015 Acceptance Notification:September 10,2015 Camera-ready papers:October 1,2015 Conference:December 12-13,2015 Contact Us: If you have any question,please feel free to contact: Mr.Yongxing He Affiliation:College of Computer Science at Zhejiang University Email:iscid2015@163.com Phone:+8615068186792
文 100 余篇,其中被SCI、EI 检索 50 余篇。 被 SCI 检索 6篇、EI 检索 22 篇。 ence on Automatic Face and Gesture Recognition. South⁃ ampton, UK, 2006: 351⁃356. [17]张秋余, 王道东, 张墨逸, 等. 基于特征包支持向量机 的手势识别[ J]. 计算机应用, 2012, 32( 12): 3392⁃ 3396. ZHANG Qiuyu, WANG Daogdong, ZHANG Moyi, et al. Hand gesture recognition based on bag of features and sup⁃ port vector machine[J]. Journal of Computer Applications, 2012, 32(12): 3392⁃3396. 作者简介: 余思泉,男,1988 年生,硕士研究 生,主要研究方向为图像处理、模式识 别,申请发明专利 2 项。 曹江涛,男,1978 年生,教授、博士, 中国自动化学会机器人专业委员会委 员和青工委委员,主要研究方向为智能 方法及其在工业控制和视频信息处理 上的应用。 承担国家自然科学基金等 李平,男,1964 年生,教授,博士生 导师,IEEE 高级会员,中国自动化学会 过程控制专业委员会委员,主要研究方 向为工业过程的先进控制理论及其应 用。 承担国家“ 863” 计划项目、国家自 2015 第 8 届计算智能与设计国际会议( ISCID 2015) 2015 8th International Symposium on Computational Intelligence and Design ( ISCID 2015) 12-13 December, 2015, Hangzhou, China 2015 8th International Symposium on Computational Intelligence and Design (ISCID 2015) will take place in Hangzhou, China, between 12-13 December, 2015. This symposium provides an idea⁃exchange and discussion platform for the world 's engineers and academia to share cutting⁃edge information, address the hottest issue in computational intelligence and de⁃ sign, explore new technologies, exchange and build upon ideas. We're certain you will find the city of Hangzhou and the surrounding area to be most pleasant and it will be our distinct pleasure to welcome each of you to the ISCID. The proceedings of ISCID 2015 will be published by the IEEE Computer Society's Conference Publishing Service (CPS), and submit to EI. All proceedings of ISCID 2008-2013 have been indexed by EI, and included in the digital libraries (CSDL, IEEE Xplore, IEEE IEL). Important Dates: Full paper submission: July 10, 2015 Acceptance Notification: September 10, 2015 Camera⁃ready papers: October 1, 2015 Conference: December 12-13, 2015 Contact Us: If you have any question, please feel free to contact: Mr. Yongxing He Affiliation: College of Computer Science at Zhejiang University Email: iscid2015@ 163.com Phone: +86 15068186792 第 3 期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·435· 项目多项,发表学术论文 40 余篇,其中 然科学基金等项目多项,发表学术论