正在加载图片...
第3期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·433. A B C D G H I L V Y 描述特征点的分布特性。本文用遍历所有权值组合的 A1.000.000.000.000.000.000.000.000.000.00 方法得到了最佳识别率下的各层权值,具体过程为设 B0.000.920.000.080.000.000.000.000.000.00 权值矩阵为A=[a1a2a3],其中a,∈[0.1,1.0](i=1,2 C0.000.000.960.040.000.000.000.000.000.00 3),变化率为△=0.1,所有权值组合数为103=1000。 D0.000.000.000.960.000.000.040.000.000.00 通过实验,选取各层特征的权值分别为0.5、0.5和0.2, G0.000.000.000.000.710.290.000.000.000.00 此时系统具有最高的识别率。 H0.000.000.000.000.290.710.000.000.000.00 4.3实验结果与其他文献的比较 10.000.040.000.000.000.000.920.040.000.00 利用测试得到的最佳参数,重新从数据库中选 L0.080.000.000.000.000.000.000.920.000.00 取12个人的40张手语图像进行实验。得到各个手 V0.000.040.000.000.000.000.000.080.880.00 语的识别混淆矩阵如图7所示,可以看到,融合后的 0.000.000.000.000.000.000.040.080.000.88 特征的识别率得到进一步改善。 (a)第1层 B CD G H I L V Y A1.000.000.000.000.000.000.000.000.000.0g A B CD GHILVY B0.000.960.000.000.000.000.000.000.040.0g A1.000.000.000.000.000.000.000.000.000.00 C0.000.001.000.000.000.000.000.000.000.0g B0.000.880.000.080.000.000.000.000.040.00 D0.000.000.000.960.000.000.040.000.000.00 C0.000.000.960.040.000.000.000.000.000.00 G 0.000.000.000.000.880.130.000.000.000.0g D0.000.000.000.960.000.000.000.000.040.00 H 0.000.000.000.000.170.830.000.000.000.0g G0.000.000.000.000.710.290.000.000.000.00 0.000.000.000.040.000.000.960.000.000.00 H0.000.000.000.000.330.67 0.000.000.000.00 0.080.000.000.000.000.000.000.920.000.00 0.040.040.000.000.000.000.920.000.000.00 0.000.080.000.000.000.000.000.000.920.00 0.080.000.000.000.000.000.000.920.000.00 0.040.000.000.000.000.000.080.000.000.88 V0.000.040.000.000.000.000.000.000.960.00 图7最佳参数下不同手语手势识别率混淆矩阵 0.040.000.000.040.000.000.040.040.000.83 Fig.7 Recognition confusion matrix with optimal parameters (b)第2层 将本文的手势识别方法与在Jochen Triesch数 A B C D G H I L V Y A0.880.000.000.000.000.000.040.040.040.00 据库中简单背景进行测试的其他方法进行比较,比 B0.000.920.000.000.000.000.040.000.040.00 较结果见表2所示。从实验结果中可以看出,提出 c0.000.000.960.040.000.000.000.000.000.00 的方法识别准确率高于文献[16-17]的手势识别方 D0.000.000.000.920.000.000.040.000.040.00 法。实验结果验证了空间金字塔与直方图相交核支 G0.000.000.000.000.730.250.000.000.000.00 持向量机应用在手势识别系统中的优越性。 H0.000.000.000.000.330.670.000.000.000.00 表2不同方法的识别结果 10.040.040.000.040.000.000.880.000.000.00 Table 2 Comparison results of different methods % 0.130.040.000.000.000.000.000.790.000.04 算法 识别方法 识别结果 0.000.130.000.000.000.000.040.000.830.00 BoF-SIFT特征+ y0.130.000.000.000.000.000.000.040.000.83 张秋余的方法[] 81.67 RBF核支持向量机 (c)第3层 A.Just的方法[o MCT特征+AdaBoost 89.97 图6空间金字塔不同层特征得到的识别率混淆矩阵 Fig.6 Recognition confusion matrix of different image BoF-SIFT特征+ 实验1 86.25 pyramid layers 直方图相交核支持向量机 空间金字塔特征包+ 通过观察图像金字塔各层特征的识别率可以看 实验2 86.67 RBF核支持向量机 到,3层特征的平均识别率呈递减趋势,这是因为图像 金字塔中不同层数的图像分割块数依次变少。图像金 空间金字塔特征包+ 本文方法 92.92 字塔第1层的图像分割块数最多,它比其他2层更能 直方图相交核支持向量机(a)第 1 层 (b)第 2 层 (c)第 3 层 图 6 空间金字塔不同层特征得到的识别率混淆矩阵 Fig. 6 Recognition confusion matrix of different image pyramid layers 通过观察图像金字塔各层特征的识别率可以看 到,3 层特征的平均识别率呈递减趋势,这是因为图像 金字塔中不同层数的图像分割块数依次变少。 图像金 字塔第 1 层的图像分割块数最多,它比其他 2 层更能 描述特征点的分布特性。 本文用遍历所有权值组合的 方法得到了最佳识别率下的各层权值,具体过程为设 权值矩阵为 A=[a1 a2 a3],其中 ai∈[0.1, 1.0](i =1,2, 3),变化率为 Δ = 0.1,所有权值组合数为 10 3 = 1 000。 通过实验,选取各层特征的权值分别为 0.5、0.5 和 0.2, 此时系统具有最高的识别率。 4.3 实验结果与其他文献的比较 利用测试得到的最佳参数,重新从数据库中选 取 12 个人的 40 张手语图像进行实验。 得到各个手 语的识别混淆矩阵如图 7 所示,可以看到,融合后的 特征的识别率得到进一步改善。 图 7 最佳参数下不同手语手势识别率混淆矩阵 Fig. 7 Recognition confusion matrix with optimal parameters 将本文的手势识别方法与在 Jochen Triesch 数 据库中简单背景进行测试的其他方法进行比较,比 较结果见表 2 所示。 从实验结果中可以看出,提出 的方法识别准确率高于文献[16-17]的手势识别方 法。 实验结果验证了空间金字塔与直方图相交核支 持向量机应用在手势识别系统中的优越性。 表 2 不同方法的识别结果 Table 2 Comparison results of different methods % 算法 识别方法 识别结果 张秋余的方法[17] BoF⁃SIFT 特征+ RBF 核支持向量机 81.67 A. Just 的方法[16] MCT 特征+AdaBoost 89.97 实验 1 BoF⁃SIFT 特征+ 直方图相交核支持向量机 86.25 实验 2 空间金字塔特征包+ RBF 核支持向量机 86.67 本文方法 空间金字塔特征包+ 直方图相交核支持向量机 92.92 第 3 期 余思泉,等:基于空间金字塔特征包的手势识别算法 ·433·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有