正在加载图片...
第2期 刘帅师,等:鲁棒的正则化编码随机遮挡表情识别 ·265· 数据库中的原始人脸表情图像尺寸为640×490。两 KNNU4(K-nearest neighbor)、SVMs1、SRCo 数据库中的表情图像进行尺寸归一化128×104,利 (sparse representation-based classifier)GSRCI6 用直方图均衡化来增强表情图像某些区域的局部对 (gabor feature based sparse representation)与本文方 比度,如图4所示。 法在以下两种数据库进行对比。 2.2结果分析 表1和表2分别表示的是本文提出的方法与其 他方法分别在JAFFE数据库上和在Cohn-Kanade 数据库上对应不同遮挡级别的平均识别率。 表1不同方法在JAFFE数据库上的识别率 Table 1 The accuracies of different methods on JAFFE 遮挡级别 本文方法 KNN SVM SRC GSRC 0 96.05 85.57 89.47 90.79 92.11 0.1 96.05 84.2688.1690.79 91.52 0.2 94.47 81.5886.84 88.16 89.47 (a)JAFFE 0.3 93.25 80.5583.6786.8488.16 0.4 90.06 84.2688.1690.79 91.52 0.5 89.57 80.5583.67 86.84 88.16 0.6 85.53 75.00 77.32 79.78 81.58 0.7 61.84 57.43 58.82 59.23 60.32 0.8 53.33 47.2348.6449.42 51.67 0.9 22.81 18.1419.3220.43 21.76 表2不同方法在Cohn-Kanade数据库上的识别率 Table 2 The accuracies of different methods on Cohn-Ka- nade % (b)Cohn-Kanade 遮挡级别 本文方法KNN SVM SRC GSRC 图4实验用的两数据库中的部分随机遮挡表情图像 0 98.10 86.8491.2392.79 93.21 Fig.4 Some samples of occluded facial images in two data- bases 0.1 98.10 84.35 89.32 90.23 92.79 与其他的影响因素不同,如姿势的变化,它的 0.2 97.62 82.12 85.93 88.69 89.23 变化特点是可以事先预测判别出来的。然而,面部 0.3 96.19 79.9884.13 85.97 88.69 遮挡是特别难以处理的,因为它具有随机性的特 0.4 94.29 86.8491.23 92.79 93.21 点,也就是说,遮挡可以发生在人脸表情图像的任 0.5 93.33 75.21 79.87 82.46 84.27 意位置并且大小也是任意的。我们对于遮挡发生的 位置和遮挡面积的大小没有任何明确的先验知识。 0.6 92.86 73.87 74.97 76.78 78.87 关于遮挡唯一有的先验信息就是遮挡毁坏的像素点 0.7 70.48 68.1268.9469.23 69.98 可能是彼此相邻的,就是说某个区域的像素点可能 0.8 32.86 27.6428.3229.43 30.76 是连续毁坏。图4表示的两个表情数据中一些在不 0.9 18.10 15.3316.9217.2317.89 同遮挡程度块遮挡级别下的人脸表情图像。遮挡级 别表示的是遮挡的部分占整个人脸表情图像的百分 从表1和表2可看出,随遮挡级别增大人脸表 比是多少。所以遮挡级别是正数并且处于[0,1],遮 情的识别率逐渐减小,符合人们的感性认识。表情 挡级别为0表示图像没有被遮挡,1表示图像全部 识别方法在遮挡级别为0.1~0.5会取得较理想的识 被遮挡,例如:遮挡级别0.1表示图像的10%被遮挡。 别效果。由于训练样本和测试样本用自身像素值不 基于稀疏表示的人脸表情识别方法最重要特点是对 需特征提取过程,KNN和SVM方法在遮挡级别 于人脸遮挡具有鲁棒性。为更好地验证本文提出的 很大时没有很好的识别效果。且这两种方法要结合 方法对于随机遮挡的鲁棒性,采用表情识别方法: 提取较好区分性特征的提取方法才可发挥较好的分数据库中的原始人脸表情图像尺寸为 640×490。两 数据库中的表情图像进行尺寸归一化 128×104,利 用直方图均衡化来增强表情图像某些区域的局部对 比度,如图 4 所示。 (a) JAFFE (b) Cohn-Kanade 图 4 实验用的两数据库中的部分随机遮挡表情图像 Fig. 4 Some samples of occluded facial images in two data￾bases 与其他的影响因素不同,如姿势的变化,它的 变化特点是可以事先预测判别出来的。然而,面部 遮挡是特别难以处理的,因为它具有随机性的特 点,也就是说,遮挡可以发生在人脸表情图像的任 意位置并且大小也是任意的。我们对于遮挡发生的 位置和遮挡面积的大小没有任何明确的先验知识。 关于遮挡唯一有的先验信息就是遮挡毁坏的像素点 可能是彼此相邻的,就是说某个区域的像素点可能 是连续毁坏。图 4 表示的两个表情数据中一些在不 同遮挡程度块遮挡级别下的人脸表情图像。遮挡级 别表示的是遮挡的部分占整个人脸表情图像的百分 比是多少。所以遮挡级别是正数并且处于[0,1],遮 挡级别为 0 表示图像没有被遮挡,1 表示图像全部 被遮挡,例如:遮挡级别 0.1 表示图像的 10% 被遮挡。 基于稀疏表示的人脸表情识别方法最重要特点是对 于人脸遮挡具有鲁棒性。为更好地验证本文提出的 方法对于随机遮挡的鲁棒性,采用表情识别方法: KNN[ 1 4 ] (K-nearest neighbor)、SVM[ 1 5 ] 、SRC[ 1 0 ] (sparse representation-based classifier)、GSRC[16] (gabor feature based sparse representation) 与本文方 法在以下两种数据库进行对比。 2.2 结果分析 表 1 和表 2 分别表示的是本文提出的方法与其 他方法分别在 JAFFE 数据库上和在 Cohn-Kanade 数据库上对应不同遮挡级别的平均识别率。 表 1 不同方法在 JAFFE 数据库上的识别率 Table 1 The accuracies of different methods on JAFFE % 遮挡级别 本文方法 KNN SVM SRC GSRC 0 96.05 85.57 89.47 90.79 92.11 0.1 96.05 84.26 88.16 90.79 91.52 0.2 94.47 81.58 86.84 88.16 89.47 0.3 93.25 80.55 83.67 86.84 88.16 0.4 90.06 84.26 88.16 90.79 91.52 0.5 89.57 80.55 83.67 86.84 88.16 0.6 85.53 75.00 77.32 79.78 81.58 0.7 61.84 57.43 58.82 59.23 60.32 0.8 53.33 47.23 48.64 49.42 51.67 0.9 22.81 18.14 19.32 20.43 21.76 表 2 不同方法在 Cohn-Kanade 数据库上的识别率 Table 2 The accuracies of different methods on Cohn-Ka￾nade % 遮挡级别 本文方法 KNN SVM SRC GSRC 0 98.10 86.84 91.23 92.79 93.21 0.1 98.10 84.35 89.32 90.23 92.79 0.2 97.62 82.12 85.93 88.69 89.23 0.3 96.19 79.98 84.13 85.97 88.69 0.4 94.29 86.84 91.23 92.79 93.21 0.5 93.33 75.21 79.87 82.46 84.27 0.6 92.86 73.87 74.97 76.78 78.87 0.7 70.48 68.12 68.94 69.23 69.98 0.8 32.86 27.64 28.32 29.43 30.76 0.9 18.10 15.33 16.92 17.23 17.89 从表 1 和表 2 可看出,随遮挡级别增大人脸表 情的识别率逐渐减小,符合人们的感性认识。表情 识别方法在遮挡级别为 0.1~0.5 会取得较理想的识 别效果。由于训练样本和测试样本用自身像素值不 需特征提取过程,KNN[16]和 SVM[17]方法在遮挡级别 很大时没有很好的识别效果。且这两种方法要结合 提取较好区分性特征的提取方法才可发挥较好的分 第 2 期 刘帅师,等:鲁棒的正则化编码随机遮挡表情识别 ·265·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有