正在加载图片...
·426 智能系统学报 第10卷 本文采用中心最近邻分类器进行表情识别,具体 多个方向多个尺度提取表情特征,但运行时间长,特 实现步骤参考文献[18],文中不再详述。采用熟悉人 征维数巨大,选择的特征降维方法能否最大程度去除 脸样本选择方式进行实验仿真,任选1幅图像作为测 冗余保留有效信息对识别率有重要影响。 试样本,剩余图像作为训练样本,交叉验证N次 表2在JAFFE数据库上不同算子的识别率 (JAFFE数据库中N=180,CK数据库中N=1665)。 采用这种样本选择方式可以最大程度选择所有数据 Table 2 Expression recognition performance with different methods on JAFFE database 作为测试样本,以确保每幅图像的表情特征都被考虑 到,实验结果更具有真实性。 表情 LBP算子Gabor算子 DLBP算子 3.1子图像尺寸大小对算法的影响 愤怒 96.67 73.33 90.00 首先分析子图像尺寸大小对分类准确性的影 厌恶 83.33 80.00 86.67 响。将人脸表情图像平均分割成1×1、2×2、4×4、8× 恐惧 80.00 86.67 93.33 8、16×16个子图像,划分的子图像个数越多,尺寸越 高兴 93.33 90.00 96.67 小。考虑CK数据库样本多,程序运行时间长,因此 悲伤 73.33 80.00 73.33 采用JAFFE数据库使用DLBP算子分别对每种分 惊讶 76.67 90.00 90.00 割情况进行仿真实验,结果如表1所示。 平均识别率 83.89 83.33 88.33 表1不同子图像个数下DLBP算子的识别率 表3在CK数据库上不同算子的识别率 Table 1 Recognition performance for different number of regions Table 3 Expression recognition performance with 分块数 识别率/% different methods on CK database % 1×1 48.33 表情 LBP算子 Gabor算子 DLBP算子 2×2 75.00 愤怒 96.74 91.16 96.28 4×4 84.44 厌恶 94.44 96.67 95.56 8x8 88.33 恐惧 97.62 91.43 98.10 16×16 87.78 高兴 97.00 98.00 98.00 悲伤 95.00 98.00 95.00 从表中可以看出,将128×128大小的图像平均 惊讶 98.33 96.67 98.61 分为8×8=64个子图像效果最佳,子图像的个数过 平均识别率 96.70 95.86 97.12 多或过少都会对识别率造成影响。子图像个数过 少,每个子图像尺寸则较大,DLBP算子无法准确提 3.3DLBP算子对噪声的鲁棒性能分析 取局部细节特征:子图像个数过多,每个子图像尺寸 以JAFFE数据库为例,在图像中加人高斯白噪 则较小,各个子图像间的DLBP特征有冗余,影响分 声和椒盐噪声,噪声的方差由小到大逐渐增加,分析 类效果。 其对LBP算子和DLBP算子的影响。识别率的变 3.2DLBP算子与LBP、Gabor算子的性能比较 化情况如图9和10所示。 本小节进一步比较DLBP算子与LBP算子 Gabor算子[6]在人脸表情识别中的性能优劣,采用 90r 文献[16]中的降维方法得到Gabor特征。LBP算子 85 bEBP 和DLBP算子编码邻域大小为3×3,采用表1中最 80 佳分块参数,分别在JAFFE数据库和CK数据库上 进行实验仿真,实验结果如表2和3所示。 15 从表2和3可以看出,无论对JAFFE数据库还是 汤 CK数据库,DLBP算子均有较强的表情特征提取能 65 力,识别率均高于LBP算子和Gabor算子。这是由于 DLBP算子通过编码邻域像素间的灰度差异快速捕 606广234567890x10 捉到丰富的纹理信息,相比传统LBP算子仅比较邻 图9高斯白噪声下JAFFE数据库的LBP和DLBP识别率 域点与中心像素点之间的灰度差异,可以更好地提高 Fig.9 LBP and DLBP recognition performance with 人脸表情的鉴别能力。同时,Gabor算子虽然可以从 Gaussian white noise on JAFFE database本文采用中心最近邻分类器进行表情识别,具体 实现步骤参考文献[18],文中不再详述。 采用熟悉人 脸样本选择方式进行实验仿真,任选 1 幅图像作为测 试样本,剩余图像作为训练样本,交叉验证 N 次 (JAFFE 数据库中 N = 180,CK 数据库中 N = 1 665)。 采用这种样本选择方式可以最大程度选择所有数据 作为测试样本,以确保每幅图像的表情特征都被考虑 到,实验结果更具有真实性。 3.1 子图像尺寸大小对算法的影响 首先分析子图像尺寸大小对分类准确性的影 响。 将人脸表情图像平均分割成 1×1、2×2、4×4、8× 8、16×16 个子图像,划分的子图像个数越多,尺寸越 小。 考虑 CK 数据库样本多,程序运行时间长,因此 采用 JAFFE 数据库使用 DLBP 算子分别对每种分 割情况进行仿真实验,结果如表 1 所示。 表 1 不同子图像个数下 DLBP 算子的识别率 Table 1 Recognition performance for different number of regions 分块数 识别率/ % 1×1 48.33 2×2 75.00 4×4 84.44 8×8 88.33 16×16 87.78 从表中可以看出,将 128×128 大小的图像平均 分为 8×8 = 64 个子图像效果最佳,子图像的个数过 多或过少都会对识别率造成影响。 子图像个数过 少,每个子图像尺寸则较大,DLBP 算子无法准确提 取局部细节特征;子图像个数过多,每个子图像尺寸 则较小,各个子图像间的 DLBP 特征有冗余,影响分 类效果。 3.2 DLBP 算子与 LBP、Gabor 算子的性能比较 本小节进一步比较 DLBP 算子与 LBP 算子、 Gabor 算子[16]在人脸表情识别中的性能优劣,采用 文献[16]中的降维方法得到 Gabor 特征。 LBP 算子 和 DLBP 算子编码邻域大小为 3×3,采用表 1 中最 佳分块参数,分别在 JAFFE 数据库和 CK 数据库上 进行实验仿真,实验结果如表 2 和 3 所示。 从表2 和3 可以看出,无论对 JAFFE 数据库还是 CK 数据库,DLBP 算子均有较强的表情特征提取能 力,识别率均高于 LBP 算子和 Gabor 算子。 这是由于 DLBP 算子通过编码邻域像素间的灰度差异快速捕 捉到丰富的纹理信息,相比传统 LBP 算子仅比较邻 域点与中心像素点之间的灰度差异,可以更好地提高 人脸表情的鉴别能力。 同时,Gabor 算子虽然可以从 多个方向多个尺度提取表情特征,但运行时间长,特 征维数巨大,选择的特征降维方法能否最大程度去除 冗余保留有效信息对识别率有重要影响。 表 2 在 JAFFE 数据库上不同算子的识别率 Table 2 Expression recognition performance with different methods on JAFFE database % 表情 LBP 算子 Gabor 算子 DLBP 算子 愤怒 96.67 73.33 90.00 厌恶 83.33 80.00 86.67 恐惧 80.00 86.67 93.33 高兴 93.33 90.00 96.67 悲伤 73.33 80.00 73.33 惊讶 76.67 90.00 90.00 平均识别率 83.89 83.33 88.33 表 3 在 CK 数据库上不同算子的识别率 Table 3 Expression recognition performance with different methods on CK database % 表情 LBP 算子 Gabor 算子 DLBP 算子 愤怒 96.74 91.16 96.28 厌恶 94.44 96.67 95.56 恐惧 97.62 91.43 98.10 高兴 97.00 98.00 98.00 悲伤 95.00 98.00 95.00 惊讶 98.33 96.67 98.61 平均识别率 96.70 95.86 97.12 3.3 DLBP 算子对噪声的鲁棒性能分析 以 JAFFE 数据库为例,在图像中加入高斯白噪 声和椒盐噪声,噪声的方差由小到大逐渐增加,分析 其对 LBP 算子和 DLBP 算子的影响。 识别率的变 化情况如图 9 和 10 所示。 图 9 高斯白噪声下 JAFFE 数据库的 LBP 和 DLBP 识别率 Fig. 9 LBP and DLBP recognition performance with Gaussian white noise on JAFFE database ·426· 智 能 系 统 学 报 第 10 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有