·60 智能系统学报 第3卷 再利用式(9)投影到特征空间上,最后使用K近邻 本测试实验与Michael等1的测试方法相同 法与1.3中使用C均值聚类得到的表情模板进行 把数据库中的213张图像分成10部分,每次使用其 比较,以达到对该表情分类的目的.K近邻法与C 中的9部分训练,剩下的1部分测试.循环测试10 均值聚类方法联合使用,考虑了同种表情的表现多 次,然后对这10次取平均值,得出正确识别率,由于 样性,能够有效地提高表情的识别率 C均值算法的C取值和K近邻的K取值不同,识 1.5表情识别的整体流程 别率有所不同,实验结果见表1 表情识别的全部过程见图3.所有的图像首先 都要进行Gabor小波变换,然后对训练图像进行训 表1C均值K近邻算法的不同取值的实验结果 Table 1 Performance of Gmeans cluster and 练得到特征空间,标准的表情图像在该特征空间中 Knearest neighbor algorithm 进行C均值聚类得到表情模板,待识别的表情图像 在该特征空间中与表情模板匹配从而实现该幅表情 K 图像的分类 2 3 5 6 91.0 91.0 91.0 91.0 91.0 91.0 标准的表 参加练的 一幅待识别 情图像 表情图像 、的表情图像 2 91.3 91.3 91.7 91.9 91.9 91.9 Gabor小波变换 Gabor小波变换 Gabor小波变换 3 92.8 92.893.2 93.1 93.1 93.0 训练特征空间 4 95.2 95.2 95.5 95.8 95.3 95.3 特 5 94.2 94.2 94.3 94.4 94.4 特征空 94.3 C均值聚类 6 93.193.1 93.393.5 93.593.4 [表特模板匹配 由表1的实验数据可以看出,采用把每个表情 表情分类) 类分成多个子表情类的方法,由于充分利用了每种 表情类之间的差异信息,因此能够提高识别率,K 的取值对识别率影响不大,识别率主要取决于C的 图3表情识别的全部过程 取值,即每种表情聚成的子类个数.随着C的取值 Fig 3 Process of facial expression recognition 从1逐渐增大,识别率也随着提高,但是当C的取 2 测试实验 值超过某一个数值之后识别率又开始下降.这是因 为当聚类的数目很多时,每类的图像数目变少,聚类 测试实验使用了日本女人表情数据库(Japa 所形成的表情模板受到了人相貌的影响,影响了表 nese female facial expression JAFFE).该数据库包 情识别的准确率.从表1看出当C=4,K=4时,达 含了10个日本女人的213幅表情图像,每个人7种 到最高识别率95.8%.该识别率高于文献[16]92% 表情,包括高兴、生气、恐惧、厌恶、害怕、悲伤和中性 的识别率.此时输入的表情与被识别出的表情的混 表情,每个人的同一种表情图像有3~4幅.JAFFE 淆矩阵(confusion matrix)见表2. 的部分表情图像如图4所示,其表情依次为中性、生 气、厌恶恐惧、高兴、悲伤、惊讶 表2C=4,K=4时的混淆矩阵 Table 2 Confusion matrix when C=4 and K=4 0 高兴厌恶生气恐惧惊讶悲伤中性 高兴 31 0 0 0 0 0 0 厌恶 0 29 0 1 0 生气 0 0 28 0 0 1 0 恐惧 0 0 0 30 2 0 0 惊讶 0 0 2 28 0 0 悲伤 0 0 1 0 29 1 图4 JAFFE表情图像数据库中的表情样本 中性 0 0 0 0 0 0 29 Fig,4 Expression samples in JAFFE expression database I:识别输入(recognition input);O:识别输出(recogni- tion output) 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved. http://www.cnki.net再利用式(9) 投影到特征空间上 ,最后使用 K 近邻 法与 11 3 中使用 C 均值聚类得到的表情模板进行 比较 ,以达到对该表情分类的目的. K 近邻法与 C 均值聚类方法联合使用 ,考虑了同种表情的表现多 样性 ,能够有效地提高表情的识别率. 115 表情识别的整体流程 表情识别的全部过程见图 3. 所有的图像首先 都要进行 Gabor 小波变换 ,然后对训练图像进行训 练得到特征空间 ,标准的表情图像在该特征空间中 进行 C 均值聚类得到表情模板 ,待识别的表情图像 在该特征空间中与表情模板匹配从而实现该幅表情 图像的分类. 图 3 表情识别的全部过程 Fig13 Process of facial expression recognition 2 测试实验 测试实验使用了日本女人表情数据库 (J apa2 nese female facial expression ,J A FFE) . 该数据库包 含了 10 个日本女人的 213 幅表情图像 ,每个人 7 种 表情 ,包括高兴、生气、恐惧、厌恶、害怕、悲伤和中性 表情 ,每个人的同一种表情图像有 3~4 幅.J AFFE 的部分表情图像如图 4 所示 ,其表情依次为中性、生 气、厌恶、恐惧、高兴、悲伤、惊讶. 图 4 J AFFE 表情图像数据库中的表情样本 Fig14 Expression samples in J AFFE expression database 本测试实验与 Michael 等[ 16 ] 的测试方法相同 , 把数据库中的 213 张图像分成 10 部分 ,每次使用其 中的 9 部分训练 ,剩下的 1 部分测试. 循环测试 10 次 ,然后对这 10 次取平均值 ,得出正确识别率. 由于 C均值算法的 C 取值和 K 近邻的 K 取值不同 ,识 别率有所不同 ,实验结果见表 1. 表 1 C均值 K近邻算法的不同取值的实验结果 Table 1 Performance of C2means cluster and K2nearest neighbor algorithm C K 1 2 3 4 5 6 1 9110 9110 9110 9110 9110 9110 2 9113 9113 9117 9119 9119 9119 3 9218 9218 9312 9311 9311 9310 4 9512 9512 9515 9518 9513 9513 5 9412 9412 9413 9414 9414 9413 6 9311 9311 9313 9315 9315 9314 由表 1 的实验数据可以看出 ,采用把每个表情 类分成多个子表情类的方法 ,由于充分利用了每种 表情类之间的差异信息 ,因此能够提高识别率. K 的取值对识别率影响不大 ,识别率主要取决于 C 的 取值 ,即每种表情聚成的子类个数. 随着 C 的取值 从 1 逐渐增大 ,识别率也随着提高 ,但是当 C 的取 值超过某一个数值之后识别率又开始下降. 这是因 为当聚类的数目很多时 ,每类的图像数目变少 ,聚类 所形成的表情模板受到了人相貌的影响 ,影响了表 情识别的准确率. 从表 1 看出当 C = 4 , K = 4 时 ,达 到最高识别率 9518 % . 该识别率高于文献[ 16 ]92 % 的识别率. 此时输入的表情与被识别出的表情的混 淆矩阵(conf usion matrix) 见表 2. 表 2 C= 4 , K= 4 时的混淆矩阵 Table 2 Confusion matrix when C= 4 and K= 4 O I 高兴 厌恶 生气 恐惧 惊讶 悲伤 中性 高兴 31 0 0 0 0 0 0 厌恶 0 29 1 0 0 1 0 生气 0 0 28 0 0 1 0 恐惧 0 0 0 30 2 0 0 惊讶 0 0 0 2 28 0 0 悲伤 0 0 1 0 0 29 1 中性 0 0 0 0 0 0 29 I :识别输入 (recognition input) ; O:识别输出 ( recogni2 tion output) · 06 · 智 能 系 统 学 报 第 3 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net