再利用式(9) 投影到特征空间上 ,最后使用 K 近邻法与 11 3 中

正在加载图片...

·60 智能系统学报第3卷再利用式(9)投影到特征空间上，最后使用K近邻本测试实验与Michael等1的测试方法相同法与1.3中使用C均值聚类得到的表情模板进行把数据库中的213张图像分成10部分，每次使用其比较，以达到对该表情分类的目的.K近邻法与C 中的9部分训练，剩下的1部分测试.循环测试10 均值聚类方法联合使用，考虑了同种表情的表现多次，然后对这10次取平均值，得出正确识别率，由于样性，能够有效地提高表情的识别率 C均值算法的C取值和K近邻的K取值不同，识 1.5表情识别的整体流程别率有所不同，实验结果见表1 表情识别的全部过程见图3.所有的图像首先都要进行Gabor小波变换，然后对训练图像进行训表1C均值K近邻算法的不同取值的实验结果 Table 1 Performance of Gmeans cluster and 练得到特征空间，标准的表情图像在该特征空间中 Knearest neighbor algorithm 进行C均值聚类得到表情模板，待识别的表情图像在该特征空间中与表情模板匹配从而实现该幅表情 K 图像的分类 2 3 5 6 91.0 91.0 91.0 91.0 91.0 91.0 标准的表参加练的一幅待识别情图像表情图像、的表情图像 2 91.3 91.3 91.7 91.9 91.9 91.9 Gabor小波变换 Gabor小波变换 Gabor小波变换 3 92.8 92.893.2 93.1 93.1 93.0 训练特征空间 4 95.2 95.2 95.5 95.8 95.3 95.3 特 5 94.2 94.2 94.3 94.4 94.4 特征空 94.3 C均值聚类 6 93.193.1 93.393.5 93.593.4 [表特模板匹配由表1的实验数据可以看出，采用把每个表情表情分类) 类分成多个子表情类的方法，由于充分利用了每种表情类之间的差异信息，因此能够提高识别率，K 的取值对识别率影响不大，识别率主要取决于C的图3表情识别的全部过程取值，即每种表情聚成的子类个数.随着C的取值 Fig 3 Process of facial expression recognition 从1逐渐增大，识别率也随着提高，但是当C的取 2 测试实验值超过某一个数值之后识别率又开始下降.这是因为当聚类的数目很多时，每类的图像数目变少，聚类测试实验使用了日本女人表情数据库(Japa 所形成的表情模板受到了人相貌的影响，影响了表 nese female facial expression JAFFE).该数据库包情识别的准确率.从表1看出当C=4,K=4时，达含了10个日本女人的213幅表情图像，每个人7种到最高识别率95.8%.该识别率高于文献[16]92% 表情，包括高兴、生气、恐惧、厌恶、害怕、悲伤和中性的识别率.此时输入的表情与被识别出的表情的混表情，每个人的同一种表情图像有3~4幅.JAFFE 淆矩阵(confusion matrix)见表2. 的部分表情图像如图4所示，其表情依次为中性、生气、厌恶恐惧、高兴、悲伤、惊讶表2C=4,K=4时的混淆矩阵 Table 2 Confusion matrix when C=4 and K=4 0 高兴厌恶生气恐惧惊讶悲伤中性高兴 31 0 0 0 0 0 0 厌恶 0 29 0 1 0 生气 0 0 28 0 0 1 0 恐惧 0 0 0 30 2 0 0 惊讶 0 0 2 28 0 0 悲伤 0 0 1 0 29 1 图4 JAFFE表情图像数据库中的表情样本中性 0 0 0 0 0 0 29 Fig,4 Expression samples in JAFFE expression database I:识别输入(recognition input);O:识别输出(recogni- tion output) 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved. http://www.cnki.net再利用式(9) 投影到特征空间上 ,最后使用 K 近邻法与 11 3 中使用 C 均值聚类得到的表情模板进行比较 ,以达到对该表情分类的目的. K 近邻法与 C 均值聚类方法联合使用 ,考虑了同种表情的表现多样性 ,能够有效地提高表情的识别率. 115 表情识别的整体流程表情识别的全部过程见图 3. 所有的图像首先都要进行 Gabor 小波变换 ,然后对训练图像进行训练得到特征空间 ,标准的表情图像在该特征空间中进行 C 均值聚类得到表情模板 ,待识别的表情图像在该特征空间中与表情模板匹配从而实现该幅表情图像的分类. 图 3 表情识别的全部过程 Fig13 Process of facial expression recognition 2 测试实验测试实验使用了日本女人表情数据库 (J apa2 nese female facial expression ,J A FFE) . 该数据库包含了 10 个日本女人的 213 幅表情图像 ,每个人 7 种表情 ,包括高兴、生气、恐惧、厌恶、害怕、悲伤和中性表情 ,每个人的同一种表情图像有 3～4 幅.J AFFE 的部分表情图像如图 4 所示 ,其表情依次为中性、生气、厌恶、恐惧、高兴、悲伤、惊讶. 图 4 J AFFE 表情图像数据库中的表情样本 Fig14 Expression samples in J AFFE expression database 本测试实验与 Michael 等[ 16 ] 的测试方法相同 , 把数据库中的 213 张图像分成 10 部分 ,每次使用其中的 9 部分训练 ,剩下的 1 部分测试. 循环测试 10 次 ,然后对这 10 次取平均值 ,得出正确识别率. 由于 C均值算法的 C 取值和 K 近邻的 K 取值不同 ,识别率有所不同 ,实验结果见表 1. 表 1 C均值 K近邻算法的不同取值的实验结果 Table 1 Performance of C2means cluster and K2nearest neighbor algorithm C K 1 2 3 4 5 6 1 9110 9110 9110 9110 9110 9110 2 9113 9113 9117 9119 9119 9119 3 9218 9218 9312 9311 9311 9310 4 9512 9512 9515 9518 9513 9513 5 9412 9412 9413 9414 9414 9413 6 9311 9311 9313 9315 9315 9314 由表 1 的实验数据可以看出 ,采用把每个表情类分成多个子表情类的方法 ,由于充分利用了每种表情类之间的差异信息 ,因此能够提高识别率. K 的取值对识别率影响不大 ,识别率主要取决于 C 的取值 ,即每种表情聚成的子类个数. 随着 C 的取值从 1 逐渐增大 ,识别率也随着提高 ,但是当 C 的取值超过某一个数值之后识别率又开始下降. 这是因为当聚类的数目很多时 ,每类的图像数目变少 ,聚类所形成的表情模板受到了人相貌的影响 ,影响了表情识别的准确率. 从表 1 看出当 C = 4 , K = 4 时 ,达到最高识别率 9518 % . 该识别率高于文献[ 16 ]92 % 的识别率. 此时输入的表情与被识别出的表情的混淆矩阵(conf usion matrix) 见表 2. 表 2 C= 4 , K= 4 时的混淆矩阵 Table 2 Confusion matrix when C= 4 and K= 4 O I 高兴厌恶生气恐惧惊讶悲伤中性高兴 31 0 0 0 0 0 0 厌恶 0 29 1 0 0 1 0 生气 0 0 28 0 0 1 0 恐惧 0 0 0 30 2 0 0 惊讶 0 0 0 2 28 0 0 悲伤 0 0 1 0 0 29 1 中性 0 0 0 0 0 0 29 I :识别输入 (recognition input) ; O:识别输出 ( recogni2 tion output) · 06 · 智能系统学报第 3 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

<<向上翻页向下翻页>>

点击下载：机器感知与模式识别：基于C均值K近邻算法的面部表情识别