算法训练 HMM．（3）把各个 HMM 输出概率组合成一个新的向量

正在加载图片...

436 北京科技大学学报第29卷算法训练HMM 脸表情库(CMU PITTSBURGH AU一coded face ex- (③)把各个HMM输出概率组合成一个新的向 pression image database)进行面部表情识别实验，实量，并把它作为BP网络的输入信号，训练BP网络验中，随机抽取了14人的面部表情序列，其中10人分类器的面部表情作为训练样本，其余4人的面部表情作 3 实验结果为测试样本.图1为CMU库中某个人愤怒表情序列中第11、13帧图像及计算出的光流场为验证上述算法的有效性，本文利用CMU人图1愤怒表情图像序列(a,b)与光流场(c) Fig-1 Anger expression image sequence (a,b)and its optical flow field (c) 对光流场采用PCA降维得到面部表情特征向为经典HMM训练算法，各种不同方法总体识别率量序列，分别训练HMM和BP网络.本文采用三状分别为：基于IMMI1/BP分类器识别率为83.5%，态左右结构HMM,混合高斯元个数均为M=3,待基于IMMI2/BP分类器的识别率为82.4%，在同等识别的面部表情有六类，故BP网络输入输出节点条件下基于改进前的最大互信息准则和BP网络的数均为6，其隐节点数通过实验调整，测试结果如表分类方法识别率为80.6%，而经典方法Baum一 1和表2所示.其中，IMMI1指基于式(3)的HMM Welch识别率仅为77.1%.由此可见，本文提出的训练算法，IMMI2指基于式(7)的HMM训练算法，方法优于传统的HMM训练算法， MMI指基于式(2)的HMM训练算法，Baum Welch 4结论表1基于IMM1/BP方法面部表情识别结果 Table 1 Facial expression recognition results based on IMMI1/BP 本文提出了一种基于改进MMI的HMM训练表情愤怒厌恶恐棋高兴悲伤惊奇算法.该方法相对于传统Baum一Welch算法，具有愤怒81.8%2.3% 0 0 15.9% 0 如下优点，(l)模型准确性：Baum一Velch本质上是厌恶12.1%84.9% 0 0 0 3.0% 最大似然法，若要保证HMM训练的准确性，则需要恐惧24.2%6.1%66.7% 0 0 3.0% 大量样本；IMMI算法充分利用了所有训练样本，因高兴 0 30.3%69.7% 0 0 此在相同训练样本集下，采用IMMI准则训练悲伤 0 0 0 1007% 0 HMM得到的模型更为精确.(2)识别能力：Baum一 2.3% 0 0 0 0 97.7% Welch训练HMM只利用本类样本，因此该方法只惊奇是注重对本类样本的建模能力，而忽略了对其他类表2基于IMMI2/BP方法面部表情识别结果样本的鉴别能力，如果出现与本类样本相似的其他 Table 2 Facial expression recognition results based on IMMI2/BP 类样本，则该HMM就很难对该样本做出准确分类；表情愤怒厌恶恐惧高兴悲伤惊奇 IMMI方法则不仅利用了本类样本，而且充分考虑愤怒80.0% 0 0 0 20.0% 0 了竞争类样本，把竞争类样本作为惩罚项引入了准厌恶6.1% 93.9% 0 0 0 0 则函数，从而可以大大提高识别能力，(3)训练的不恐惧15.2% 9.1% 66.7%3.0% 0 6.0% 平衡性：对于Baum Welch方法，如果某类样本很少高兴 0 0 36.4%63.6 0 0 或缺少，则与该类对应的HMM则训练不充分或无悲伤 0 0 0 5.0% 95.0% 0 法训练，不能有效对该类样本建模；而IMMI法则惊奇2.3% 0 2.3% 0 95.4% 可有效避免这类情况发生，而且如果某类样本缺少时，还可以利用其竞争类的样本对该类HMM进行算法训练 HMM．（3）把各个 HMM 输出概率组合成一个新的向量并把它作为 BP 网络的输入信号训练 BP 网络分类器． 3 实验结果为验证上述算法的有效性本文利用 CMU 人脸表情库（CMU—PITTSBURGH AU—coded face expression image database）进行面部表情识别实验．实验中随机抽取了14人的面部表情序列其中10人的面部表情作为训练样本其余4人的面部表情作为测试样本．图1为 CMU 库中某个人愤怒表情序列中第11、13帧图像及计算出的光流场．图1 愤怒表情图像序列（ab）与光流场（c） Fig．1 Anger expression image sequence （ab） and its optical flow field （c）对光流场采用 PCA 降维得到面部表情特征向量序列分别训练 HMM 和 BP 网络．本文采用三状态左右结构 HMM混合高斯元个数均为 M＝3待识别的面部表情有六类故 BP 网络输入输出节点数均为6其隐节点数通过实验调整．测试结果如表 1和表2所示．其中IMMI1指基于式（3）的 HMM 训练算法IMMI2指基于式（7）的 HMM 训练算法 MMI 指基于式（2）的 HMM 训练算法Baum—Welch 表1 基于 IMMI1／BP 方法面部表情识别结果 Table1 Facial expression recognition results based on IMMI1／BP 表情愤怒厌恶恐惧高兴悲伤惊奇愤怒 81∙8％ 2∙3％ 0 0 15∙9％ 0 厌恶 12∙1％ 84∙9％ 0 0 0 3∙0％恐惧 24∙2％ 6∙1％ 66∙7％ 0 0 3∙0％高兴 0 0 30∙3％ 69∙7％ 0 0 悲伤 0 0 0 0 100％ 0 惊奇 2∙3％ 0 0 0 0 97∙7％表2 基于 IMMI2／BP 方法面部表情识别结果 Table2 Facial expression recognition results based on IMMI2／BP 表情愤怒厌恶恐惧高兴悲伤惊奇愤怒 80∙0％ 0 0 0 20∙0％ 0 厌恶 6∙1％ 93∙9％ 0 0 0 0 恐惧 15∙2％ 9∙1％ 66∙7％ 3∙0％ 0 6∙0％高兴 0 0 36∙4％ 63∙6％ 0 0 悲伤 0 0 0 5∙0％ 95∙0％ 0 惊奇 2∙3％ 0 0 2∙3％ 0 95∙4％为经典 HMM 训练算法．各种不同方法总体识别率分别为：基于 IMMI1／BP 分类器识别率为83∙5％基于 IMMI2／BP 分类器的识别率为82∙4％在同等条件下基于改进前的最大互信息准则和 BP 网络的分类方法识别率为 80∙6％而经典方法 Baum— Welch 识别率仅为77∙1％．由此可见本文提出的方法优于传统的 HMM 训练算法． 4 结论本文提出了一种基于改进 MMI 的 HMM 训练算法．该方法相对于传统 Baum—Welch 算法具有如下优点．（1）模型准确性：Baum—Welch 本质上是最大似然法若要保证 HMM 训练的准确性则需要大量样本；IMMI 算法充分利用了所有训练样本因此在相同训练样本集下采用 IMMI 准则训练 HMM 得到的模型更为精确．（2）识别能力：Baum— Welch 训练 HMM 只利用本类样本因此该方法只是注重对本类样本的建模能力而忽略了对其他类样本的鉴别能力如果出现与本类样本相似的其他类样本则该 HMM 就很难对该样本做出准确分类； IMMI 方法则不仅利用了本类样本而且充分考虑了竞争类样本把竞争类样本作为惩罚项引入了准则函数从而可以大大提高识别能力．（3）训练的不平衡性：对于 Baum—Welch 方法如果某类样本很少或缺少则与该类对应的 HMM 则训练不充分或无法训练不能有效对该类样本建模；而 IMMI 法则可有效避免这类情况发生而且如果某类样本缺少时还可以利用其竞争类的样本对该类 HMM 进行 ·436· 北京科技大学学报第29卷

<<向上翻页向下翻页>>

点击下载：基于改进MMI的HMM训练算法及其在面部表情识别中的应用