正在加载图片...
第1期 王雨轩,等:手语识别中基于HMM的区分性训练方法 ·83· 3 实验结果及分析 1.00 仔改进的算法 ·¢传统的EBW算法 3.1实验架构 MLE算法 文中使用具有代表性的400手语孤立词汇集 0.95 0 数据由6位专业手语老师通过数据手套采集得来 …0g00 每位手语老师采集2遍,一共是12遍数据,每词按 词本身的结构,打手语者的习惯,以及打手语时的环 0.90 境不同而有不同的帧长,每一帧有51维的观察值. 对于注册集测试,采用手语者的一遍数据加入 0.850 12 训练集,另一遍数据作为测试集的方法.对于非注册 3456789 迭代次数/次 集测试,则将所有其他人的数据作为训练集,该手语 图2迭代次数的实验 者的一遍数据作为测试集的方法 Fig.2 The experiment of iterations 将首先针对新的重估公式进行测试,以获取最 佳参数,迭代次数等的信息.最后给出在不同易混集 一般来说会获得比较理想的结果.这里h值取为 构建方法下,MLE,EBW算法,改良的算法的识别 1.7,识别率达到92.5%, 33实验结果 率的比较 实验对MLE算法,传统的EBW算法,以及文 3.2h参数及迭代次数的分析 中采用的改进的算法进行比较.对于改进的算法,进 在H准则中,h参数对于重估公式影响很大 它既关系到收敛的速度,又关系到识别率.经过大量 行2组测试.第1组用上文提到的易混集构建方法 的实验,发现将h值从传统的0,11区间扩展到 而不加入任何主观经验因素,用NEW表示.第2组 1,+网会获得更好的效果.以注册集上的区分性 在易混集构建的基础上加入主观的经验因素,用 EXP表示.分别在注册集和非注册集上对6位手语 训练一次迭代后的结果为例,如图1,在h值定为 1.7时,效果最好.在其他训练情况下,也有类似结 老师中的5位给出识别结果.另一位老师的2遍数 彩 据作为构建训练集的基础,不参与测试.结果如下: 0.930 表1注册集识别结果 0.925 Table 1 Recognition results for registered sets 0.920 Signer MLE EBW NEW EXP 0.915 ljh 90.75 91.25 93.25 94.75 llg 92.50 93.00 94.00 95.25 0.9051 Iwr 91.50 92.75 94.50 95.00 0.90 mwh 90.25 91.25 92.75 95.00 0 0.5 1.01.52.0 2.5 3.0 pfz 93.50 94.00 95.00 96.25 Average 91.70 92.45 93.90 95.25 图1参数h的实验 Fig.1 The experiment of h 表2非注册集识别结果 对于区分性训练的迭代次数也进行了大量的实 Table 2 Recognition results for unregistered sets 验,结果发现在第4次或第5次迭代时,会得到很好 Signer MLE EBW NEW EXP 的收敛效果,再继续训练,将会造成发散 lih 67.75 68.57 1.25 75 如图2可以看到MIE算法已经收敛到极限,对 lq 61.25 61.75 68.5 71.25 其进一步的迭代计算将不会对结果产生任何影响, 65 66.5 69.5 74.25 mwh 65.25 66.75 69 73.75 这也从侧面反映了引入区分性训练的必要性.但是 pfz 母 70.25 73.25 76.5 区分性训练相对MIE准则来说并不稳定,随着迭代 Average 65.65 66.75 70.3 74.15 次数的增加,识别率反而会降低.这是由于虽然加大 了竞争模型与误识词之间的距离,但是可能造成误 通过表1和表2可以看到,在注册集和非注册 识数据过训练,从而使该误识词向其他原来并不是 上新的改进算法要大大优于传统的MLE算法,这 竞争模型的模型靠近,造成新的误识.采用4次迭代 是由于改进算法是在MLE基础上的再训练,它不 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net3 实验结果及分析 3. 1 实验架构 文中使用具有代表性的 400 手语孤立词汇集 , 数据由 6 位专业手语老师通过数据手套采集得来. 每位手语老师采集 2 遍 ,一共是 12 遍数据. 每词按 词本身的结构 ,打手语者的习惯 ,以及打手语时的环 境不同而有不同的帧长 ,每一帧有 51 维的观察值. 对于注册集测试 ,采用手语者的一遍数据加入 训练集 ,另一遍数据作为测试集的方法. 对于非注册 集测试 ,则将所有其他人的数据作为训练集 ,该手语 者的一遍数据作为测试集的方法. 将首先针对新的重估公式进行测试 ,以获取最 佳参数 ,迭代次数等的信息. 最后给出在不同易混集 构建方法下 ,ML E , EBW 算法 ,改良的算法的识别 率的比较. 3. 2 h 参数及迭代次数的分析 在 H 准则中 , h 参数对于重估公式影响很大. 它既关系到收敛的速度 ,又关系到识别率. 经过大量 的实验 ,发现将 h 值从传统的 [ 0 , 1 ]区间扩展到 [1 , + ∞) 会获得更好的效果. 以注册集上的区分性 训练一次迭代后的结果为例 , 如图 1 , 在 h 值定为 117 时 ,效果最好. 在其他训练情况下 ,也有类似结 果. 图 1 参数 h 的实验 Fig. 1 The experiment of h 对于区分性训练的迭代次数也进行了大量的实 验 ,结果发现在第 4 次或第 5 次迭代时 ,会得到很好 的收敛效果 ,再继续训练 ,将会造成发散. 如图 2 可以看到 MIE 算法已经收敛到极限 ,对 其进一步的迭代计算将不会对结果产生任何影响 , 这也从侧面反映了引入区分性训练的必要性. 但是 区分性训练相对 MIE 准则来说并不稳定 ,随着迭代 次数的增加 ,识别率反而会降低. 这是由于虽然加大 了竞争模型与误识词之间的距离 ,但是可能造成误 识数据过训练 ,从而使该误识词向其他原来并不是 竞争模型的模型靠近 ,造成新的误识. 采用 4 次迭代 图 2 迭代次数的实验 Fig. 2 The experiment of iterations 一般来说会获得比较理想的结果. 这里 h 值取为 117 ,识别率达到 92. 5 %. 3. 3 实验结果 实验对 ML E 算法 ,传统的 EBW 算法 ,以及文 中采用的改进的算法进行比较. 对于改进的算法 ,进 行 2 组测试. 第 1 组用上文提到的易混集构建方法 而不加入任何主观经验因素 ,用 N EW 表示. 第 2 组 在易混集构建的基础上加入主观的经验因素 ,用 EXP 表示. 分别在注册集和非注册集上对 6 位手语 老师中的 5 位给出识别结果. 另一位老师的 2 遍数 据作为构建训练集的基础 ,不参与测试. 结果如下 : 表 1 注册集识别结果 Table 1 Recognition results for registered sets Signer ML E EBW N EW EXP ljh 90. 75 91. 25 93. 25 94. 75 llq 92. 50 93. 00 94. 00 95. 25 lwr 91. 50 92. 75 94. 50 95. 00 mwh 90. 25 91. 25 92. 75 95. 00 pfz 93. 50 94. 00 95. 00 96. 25 Average 91. 70 92. 45 93. 90 95. 25 表 2 非注册集识别结果 Table 2 Recognition results for unregistered sets Signer ML E EBW N EW EXP ljh 67. 75 68. 57 1. 25 75 llq 61. 25 61. 75 68. 5 71. 25 lwr 65 66. 5 69. 5 74. 25 mwh 65. 25 66. 75 69 73. 75 pfz 69 70. 25 73. 25 76. 5 Average 65. 65 66. 75 70. 3 74. 15 通过表 1 和表 2 可以看到 ,在注册集和非注册 上新的改进算法要大大优于传统的 ML E 算法 ,这 是由于改进算法是在 ML E 基础上的再训练 ,它不 第 1 期 王雨轩 ,等 :手语识别中基于 HMM 的区分性训练方法 ·83 · © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有