正在加载图片...
第4期 王洪海,等:基于滑动倒谱的自动语言辨识 ·339 的识别效果好于7-133,但是,当k增加到5时,由 爬山法可以比较快捷地得到一个局部最优的参数组 SDC(7-13-5)得到的改善效果明显好于SDC(9-13- 合.通过3.22节的实验可知,局部最优的参数未必 5).因此,接下来继续对SDC(71-36)和SDC(71- 是全局最优的.有时需要利用经验知识对搜索方向 3-7)进行测试,并由此确认SDC(7-1-36)可以达到 进行调整.图1给出了利用爬山法和经验知识进行 局部最优的识别效果 搜索确定的控制参数优化路径,并标出了对应的控 3.23参数p对性能的影响 制参数 是相邻倒谱块的相对滑动帧数,它确定了进 3.5 +SC 3.0 SDC 行信息融合的前后帧的时移.确定最佳的p值可以 13-1-3-3 2.5 -、。9-J-3-3 说明前后哪些帧的参数具有最大的互补性.在SDC 2.0 、7-1-367-1-26 和SC特征矢量的控制参数分别取7-136和7-3-5 1.5 1.0 13-3-37-33 的基础上调整p的取值,测试结果如表4所示 7-3-57-2-5 0.5 表4参数p对性能的影响 2 3 4 5 Table 4 Effect ofp on performance 优化步骤 特征参数 误识率/% 特征参数 误识率/% 图1SC和DC控制参数优化的路径 DC(7-136) 1.47 SC(7-3-5) 1.07 Fig 1 Optmizing path of control parameters of SC and SDC SDC(7-126) 1.40 8℃(7-2-5) 103 DC(7-1-16) 1.90 SC(7-1-5) 117 3.25SC与SDC矢量的数据融合 从表4中可以看出,滑动2帧的倒谱块参数具 利用以上实验中性能达到局部最优的SC(72 有最大的互补性,这些互补性的信息融合在一个SC 5)参数所建立的模型作为一个子系统(标注为 特征向量内可以达到比较好的识别效果.与SC特 Sub1),然后与采用SDC(7-1-26)参数建立的子系 征向量一样,SDC特征向量也需要融合滑动2帧的 统(标注为Sub2)进行决策级数据融合,2个子系统 差分倒谱块才能达到比较好的效果 使用的分类器都是混合分量数为128的GMM融合 3.24参数d对SDC矢量性能的影响 方式采用线性加权组合,即: DC矢量比SC矢量多了一个控制参数d,它 是计算差分倒谱的时移.当d值变化时对DC(7-X S=Ssubl +a XSsub2. (4) 式中:Ssb1和S分别代表2个子系统的得分,S为 2-6)矢量性能的影响如表5所示 表5参数d对SDC性能的影响 数据融合之后系统的总得分.式(4)表示首先固定 Table 5 Effect of d on perfommance of SDC Sub1子系统的加权系数为1,然后调整Sub2子系统 的加权系数α,使融合后的识别效果达到全局或局 特征参数 误识率/% DC(7-126) 140 部最优.加权系数a采用搜索算法确定,即从ā=1 SDC(7-22-6) 233 开始,按01的步长增加或降低a的取值,使系统的 从表5可以看出,按照前后帧的时移间隔计算 识别率逐步增加,直到达到一个局部最优的结果.表 差分倒谱可以使SDC特征向量获得比较好的性能, 6给出了最终确定的加权系数及对应的测试结果 从以上实验可以看出,调整滑动倒谱$C℃和滑 表6决策级数据融合 动差分倒谱SDC的控制参数可以使系统的识别率 Table 6 Data fusion on dec ision level 得到明显的改善.对于特定的语音语料库和识别任 特征参数 加权系数ā误识率/% 务,SDC矢量和SC矢量应当各自存在一个最优的 SC(7-2-5) … 103 参数组合,使系统的识别性能达到最佳.但是,最优 ①C(7-1-26) 1.40 数据融合 01 097 的控制参数需要长时间的搜索才能确定.一般通过 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net的识别效果好于 7212323,但是 ,当 k增加到 5时 ,由 SDC (7212325)得到的改善效果明显好于 SDC (921232 5). 因此 ,接下来继续对 SDC (7212326)和 SDC (7212 327)进行测试 ,并由此确认 SDC ( 7212326)可以达到 局部最优的识别效果. 3. 2. 3 参数 p对性能的影响 p是相邻倒谱块的相对滑动帧数 , 它确定了进 行信息融合的前后帧的时移. 确定最佳的 p值可以 说明前后哪些帧的参数具有最大的互补性. 在 SDC 和 SC特征矢量的控制参数分别取 7212326和 72325 的基础上调整 p的取值 ,测试结果如表 4所示. 表 4 参数 p对性能的影响 Table 4 Effect ofp on performance 特征参数 误识率 /% 特征参数 误识率 /% SDC (7212326) 1. 47 SC (72325) 1. 07 SDC (7212226) 1. 40 SC (72225) 1. 03 SDC (7212126) 1. 90 SC (72125) 1. 17 从表 4中可以看出 ,滑动 2帧的倒谱块参数具 有最大的互补性 ,这些互补性的信息融合在一个 SC 特征向量内可以达到比较好的识别效果. 与 SC特 征向量一样 , SDC特征向量也需要融合滑动 2帧的 差分倒谱块才能达到比较好的效果. 3. 2. 4 参数 d对 SDC矢量性能的影响 SDC矢量比 SC矢量多了一个控制参数 d ,它 是计算差分倒谱的时移. 当 d值变化时对 SDC (72X2 226)矢量性能的影响如表 5所示. 表 5 参数 d对 SDC性能的影响 Table 5 Effect of d on performance of SDC 特征参数 误识率 /% SDC (7212226) 1. 40 SDC (7222226) 2. 33 从表 5可以看出 ,按照前后帧的时移间隔计算 差分倒谱可以使 SDC特征向量获得比较好的性能. 从以上实验可以看出 ,调整滑动倒谱 SC和滑 动差分倒谱 SDC的控制参数可以使系统的识别率 得到明显的改善. 对于特定的语音语料库和识别任 务 , SDC矢量和 SC矢量应当各自存在一个最优的 参数组合 ,使系统的识别性能达到最佳. 但是 ,最优 的控制参数需要长时间的搜索才能确定. 一般通过 爬山法可以比较快捷地得到一个局部最优的参数组 合. 通过 3. 2. 2节的实验可知 ,局部最优的参数未必 是全局最优的. 有时需要利用经验知识对搜索方向 进行调整. 图 1给出了利用爬山法和经验知识进行 搜索确定的控制参数优化路径 ,并标出了对应的控 制参数. 图 1 SC和 SDC控制参数优化的路径 Fig. 1 Op timizing path of control parameters of SC and SDC 3. 2. 5 SC与 SDC矢量的数据融合 利用以上实验中性能达到局部最优的 SC (7222 5)参数所建立的模型作为一个子系统 (标注为 Sub1) ,然后与采用 SDC ( 7212226)参数建立的子系 统 (标注为 Sub2)进行决策级数据融合 , 2个子系统 使用的分类器都是混合分量数为 128的 GMM. 融合 方式采用线性加权组合 ,即 : S = SSub1 +α ×SSub2 . (4) 式中 : SSub1和 SSub2分别代表 2个子系统的得分 , S为 数据融合之后系统的总得分. 式 ( 4)表示首先固定 Sub1子系统的加权系数为 1,然后调整 Sub2子系统 的加权系数 α,使融合后的识别效果达到全局或局 部最优. 加权系数 α采用搜索算法确定 ,即从 α = 1 开始 ,按 0. 1的步长增加或降低α的取值 ,使系统的 识别率逐步增加 ,直到达到一个局部最优的结果. 表 6给出了最终确定的加权系数及对应的测试结果. 表 6 决策级数据融合 Table 6 Da ta fusion on dec ision level 特征参数 加权系数 α 误识率 /% SC (72225) … 1. 03 SDC (7212226) … 1. 40 数据融合 0. 1 0. 97 第 4期 王洪海 ,等 :基于滑动倒谱的自动语言辨识 · 933 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有