正在加载图片...
·340· 智能系统学报 第3卷 3.3对测试集的实验 后的EER,如表8所示」 对测试集的实验分为闭集辨识和开集辨识.对 对于初步确认语种属于闭集的语音片段进行进 于开集辨识,要求系统首先判决被测语言片段的语 一步的识别,以确定其具体的语言种类,得到表9所 种是否属于闭集中的注册成员.因此,开集辨识比闭 示的识别结果 集辨识多了一个确认过程,其正确识别率将有所降 表9对测试集的开集辨识结果 低,但与实际情况更为接近 Table 9 Iden tifica tion results for the open test set 3.3.1闭集辨识 特征参数 加权系数a 误识率/% 根据3.2节得到优化结果,分别选取最优的特 S℃(7-2-5)】 833 征参数SC(7-2-5)和SDC(7-1-2-6)建立模型对测 DC(7-126) … 898 数据融合 01 7.85 试集闭集中的数据进行测试,然后再利用优化的加 权系数将2类模型进行融合,得到了表7所列出的 从表8和表9中可以看出,对于开集辨识的语种 测试结果 确认过程和识别过程,使用滑动倒谱的效果也好于滑 表7对测试集的闭集辨识结果 动差分倒谱.并且这2种参数也具有特征互补性,将 Table 7 ldentification results for the closed test set 它们进行数据融合可以进一步改善系统的识别效果】 特征参数 加权系数a 误识率/% 4结束语 SC(7-2-5) 0 205 DC(7-1-26) 232 从对比实验可以看出,无论对于闭集辨识的测 数据融合 01 197 试还是开集辨识的测试,SC参数比SDC参数都表 从表7可以看出,滑动倒谱的性能优于滑动差 现出了更优越的性能,并且SC参数不需要计算差 分倒谱,将滑动倒谱与滑动差分倒谱进行数据融合 分倒谱,计算量比SDC参数小,因此,这种参数形式 可以进一步提高系统的识别率 值得在今后的研究中进一步关注.利用爬山法可以 3.3.2开集辨识 方便快捷地对SC和SDC的控制参数进行优化.但 在开集辨识中,系统首先根据设定的阈值对被 是,这种方法得到的往往是局部最优结果,并且需要 测语言片段的语种是否属于闭集做出判决,此时使 利用经验知识对搜索方向进行调整.以前的研 用拒识率E和误识率E2个参量来表征系统的性 究B79指出,DC控制参数的优化组合为713-7, 能.调节判决阈值的大小可以得到拒识率和误识率 而在本实验中得到的局部最优参数组合为71-26, 相等时的等错误率(equal eror rate,EER) 这说明最佳的控制参数组合与系统的识别任务及所 根据优化结果,分别选取最优的特征参数SC(7: 使用的语音语料库密切相关.另外,SDC和SC特征 2-5)和SDC(7-1-2-6)建立模型对测试集开集中的语 向量中不同的控制参数组合最终反映了特征信息的 言片段是否属于闭集中的语种进行表决,在不同的判 时序长度和向量中内嵌特征块的间隔,而这2项又 决阈值条件下得到不同的拒识率和误识率,通过调节 同时受到帧长和帧移的影响.因此,帧长和帧移变化 判决阈值的大小得到最后的EER,结果见表& 时,最优的控制参数组合也可能受到影响,最终系统 表8对测试集开集的确认结果 的性能也会有所变化.而在以前的研究中还没有关 Table 8 Verification results for the open test set 于最优的控制参数组合随帧长和帧移变化的讨论, 特征参数 加权系数a EER/% 这种变化关系的确定需要进一步研究 SC(725) … 683 DC(7-1-26) … 7.35 数据融合 01 628 参考文献: 然后,再利用优化的加权系数将2类模型进行 [1任洪海,刘刚,郭军.自动语言辨识研究方法及发 融合,重新设定判决阈值进行表决,得到了数据融合 展概述[J].电脑与信息技术,2007,16(2):37-39 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net3. 3 对测试集的实验 对测试集的实验分为闭集辨识和开集辨识. 对 于开集辨识 ,要求系统首先判决被测语言片段的语 种是否属于闭集中的注册成员. 因此 ,开集辨识比闭 集辨识多了一个确认过程 ,其正确识别率将有所降 低 ,但与实际情况更为接近. 3. 3. 1 闭集辨识 根据 3. 2节得到优化结果 ,分别选取最优的特 征参数 SC ( 72225)和 SDC ( 721222 6)建立模型对测 试集闭集中的数据进行测试 ,然后再利用优化的加 权系数将 2类模型进行融合 ,得到了表 7所列出的 测试结果. 表 7 对测试集的闭集辨识结果 Table 7 Iden tifica tion results for the closed test set 特征参数 加权系数 α 误识率 /% SC (72225) … 2. 05 SDC (7212226) … 2. 32 数据融合 0. 1 1. 97 从表 7可以看出 ,滑动倒谱的性能优于滑动差 分倒谱 ,将滑动倒谱与滑动差分倒谱进行数据融合 可以进一步提高系统的识别率. 3. 3. 2 开集辨识 在开集辨识中 ,系统首先根据设定的阈值对被 测语言片段的语种是否属于闭集做出判决 ,此时使 用拒识率 EFJ和误识率 EFA 2个参量来表征系统的性 能. 调节判决阈值的大小可以得到拒识率和误识率 相等时的等错误率 ( equal error rate, EER). 根据优化结果 ,分别选取最优的特征参数 SC (72 225)和 SDC (7212226)建立模型对测试集开集中的语 言片段是否属于闭集中的语种进行表决 ,在不同的判 决阈值条件下得到不同的拒识率和误识率. 通过调节 判决阈值的大小得到最后的 EER,结果见表 8. 表 8 对测试集开集的确认结果 Table 8 Ver ifica tion results for the open test set 特征参数 加权系数 α EER /% SC (72225) … 6. 83 SDC (7212226) … 7. 35 数据融合 0. 1 6. 28 然后 ,再利用优化的加权系数将 2类模型进行 融合 ,重新设定判决阈值进行表决 ,得到了数据融合 后的 EER,如表 8所示. 对于初步确认语种属于闭集的语音片段进行进 一步的识别 ,以确定其具体的语言种类 ,得到表 9所 示的识别结果. 表 9 对测试集的开集辨识结果 Table 9 Iden tifica tion results for the open test set 特征参数 加权系数 α 误识率 /% SC (72225) … 8. 33 SDC (7212226) … 8. 98 数据融合 0. 1 7. 85 从表 8和表 9中可以看出 ,对于开集辨识的语种 确认过程和识别过程 ,使用滑动倒谱的效果也好于滑 动差分倒谱. 并且这 2种参数也具有特征互补性 ,将 它们进行数据融合可以进一步改善系统的识别效果. 4 结束语 从对比实验可以看出 ,无论对于闭集辨识的测 试还是开集辨识的测试 , SC参数比 SDC参数都表 现出了更优越的性能 ,并且 SC参数不需要计算差 分倒谱 ,计算量比 SDC参数小 ,因此 ,这种参数形式 值得在今后的研究中进一步关注. 利用爬山法可以 方便快捷地对 SC和 SDC的控制参数进行优化. 但 是 ,这种方法得到的往往是局部最优结果 ,并且需要 利用经验知识对搜索方向进行调整. 以前的研 究 [ 2, 729 ]指出 , SDC控制参数的优化组合为 7212327, 而在本实验中得到的局部最优参数组合为 7212226, 这说明最佳的控制参数组合与系统的识别任务及所 使用的语音语料库密切相关. 另外 , SDC和 SC特征 向量中不同的控制参数组合最终反映了特征信息的 时序长度和向量中内嵌特征块的间隔 ,而这 2项又 同时受到帧长和帧移的影响. 因此 ,帧长和帧移变化 时 ,最优的控制参数组合也可能受到影响 ,最终系统 的性能也会有所变化. 而在以前的研究中还没有关 于最优的控制参数组合随帧长和帧移变化的讨论 , 这种变化关系的确定需要进一步研究. 参考文献 : [ 1 ]王洪海 , 刘 刚 , 郭 军. 自动语言辨识研究方法及发 展概述 [J ]. 电脑与信息技术 , 2007, 16 (2) : 37239. · 043 · 智 能 系 统 学 报 第 3卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有