正在加载图片...
·338 智能系统学报 第3卷 语种包含了多种内容体裁.整个语料库的语音被分 以下就从系统的初始模型(SDC和SC的控制 成训练集、开发集和测试集3部分.训练集包括汉、 参数组合分别为13-13-3和13-3-3)出发,依次调整 英、日、德、法、西6个语种,每个语种包括36~38个 特征向量的控制参数,考察它们对性能的影响 说话人,每个说话人的语音片段为30~60s每种语 3.21参数N对性能的影响 言大约有20m的训练语料.开发集也只包括汉、 首先,保持2类特征向量的其他控制参数不变, 英、日、德、法、西6个语种,每个语种包含5名男性 只调整参数N的取值,得到测试结果如表2所示 和5名女性的语音,每人有50个平均时长为45s从表2中可以看出,对于普遍使用的13维的RAS 的语音片段.测试集包括闭集和开集2个集合.闭集ALP倒谱系数,其SDC和S℃特征矢量并没有表 包括汉、英、日、德、法、西6个语种,与训练集中的语 现出最好的识别性能,而是在阶数比较少的情况下 种完全相同,而开集则在闭集的基础上增加了俄语 (分别是9维和7维)SDC和SC参数获得了比较好 和阿拉伯语.测试集中,每个语种包括10名男性和 的识别效果.这说明,对于SC和SDC,比较少的系 10名女性、每人有50个语音片段,每个测试语音片 数已经包含了充分的识别信息,信息冗余反而会造 段的平均长度为45s训练集、开发集和测试集中 成识别性能下降 的说话人没有交叉.关于语料库的详细介绍请参见 表2参数N对性能的影响 文献121 Table 2 Effect ofN on perfommance 32对开发集的实验 特征参数 误识率1% 特征参数 误识率/% 对于开发集的实验主要是考察不同的控制参数 DC(13-1-3-3) 237 ℃(13-3-3) 157 组合对SDC和SC特征向量的性能的影响,利用爬 DC(10-1-3-3) 217 S℃(10-3-3)) 173 山法确定这2类特征矢量达到局部最优识别效果时 DC(9-13-3) 207 S℃(9-3-3) 1.53 的控制参数组合,并对这2类特征向量采用加权系 DC(8-1-3-3) 257 S℃(7-3-3) 1.50 统数a进行数据融合 DC(7-1-3-3) 233 9℃(6-3-3) 243 实验中,输入的语音经16kHz取样16bit量化后 3.22参数k对性能的影响 进行预加重,用帧长为25ms帧移为10ms的汉明窗 对于SC特征矢量,使控制参数在组合73-3的 分帧,计算13维的RASTA-LP参数包括0阶的能 基础上调整k的取值,而对于SDC特征矢量,以前 量系数).然后,取Npk为133-3构建SC特征矢量, 的研究中2得到的N的优化数值为7,所以本实 利用期望最大算法为每种语言建立GMM模型 验中取SDC的控制参数分别为7-133和9-1-33 与此同时,在经RASTA滤波的感知线性预测 为初值,然后调整k的取值,利用开发集中的语音进 (RASTA peretep tual linear prediction,RASTA-PLP) 行测试得到了表3中所列的结果 参数的基础上计算差分倒谱,然后取N-dpk为13- 表3参数k对性能的影响 13-3构建SDC特征矢量,并为每种语言建立GMM Table 3 Effect of k on perfommance 模型.所有GMM模型的混合分量数目都为128这 特征参数 误识率/% 特征参数 误识率/% 样,对应于SC和SDC控制参数组合的一组初始值 SDC(9-1-35) 1.77 SC(7-3-3) 1.50 分别建立起了系统的初始模型,对于开发集中的语 sDC(7-1-3-5) 1.53 S℃(7-3-5) 1.07 音进行测试的结果见表1 SDC(7-1-36)】 1.47 S℃(7-3-6) 1.13 1.67 S℃(7-3-7) 表1初始模型的测试结果 SDC(7-1-3-7) 1.30 Table 1 Test results of orignalmodel 从表3中可以看出,对于滑动倒谱SC矢量,当 特征参数 误识率/% 串联倒谱块的数目为5时表现出了最好的性能,当 RASTA-PLP-SDC 237 k继续增加时,系统的识别率略有降低.而对于滑动 RASTA-PLP-SC 1.57 差分倒谱SDC矢量,虽然在控制参数为9-133时 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net语种包含了多种内容体裁. 整个语料库的语音被分 成训练集、开发集和测试集 3部分. 训练集包括汉、 英、日、德、法、西 6个语种 ,每个语种包括 36~38个 说话人 ,每个说话人的语音片段为 30~60 s,每种语 言大约有 20 m in的训练语料. 开发集也只包括汉、 英、日、德、法、西 6个语种 ,每个语种包含 5名男性 和 5名女性的语音 ,每人有 50个平均时长为 4. 5 s 的语音片段. 测试集包括闭集和开集 2个集合. 闭集 包括汉、英、日、德、法、西 6个语种 ,与训练集中的语 种完全相同 ,而开集则在闭集的基础上增加了俄语 和阿拉伯语. 测试集中 ,每个语种包括 10名男性和 10名女性、每人有 50个语音片段 ,每个测试语音片 段的平均长度为 4. 5 s. 训练集、开发集和测试集中 的说话人没有交叉. 关于语料库的详细介绍请参见 文献 [12 ]. 3. 2 对开发集的实验 对于开发集的实验主要是考察不同的控制参数 组合对 SDC和 SC特征向量的性能的影响 ,利用爬 山法确定这 2类特征矢量达到局部最优识别效果时 的控制参数组合 ,并对这 2类特征向量采用加权系 统数 α进行数据融合. 实验中 ,输入的语音经 16 kHz取样 16 bit量化后 进行预加重,用帧长为 25 ms、帧移为 10 ms的汉明窗 分帧,计算 13维的 RASTA2PLP参数 (包括 0阶的能 量系数 ). 然后 ,取 N 2p2k为 132323构建 SC特征矢量, 利用期望最大算法为每种语言建立 GMM模型. 与此同时 ,在经 RASTA 滤波的感知线性预测 (RASTA2peretep tual linear p rediction, RASTA2PLP) 参数的基础上计算差分倒谱 ,然后取 N 2d2p2k为 132 12323构建 SDC特征矢量 ,并为每种语言建立 GMM 模型. 所有 GMM模型的混合分量数目都为 128. 这 样 ,对应于 SC和 SDC控制参数组合的一组初始值 分别建立起了系统的初始模型 ,对于开发集中的语 音进行测试的结果见表 1. 表 1 初始模型的测试结果 Table 1 Test results of or ig ina l m odel 特征参数 误识率 /% RASTA2PLP2SDC 2. 37 RASTA2PLP2SC 1. 57 以下就从系统的初始模型 (SDC和 SC的控制 参数组合分别为 13212323和 132323)出发 ,依次调整 特征向量的控制参数 ,考察它们对性能的影响. 3. 2. 1 参数 N 对性能的影响 首先 ,保持 2类特征向量的其他控制参数不变 , 只调整参数 N 的取值 ,得到测试结果如表 2所示. 从表 2中可以看出 ,对于普遍使用的 13维的 RAS2 TA2PLP倒谱系数 ,其 SDC和 SC特征矢量并没有表 现出最好的识别性能 ,而是在阶数比较少的情况下 (分别是 9维和 7维 ) SDC和 SC参数获得了比较好 的识别效果. 这说明 ,对于 SC和 SDC,比较少的系 数已经包含了充分的识别信息 ,信息冗余反而会造 成识别性能下降. 表 2 参数 N 对性能的影响 Table 2 Effect of N on performance 特征参数 误识率 /% 特征参数 误识率 /% SDC (13212323) 2. 37 SC (132323) 1. 57 SDC (10212323) 2. 17 SC (102323) 1. 73 SDC (9212323) 2. 07 SC (92323) 1. 53 SDC (8212323) 2. 57 SC (72323) 1. 50 SDC (7212323) 2. 33 SC (62323) 2. 43 3. 2. 2 参数 k对性能的影响 对于 SC特征矢量 ,使控制参数在组合 72323的 基础上调整 k的取值 ,而对于 SDC特征矢量 ,以前 的研究中 [ 2, 729 ]得到的 N 的优化数值为 7,所以本实 验中取 SDC的控制参数分别为 7212323和 9212323 为初值 ,然后调整 k的取值 ,利用开发集中的语音进 行测试得到了表 3中所列的结果. 表 3 参数 k对性能的影响 Table 3 Effect of k on performance 特征参数 误识率 /% 特征参数 误识率 /% SDC (9212325) 1. 77 SC (72323) 1. 50 SDC (7212325) 1. 53 SC (72325) 1. 07 SDC (7212326) 1. 47 SC (72326) 1. 13 SDC (7212327) 1. 67 SC (72327) 1. 30 从表 3中可以看出 ,对于滑动倒谱 SC矢量 ,当 串联倒谱块的数目为 5时表现出了最好的性能 ,当 k继续增加时 ,系统的识别率略有降低. 而对于滑动 差分倒谱 SDC矢量 ,虽然在控制参数为 9212323时 · 833 · 智 能 系 统 学 报 第 3卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有