正在加载图片...
第2期 张毅,等:一种语音特征提取中Ml倒谱系数的后处理算法 ·213 20 20 0 - -20 0 100200300 0100200300 0100200300 100200300 0 100200300 频率Hz 频率/Hz 频率Hz 顺率Hz 频率Hz (a)原始语音信号 (b)均值消减输出 (c方差归一化输出 (d时间序列滤波输出 (e)加权自回归平均输出 图5语音特征C[1]噪声为-5dB时,MVDA后处理输出 Fig.5 The MVDA postprocessing output of voice features C[1]with noise of-5 dB 20 20 2 M0 -20 二20 1 0 100200300 0 100200300 0100200300 0 100200300 0 100200300 频率/Hz 频率/Hz 频率Hz 频率/Hz 频率/Hz (a)原始语音信号 b)均值消减输出 (c)方差归一化输出 (d)时间序列滤波输出 (e加权自回归平均输出 图6语音特征C[D]噪声为20dB时,MVDA后处理输出 F1g.61 The MVDA postprocessing output of voice features C[D]with noise of 20 dB 20 .on/m 20 睡20 0 100200300 0 100200300 100200300 100200300 100200300 频率/Hz 频率Hz 频率/Hz 频率/Hz 频率/Hz (a)原始语音信号 (b)均值消减输出 (c方差归一化输出 (d)时间序列滤波输出 (e)加权自回归平均输出 图7语音特征C[D]噪声为10dB时,MVDA后处理输出 Fig.7 The MVDA postprocessing output of voice features C[D]with noise of 10 dB 20 20 20 10 0 100200300 0 100200300 0 100200300 0 100200300 0 100200300 频率/Hz 頫率/Hz 頫率/Hz 频率/Hz 频率/Hz (a)原始语音信号 (b)均值消减输出 (c方差归一化输出 (d)时间序列滤波输出 (e)加权自回归平均输出 图8语音特征C[D]噪声为0dB时,MVDA后处理输出 Fig.8 The MVDA postprocessing output of voice features C[D]with noise of 0 dB 20 0 100200300 0 100200300 0 100200300 0 100200300 0 100200300 频率/Hz 频率Hz 频率/Hz 频率/Hz 频率/Hz (a)原始语音信号 (b)均值消减输出 (c)方差归一化输出 (d时间序列滤波输出 (e加权自回归平均输出 图9语音特征C[D]噪声为-5dB时,MVDA后处理输出 Fig.9 The MVDA postprocessing output of voice features C[D]with noise of-5 dB 然而使用视觉检查推断语音识别处理方法的不 音更加接近真实的语音信号。 确定性总是存在的。为了便于比较,本文计算了语 表1含噪语音MVDA参数与语音信号的欧氏距离 音信号特征和带噪语音信号特征的欧式距离,具体 Table 1 The compasison of training beteeen MVDA and 数值见表1。可以分析得出,含噪语音特征和无噪 MFCC 语音信号特征的欧式距离均与噪声强度正相关。均 参数 20/dB 10/dB 0/dB -10/dB 值消减和方差归一化减小了含噪语音特征与无噪语 均值消减 939 1356 1845 1956 音信号特征的欧式距离。最终,时间序列滤波和加 方差归一化 129 196 259 346 权自回归移动平均滤波进一步减小了欧式距离。根 时间序列滤波 78 112 136 203 据表1,加权自回归移动平均滤波处理后的带噪语 加权自回归移动平均61 69 72 76图 5 语音特征 C[1] 噪声为-5 dB 时,MVDA 后处理输出 Fig.5 The MVDA postprocessing output of voice features C[1] with noise of -5 dB 图 6 语音特征 C[D] 噪声为 20 dB 时,MVDA 后处理输出 Fig.6 The MVDA postprocessing output of voice features C[D] with noise of 20 dB 图 7 语音特征 C[D] 噪声为 10 dB 时,MVDA 后处理输出 Fig.7 The MVDA postprocessing output of voice features C[D] with noise of 10 dB 图 8 语音特征 C[D] 噪声为 0 dB 时,MVDA 后处理输出 Fig.8 The MVDA postprocessing output of voice features C[D] with noise of 0 dB 图 9 语音特征 C[D] 噪声为-5 dB 时,MVDA 后处理输出 Fig.9 The MVDA postprocessing output of voice features C[D] with noise of -5 dB 然而使用视觉检查推断语音识别处理方法的不 确定性总是存在的。 为了便于比较,本文计算了语 音信号特征和带噪语音信号特征的欧式距离,具体 数值见表 1。 可以分析得出,含噪语音特征和无噪 语音信号特征的欧式距离均与噪声强度正相关。 均 值消减和方差归一化减小了含噪语音特征与无噪语 音信号特征的欧式距离。 最终,时间序列滤波和加 权自回归移动平均滤波进一步减小了欧式距离。 根 据表 1,加权自回归移动平均滤波处理后的带噪语 音更加接近真实的语音信号。 表 1 含噪语音 MVDA 参数与语音信号的欧氏距离 Table 1 The compasison of training beteeen MVDA and MFCC 参数 20 / dB 10 / dB 0 / dB -10 / dB 均值消减 939 1 356 1 845 1 956 方差归一化 129 196 259 346 时间序列滤波 78 112 136 203 加权自回归移动平均 61 69 72 76 第 2 期 张毅,等:一种语音特征提取中 Mel 倒谱系数的后处理算法 ·213·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有