将ＭＶＤＡ与ＭＦＣＣ特征在自动语音识别系统下进行语音识别实验对比

点击下载：【机器感知与模式识别】一种语音特征提取中Mel倒谱系数的后处理算法编辑部

正在加载图片...

.214. 智能系统学报第11卷将MVDA与MFCC特征在自动语音识别系统 5 下进行语音识别实验对比，实验结果如图4。可以结束语得出，信噪比较高时，MFCC特征与MVDA特征的识本文的分析主要基于加性噪声和卷积噪声环境别率基本相同，但随着信噪比降低，MVDA语音特征下MFCC特征参数的失真，针对这一问题提出了的效果更加显著。 MVDA语音特征提取法。分析得出实验效果与语音基本特征、滤波器的类型均相关。在使用MVDA滤 100 o-MFCC参数波法后，相较于MFCC语音特征，自动语音识别系统 95 -MVDA参数在不同性噪比环境下的识别率提高了2.7%~ 90 卧 15.0%。MVDA特征提取可以达到很多复杂去噪算法的效果，却可以减少系统对计算能力的要求，减小 80f 系统的时延。因此，MVDA后处理法可以在更小的 75 计算代价下提高系统的鲁棒性，具有较高的实际应 105 0 5 10 20 用价值。躁声强度/dB (a)噪青类型为white 参考文献： 95 [1]PALIWAL KK,BASU A.A speech enhancement method 90 based on Kalman fltering[C]//Proceedings of IEEE Inter- national Conference on Acoustics,Speech,and Signal Pro- cessing.Dallas,USA,1997:177-180. 80 。MFCC参数 [2]GIBSON J D.KOO B.GRAY S D.Filtering of Colored 75 -MVDA参数 Noise for Speech Enhancement and Coding J].IEEE 70 Transactions on Signal Processing,1991,39(8):1732- 5 0 5 10 15 20 1742 噪声强度/dB (b)噪声类型为pink [3]ZELINSKI R.A microphone array with adaptive post-filte- ring for noise reduction in reverberant rooms[C]//Proceed- 95 ings of IEEE International Conference on Acoustics, % Speech,and Signal Processing.New York,USA,1998: 2578-2581. 禁 [4]MYLLYMAKI M,VIRTANEN T.Non-stationary noise mod- 80 el compensation in voice activity detection[C]//Proceed- ·MFCC参数 ings of IEEE International Conference on Signal Processing -MVDA参数 Conference.Glasgow,Scotland,2009:2186-2190. 105 0 5 1015 20 [5]RAMFREZ J,SEGURA J C,BENFTEZ C,et al.Efficient 噪声强度/dB voice activity detection algorithms using long-term speech in- (c)噪声类型为volvo formation J].Speech communication,2004,42(3/4): 95 271-287. [6]CHOWDHURY M,SELOUANI S A,OSHAUGHNESSY D. 90 A soft computing approach to improve the robustness of on- 85 line ASR in previously unseen highly non-stationary acoustic environments[C]//Proceedings of the 11th IEEE Interna- 80 -MFCC参数 tional Conference on Information Science,Signal Processing 75 -MVDA参数 and their Applications.Montreal,Canada,2012:522-527. 70 [7]GUPTA H A,RAJU A,ALWAN A.Non-linear dimension 5 10 1520 噪声强度/dB reduction of Gabor features for noise-robust ASR[C]//Pro- (d)噪声类型为DE ceedings of IEEE International Conference on Acoustics, 图10自动语音识别结果对比图 Speech,and Signal Processing.Florence,Italy,2014: Fig.10 Comparison of automatic speech recognition results 1715-1719. 8 HANSEN J H L.VARADARAJAN V.Analysis and com-将ＭＶＤＡ与ＭＦＣＣ特征在自动语音识别系统下进行语音识别实验对比，实验结果如图４。可以得出，信噪比较高时，ＭＦＣＣ特征与ＭＶＤＡ特征的识别率基本相同，但随着信噪比降低，ＭＶＤＡ语音特征的效果更加显著。图１０自动语音识别结果对比图Ｆｉｇ．１０Ｃｏｍｐａｒｉｓｏｎｏｆａｕｔｏｍａｔｉｃｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎｒｅｓｕｌｔｓ５结束语本文的分析主要基于加性噪声和卷积噪声环境下ＭＦＣＣ特征参数的失真，针对这一问题提出了ＭＶＤＡ语音特征提取法。分析得出实验效果与语音基本特征、滤波器的类型均相关。在使用ＭＶＤＡ滤波法后，相较于ＭＦＣＣ语音特征，自动语音识别系统在不同性噪比环境下的识别率提高了２．７％～１５．０％。ＭＶＤＡ特征提取可以达到很多复杂去噪算法的效果，却可以减少系统对计算能力的要求，减小系统的时延。因此，ＭＶＤＡ后处理法可以在更小的计算代价下提高系统的鲁棒性，具有较高的实际应用价值。参考文献：［１］ＰＡＬＩＷＡＬＫＫ，ＢＡＳＵＡ．ＡｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔｍｅｔｈｏｄｂａｓｅｄｏｎＫａｌｍａｎｆｌｔｅｒｉｎｇ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆＩＥＥＥＩｎｔｅｒ⁃ ｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏ⁃ ｃｅｓｓｉｎｇ．Ｄａｌｌａｓ，ＵＳＡ，１９９７：１７７⁃１８０．［２］ＧＩＢＳＯＮＪＤ，ＫＯＯＢ，ＧＲＡＹＳＤ．ＦｉｌｔｅｒｉｎｇｏｆＣｏｌｏｒｅｄＮｏｉｓｅｆｏｒＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔａｎｄＣｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，１９９１，３９（８）：１７３２⁃ １７４２．［３］ＺＥＬＩＮＳＫＩＲ．Ａｍｉｃｒｏｐｈｏｎｅａｒｒａｙｗｉｔｈａｄａｐｔｉｖｅｐｏｓｔ⁃ｆｉｌｔｅ⁃ ｒｉｎｇｆｏｒｎｏｉｓｅｒｅｄｕｃｔｉｏｎｉｎｒｅｖｅｒｂｅｒａｎｔｒｏｏｍｓ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．ＮｅｗＹｏｒｋ，ＵＳＡ，１９９８：２５７８⁃２５８１．［４］ＭＹＬＬＹＭＡＫＩＭ，ＶＩＲＴＡＮＥＮＴ．Ｎｏｎ⁃ｓｔａｔｉｏｎａｒｙｎｏｉｓｅｍｏｄ⁃ ｅｌｃｏｍｐｅｎｓａｔｉｏｎｉｎｖｏｉｃｅａｃｔｉｖｉｔｙｄｅｔｅｃｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＣｏｎｆｅｒｅｎｃｅ．Ｇｌａｓｇｏｗ，Ｓｃｏｔｌａｎｄ，２００９：２１８６⁃２１９０．［５］ＲＡＭＦＲＥＺＪ，ＳＥＧＵＲＡＪＣ，ＢＥＮＦＴＥＺＣ，ｅｔａｌ．Ｅｆｆｉｃｉｅｎｔｖｏｉｃｅａｃｔｉｖｉｔｙｄｅｔｅｃｔｉｏｎａｌｇｏｒｉｔｈｍｓｕｓｉｎｇｌｏｎｇ⁃ｔｅｒｍｓｐｅｅｃｈｉｎ⁃ ｆｏｒｍａｔｉｏｎ［Ｊ］．Ｓｐｅｅｃｈｃｏｍｍｕｎｉｃａｔｉｏｎ，２００４，４２（３／４）：２７１⁃２８７．［６］ＣＨＯＷＤＨＵＲＹＭ，ＳＥＬＯＵＡＮＩＳＡ，Ｏ＇ＳＨＡＵＧＨＮＥＳＳＹＤ．Ａｓｏｆｔｃｏｍｐｕｔｉｎｇａｐｐｒｏａｃｈｔｏｉｍｐｒｏｖｅｔｈｅｒｏｂｕｓｔｎｅｓｓｏｆｏｎ⁃ ｌｉｎｅＡＳＲｉｎｐｒｅｖｉｏｕｓｌｙｕｎｓｅｅｎｈｉｇｈｌｙｎｏｎ⁃ｓｔａｔｉｏｎａｒｙａｃｏｕｓｔｉｃｅｎｖｉｒｏｎｍｅｎｔｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１１ｔｈＩＥＥＥＩｎｔｅｒｎａ⁃ ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ，ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇａｎｄｔｈｅｉｒＡｐｐｌｉｃａｔｉｏｎｓ．Ｍｏｎｔｒｅａｌ，Ｃａｎａｄａ，２０１２：５２２⁃５２７．［７］ＧＵＰＴＡＨＡ，ＲＡＪＵＡ，ＡＬＷＡＮＡ．Ｎｏｎ⁃ｌｉｎｅａｒｄｉｍｅｎｓｉｏｎｒｅｄｕｃｔｉｏｎｏｆＧａｂｏｒｆｅａｔｕｒｅｓｆｏｒｎｏｉｓｅ⁃ｒｏｂｕｓｔＡＳＲ［Ｃ］／／Ｐｒｏ⁃ ｃｅｅｄｉｎｇｓｏｆＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ．Ｆｌｏｒｅｎｃｅ，Ｉｔａｌｙ，２０１４：１７１５⁃１７１９．［８］ＨＡＮＳＥＮＪＨＬ，ＶＡＲＡＤＡＲＡＪＡＮＶ．Ａｎａｌｙｓｉｓａｎｄｃｏｍ⁃ ·２１４· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】一种语音特征提取中Mel倒谱系数的后处理算法编辑部