第１１卷第２期智能系统学报Ｖｏｌ．１１ №．２２０

点击下载：【机器感知与模式识别】一种语音特征提取中Mel倒谱系数的后处理算法编辑部

正在加载图片...

第11卷第2期智能系统学报 Vol.11 No.2 2016年4月 CAAI Transactions on Intelligent Systems Apr.2016 D0I:10.11992/is.201511008 网络出版地址：http://www.enki..net/kcms/detail/23.1538.TP.20160315.1248.018.html 一种语音特征提取中Ml倒谱系数的后处理算法张毅，谢延义2，罗元3，席兵3 (1.重庆邮电大学先进制造工程学院，重庆400065：2.重庆邮电大学自动化学院，重庆400065：3.重庆邮电大学光电工程学院，重庆400065) 摘要：为提高语音识别系统的鲁棒性，本文以Ml频率倒谱系数(MFCC)为基础，结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法，提出了一种后处理算法，本文将该算法命名为MVDA后处理法，所得语音特征参数简称MVDA。本文首先从理论上推导了MVDA后处理法可以去除加性噪声和卷积噪声的干扰，接着针对MVDA与MFCC做了对比试验，并分析了含噪语音与语音信号的欧氏距离变化，证明MVDA后处理法的每一步均有效降低了噪声的干扰，且得出了MVDA在不同噪声环境中均更优的结论。这种简洁的语音特征不仅可以达到许多复杂语音特征处理方法的效果，而且有效减少了自动语音识别系统的计算量。关键词：后处理：语音特征：语音识别：噪声：鲁棒性中图分类号：TP391.4文献标志码：A文章编号：1673-4785(2016)02-0208-07 中文引用格式：张毅，谢延义，罗元，等.一种语音特征提取中Ml倒谱系数的后处理算法[J].智能系统学报，2016,11(2)： 208-215. 英文引用格式：ZHANG Yi,XIE Yanyi,LUO Yuan,etal.Postprocessing method of MFCC in speech feature extraction[J].CAAI transactions on intelligent systems,2016,11(2):208-215. Postprocessing method of MFCC in speech feature extraction ZHANG Yi',XIE Yanyi2,LUO Yuan',XI Bing' (1.Institute of Advanced Manufacturing Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065, China;2.College of Automation,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;3.College of Opto Electronic Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China) Abstract:To improve the robustness of automatic speech recognition systems,a new speech feature postprocessing method based on the Mel-frequency Cepstral Coefficient MFCC)is proposed,which is named the MVDA postpro- cessing method.The postprocessed feature parameters are named MVDAs.This technique combines mean subtrac- tion,variance normalization,time sequence fltering,and autoregressive moving average flters.Experiments were conducted to compare MVDA and MFCC.Changes in the Euclidean distance of the speech with noise and the speech signal were analyzed,proving that every step of MVDA postprocessing could effectively reduce the noise in- terference.Thus,all MVDAs in different noise environments were superior.This simple feature does not only a- chieve the effect of many complex speech feature processing methods but also effectively reduces the computational complexity of automatic speech recognition systems. Keywords:postprocessing;phonetic feature;speech recognition;noise;robustness 为了提高语音识别系统的鲁棒性，谱减法、卡尔收稿日期：2015-11-06.网络出版日期：2016-03-15. 曼滤波1]和麦克风阵列[]等语音增强技术得到应基金项目：重庆市科委前沿技术专项重点项目(cstc2015 jeyjBX0066). 通信作者：谢延义.E-mail:811719530@qq.com. 用和推广。语音特征的失真造成声学空间的变形，第１１卷第２期智能系统学报Ｖｏｌ．１１ №．２２０１６年４月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｐｒ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１５１１００８网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０３１５．１２４８．０１８．ｈｔｍｌ一种语音特征提取中Ｍｅｌ倒谱系数的后处理算法张毅１，谢延义２，罗元３，席兵３（１．重庆邮电大学先进制造工程学院，重庆４０００６５；２．重庆邮电大学自动化学院，重庆４０００６５；３．重庆邮电大学光电工程学院，重庆４０００６５）摘要：为提高语音识别系统的鲁棒性，本文以Ｍｅｌ频率倒谱系数（ＭＦＣＣ）为基础，结合均值消减法、方差归一化、时间序列滤波法和加权自回归移动平均滤波法，提出了一种后处理算法，本文将该算法命名为ＭＶＤＡ后处理法，所得语音特征参数简称ＭＶＤＡ。本文首先从理论上推导了ＭＶＤＡ后处理法可以去除加性噪声和卷积噪声的干扰，接着针对ＭＶＤＡ与ＭＦＣＣ做了对比试验，并分析了含噪语音与语音信号的欧氏距离变化，证明ＭＶＤＡ后处理法的每一步均有效降低了噪声的干扰，且得出了ＭＶＤＡ在不同噪声环境中均更优的结论。这种简洁的语音特征不仅可以达到许多复杂语音特征处理方法的效果，而且有效减少了自动语音识别系统的计算量。关键词：后处理；语音特征；语音识别；噪声；鲁棒性中图分类号：ＴＰ３９１．４文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１６）０２⁃０２０８⁃０７中文引用格式：张毅，谢延义，罗元，等．一种语音特征提取中Ｍｅｌ倒谱系数的后处理算法［Ｊ］．智能系统学报，２０１６，１１（２）：２０８⁃２１５．英文引用格式：ＺＨＡＮＧＹｉ，ＸＩＥＹａｎｙｉ，ＬＵＯＹｕａｎ，ｅｔａｌ．ＰｏｓｔｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｏｆＭＦＣＣｉｎｓｐｅｅｃｈｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１６，１１（２）：２０８⁃２１５．ＰｏｓｔｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｏｆＭＦＣＣｉｎｓｐｅｅｃｈｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎＺＨＡＮＧＹｉ１，ＸＩＥＹａｎｙｉ２，ＬＵＯＹｕａｎ３，ＸＩＢｉｎｇ３（１．ＩｎｓｔｉｔｕｔｅｏｆＡｄｖａｎｃｅｄＭａｎｕｆａｃｔｕｒｉｎｇＥｎｇｉｎｅｅｒｉｎｇ，ＣｈｏｎｇｑｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｃｈｏｎｇｑｉｎｇ４０００６５，Ｃｈｉｎａ；２．ＣｏｌｌｅｇｅｏｆＡｕｔｏｍａｔｉｏｎ，ＣｈｏｎｇｑｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｃｈｏｎｇｑｉｎｇ４０００６５，Ｃｈｉｎａ；３．ＣｏｌｌｅｇｅｏｆＯｐｔｏＥｌｅｃｔｒｏｎｉｃＥｎｇｉｎｅｅｒｉｎｇ，ＣｈｏｎｇｑｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｃｈｏｎｇｑｉｎｇ４０００６５，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｏｉｍｐｒｏｖｅｔｈｅｒｏｂｕｓｔｎｅｓｓｏｆａｕｔｏｍａｔｉｃｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍｓ，ａｎｅｗｓｐｅｅｃｈｆｅａｔｕｒｅｐｏｓｔｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｂａｓｅｄｏｎｔｈｅＭｅｌ⁃ｆｒｅｑｕｅｎｃｙＣｅｐｓｔｒａｌＣｏｅｆｆｉｃｉｅｎｔ（ＭＦＣＣ）ｉｓｐｒｏｐｏｓｅｄ，ｗｈｉｃｈｉｓｎａｍｅｄｔｈｅＭＶＤＡｐｏｓｔｐｒｏ⁃ ｃｅｓｓｉｎｇｍｅｔｈｏｄ．ＴｈｅｐｏｓｔｐｒｏｃｅｓｓｅｄｆｅａｔｕｒｅｐａｒａｍｅｔｅｒｓａｒｅｎａｍｅｄＭＶＤＡｓ．Ｔｈｉｓｔｅｃｈｎｉｑｕｅｃｏｍｂｉｎｅｓｍｅａｎｓｕｂｔｒａｃ⁃ ｔｉｏｎ，ｖａｒｉａｎｃｅｎｏｒｍａｌｉｚａｔｉｏｎ，ｔｉｍｅｓｅｑｕｅｎｃｅｆｌｔｅｒｉｎｇ，ａｎｄａｕｔｏｒｅｇｒｅｓｓｉｖｅｍｏｖｉｎｇａｖｅｒａｇｅｆｌｔｅｒｓ．ＥｘｐｅｒｉｍｅｎｔｓｗｅｒｅｃｏｎｄｕｃｔｅｄｔｏｃｏｍｐａｒｅＭＶＤＡａｎｄＭＦＣＣ．ＣｈａｎｇｅｓｉｎｔｈｅＥｕｃｌｉｄｅａｎｄｉｓｔａｎｃｅｏｆｔｈｅｓｐｅｅｃｈｗｉｔｈｎｏｉｓｅａｎｄｔｈｅｓｐｅｅｃｈｓｉｇｎａｌｗｅｒｅａｎａｌｙｚｅｄ，ｐｒｏｖｉｎｇｔｈａｔｅｖｅｒｙｓｔｅｐｏｆＭＶＤＡｐｏｓｔｐｒｏｃｅｓｓｉｎｇｃｏｕｌｄｅｆｆｅｃｔｉｖｅｌｙｒｅｄｕｃｅｔｈｅｎｏｉｓｅｉｎ⁃ ｔｅｒｆｅｒｅｎｃｅ．Ｔｈｕｓ，ａｌｌＭＶＤＡｓｉｎｄｉｆｆｅｒｅｎｔｎｏｉｓｅｅｎｖｉｒｏｎｍｅｎｔｓｗｅｒｅｓｕｐｅｒｉｏｒ．Ｔｈｉｓｓｉｍｐｌｅｆｅａｔｕｒｅｄｏｅｓｎｏｔｏｎｌｙａ⁃ ｃｈｉｅｖｅｔｈｅｅｆｆｅｃｔｏｆｍａｎｙｃｏｍｐｌｅｘｓｐｅｅｃｈｆｅａｔｕｒｅｐｒｏｃｅｓｓｉｎｇｍｅｔｈｏｄｓｂｕｔａｌｓｏｅｆｆｅｃｔｉｖｅｌｙｒｅｄｕｃｅｓｔｈｅｃｏｍｐｕｔａｔｉｏｎａｌｃｏｍｐｌｅｘｉｔｙｏｆａｕｔｏｍａｔｉｃｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎｓｙｓｔｅｍｓ．Ｋｅｙｗｏｒｄｓ：ｐｏｓｔｐｒｏｃｅｓｓｉｎｇ；ｐｈｏｎｅｔｉｃｆｅａｔｕｒｅ；ｓｐｅｅｃｈｒｅｃｏｇｎｉｔｉｏｎ；ｎｏｉｓｅ；ｒｏｂｕｓｔｎｅｓｓ收稿日期：２０１５⁃１１⁃０６．网络出版日期：２０１６⁃０３⁃１５．基金项目：重庆市科委前沿技术专项重点项目（ｃｓｔｃ２０１５ｊｃｙｊＢＸ００６６）．通信作者：谢延义．Ｅ⁃ｍａｉｌ：８１１７１９５３０＠ｑｑ．ｃｏｍ．为了提高语音识别系统的鲁棒性，谱减法、卡尔曼滤波［１⁃２］和麦克风阵列［３］等语音增强技术得到应用和推广。语音特征的失真造成声学空间的变形

向下翻页>>

点击下载：【机器感知与模式识别】一种语音特征提取中Mel倒谱系数的后处理算法编辑部