第5期 张磊,等:结合关键词混淆网络的关键词检出系统 ·435· 90 [3]陈立伟,宋宪晨,章东华,等.一种基于优化神经网络的 85 语音识别[J].应用科技,2008,35(2):17-20 CHEN Liwei,SONG Xianchen,ZHANG Dongsheng,et al. 多 Speech recognition using an optimized wavelet neural net- work[J].Applied Science and Technology,2008,35(2): 70 17-20. 65 [4]郑铁然,韩纪庆.汉语语音检索中基于音节的素引方法 60 研究[C]/第八届全国人机语音通讯学术会议论文集. 550 北京,中国,2005:419-424. 1 2 34 ZHENG Tieran,HAN Jiqing.Study on syllable based inde- 每个关键词每小时的虚警次数 xing methods in mandarin speech retrieval[C]//Proceed- 图5基于CN的关键词检出系统的ROC ings of National Conference on Man-Machine Speech Com- Fig.5 ROC of keyword spotting based on CN munication.Beijing,China,2005:419-424. 对于2种不同的方法,实验结果对比如表2所 [5]MANGU L,BRILL E,STOLCKE A.Finding consensus in 示.相对于20-best的65.46%的结果,在关键词混 speech recognition:word error minimization and other appli- cations of confusion networks[J].Computer Speech and 淆网络中检出关键词的召回率提高了21.65%,这 Langu8ge,2000,14(4):373400. 是由于关键词混淆网络方法同时考虑了声学得分和 [6]XUE Jian,ZHAO Yunxin.Improved confusion network al- 语言学得分,突出关键词部分的竞争,并且最小化词 gorithm and shortest path search from word Lattice[C]// 错误率,所以在混淆网络结构中检出关键词比直接 Proceedings of IEEE International Conference on Acoustics, 在N-best结果中检出关键词的能力明显提高;但是 Speech,and Signal Processing.Philadelphia,USA,2005: 误识率却上升5.35%,这是因为随着检出关键词数 853-856. 的增加,误识的关键词数也会上升 [7]ZHANG Pengyuan,SHAO Jian,ZHAO Qingwei,et al. 表2实验结果比较 Keyword spotting based on syllable confusion network Table 2 The comparison of different methods % [C]//The Third Interational Conference on Natural Com- puting.Haikou,China,2007:656-659. 实验方法 召回率 误识率 [8]YONG S,EVERMANN G,GALES M.The HTK book for 20-best 65.46 3.79 HTK3.3)[EB/0L].[2009-11-25].Hp:/htk.eng 关键词混淆网络 87.11 9.14 cam.ac.uk. [9]GOODMAN JT.A bit of progress in language modeling[J]. 4 结束语 Computer Speech and Language,2001,15(4):403-434. 本文将关键词检出技术融合到混淆网络生成 作者简介: 中,从关键词的首音节开始只生成和关键词相关的 张磊,女,1973年生,副教授,主 部分混淆网络,因此和传统的混淆网络生成算法相 要研究方向为语音信号处理,承担或参 比,具有速度快、定位准的优点.同时利用归一化后 与4项国家自然科学基金项目,发表学 术论文30余篇, 验概率进行确认,和N-best结构的关键词检出系统 相比,具有较高的检出率.下一步工作将考虑词表进 一步扩大到包含三字词和四字词,并在关键词混淆 网络生成中,考虑加重语言学模型的概率信息.在实 验过程中,发现误识率增加是由于音调的误识造成, 陈晶,女,1984年生,硕士研究 因此下一步工作将在关键词混淆网络中,将具有相 生,主要研究方向为语音信号处理。 同音节不同音调的各竞争候选整合,来弥补音调误 识带来的影响。 参考文献: [1]叶靓,王智斌,邵谦明.基于相关反馈的语音检索引擎 [J].计算机工程,2007,33(17):228-230. 项学智,男,1979年生,讲师、博士, YE Liang,WANG Zhibin,SHAO Qianming.Speech re- 主要研究方向为信号处理,参与多项国 trieval engine based on relevance feedback[].Computer 家自然科学基金项目,发表学术论文20 Eng9 ineering,2007,33(17):228-230. [2]王让定,袁旭海,徐霁.一种新颗的混合语音检索算法 余篇。 [J].计算机应用研究,2008,25(5):1349-1351. WANG Rangding,YUAN Xuhai,XU Ji.Novel mixing speech retrieval algorithm [J].Application Research of Computers,2008,25(5):1349-1351