正在加载图片...
第5期 张磊,等:结合关键词混淆网络的关键词检出系统 ·433 文将关键词检出融合到混淆网络生成算法中,在简 中通过一定的约束条件找出最佳识别结果,连接即可. 化混淆网络生成算法的同时,突出关键词候选之间 它突出了识别结果之间的竞争关系,这也正为关键词 的竞争关系,实验表明,该方法提高了关键词检出效 检出提供了有利条件.在对Lattice的解码过程中,人们 率,且该算法时间复杂度低,易于实现, 常常采用基于句子的最大后验概率(MAP)准则的解码 方法.这种方法更加关注最小化句子错误率,不能保证 1系统框架 最小化词错误率.但在混淆网络的解码过程中,通过在 基于关键词混淆网络的关键词检出系统框架如 每个候选集合中选择后验概率最大的词,可以对它进 图1所示. 行高效的最小化词错误率解码操作,这样就保证了关 键词部分的正确率. 前瑞处理 后端检出 jingl ○i4 jianL she3 sil jian4 i2 she4 sil jingl 语 声学模型 解 ji4 缺词 关键司 sil jian3 Oshis4○y 码 Lattice 混游 输 输 jiand O shes 器 出 模块 语言学模型 (a)Lattice结构 she5 jiang l ji2 jian l she3 图1关键词检出系统框图 jing l ji4 /jian4 sil Fig.1 Diagram of keyword spotting system jiu4 jian3 shi4 前端处理部分采用HTK工具箱进行模型的训 (b)混淆网络结构 练和识别8].系统声学模型为上下文相关的三因素 图2 Lattice和混淆网络对比示意图 ti-phone模型,拓扑结构为带跳转的自左向右结构, Fig.2 Diagram of Lattice and confusion network 每个模型取5个状态,按照字典拼接成音节模型进 2.2关键词混淆网络的生成 行识别;语言学模型为基于音节的bi-am语言模 关键词混淆网络是根据Lattice生成,为了区别 型,并应用Katz算法9进行平滑. 表示Lattice和混淆网络中的节点和弧,Lattice中的 后端检出是本文研究的重点.首先,把解码后的 节点和弧用小写字母表示,其中节点为{n,n1,…}, Lattice结构作为关键词混淆网络生成的输入,通过 每个节点n:含有一个时间标记t(n),弧e表示节 匹配关键词,在Lattice中生成带有得分标记的关键 点“连接到节点和的一个弧.混淆网络中的节点用 词混淆网络.其次,要在生成的关键词混淆网络中对 大写字母表示,如{No,N,…{,其中N:如图2(b) 关键词进行确认.对于Lattice中的每个弧都有标记 所示的白色节点,对应Lattice中的节点集合,Ew一w 的声学得分和语言学得分,生成混淆网络后,相应地 表示混淆网络中节点N连接到节点N的一组弧. 转化为混淆网络中弧的得分,代表了识别结果与待 对于混淆网络和Lattice节点之间的关系,有以 识别语音的匹配程度.最后,根据弧的得分可判断出 下几点约束: 最有可能的候选 1)对于Lattice中节点n:和n,如果在混淆网络 2关键词混淆网络 中属于一个集合N,则时序关系决定序号关系,即 t(n:)<t(n)可得i<j;t(n:)=t(n)可得i=j 2.1混淆网络的概念 2)Veww∈E,如果对于u∈N和v∈N,en相 混淆网络是L,attice中弧和节点通过动态对齐 当于一组Ew。w,则可以将e的2个端点对应到 后生成的结构.在这种结构中,所有竞争同一个发音 混淆网络中相邻的2个节点上,分别属于Nm和N., 位置的词形成一个集合,然后把这些集合按照时间 其中n=m+1,i≤m≤n≤j. 顺序依次连接起来,在每个集合中挑选最可能的词 在上述约束条件的基础上,可以进一步构建关 形成最佳词串.图2给出了Lattice和混淆网络对比 键词混淆网络.和传统的混淆网络相比,关键词混淆 的例子.以“经济建设”为例,其Lattice结构如图2 网络直接在Lattice中定位关键词,以关键词的第1 (a)所示;其混淆网络结构如图2(b)所示.其中,节 个音节为切入点,通过判断相邻节点的连接情况,计 点的横向排列严格按照时间先后顺序。 算得到包含关键词的混淆网络,并且标注关键词竞 在图2中,混淆网络结构很好地解决了Lattice中 争候选生成的得分标记.具体算法改进如下: 的识别结果在时间上相互交叠的现象.在混淆网络中, 1)把关键词转化为对应的音节串:KK2…K则 同一语音单元的不同识别结果及其对应的得分体现地 (M为关键词音节数,这里以M=2,关键词为“经 非常明显.句子的识别结果只要在每个音节混淆网络 济”为例,则对应音节串K为jingl,K2为j4)
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有