正在加载图片...
第3期 沈映泉,等:利用人类计算技术的语音语料库标注方法及其实现 .271 和形式上与标注图像信息(labeling images)是类似 足,手工标注方法一般只能用来标注小型语料库(如 的.因此,图像标注的一些实现方法,比如采用基于人 TT)或者大型语料库中的一小部分.这就导致了在 类计算(human computation)的网络游戏)来产生图 开发各种语言的高性能语音识别系统时,常常面临着 像标注的技术,完全可以被借鉴来解决语音语料库标 缺乏高质量标注的大型语音语料库的难题, 注的问题.本文据此提出了一个采用人类计算技术的 1.2自动标注 Wb语言学习系统,该系统将语音语料库的标注任务 为了克服手工标注大型语音语料库存在的难 和英语学习的教学过程结合在了一起,从而在分布式 题,人们开发出了许多可对语音语料库自动添加词 知识获取的基础上实现语音语料库的标注.尽管这个 汇标注和音标标注的方法.对各种自动标注系统,有 Wb语言学习系统与图像标注的网络游戏一样,都采 一个基本的质量要求,那就是自动生成的标注应具 用了人类计算技术,但二者在为用户提供的服务方面 有足够高的准确度,使其能用于声学模型和语言模 存在很大的不同.后者的服务给用户带来的只是游戏 型的训练 的乐趣,而Wb语言学习系统则为英语学习者提供 通常可以用自动语音识别系统(automatic 了一个练习英语听力理解和训练英语发音的学习平 speech recognition,ASR)来生成词汇标注.此外, 台,用户通过这个平台获得的是一个语言学习和训练 ASR系统也可以用来自动生成音标标注,例如可采 的环境 用神经网络、单音子或三音子声学模型来标记和分 割自然口语语音(spontaneous8 peech)的音素序 1 语音语料库的标注 列56.虽然对于新闻广播的标准朗读语音来说,目 在语音识别领域,通常需要对语音语料库进行 前的A$R系统已经能够达到超过90%的词汇识别 词汇标注和音标标注,这两类标注是训练声学模型 准确率7)和80%左右的音素识别准确率,但这样 和语言模型所不可或缺的24.此外,这2种标注在 的应用还远未达到令人满意的程度.自动生成的词 其他领域也有着重要的应用,例如为听力残障人士 汇标注和音标标注中散布着比例相当大的错误成 提供视频字幕,以及对音频或音/视频节目进行基于 分,还需要由人类标注者逐个词、逐个音标地仔细检 内容的搜索等等,由于语音识别系统的质量在很大 查和校对,以保证标注的可用性.因此,目前的自动 程度上取决于在识别引擎建模过程中是否有足够多 语音识别系统应用并没有真正解决手工标注枯燥乏 的精确标注的语音语料,因此,对大规模语音语料进 味、费时费力的问题.另一个更严重的问题是目前技 行高质量的词汇标注和音标标注在语音识别系统的 术水平的ASR系统要求用户发音清晰、语速稳定, 开发中是一个十分重要的环节.由于词汇标注只需 而且发音和语法都必须是正确的.然而在现场新闻 提供给用户一个输入框,接收用户的输入,而后台的 报道当中,往往存在大量的不正规的语音,比如随意 实现上完全和音标标注相同,因此,作者只论述音标 的发音、不完整的词汇、语音中的停顿、迟疑,以及不 标注 时出现的语速变化等等.这些语音现象的存在使得 为语音语料库添加标注信息的方法有手工标注 自然口语语音的自动标注变得十分困难.自然口语 和自动标注2种.下面分别介绍这2种方法的特点 语音的识别率,特别是词汇的识别率是比较低的 及其在应用中面临的困难 (一般低于80%)91.因此,由ASR系统生成的自 1.1手工标注 然口语语音的词汇和音标标注集合无法被用作可靠 手工标注由受过专门的语言学训练的专家来完 的语料库来建立语言模型和声学模型. 成,因此它直接从人类专家那里获取语言学知识虽 有一些音标自动标注系统通过查找发音词典的 然手工标注可借助如Transcriber和WinSnoori等一些 方法将词汇标注文本映射为它们的发音音标).发音 软件工具来完成,但对于标注者来说,标注大型的语 词典由不同的词汇及其对应的发音组成.这种方法的 音语料库是一项枯燥乏味、费时费力的机械性劳动; 应用有一个先决条件,那就是语音的词汇标注已经存 因此在标注过程中容易出错.为了保证标注的质量, 在.对于有多种不同发音,或者有多种口音变化的词 通常需要由一组标注者对所有的标注文本进行交叉 汇,这种查找发音词典的方法往往难以奏效.对于多 校验和核查,以纠正标注中存在的错误.这意味着在 音词,尽管可以建立一个准确的发音词典,词典中同 大型语音语料库标注项目的实施过程中要投入相当 时列出它的所有发音;但是在将一个多音词映射到其 大的人力资源,整个工程往往耗资巨大,手工进行音 发音的过程中,发音词典本身无法提供如何根据上下 标标注尤其如此.正是由于广泛存在的资金投人不 文来为多音字选择对应发音的规则.另外,许多人名
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有