引言 ·同学们好,人工智能技术中的语音识别技术在生 活中的应用非常广泛,如果电灯、电视机、门窗、 水龙头都能听我们的话,让它开它就开,让它关 它就关,是不是很方便呢?今天我们就一起来学 习语音识别的原理,探索语音识别的奥秘
引言 •同学们好,人工智能技术中的语音识别技术在生 活中的应用非常广泛,如果电灯、电视机、门窗、 水龙头都能听我们的话,让它开它就开,让它关 它就关,是不是很方便呢?今天我们就一起来学 习语音识别的原理,探索语音识别的奥秘
语音识别 ·思考:语音识别是将人类语音中的词汇内容转换为计算机可 读的输入的技术。当声音识别后,记录下来的是音频,就是 一系列高高低低的频率。那么这一系列频率都和什么有关? 声音的特性图 说明声音的特征 识别中会有哪些影响 声音的响度和整体声音的大 声音的大小 小有关 和声波整体的幅度有关 有人说话音高,有人说话音 低,和声音的频率有关,乐 声音的频率 器不同的音调也体现在不同 的频率上
语音识别 • 思考:语音识别是将人类语音中的词汇内容转换为计算机可 读的输入的技术。当声音识别后,记录下来的是音频,就是 一系列高高低低的频率。那么这一系列频率都和什么有关?
语音识别的原理 1.分帧 ·一整段声波电脑是无法直接 把整段声波分成帧为单位的声波 处理的,需要分成一小段一 小段的进行处理,每一小段 为一个帧,相当于把整理流 动的声音切成一片一片的样 子。如果分帧过细会需要很 大的计算量,分帧过粗的话 懒一态流中最小的单,通常每懒时长为25毫粉。5秒的声 波可提取出200慎的声波, 则会损失声音细节
语音识别的原理 • 1. 分帧 • 一整段声波电脑是无法直接 处理的,需要分成一小段一 小段的进行处理,每一小段 为一个帧,相当于把整理流 动的声音切成一片一片的样 子。如果分帧过细会需要很 大的计算量,分帧过粗的话 则会损失声音细节
语音识别的原理 ·2.提取特征值 ·把每一帧识别为一个状态,其实状态就是由若干特征向量 组合而成的,这些特征值经过组合能够表现出这一段音频 的有效信息,就可以组成一个音素。 一帧声波 提取 特征向量一每一帧声波可提取出多组特 征向量
语音识别的原理 • 2. 提取特征值 • 把每一帧识别为一个状态,其实状态就是由若干特征向量 组合而成的,这些特征值经过组合能够表现出这一段音频 的有效信息,就可以组成一个音素
语音识别的原理 ·3.声学模型 ·把若干帧中的特征值组合成音素的过程,就用到了声音的 声学特性,不同语言的声学特性是不同的。汉语的音素就 包含了声母和韵母。 导入 声学模型 生成 0 特征向量
语音识别的原理 • 3. 声学模型 • 把若干帧中的特征值组合成音素的过程, 就用到了声音的 声学特性, 不同语言的声学特性是不同的。汉语的音素就 包含了声母和韵母