第3章音频信息处理 学习目标 ●了解声音信号的特点、存储格式及质量的度量方法 ●理解音频信号压缩方法及音频编码标准 ●掌握常用的音频处理软件对声音信号进行处理 ●了解语音识别技术及其应用
第3章 音频信息处理 学习目标 l 了解声音信号的特点、存储格式及质量的度量方法 l 理解音频信号压缩方法及音频编码标准 l 掌握常用的音频处理软件对声音信号进行处理 l了解语音识别技术及其应用
31音频信息处理基础 音频信息在多媒体中的应用极为广泛:视频图像配以娓 娓动听的音乐和语音;静态或动态图像配以解说和背景音 乐;立体声音乐可增加空间感;游戏中的音响效果等 音频处理技术主要包括电声转换、音频信号的存储、重 放技术、加工处理技术以及数字化音频信号的编码、压缩、 传输、存取、纠错等
3.1 音频信息处理基础 音频信息在多媒体中的应用极为广泛:视频图像配以娓 娓动听的音乐和语音 ;静态或动态图像配以解说和背景音 乐 ;立体声音乐可增加空间感 ;游戏中的音响效果等。 音频处理技术主要包括电声转换、音频信号的存储、重 放技术、加工处理技术以及数字化音频信号的编码、压缩、 传输、存取、纠错等
3.1.1音频信号的特点 1.音频信号的分类 音频信号可分为两类:语音信号和非语音信号 语音是语言的物质载体,是社会交际工具的符号,它包含了丰 富的语言内涵,是人类进行信息交流所特有的形式 非语音信号主要包括音乐和自然界存在的其他声音形式。非语 音信号的特点是不具有复杂的语义和语法信息,信息量低、识 别简单
3.1.1 音频信号的特点 1.音频信号的分类 音频信号可分为两类:语音信号和非语音信号。 语音是语言的物质载体,是社会交际工具的符号, 它包含了丰 富的语言内涵,是人类进行信息交流所特有的形式。 非语音信号主要包括音乐和自然界存在的其他声音形式。非语 音信号的特点是不具有复杂的语义和语法信息,信息量低、识 别简单
规则音频是一种连续变化的模拟信号,可用一条连续的曲线 来表示,称为声波。因声波是在时间和幅度上都连续变化的量, 我们称之为模拟量 用声音录制软件记录的英文单词“He1lo”的语音实际波形 00U 005 U10 05 030
规则音频是一种连续变化的模拟信号,可用一条连续的曲线 来表示,称为声波。因声波是在时间和幅度上都连续变化的量, 我们称之为模拟量。 用声音录制软件记录的英文单词“Hello”的语音实际波形
2模拟音频信号的两个重要参数 模拟音频信号有两个重要参数:频率和幅度。声音的频率 体现音调的高低,声波幅度的大小体现声音的强弱 个声源每秒钟可产生成百上千个波,我们把每秒钟波峰 所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹 (kHz)表示。信号的幅度是从信号的基线到当前波峰的距离 幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音 频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量 周期
2.模拟音频信号的两个重要参数 模拟音频信号有两个重要参数:频率和幅度。声音的频率 体现音调的高低,声波幅度的大小体现声音的强弱。 一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰 所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹 (kHz)表示。信号的幅度是从信号的基线到当前波峰的距离。 幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音 频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。 幅度限 周期 基线
3.声音的A/D与D/A转换 A/D转换就是把模拟信号转换成数字信号的过程,模拟电信号 变为了由“0和“1”组成的Bi信号。这样做的好处是显而易 见的,声音存储质量得到了加强,数字化的声音信息使计算 机能够进行识别、处理和压缩 A/D转换的一个关键步骤是声音的采样和量化,得到数字音频 信号,它在时间上是不连续的离散信号 借助于A/或D/A转换器,模拟信号和数字信号可以互相转换
3. 声音的A/D与D/A转换 A/D转换就是把模拟信号转换成数字信号的过程,模拟电信号 变为了由“0”和“1”组成的Bit信号。这样做的好处是显而易 见的,声音存储质量得到了加强,数字化的声音信息使计算 机能够进行识别、处理和压缩 。 A/D转换的一个关键步骤是声音的采样和量化,得到数字音频 信号,它在时间上是不连续的离散信号。 借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换
4.声音的三要素 1)音调:代表了声音的高低。音调与频率有关,频率越高, 音调越高,反之亦然。 读者也许有这样的经验,当提高磁带录音机的转速时,其 旋转加快,声音信号的频率提高,其喇叭放出来声音的音调 提高了。同样,在使用音频处理软件对声音的频率进行调整 时,也可明显感到音调随之而产生的变化。各种不同的声源 具有自己特定的音调,如果改变了某种声源的音调,则声音 会发生质的转变,使人们无法辨别声源本来的面目
4. 声音的三要素 1)音调:代表了声音的高低。音调与频率有关,频率越高, 音调越高,反之亦然。 读者也许有这样的经验,当提高磁带录音机的转速时,其 旋转加快,声音信号的频率提高,其喇叭放出来声音的音调 提高了。同样,在使用音频处理软件对声音的频率进行调整 时,也可明显感到音调随之而产生的变化。各种不同的声源 具有自己特定的音调,如果改变了某种声源的音调,则声音 会发生质的转变,使人们无法辨别声源本来的面目
2)音色:即特色的声音。声音分纯音和复音两种类型。所 谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同 频率和不同振幅的混合声音。大自然中的声音绝大部分是复音 在复音中,最低频率的声音是“基音”,它是声音的基调。其 他频率的声音称为“谐音”,也叫泛音。基音和谐音是构成声 音音色的重要因素。各种声源都具有自己独特的音色,例如各 种乐器的声音、每个人的声音、各种生物的声音等,人们就是 依据音色来辨别声源种类的。 3)音强:声音的强度,也被称为声音的响度,常说的“音量” 也是指音强。音强与声波的振幅成正比,振幅越大,强度越大 唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的, 通过播放设备的音量控制,可改变聆听时的响度
2)音色:即特色的声音。声音分纯音和复音两种类型。所 谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同 频率和不同振幅的混合声音。大自然中的声音绝大部分是复音。 在复音中,最低频率的声音是“基音” ,它是声音的基调。其 他频率的声音称为“谐音” ,也叫泛音。基音和谐音是构成声 音音色的重要因素。各种声源都具有自己独特的音色,例如各 种乐器的声音、每个人的声音、各种生物的声音等,人们就是 依据音色来辨别声源种类的。 3)音强:声音的强度,也被称为声音的响度,常说的“音量” 也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。 唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的, 通过播放设备的音量控制,可改变聆听时的响度
5.声音的频谱 声音的频谱有线性频谱和连续频谱之分。线性频谱是具有 周期性的单一频率声波;连续频谱是具有非周期性的带有 定频带所有频率分量的声波。纯粹的单一频率的声波 能在专门的设备中创造出来,声音效果单调而乏味。自然 界中的声音几乎全部属于非周期性声波,该声波具有广泛 的频率分量,听起来声音饱满、音色多样且具有生气
声音的频谱有线性频谱和连续频谱之分。线性频谱是具有 周期性的单一频率声波;连续频谱是具有非周期性的带有 一定频带所有频率分量的声波。纯粹的单一频率的声波只 能在专门的设备中创造出来,声音效果单调而乏味。自然 界中的声音几乎全部属于非周期性声波,该声波具有广泛 的频率分量,听起来声音饱满、音色多样且具有生气。 5.声音的频谱
3.1.2模拟音频的数字化过程 数字化的声音易于用计算机软件处理,现在几乎所有的专 业化声音录制、编辑器都是数字方式。对模拟音频数字化过程 涉及到音频的采样、量化和编码。 采样和量化的过程可由A转换器实现。AD转换器以固定的 频率去采样,即每个周期测量和量化信号一次。经采样和量化 后声音信号经编码后就成为数字音频信号,可以将其以文件形 式保存在计算机的存储介质中,这样的文件一般称为数字声波 文件。 △□ 1001011001101 模拟信号 采样 量化 数字信号 模拟信号的数字化过程
3.1.2 模拟音频的数字化过程 数字化的声音易于用计算机软件处理,现在几乎所有的专 业化声音录制、编辑器都是数字方式。对模拟音频数字化过程 涉及到音频的采样、量化和编码。 采样和量化的过程可由A/D转换器实现。A/D转换器以固定的 频率去采样,即每个周期测量和量化信号一次。经采样和量化 后声音信号经编码后就成为数字音频信号,可以将其以文件形 式保存在计算机的存储介质中,这样的文件一般称为数字声波 文件。 模拟信号的数字化过程 100101100011101