第二章媒体信息处理技术 21音频处理技术 2.1.1音频数字化处理 1.声音的基本描述 2.音频信号的数字化过程 3.数字音频的主要技术指标 2.1.2MIDI音乐合成 1.数字音乐生成方法 2.MIDI音频处理过程 2.1.3多媒体声音卡 2.1.4音频文件格式
第二章 媒体信息处理技术 2.1 音频处理技术 2.1.1 音频数字化处理 1.声音的基本描述 2.音频信号的数字化过程 3.数字音频的主要技术指标 2.1.2 MIDI音乐合成 1.数字音乐生成方法 2.MIDI音频处理过程 2.1.3 多媒体声音卡 2.1.4 音频文件格式
2.1音频处理技术 基本内容:音频数字化处理,MIDI音乐合成, 多媒体声音卡,音频文件格式 2.1.1音频数字化处理 1.声音的基本描述 ①波形声音:基于振动波(信号化)描述的声音; 可形成数字波形文件 ②语音:人的声道发出的声音一语义化描述的语言形式 ③音乐:通过乐谱规范表达的乐曲—符号化描述的声音; 可形成数字音乐文件
2.1 音频处理技术 基本内容:音频数字化处理,MIDI音乐合成, 多媒体声音卡,音频文件格式 2.1.1 音频数字化处理 1.声音的基本描述 ① 波形声音:基于振动波(信号化)描述的声音; 可形成数字波形文件 ② 语音:人的声道发出的声音 — 语义化描述的语言形式 ③ 音乐:通过乐谱规范表达的乐曲 — 符号化描述的声音; 可形成数字音乐文件
(1)声音的模拟信号表示方法 Sound= Bline+A×f(t) Bline ①基线B1ine:提供一个测量模拟信号的基准点 ②周期T:两个相邻信号的波峰(或波谷)之间的时间间隔, 用于表示信号的快慢即声音发生的频率f;f=1/T(Hz ③振幅A:波形峰点(或谷点)与基线之间的距离 用于表示信号的强弱即声音的响度
(1)声音的模拟信号表示方法 Sound = Bline + A×f(t) ① 基线Bline:提供一个测量模拟信号的基准点 ② 周期T:两个相邻信号的波峰(或波谷)之间的时间间隔, 用于表示信号的快慢即声音发生的频率f;f = 1/T(Hz) ③ 振幅A:波形峰点(或谷点)与基线之间的距离 用于表示信号的强弱即声音的响度
(2)声音的质量特性 SQuality =(Tone, Volume, TQuality ①音调(Tone):声音频度与音域宽窄程度,与频率f有关 音调可按频率分为: 次声(f20KHz) ②音量( Volume):声音响度亦或音强,与振幅A成正比 ③音质( Tone Quality):声音在听觉上的优美程度, 亦称音色; 是振幅与频率的优化组合(基音+谐音)
(2)声音的质量特性 SQuality = (Tone, Volume, TQuality) ① 音调(Tone):声音频度与音域宽窄程度,与频率f有关. 音调可按频率分为: ·次声(f 20KHz) ② 音量(Volume):声音响度亦或音强,与振幅A成正比. ③ 音质(Tone Quality):声音在听觉上的优美程度, 亦称音色; 是振幅与频率的优化组合(基音 + 谐音)
声音的质量通常以音频信号的带宽来衡量 音频( Audio):声音的同义词 频率范围为:20Hz~20KHz 人的声带一般为:50~500Hz 常见的音频带宽: ①电话音频: 200Hz3 4KHZ ②无线电广播调幅(AM)声:50Hz~7KHz ③无线电广播调频(FM)声:20Hz~15KHz ④高保真(HiFi)立体声:20Hz~20KH
声音的质量通常以音频信号的带宽来衡量 音频(Audio):声音的同义词 频率范围为:20Hz~20KHz 人的声带一般为:50~500 Hz 常见的音频带宽: ① 电话音频: 200Hz~3.4KHz ② 无线电广播调幅(AM)声:50Hz~7KHz ③ 无线电广播调频(FM)声:20Hz~15KHz ④ 高保真(HiFi)立体声: 20Hz~20KHz
2.音频信号的数字化过程 音频信号 放大/滤波 采样/保持 望化 编码 数字化声音 采样脉冲 ①放大:使信号幅度达到可采集与变换要求; 并滤除高频干扰和噪声 ②采样:模拟信号离散化 以固定的采样周期T对波形Xa(t)的幅值进行抽样 得到一个离散的序列X(n).采样值: X(n ) Xa (nt) ··●·· (离散点的个数), T=1/f,f为采样频率
2.音频信号的数字化过程 ① 放大:使信号幅度达到可采集与变换要求; 并滤除高频干扰和噪声 ② 采样:模拟信号离散化 以固定的采样周期T对波形Xa(t)的幅值进行抽样, 得到一个离散的序列X(n).采样值: X(n)= Xa(nT); N = 1,2,3,……(离散点的个数), T = 1/f,f为采样频率
③量化:离散信号数字化 把每个采样值(模拟量)转换成数字量, 并用n个二进制数表示;n越大,量化精度越高 量化值: xGm)=Q[X(n)];n=1,2,3,……, 量化误差:e()=xGmX();n=1,2,3,… 注意点:a.实现量化的过程称A/D变换 b.均匀量化后的信号称脉冲编码调制(PCM)信号 c.A/D变换一般是均匀量化;因而称PCM量化 ④编码:数字信号格式化 把每个量化值表示成二进制存储位形式的字长 8位字长≡8bit(1个Byte) 若要进行数据压缩编码时,需采用相关算法及数据格式表示
③ 量化:离散信号数字化 把每个采样值(模拟量)转换成数字量, 并用n个二进制数表示;n越大,量化精度越高 量化值: 量化误差: 注意点:a. 实现量化的过程称A/D变换 b. 均匀量化后的信号称脉冲编码调制(PCM)信号 c. A/D变换一般是均匀量化;因而称PCM量化 ④ 编码:数字信号格式化 把每个量化值表示成二进制存储位形式的字长 8位字长 ≡ 8bit (1个Byte) 若要进行数据压缩编码时,需采用相关算法及数据格式表示
3.数字音频的主要技术指标 (1)采样频率fc:单位时间间隔(采样周期)内所采集的样本数 fc越高,数字化后的信号质量就越高;但存储量也越大 (2)量化字长:用采样周期分割样本波形的振幅空间的等分数, 表示为采样值的二进制位数;因而称采样精度或样本字长 量化字长(位数)与采样值的精度成正比.关系: 4bit16级(n=16),8bit256级,16bit65536级 (3)声道数:一次采样所记录的声音波形个数 单声道一产生一个声音波形; 双声道一产生两个声音波形(立体声) 声道数增加,将使存储容量及开销成倍增加.计算公式: 存储量=(采样频率×量化字长×声道数)/8(Byte/s)
3.数字音频的主要技术指标 (1)采样频率fc:单位时间间隔(采样周期)内所采集的样本数 fc越高,数字化后的信号质量就越高;但存储量也越大 (2)量化字长:用采样周期分割样本波形的振幅空间的等分数, 表示为采样值的二进制位数;因而称采样精度或样本字长. 量化字长(位数)与采样值的精度成正比.关系: 4bit16级(n=16),8bit256级,16bit65536级. (3)声道数:一次采样所记录的声音波形个数 单声道 — 产生一个声音波形; 双声道 — 产生两个声音波形(立体声) 声道数增加,将使存储容量及开销成倍增加.计算公式: 存储量 =(采样频率×量化字长×声道数)/8 (Byte/s)
采样定理:若fc≡2 wimax( wimax为最大信号频率) 则可保证量化后的信号具有还原为模拟信号的能力 例:人耳听觉的上限频率为20KHz;则fc≡40KHz 釆样频率量化字长占用存储空间 音质等级 (KHz) (bit) (MB/ min) 说明 11025 066 C级(电话语音,AM 22.050 888 1.32 B级(磁带音乐,FM) 44.100 2.64 A级 11025 132 22.050 2.64 44.100 16 5.29 超级高保真(HiFi)
采样定理:若fc≧2fsmax (fsmax为最大信号频率), 则可保证量化后的信号具有还原为模拟信号的能力. 例:人耳听觉的上限频率为20KHz;则fc≧40KHz
2.1.2MIDI音乐合成 音乐设备数字接口MID的作用: 定义电子音乐设备连入计算机的电缆和端口标准 定义计算机与MIDI设备之间进行信息交换的一整套规则 包括电子乐器之间传送数据的通信协议 1988年,MID正式成为数字式音乐的一个国际标准 数字音乐的生成方法 波形声音数字化方法=→生成数字波形文件 MIDI方法(电子音乐合成方法)=→生成数字音乐文件 (乐谱的数字式描述一MD消息
2.1.2 MIDI音乐合成 音乐设备数字接口MIDI的作用: 定义电子音乐设备连入计算机的电缆和端口标准; 定义计算机与MIDI设备之间进行信息交换的一整套规则, 包括电子乐器之间传送数据的通信协议 1988年,MIDI正式成为数字式音乐的一个国际标准 1. 数字音乐的生成方法 ·波形声音数字化方法 生成数字波形文件 ·MIDI方法(电子音乐合成方法) 生成数字音乐文件 ( 乐谱的数字式描述 — MIDI消息 )