西安电子科技大学：《多媒体数据处理》课程教学课件（PPT讲稿）第二章数字声音及MIDI简介

声音是携带信息的极其重要的媒体，是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。这些声音有许多共同的特性，也有它们各自的特性。在用计算机处理这些声音时，既要考虑它们的共性，又要利用它们的各自的特性。

团购合买资源类别：文库，文档格式：PPT，文档页数：27，文件大小：233.5KB

数字言音及MID简介西安电子科技大学多媒体研究所 http://www.mti.xidian.edu.cn

XIDIAN 西安电子科技大学多媒体研究所 http://www.mti.xidian.edu.cn 数字声音及MIDI简介

音频处理技不声音是携带信息的极其重要的媒体,是多媒体技术硏究中的一个重要内容。声音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们的各自的特性我们将研究声音的基础知识,掌握声音数字化的两个最基本的概念;了解基本的音频信号编码技术

声音是携带信息的极其重要的媒体，是多媒体技术研究中的一个重要内容。声音的种类繁多，如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。这些声音有许多共同的特性，也有它们各自的特性。在用计算机处理这些声音时，既要考虑它们的共性，又要利用它们的各自的特性。我们将研究声音的基础知识，掌握声音数字化的两个最基本的概念；了解基本的音频信号编码技术。音频处理技术

音频处理技术声音与听觉器官声音是通过空气传播的一种连续的波,叫声波。音的强弱(音强) 音调的高低(频率)-示例声波的特性反射 reflection)、折射 refraction和行射 diffraction)

声音是通过空气传播的一种连续的波，叫声波。声音的强弱（音强）音调的高低（频率）－示例声波的特性反射 (reflection)、折射 (refraction)和衍射 (diffraction) 声音与听觉器官音频处理技术

音频处理技术声音与听觉器官声音信号由许多频率不同的信号组成带宽:它用来描述组成复合信号的频率范围。 20~20000Hz(音频) 80~3400Hz(话音) 0~120dB(音强)

声音信号由许多频率不同的信号组成。带宽：它用来描述组成复合信号的频率范围。 20～20000 Hz （音频） 0～120 dB （音强）声音与听觉器官音频处理技术 80～3400 Hz （话音）

音乐令以小提琴为例,当它的A弦振动时,并不仅仅是整根弦在振动,这根弦的二分之一、三分之一、四分之一、五分之处都在振动着。于是,整根弦的振动产生了最主要的频率,我们称之为基,而弦长的二分之一、三分之四分之一等处的振动则产生了一些次要的频率,我们称之为泛彦令如果一个物体振动所发出的泛音为基音的整数倍,这个音就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小提琴等发出的都是乐膏;如果泛音是基音的非整数倍,这个音就不具备清晰可辨的音高,我们称之为噪音,如汽车发动机、计算机风扇等发出的都是噪音

音乐 ❖ 以小提琴为例，当它的A弦振动时，并不仅仅是整根弦在振动，这根弦的二分之一、三分之一、四分之一、五分之一……处都在振动着。于是，整根弦的振动产生了最主要的频率，我们称之为基音，而弦长的二分之一、三分之一、四分之一等处的振动则产生了一些次要的频率，我们称之为泛音。 ❖ 如果一个物体振动所发出的泛音为基音的整数倍，这个音就会具有清晰可辨的音高，我们称之为乐音，如钢琴，小提琴等发出的都是乐音；如果泛音是基音的非整数倍，这个音就不具备清晰可辨的音高，我们称之为噪音，如汽车发动机、计算机风扇等发出的都是噪音

聲壓級聲壓音强中分贝的定义 (分貝)(徽巴斯卡) 100,000,000 船隻引擎室內120 在10米範圍的撞擊式打樁10 10000,000 的士高内強勁的音樂/紡陋100 在10米範圍的破碎機在25米範圍柴油貨運火車高速前進 100.000 定义示例在25米範園交通繁忙的馬路上客醺内的對話6 10.000 寫字樓內圖害館2米範圍的低語40- 青葱寧静的郊野30 播音室正常年輕人的聽覺闓聲(分貝)和整壓(微巴斯卡)的比對表

音强中分贝的定义定义示例

声音质量的度量 ◇声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。声音类型带宽电话语音 200Hz-34kHZ 调幅广播 50Hz-7kHz 调频广播 20HZ-15kHZ CD 20Hz-20KHz 信噪比(SNR)、主观平均判分法(MOS)

声音质量的度量 ❖声音的质量与声音的带宽有关，一般来说频率范围越宽，声音质量也就越高。声音类型带宽电话语音 200Hz－3.4kHz 调幅广播 50Hz－7kHz 调频广播 20Hz－15kHz CD 20Hz－20kHz • 信噪比（SNR）、主观平均判分法（MOS）

声音信号数字化声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。 ◇声音进入计算机的第一步就是数字化,数字化过程中最重要的步骤就是采样和量化

声音信号数字化 ❖声音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续的。 ❖声音进入计算机的第一步就是数字化，数字化过程中最重要的步骤就是采样和量化

声音信号数字化令采样( sampling):将声音信号在时间上离散化,即每隔相等的一段时间抽取一个信号样本。 0101 0l00 0011 0010 0001 1001 1010 l011 l00

声音信号数字化 ❖ 采样（sampling）：将声音信号在时间上离散化，即每隔相等的一段时间抽取一个信号样本

声音信号数字化令采样频率奈奎斯特理论指出:采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音,称为无损数字化。 fs >=2fmax 话音信号最高频率约为34kHz,所以采样频率取为8kHz

声音信号数字化 ❖采样频率奈奎斯特理论指出：采样频率不应低于声音信号最高频率的两倍，这样就能把以数字表达的声音还原成原来的声音，称为无损数字化。 fs >= 2fmax 话音信号最高频率约为3.4kHz，所以采样频率取为8kHz

点击下载完整版文档（PPT格式）

共27页，试读结束，阅读完整版请下载

点击下载（PPT格式）

浏览记录