数字言音及MID简介 西安电子科技大学多媒体研究所 http://www.mti.xidian.edu.cn
XIDIAN 西安电子科技大学多媒体研究所 http://www.mti.xidian.edu.cn 数字声音及MIDI简介
音频处理技不 声音是携带信息的极其重要的媒体,是多媒体技术硏究中 的一个重要内容。声音的种类繁多,如人的话音、乐器声、动 物发出的声音、机器产生的声音以及自然界的声音等。 这些声音有许多共同的特性,也有它们各自的特性。在用 计算机处理这些声音时,既要考虑它们的共性,又要利用它们 的各自的特性 我们将研究声音的基础知识,掌握声音数字化的两个最基 本的概念;了解基本的音频信号编码技术
声音是携带信息的极其重要的媒体,是多媒体技术研究中 的一个重要内容。声音的种类繁多,如人的话音、乐器声、动 物发出的声音、机器产生的声音以及自然界的声音等。 这些声音有许多共同的特性,也有它们各自的特性。在用 计算机处理这些声音时,既要考虑它们的共性,又要利用它们 的各自的特性。 我们将研究声音的基础知识,掌握声音数字化的两个最基 本的概念;了解基本的音频信号编码技术。 音频处理技术
音频处理技术 声音与听觉器官 声音是通过空气传播的一种连续的波,叫声波。 音的强弱(音强) 音调的高低(频率)-示例 声波的特性 反射 reflection)、折射 refraction和行射 diffraction)
声音是通过空气传播的一种连续的波,叫声波。 声音的强弱(音强) 音调的高低(频率)-示例 声波的特性 反射 (reflection)、折射 (refraction)和衍射 (diffraction) 声音与听觉器官 音频处理技术
音频处理技术 声音与听觉器官 声音信号由许多频率不同的信号组成 带宽:它用来描述组成复合信号的频率范围。 20~20000Hz(音频) 80~3400Hz(话音) 0~120dB(音强)
声音信号由许多频率不同的信号组成。 带宽:它用来描述组成复合信号的频率范围。 20~20000 Hz (音频) 0~120 dB (音强) 声音与听觉器官 音频处理技术 80~3400 Hz (话音)
音乐 令以小提琴为例,当它的A弦振动时,并不仅仅是整根弦在 振动,这根弦的二分之一、三分之一、四分之一、五分之 处都在振动着。于是,整根弦的振动产生了最主要 的频率,我们称之为基,而弦长的二分之一、三分之 四分之一等处的振动则产生了一些次要的频率,我们称之 为泛彦 令如果一个物体振动所发出的泛音为基音的整数倍,这个音 就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小 提琴等发出的都是乐膏;如果泛音是基音的非整数倍,这 个音就不具备清晰可辨的音高,我们称之为噪音,如汽车 发动机、计算机风扇等发出的都是噪音
音乐 ❖ 以小提琴为例,当它的A弦振动时,并不仅仅是整根弦在 振动,这根弦的二分之一、三分之一、四分之一、五分之 一……处都在振动着。于是,整根弦的振动产生了最主要 的频率,我们称之为基音,而弦长的二分之一、三分之一、 四分之一等处的振动则产生了一些次要的频率,我们称之 为泛音。 ❖ 如果一个物体振动所发出的泛音为基音的整数倍,这个音 就会具有清晰可辨的音高,我们称之为乐音,如钢琴,小 提琴等发出的都是乐音;如果泛音是基音的非整数倍,这 个音就不具备清晰可辨的音高,我们称之为噪音,如汽车 发动机、计算机风扇等发出的都是噪音
聲壓級聲壓 音强中分贝的定义 (分貝)(徽巴 斯卡) 100,000,000 船隻引擎室內120 在10米範圍的撞擊式打樁10 10000,000 的士高内強勁的音樂/紡陋100 在10米範圍的破碎機 在25米範圍柴油貨運火車高速前進 100.000 定义示例 在25米範園交通繁忙的馬路上 客醺内的對話6 10.000 寫字樓內 圖害館2米範圍的低語40- 青葱寧静的郊野30 播音室 正常年輕人的聽覺闓 聲(分貝)和整壓(微巴斯卡)的比對表
音强中分贝的定义 定义示例
声音质量的度量 ◇声音的质量与声音的带宽有关,一般来说频率范 围越宽,声音质量也就越高。 声音类型 带宽 电话语音 200Hz-34kHZ 调幅广播 50Hz-7kHz 调频广播 20HZ-15kHZ CD 20Hz-20KHz 信噪比(SNR)、主观平均判分法(MOS)
声音质量的度量 ❖声音的质量与声音的带宽有关,一般来说频率范 围越宽,声音质量也就越高。 声音类型 带 宽 电话语音 200Hz-3.4kHz 调幅广播 50Hz-7kHz 调频广播 20Hz-15kHz CD 20Hz-20kHz • 信噪比(SNR)、主观平均判分法(MOS)
声音信号数字化 声音信号是典型的连续信号,不仅在时间上是连 续的,而且在幅度上也是连续的。 ◇声音进入计算机的第一步就是数字化,数字化过 程中最重要的步骤就是采样和量化
声音信号数字化 ❖声音信号是典型的连续信号,不仅在时间上是连 续的,而且在幅度上也是连续的。 ❖声音进入计算机的第一步就是数字化,数字化过 程中最重要的步骤就是采样和量化
声音信号数字化 令采样( sampling):将声音信号在时间上离散化,即每 隔相等的一段时间抽取一个信号样本。 0101 0l00 0011 0010 0001 1001 1010 l011 l00
声音信号数字化 ❖ 采样(sampling):将声音信号在时间上离散化,即每 隔相等的一段时间抽取一个信号样本
声音信号数字化 令采样频率 奈奎斯特理论指出:采样频率不应低于声音信号最高频率的 两倍,这样就能把以数字表达的声音还原成原来的声音,称 为无损数字化。 fs >=2fmax 话音信号最高频率约为34kHz,所以采样频率取为8kHz
声音信号数字化 ❖采样频率 奈奎斯特理论指出:采样频率不应低于声音信号最高频率的 两倍,这样就能把以数字表达的声音还原成原来的声音,称 为无损数字化。 fs >= 2fmax 话音信号最高频率约为3.4kHz,所以采样频率取为8kHz