正在加载图片...
第2章数字声音简介 图2-01声音是一种连续的波 对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为复合信号, 而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽,它用来描述组成复合 信号的频率范围。如高保声音信号(high- fidelity audio)的频率范围为10Hz~20000Hz, 它的带宽约为20kHz,而视频信号的带宽是6MHz 声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数,用Hz 表示。例如,大气压的变化周期很长,以小时或天数计算,一般人不容易感到这种气压信号 的变化,更听不到这种变化。对于频率为几Hz到20H的空气压力信号,人们也听不到,如 果它的强度足够大,也许可以感觉到。人们把频率小于20Hz的信号称为亚音信号,或称为 次音信号( subsonic):频率范围为20Hz~20kHz的信号称为音频( Audio)信号:虽然人的发 音器官发出的声音频率大约是80~3400Hz,但人说话的信号频率通常为300~3000Hz,人 们把在这种频率范围的信号称为话音( speech)信号:高于20kHz的信号称为超音频信号,或 称超声波( ultrasonic)信号。超音频信号具有很强的方向性,而且可以形成波束,在工业 上得到广泛的应用,如超声波探测仪,超声波焊接设备等就是利用这种信号。在多媒体技术 中,处理的信号主要是音频信号,它包括音乐、话音、风声、雨声、鸟叫声、机器声等 人们是否都能听到音频信号,这主要取决于各个人的年龄和耳朵的特性。一般来说,人 的听觉器官能感知的声音频率大约在20~20000H之间,在这种频率范围里感知的声音幅度 大约在0~120dB之间。除此之外,人的听觉器官对声音的感知还有一些重要特性,这些特 性将在第9章中介绍,它们在声音数据压缩中已经得到广泛的应用 2.2声音信号数字化 2.2.1从模拟过渡到数字 回顾历史,大多数电信号的处理一直是用模拟元部件(如晶体管、变压器、电阻、电容 等)对模拟信号进行处理。但是,开发一个具有相当精度、且几乎不受环境变化影响的模拟 信号处理元部件是相当困难的,而且成本也很高。 如果把模拟信号转变成数字信号,用数字来表示模拟量,对数字信号做计算,那末难点 就发生了转移,把开发模拟运算部件的问题转变成开发数字运算部件的问题,这就出现了数 字信号处理器( digital signal processor,DsP)。DSP与通用微处理器相比,除了它们的结 构不同外,其基本差别是,DSP有能力响应和处理采样模拟信号得到的数据流,如做乘法和 累加求和运算。 在数字域而不在模拟域中做信号处理的主要优点是:首先,数字信号计算是一种精确的 运算方法,它不受时间和环境变化的影响:其次,表示部件功能的数学运算不是物理上实现 的功能部件,而是仅用数学运算去模拟,其中的数学运算也相对容易实现:此外,可以对数 字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程 2.2.2模拟信号与数字信号 话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时 间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续 是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。 在某些特定的时刻对这种模拟信号进行测量叫做采样( sampling),由这些特定时刻采样 得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是 连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅 度信号。例如,假设输入电压的范围是0.0V~0.7V,并假设它的取值只限定在0、0.1、0.2,…, 0.7共8个值。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V,如果采样得到的幅第2章 数字声音简介 2 图2-01 声音是一种连续的波 对声音信号的分析表明,声音信号由许多频率不同的信号组成,这类信号称为复合信号, 而单一频率的信号称为分量信号。声音信号的一个重要参数就是带宽,它用来描述组成复合 信号的频率范围。如高保声音信号(high-fidelity audio)的频率范围为10 Hz~20 000 Hz, 它的带宽约为20 kHz,而视频信号的带宽是6 MHz。 声音信号的两个基本参数是频率和幅度。信号的频率是指信号每秒钟变化的次数,用Hz 表示。例如,大气压的变化周期很长,以小时或天数计算,一般人不容易感到这种气压信号 的变化,更听不到这种变化。对于频率为几Hz到20 Hz的空气压力信号,人们也听不到,如 果它的强度足够大,也许可以感觉到。人们把频率小于20 Hz的信号称为亚音信号,或称为 次音信号(subsonic);频率范围为20 Hz~20 kHz的信号称为音频(Audio)信号;虽然人的发 音器官发出的声音频率大约是80~3400 Hz,但人说话的信号频率通常为300~3000 Hz,人 们把在这种频率范围的信号称为话音(speech)信号;高于20 kHz的信号称为超音频信号,或 称超声波 (ultrasonic) 信号。超音频信号具有很强的方向性,而且可以形成波束,在工业 上得到广泛的应用,如超声波探测仪,超声波焊接设备等就是利用这种信号。在多媒体技术 中,处理的信号主要是音频信号,它包括音乐、话音、风声、雨声、鸟叫声、机器声等。 人们是否都能听到音频信号,这主要取决于各个人的年龄和耳朵的特性。一般来说,人 的听觉器官能感知的声音频率大约在20~20000 Hz之间,在这种频率范围里感知的声音幅度 大约在0~120 dB之间。除此之外,人的听觉器官对声音的感知还有一些重要特性,这些特 性将在第9章中介绍,它们在声音数据压缩中已经得到广泛的应用。 2.2 声音信号数字化 2.2.1 从模拟过渡到数字 回顾历史,大多数电信号的处理一直是用模拟元部件(如晶体管、变压器、电阻、电容 等)对模拟信号进行处理。但是,开发一个具有相当精度、且几乎不受环境变化影响的模拟 信号处理元部件是相当困难的,而且成本也很高。 如果把模拟信号转变成数字信号,用数字来表示模拟量,对数字信号做计算,那末难点 就发生了转移,把开发模拟运算部件的问题转变成开发数字运算部件的问题,这就出现了数 字信号处理器(digital signal processor,DSP)。DSP与通用微处理器相比,除了它们的结 构不同外,其基本差别是,DSP有能力响应和处理采样模拟信号得到的数据流,如做乘法和 累加求和运算。 在数字域而不在模拟域中做信号处理的主要优点是:首先,数字信号计算是一种精确的 运算方法,它不受时间和环境变化的影响;其次,表示部件功能的数学运算不是物理上实现 的功能部件,而是仅用数学运算去模拟,其中的数学运算也相对容易实现;此外,可以对数 字运算部件进行编程,如欲改变算法或改变某些功能,还可对数字部件进行再编程。 2.2.2 模拟信号与数字信号 话音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时 间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续” 是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。 在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样 得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是 连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅 度信号。例如,假设输入电压的范围是0.0V~0.7V,并假设它的取值只限定在0、0.1、0.2,…, 0.7共8个值。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V,如果采样得到的幅
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有