爱门大第 KIAMEN UNIVERSITY 第2章语音信号基础 洪青阳 厦门大学信息学院 qyhong@xmu.edu.cn
第2章 语音信号基础 洪青阳 厦门大学信息学院 qyhong@xmu.edu.cn
度)大第 纲要 XIAMEN UNIVERSITY 2.1声波的特性 2.2声音的接收装置 2.3声音的采样 2.4声音的量化 2.5语音的编码 2.6WAV文件格式 2.7WAV文件分析 2.8本章小结
纲要 2.1 声波的特性 2.2 声音的接收装置 2.3 声音的采样 2.4 声音的量化 2.5 语音的编码 2.6 WAV文件格式 2.7 WAV文件分析 2.8 本章小结
2.1声波的特性 爱门大第 XIAMEN UNIVERSITY 声波在空气中是一种纵波,它的振动方向和传播方向是一致的 声音在空气中的震动形成压力波动,产生压强,经过传感器接收 转化,变成时变的电压信号。 振动 在空气中形成压力波动 t.r 传感器的动作 时变的电压信号
2.1 声波的特性 • 声波在空气中是一种纵波,它的振动方向和传播方向是一致的。 声音在空气中的震动形成压力波动,产生压强,经过传感器接收 转化,变成时变的电压信号。 振动 在空气中形成压力波动 传感器的动作 时变的电压信号
2.1声波的特性 爱门大第 XIAMEN UNIVERSITY 声波的特性主要包括频率和声强。某一瞬间介质中的压强相对于 无声波时压强的改变量称为声压,记为p(t),单位是Pa。 ·一般把很小的声压po=2×10-5Pa作为参考声压,把所要测量的声 压p与参考声压po的比值取常用对数后,乘以20得到的数值称为 声压级(sound pressure level,SPL),其单位为分贝(dB)。 SPL 20log dB Po 国家标准规定住宅区的噪音大小,白天不能超过50分贝,夜间应 低于45分贝。 ·注意衡量声音的信噪比(Signal to Noise Ratio,SNR)单位也用 分贝,其数值越高,表示声音越干净,噪声比例越少
2.1 声波的特性 • 声波的特性主要包括频率和声强。某一瞬间介质中的压强相对于 无声波时压强的改变量称为声压,记为p(t),单位是Pa。 • 一般把很小的声压𝑝0=2×10-5Pa作为参考声压,把所要测量的声 压𝑝与参考声压𝑝0的比值取常用对数后,乘以20得到的数值称为 声压级(sound pressure level, SPL),其单位为分贝(dB)。 SPL = 20log 𝑝 𝑝0 dB • 国家标准规定住宅区的噪音大小,白天不能超过50分贝,夜间应 低于45分贝。 • 注意衡量声音的信噪比(Signal to Noise Ratio,SNR)单位也用 分贝,其数值越高,表示声音越干净,噪声比例越少
2.2声音的接收装置 爱门大第 XIAMEN UNIVERSITY 采样 量化 模拟 离散 数字离散 语音信号 时间信号 时间信号
2.2 声音的接收装置 采样 量化 模拟 语音信号 离散 时间信号 数字离散 时间信号 声波
2.2声音的接收装置 爱门大第 XIAMEN UNIVERSITY 制 空腔 振动膜 极板 振动股、 线圆 升压变压器 软铁 图1动圈式传声器 图2普通电容式传声器
2.2 声音的接收装置 图1 动圈式传声器 图2 普通电容式传声器
2.2声音的接收装置 爱门大第 XIAMEN UNIVERSITY 0 动圈式麦克风:精度、灵敏度较低,体积大,其突出特 点是输出阻抗小,所以接较长的电缆也不降低其灵敏度 温度和湿度的变化对其灵敏度也无大的影响,用于语音 广播、扩声系统。 发制电路和电粮G 。电容式麦克风:音质好,灵度较高,但需要电源,适 用于舞台、录音室等。 发射大规 。驻极体麦克风:是电容式的一种,无需外加电源,体积小,使 用最广泛。 。 振膜式:带电体是驻极体振膜本身,话筒拾声的音质效果相对差些 多用在对于音质效果要求不高的场合,如普通电话机、玩具等。 。 背级式:带电体是涂敷在背极板上的驻极体膜层, 与振膜分离设计 手机、语音识别等高端传声录音产品多采用背极式驻极体
2.2 声音的接收装置 ◦ 动圈式麦克风:精度、灵敏度较低,体积大,其突出特 点是输出阻抗小,所以接较长的电缆也不降低其灵敏度, 温度和湿度的变化对其灵敏度也无大的影响,用于语音 广播、扩声系统。 ◦ 电容式麦克风:音质好,灵敏度较高,但需要电源,适 用于舞台、录音室等。 ◦ 驻极体麦克风:是电容式的一种,无需外加电源,体积小,使 用最广泛。 ◦ 振膜式:带电体是驻极体振膜本身,话筒拾声的音质效果相对差些, 多用在对于音质效果要求不高的场合,如普通电话机、玩具等。 ◦ 背级式:带电体是涂敷在背极板上的驻极体膜层,与振膜分离设计, 手机、语音识别等高端传声录音产品多采用背极式驻极体
2.2声音的接收装置 爱门大第 XIAMEN UNIVERSITY 随着现代生产工艺的发展,现在工业上广泛采用一种叫MEMS的麦克 风。MEMS麦克风原理依然属于电容式麦克风,是一个电容器集成在 微硅晶片上,可以采用贴片工艺进行制造。 ·MEMS麦克风的优点是一致性比较好,特别是中高端手机应用中,更 适合远场语音交互用的麦克风阵列。 白Infineon 1M69D130 MEMS麦克风
2.2 声音的接收装置 • 随着现代生产工艺的发展,现在工业上广泛采用一种叫MEMS的麦克 风。MEMS麦克风原理依然属于电容式麦克风,是一个电容器集成在 微硅晶片上,可以采用贴片工艺进行制造。 • MEMS麦克风的优点是一致性比较好,特别是中高端手机应用中,更 适合远场语音交互用的麦克风阵列。 MEMS麦克风
2.2声音的接收装置一麦克风的性能指标 爱门大第 XIAMEN UNIVERSITY ·指向性 SG0-578技术参数 ·单体:背极式驻级体 ·招向性:心平指向超心平细向 ·频率响应 +0率响应:80Hz-14kH也 灵段度:-30dB±2dB(0aB=1 ViPa at1kHz ·输出粗抗:5000/1600Q±30%(at1k女) ·灵敏度 ·负航用抗:10000 ,头由方式:1.5VAA电的 +年体尺寸:022×27Bmm ·输出阻抗 Hyper-cardioid Cardioid 22mm
2.2 声音的接收装置—麦克风的性能指标 • 指向性 • 频率响应 • 灵敏度 • 输出阻抗
2.2声音的接收装置一麦克风的性能指标 爱门大第 XIAMEN UNIVERSITY ·指向性:麦克风对于不同方向的声音灵敏度,称为麦克风的指向 性。指向性用麦克风正面0°方向和背面180°方向上的灵敏度的差 值来表示,差值大于15dB者称为强方向性麦克风。 ·全指向性麦克风从各个方向拾取声音的性能一致。当说话的人要来回走 动时采用此类麦克风较为合适。 ·心形指向麦克风的灵敏度在水平方向呈心脏形,正面灵敏度最大侧面稍 小,背面最小。这种麦克风在多种扩音系统中都有优秀的表现。 ·单指向性麦克风又称为超心形指向性麦克风,它的指向性比心形麦克风 更尖锐,正面灵敏度极高,其它方向灵敏度急剧衰减,特别适用于高噪 音的环境
2.2 声音的接收装置—麦克风的性能指标 • 指向性:麦克风对于不同方向的声音灵敏度,称为麦克风的指向 性。指向性用麦克风正面0°方向和背面180°方向上的灵敏度的差 值来表示,差值大于15dB者称为强方向性麦克风。 • 全指向性麦克风从各个方向拾取声音的性能一致。当说话的人要来回走 动时采用此类麦克风较为合适。 • 心形指向麦克风的灵敏度在水平方向呈心脏形,正面灵敏度最大侧面稍 小,背面最小。这种麦克风在多种扩音系统中都有优秀的表现。 • 单指向性麦克风又称为超心形指向性麦克风,它的指向性比心形麦克风 更尖锐,正面灵敏度极高,其它方向灵敏度急剧衰减,特别适用于高噪 音的环境