D0第地糝第1期s1001-053x.1996.9化00陳科技大学学报 Vol.18 No.1 199%年2月 Journal of University of Science and Technology Beijing Feb.199% Mallat算法用于语音信号分析与压缩 杨蕾 郑慧民杨扬 北京科技大学智能·语言·计算机科学研究所,北京100083 摘要给出了一种基于小波变换的汉语语音信号预处理的方法.通过小波变换中的Mallat算法来 分解汉语语音信号,能够消除信号冗余度,提高数据压缩比,而不影响语音信号的真实效果,同 时还给出了小波变换原理和Mallat算法以及实验结果, 关键词语音数据处理/小波变换,Mallat算法 中图分类号TP391.42 小波分析是一种时域一频域分析,同时具有时域和频域的良好局部化性质,而且随 着信号不同频率成分在时间(空间)域取样的疏密自动调节(频高者密,频低者疏),可达 到效率高,质量佳的效果,基于小波变换的这一特性,可将其用于语音编码数据压缩,通过 识别语音号中的冗余度并设法消除它们,从而达到提高压缩比特率的目的.在文献[1,2] 中阐述了小波变换在西语语音信号处理中较好的应用· 本文应用小波变换中的Mallat算法,将一维语音信号(汉语)进行分解,并将具有信 号特征部分保留,冗余部分置零,从而达到消除冗余度的目的,实验结果表明通过对语音信 号进行小波变换处理,再将其用脉冲编码调制(PCM)、自适应预测编码(APC)、熵编码 等方法1进行压缩,发现其压缩比特率比不用小波变换处理直接压缩的提高1倍,而且解 压缩后信号失真小,符合技术要求, 1离散小波变换1 小波无论在时域上还是频域上都是某一位置上局部存在的函数,其波形是仅在特定位置 上振幅发生变化的,当要分析信号的高频分量时,可通过将基本小波缩小倍,反之当要分 析信号的低频分量时,通过放大倍进行,另外,为了能够发现信号发生变化的时刻,可以 在时间轴上移动k$,最终构成基底函数,小波变换则是以此基底函数而展开·小波分析对于 高频分量来说,时间的分析能力强;对于低频分量,频率的分析能力强,具有多分辨率分析 的实际能力·小波波形的位置是某一局部位置,因为没有直流分量,不致对波形变化点特别敏感, 离散小波变换构造出了雷曼空间L()上完全正交的小波函数,弥补它在欧几里德空间 上的不足, 假设所选函数系为: {9.k(t)川9,k(t)=22φ(2't-k),j,k∈2} (1) 是完全正交系,则: 195-03-30收稿 第一作者女23岁硕士生
第 卷 第 期 北 京 科 技 大 学 学 报 姚 年 月 正 。 心 功 。 望兜 算法用 于 语音信号分析 与 压缩 杨 蕾 郑 慧 民 杨扬 北京科 技大 学智 能 语 言 计算机科 学研究 所 , 北京 幻 摘要 给 出 了一种基于 小波变换 的汉语语音信号预处理 的方法 通过小波变换 中的 算法来 分解 汉语语音信号 , 能够消除信号冗余度 , 提高数据压缩 比 , 而 不影 响语音信号 的真 实效果 同 时还给 出了 小波变换原理和 算法 以 及 实验结果 关键词 语音数据处理 小波变换 , 算法 中图分类号 小 波 分 析 是 一 种 时 域 一 频 域 分 析 , 同 时具 有 时 域 和 频 域 的 良好 局 部 化 性 质 , 而 且 随 着信号不 同频率成分在 时 间 空 间 域取样 的疏 密 自动调节 频 高 者 密 , 频 低 者 疏 , 可 达 到 效率高 , 质量佳 的效果 基 于 小波 变换 的这一特性 , 可将其用 于语音编 码 数 据压缩 , 通过 识别语音 号 中的冗余 度 并 设 法 消 除 它 们 , 从 而 达 到 提 高 压 缩 比 特 率 的 目 的 在 文献 【 刀 中 阐述 了小波 变换在 西 语语音 信号处理 中较好 的应用 本文应用 小 波 变换 中的 算 法 , 将 一 维语 音 信 号 汉 语 进 行 分 解 , 并 将 具 有 信 号 特征部分保 留 , 冗余部分置零 , 从而 达到 消除冗余度 的 目的 , 实验结 果 表 明通过 对语音信 号 进行小 波 变换处理 , 再将其 用脉冲 编 码 调 制 、 自适 应 预 测 编 码 、 嫡 编 码 等 方 法 进行压缩 , 发现其压缩 比特率 比不 用小 波 变 换 处理 直 接 压 缩 的 提 高 倍 , 而 且 解 压缩后 信号失 真 小 , 符合技术要 求 离散小 波变换 小波 无论在 时域上 还是 频域 上 都是某 一位 置上局部存在 的 函数 , 其 波形 是 仅在 特定 位 置 上振 幅发生 变化 的 当要分 析信号 的高频分量 时 , 可 通过将基本小 波缩小 倍 , 反 之 当要 分 析信号 的低 频分量 时 , 通 过放大 倍进行 另外 , 为 了能够 发 现信号 发 生 变化 的 时 刻 , 可 以 在 时 间轴上移 动 , 最 终构成基底 函 数 , 小波 变换则是 以 此基底 函数而 展 开 小 波分 析 对于 高频分量来说 , 时 间的分 析 能力 强 对于低 频分量 , 频 率 的分 析能力 强 , 具有 多分 辨 率 分析 的实际能力 小波波形 的位置是某一局部位置 , 因为没有直流分量 , 不致对波形变化点特 别敏感 离散小 波 变换构造 出了 雷曼 空 间 ’ 上完 全 正交 的小波 函数 , 弥补 它在 欧 几 里 德 空 间 上 的不足 假设所 选 函 数系 为 毋 , , 沪 , , ,‘,沪 , 一 , , 任 是 完 全 正 交 系 , 则 卯 一 一 收稿 第 一 作 者 女 岁 硕 士 生 DOI :10.13374/j .issn1001-053x.1996.01.003
Vol.18 No.I 杨蕾等:Mallat算法用于语音信号分析与压缩 11 pjk(t)p,.k·(t)dt=δδs.k (2) 即对任意的函数(t),展开式: f0=2.王.04e0, a.= p.(t)·f(t)dt (3) 成立,而且式(2)可写为: f(t)=lim f(t), 0=2.三。490 (4) 实际上j广是放大和缩小的参数,因而容易理解f+,(t)是以比(t)细1倍的分辨率去捕捉原函数 ft),因此可以认为j又是表示分辨率的· 2 Mallat算法及其在语音数据编码中的应用 2.1 Mallat算法s1 在离散小波变换下,Mallat提出了快速塔式分解方法,即Mallat算法. 设{'V}是一给定的多分辨分析,P和山分别是相应的尺度函数和小波函数.现在要对一个函数 (信号)∫进行分析.设∫飞V,(J,为一确定整数)·这个假设是合理的,因为物理仪器记录下 来的信号总是只具有有限的分辨率,既然,∫飞V,便有分解: =Ax)-2Cp(0 注意到: (pk,p,+1.m)=hk-2m:(9,k,Ψ,+1.m)=9k-2m 有: fx)=A,f(x)=A,+1f(x)+D,+1f(x) (5) 其中: A:2.C91;D四=2D里w 仿 D41…2。C1 引入无穷矩阵H=(Hm.,G=(Gm.k),其中Hn.k=h-2m,Gm.k=9-2m,则(5)式可 写成以下简洁的形式:C+1=HC, D+=GD) 这样一直做下去,将有:x)=A)+之D,) 1=+1 其中:42.C创D,:2.D,平.(侧 (6) 而: C+1=HCD,+1=GD,(j=.J+1,…h-1) 式(6)便是Mallat塔式算法.将Af称作f在2分辨率下的连续逼近,D,∫为在2分辨率下的 连续细节,而称相应的数列C和D,分别为在分辨率下的离散逼近和离散细节.A,∫可理解为 函数不超过2」的成分,而D∫是∫的频率介于2和2+'之间的成分.因此式(4)~(6)
杨蕾等 田」 算法 用 于语音信号分析 与压缩 工 二 , , 左 ,,, , , , , 一 ‘ , , 厂 ‘ 无 , ‘ 即 对 任 意 的 函 数 , 展 开 式 ﹃ 产 一 成 立 , 而 且 式 二 叉一 的 艺一 田 可 写 为 , , 中, , , 中, , · 不 芳 二 艺一 的 叉 , , 毋, , ‘ 实际 上 是 放大 和 缩 小 的参数 , 因而容 易理解 芳 是 以 比爪 细 倍的分辨率 去捕 捉 原 函 数 , 因 此 可 以 认 为 又 是 表 示 分 辨 率 的 算 法 及 其 在 语 音 数 据 编 码 中 的应 用 算 法, , 在离 散小 波 变换下 , 提 出了 快 速 塔 式分解方法 , 即 算法 设 砚 是一给定的多分辨分析 , 甲 和 少分别是相应的尺度 函数和 小波函数 现在要对一个函数 信号 进 行分析 · 设 任 ,为一确定整 数 · 这个 假设是 合 理 的 , 因 为物理 仪 器记录下 来 的信号 总是 只 具有有 限 的分辨率 既 然 , 任 玛 ,, 便 有分解 一 一 是 了一 ,了 , 、 注意到 俩 , 、 , 妈 , , 一 、 一 帆 ,, ,甲 一 , 爪 一 乳一 有 其 中 , ,,、 , 】 一 、 万多 二 了 一 , 。 ,一 , 二 ” 了,一 烹里 。 ” 了 一 , · ,了】 一 , 。 , 卜 二 一 艺 人 。 、 一 , 。 万里 二 吞一 了,, 几 引 入 无 穷 矩 阵 二 。 , 、 , , , 、 , 其 中 。 , 、 一 , , 夕、 一 一 则 式 可 写 成 以 下 简 洁 的 形 式 , , , 一 , 这 样 一 直 做 下 去 , 将 有 ,一 ‘ ‘ ,像 、 其 中 ‘ , 万里 二 砚 , 人中, , , 、 卜 艺 , , 巩 , 一 的 而 , , 二 , 二 , 十 , · · 一 式 便 是 塔式算法 将 再 称作 了在 分辨率下的连续逼近 , 几伪在 分辨率下的 连续细节 , 而称相 应 的数列 ,和 , 分别 为在留 分辨率下的离散逼近和离散细节 · ,了可理解为 函数不超过 一 , 的成 分 , 而 几 是 的 频 率 介 于 一 , 和 一 ‘ 之 间 的 成 分 · 因 此式 一
·12· 北京科技大学学报 199%年No.1 表明,按Mallat分解算法,将函数∫分解成了不同的频率通道成分,并将每一频率通道成分又 按相位进行了分解一频率越高者,相位划分越细,反之越疏· 2.2应用161 语音数据特征是一个一维时变函数,依照Mallat算法,可以将信号分解成不同的频 道,即信号中频率低于2的成分和信号中频率介于2与2-)之间的成分,系数序 列可按塔式算法由C。出发递归得到: C+=HC D+1=GDj(j=J,J+1,J2) 其中低通滤波器H作用在一个序列a={ak}k:上的效果是: (Ha)n=∑hk-znak (7) 最后” 其中高通滤波器G的效果是: (Ga)n=2gk-2ax (8) 其中{hk}k:与{9k}k:是由尺度函数p和小波函数Ψ所决定的数列·分析由此得出的2 个系数序列,一个是信号的高频部分D,,另一个是低频部分C,C,保留了信号的主要特征, D,则主要是信号中冗余部分.将D,置零,用C,代替信号,再进行压缩,则可将压缩比提高 1倍·同样通过这种方法,调整形成新的序列,则得到去噪后信号,实现信噪分离· 3实验结果 将语音信号“京”C(如图l)按照Mallat算法来进行处理,得到了信号高频部分D,(如 图2)和低频部分C,(如图3).从图中看出信号低频部分C,保留了原信号的主要特征,因此 将低频部分C,做发音试验,发现其发音比原信号更加清晰,基于这个结果,就将它代替原 信号进行压缩处理,而使压缩比提高了1倍,并且解压缩后的信号失真很小,从而说明利用 Mallat算法能有效地消除语音信号中的冗余度. co一h的phjiihimwwm- 图1语音信号“京”C0 muthttwwmrnw 图2信号的高频部分D 一一一一t州jahthore*n- 图3信号的低频部分C
北 京 科 技 大 学 学 报 从 年 表 明 , 按 分解 算 法 , 将 函 数了分解成 了不 同的频率通道成分 , 并将每一频率通道成分又 按相位进行 了分解一 频率越 高者 , 相 位划 分越 细 , 反 之越疏 应 用’ 语 音 数 据 特 征 是 一 个 一 维 时 变 函 数 , 依 照 算 法 , 可 以 将 信 号 分 解 成 不 同 的 频 道 , 即 信 号 中频 率 低 于 一 , 的成 分 和 信号 中频 率 介 于 一 , 与 一 ’ 一 ’ 之 间 的 成 分 系 数 序 列 可按塔式算 法 由 出发递 归得 到 砚 , , , , , 么 ,去 , ’ · ’ 几 其 中 低 通 滤 波 器 作 用 在 一 个 序 列 二 。 上 的 效 果 是 万。 , 一 艺人 , 其 中 高 通 滤 波 器 的 效 果 是 。 。 艺 一 声 其 中 。 与 。 是 由尺 度 函 数 中和 小 波 函数 甲所决定 的数列 分析 由此得 出的 个 系 数 序 列 , 一个是 信 号 的 高 频部分 , 另 一个是低频部分 , , 保留了信号的主 要特征 , , 则 主要是信号 中冗余部分 将 , 置零 , 用 , 代替信号 , 再进行压缩 , 则可将压缩 比提高 倍 同 样 通 过 这 种 方 法 , 调 整 形 成 新 的 序 列 , 则 得 到 去 噪 后 信 号 , 实 现 信 噪 分 离 实 验 结 果 将语音信号 “ 京 ” 。 如 图 按 照 算法来 进行处理 , 得 到 了信 号 高频部分 如 图 和低 频部分 如 图 从 图中看 出信 号 低 频 部 分 , 保 留 了 原 信 号 的 主 要 特征 , 因此 将低频部分 做发音 试验 , 发 现其发 音 比 原信号更加清 晰 基于 这个结 果 , 就 将 它 代 替 原 信号进行 压缩处理 , 而使压缩 比提高 了 倍 , 并 且解 压缩后 的信号失真 很小 , 从而说 明利 用 算 法 能有 效地 消 除语音信号 中的冗余度 · 州脚枷翩腼 一 图 语音信号 “ 京 ” 。 “一咖喊吻卿竹 才 一 一一一 图 信号 的高频部分 一酬硼脑翩恤 一 图 信号 的低频部分
Vol.18 No.1 杨蕾等:Mallat算法用于语音信号分析与压缩 .13, 4结论 本文提出使用小波分析中Mallat算法对语音信号进行处理的方法,通过实验反复比 较,发现此方法不仅能将语音信号数据压缩比在原基础上提高1倍,而且恢复后的语音信号 失真小,效果好, 参考文献 1 Gianpaolo Evangelista.Pitch-Synchronous Wavelet Representations of Speech and Music Signals.IEEE Trans on Signal Processing,1993,41(12):3313~3330 2 Evangelista G.Comb and Multiplexed Wavelet Transforms and Their Applications to Signal Processing.IEEE Trans on Signal Processing,1994,30(2):1229~1248 3陈永彬,王仁华.语言信号处理.合肥:中国科技大学出版杜,1990.155~173 4高文.多媒体数据压缩技术.北京:电子工业出版社,1994.240~245 5 Mallat S G.A Theory for Multiresolution Signal Decomposition;the Wavelet Represention. IEEE Trans on Pattern Analysis and Machine Intellegence,1989,11(7):674~693 6刘贵忠,邸双亮,小被分析及其应用.西安:西安电子科技大学出版社,1992.160~164 Application of Mallat's Algorithm to the Analysis and Compression of Speech Signal Yang Lei Zheng Huimin YangYang Intelligence,Language and Computer Sciences Institute,USTB,Beijing 100083,PRC ABSTRACT The Mallat's Algorithm in wavelet transforms is used to preprocess the chinese speech signal.By decomposing the speech signal,the compression ratios is improved under the certain distortion degree.The theory of wavelet transforms and the Mallat's Algorithm are proposed and the method is verified by the experimental results. KEY WORD voice data processing,wavelet transforms,mallat's algorithm
杨蕾等 算法用 于 语音信号分析与压缩 结 论 本 文 提 出 使 用 小 波 分 析 中 算 法 对语音 信 号 进 行 处理 的方 法 , 通 过 实 验 反 复 比 较 , 发 现此方法 不仅 能将语音信号数据压缩 比在 原基础上 提 高 倍 , 而且恢复后 的语音信号 失真小 , 效果好 参 考 文 献 一 堪刃 , , 一 叭 仪“ , , 刃 一 陈永 彬 , 王 仁 华 语 言信 号 处理 合 肥 中国 科 技 大 学 出版 社 , 巧 一 高 文 多 媒 体 数 据 压 缩 技术 北 京 电子 工 业 出 版 社 , 一 刘 贵 忠 , 邸双 亮 郊 , , 一 小 波 分 析及 其应 用 西 安 西 安 电 子 科 技 大 学 出 版 社 , 一 ‘ 皿 卫 , , , ‘ , ‘ ‘ 代 , , ‘