信源编码技术 语音与图像压缩编码
信源编码技术 语音与图像压缩编码
信源编码技术 信源编码:将模拟信源信号转换为二进 制数字信号,在接收端再将收到的数字 信号还原为模拟信号的方法 这是由模拟网→数字网至关重要的一步 类别 语音编解码 图像编解码 目前在移动通信系统中,语音信号还是 主要业务,在今后多媒体移动系统中 图像业务比重越来越大
信源编码技术 ◼ 信源编码:将模拟信源信号转换为二进 制数字信号,在接收端再将收到的数字 信号还原为模拟信号的方法 – 这是由模拟网→数字网至关重要的一步 ◼ 类别 – 语音编解码 – 图像编解码 ◼ 目前在移动通信系统中,语音信号还是 主要业务,在今后多媒体移动系统中, 图像业务比重越来越大
语音编码 概 把模拟语音信号变成数字语音信号,以便在信道中 传输 ■意义 提高通话质量(数字化十纠错码) 提高频谱利用率(低码率编码) 提高系统容量(低码率十话音激活技术) ■移动通信对语音编码要求 码率低、语音质量高 抗噪声和抗干扰能力强 编译码延时小,总延时在65ms以内 编译码复杂度低,便于大规模集成化 功耗小,便于应用于手持台
语音编码 ◼ 概念: – 把模拟语音信号变成数字语音信号,以便在信道中 传输 ◼ 意义 – 提高通话质量(数字化+纠错码) – 提高频谱利用率(低码率编码) – 提高系统容量(低码率+话音激活技术) ◼ 移动通信对语音编码要求 – 码率低、语音质量高 – 抗噪声和抗干扰能力强 – 编译码延时小,总延时在65ms以内 – 编译码复杂度低,便于大规模集成化 – 功耗小,便于应用于手持台
语音编码分类 4域或 波形 ):分→P 时域 多乐沖激励LP 线∷ 参渐门器 和激P ;元.崙 i i器
语音编码分类
语音编码方法 波形编码: 将时间域信号直接变换成数字代码,目的是尽可 能精确再现原始语音波形。基本原理是在时间轴 对模拟语音按一定速率抽样,然后将幅度样木 分层量化,并用代码表示。 参量编码: 又称声源编码,是将信源信号在频域或其它正交 变换域提 并转换 码进行传 输。基本原理是以发音机制的模型为基础,用 套模拟声带频谱特性的 源参 数来描述这仝模型,从模拟语音信号中提取这些 特征参量并量化编码 ■混合编码: 将波形编码和参量编码结合起来
语音编码方法 ◼ 波形编码: – 将时间域信号直接变换成数字代码,目的是尽可 能精确再现原始语音波形。基本原理是在时间轴 上对模拟语音按一定速率抽样,然后将幅度样本 分层量化,并用代码表示。 ◼ 参量编码: – 又称声源编码,是将信源信号在频域或其它正交 变换域提取特征参量,并转换成数字代码进行传 输。基本原理是以发音机制的模型为基础,用一 套模拟声带频谱特性的滤波器系数和若干声源参 数来描述这个模型,从模拟语音信号中提取这些 特征参量并量化编码 ◼ 混合编码: – 将波形编码和参量编码结合起来
几种语音编码优缺点 ■波形编码 优点:对于比特速率较高的编码信号(16-64kbit s,波形编码技术能够提供相当好的话音质量 缺点:对低速语音编码(低于16kbis),波形编码 的语音质量显著下降,所以不适合频谱资源紧张 的移动通信系统 参量编码 优点:可实现低速语音编码,速率可达2~48k bits/s 缺点:语音质量只能达到中等 ■混合编码 吸收了上述两种编码的优点,是优选方向
几种语音编码优缺点 ◼ 波形编码 – 优点:对于比特速率较高的编码信号(16~64kbit s/s),波形编码技术能够提供相当好的话音质量 – 缺点:对低速语音编码(低于16kbits/s),波形编码 的语音质量显著下降,所以不适合频谱资源紧张 的移动通信系统 ◼ 参量编码 – 优点:可实现低速语音编码,速率可达2~4.8k bits/s – 缺点:语音质量只能达到中等 ◼ 混合编码 – 吸收了上述两种编码的优点,是优选方向
音编码与压缩技术 要实现低速、高质量的语音编码,必须采用压缩技术 波形技术处理: 削减语音波形冗余度, 波形处题技术 填码方式 意化技术 包括线性预测分析 频带分割、正交变换 APC 和分析合成等 ADPCM 线形顶测 SEC 量化技术: 时间分割 自适应量化 优化幅度量化,包括 APC-AB 适应量化、自适 频带分割 自适应比特分配 比特分配和矢量量化 ATC 正交变换 TC-WVQ 失量量化 分析合成 MPC 成差脉冲摸型化 CELP
语音编码与压缩技术 ◼ 要实现低速、高质量的语音编码,必须采用压缩技术; ◼ 波形技术处理: – 削减语音波形冗余度, 包括线性预测分析、 频带分割、正交变换 和分析合成等; ◼ 量化技术: – 优化幅度量化,包括 自适应量化、自适应 比特分配和矢量量化
语音评价 客观评定方法 用客观测量的手段来评价语音编码的质量,常用信噪比、加 权信噪比、平均分段信噪比等方法;特点有 建立在度量均方误差基础上 计算简单 对于低速语音编码,不能完全反映人对语音质量的感觉 Mean Opinion Score 主观评定方法: 主观评定等级或平均评定得分MO)一由数十名试听者在 相同信道环境中试听并给予评分,然后对评分进行统计处理, 求出平均得分。要求 试听者人数足够多; 语音材料足够丰富; 试听环境尽量相同
语音评价 ◼ 客观评定方法: – 用客观测量的手段来评价语音编码的质量,常用信噪比、加 权信噪比、平均分段信噪比等方法;特点有 ◼ 建立在度量均方误差基础上; ◼ 计算简单; ◼ 对于低速语音编码,不能完全反映人对语音质量的感觉 ◼ 主观评定方法: – 主观评定等级或平均评定得分(MOS)--由数十名试听者在 相同信道环境中试听并给予评分,然后对评分进行统计处理, 求出平均得分。要求 ◼ 试听者人数足够多; ◼ 语音材料足够丰富; ◼ 试听环境尽量相同 Mean Opinion Score
主观评定等级 试听者对语音质量的感觉往往是和注意力集 中程度相联系的,因此对于主观评定等级, 还有一个收听注意力等级。 质量等级 分 数 收听注意力等级 优 叮完全松驰,不蓿要注意力 需要注意,但不需要明显集中注意力 满意(正常) 斋要中等程度沫意,力 差劣 需要集中注意力 即使努力去听,也很难听懂
主观评定等级 ◼ 试听者对语音质量的感觉往往是和注意力集 中程度相联系的,因此对于主观评定等级, 还有一个收听注意力等级
MOS分与语音质量 MOS分在4.0~4.5分为高质量语音编码, 达到长途电话网的质量要求 ■MOS分为3.5分左右称作通信质量,听 者能感觉到语音质量有所下降,但不影 响正常通话,可以满足多数通信系统使 用要求 MOS分为3分以下常称为合成语音质量, 只有足够高的可懂度,但自然度较差, 不容易识别讲话者
MOS分与语音质量 ◼ MOS分在4.0~4.5分为高质量语音编码, 达到长途电话网的质量要求 ◼ MOS分为3.5分左右称作通信质量,听 者能感觉到语音质量有所下降,但不影 响正常通话,可以满足多数通信系统使 用要求 ◼ MOS分为3分以下常称为合成语音质量, 只有足够高的可懂度,但自然度较差, 不容易识别讲话者