第四章数字音像压缩技术基础 第四章数字音像压缩技术基础 VCD、DVD光盘上的数字信号都是压缩的,重放的过程就是对数据进行解压的过程。这 里,压缩解压都是模块化的,只要求了解其输入输出信号的特点。 第一节图像信号的数字化 、有关图像的几个名词 1.显像点 显像点是显像管的电子束在屏幕上形成的光点。在PAL-D制式中,显像点数为: 575×(4/3)×575=440833 2.像素 形成图像的基本微粒(单元)称为像素。像素越小越密集,图像越清晰;反之,图像越 粗糙。像素的大小取决于信号的质量。 像素与显像点是不同的两个概念,若图像要全幅显示,则像素数不大显像点数。 例如:VCD、DVD的像素数如下: NTSC PAL VCD 352×240 352×288 DVD 720×480 720×576 3.图像分辨率 图像分辨率是图像像素密度、图像质量、图像存储所需空间的度量方法。常有如下两种 表示方式: (1)用X、Y两个方向上,每英寸长度上的像素数来表示,单位DPI。此种表示常用于打 印机、扫描仪等仪器中。 例如:面积为4平方英寸的一幅画,像素2073600个,则分辨率为720DPI。 720×720×4=2073600 (2)彩色电视的分辨率(清晰度),其大小是人们的视力主观感觉 我国普通电视清晰度 M=07Z=0.7×575=400线 E:用这样的电视机来还原DVD图像,清晰度不能充分体现 4.显示分辨率
第四章 数字音像压缩技术基础 - 1 - 第四章 数字音像压缩技术基础 VCD、DVD 光盘上的数字信号都是压缩的,重放的过程就是对数据进行解压的过程。这 里,压缩解压都是模块化的,只要求了解其输入输出信号的特点。 第一节 图像信号的数字化 一、有关图像的几个名词 1.显像点 显像点是显像管的电子束在屏幕上形成的光点。在 PAL-D 制式中,显像点数为: 575×(4/3)×575=440833 2.像素 形成图像的基本微粒(单元)称为像素。像素越小越密集,图像越清晰;反之,图像越 粗糙。像素的大小取决于信号的质量。 像素与显像点是不同的两个概念,若图像要全幅显示,则像素数不大于显像点数。 例如:VCD、DVD 的像素数如下: NTSC PAL VCD 352×240 352×288 DVD 720×480 720×576 3.图像分辨率 图像分辨率是图像像素密度、图像质量、图像存储所需空间的度量方法。常有如下两种 表示方式: ⑴用 X、Y 两个方向上,每英寸长度上的像素数来表示,单位 DPI。此种表示常用于打 印机、扫描仪等仪器中。 例如:面积为 4 平方英寸的一幅画,像素 2073600 个,则分辨率为 720DPI。 720×720×4=2073600 ⑵彩色电视的分辨率(清晰度),其大小是人们的视力主观感觉。 我国普通电视清晰度: M=0.7Z=0.7×575=400 线 说明:用这样的电视机来还原 DVD 图像,清晰度不能充分体现。 4.显示分辨率
第四章数字音像压缩技术基础 显示分辨率是指显示屏上能够显示出的显像点(或像素)数目。常有如下两种表示方式: (1)用显像点的数目表示显示器的显示分辨率 例如:640×480表示显示屏能够分成480行,每行有640个显像点。也可以表示成 300kpx,其中“px”表示显像点。 嘐若显示分辨率为640×480,则一幅320×240的图片只占全屏面积的14 (2)用点距表示显示器的显示分辨率。 例如:028mm、0.26mm、0.24mm等。点距越小,分辨率越高 二、关于音像压缩的几个标准 1.与音像压缩技术有关的组织及其标准 ISO( International Standards organization):国际标准化组织 IEC( International Electrotechnic Committee):国际电工委员会。 CCIR( International Radio Consultative committee):国际无线电咨询委员会 JPEG( Joint Photographic Experts Group):联合图片专家组,又称由ISO和IEC组 成的“静止图像专家组”。 MPEG( Moving Picture Expers Group):由ISO和IEC组成的“活动图像专家组”。 CCIR-601(现改名为IU-RT.601)标准:由CCIR制定的广播级质量的数字电视编码标 准。 2.数据压缩的必要性 (1)CD光盘的容量 音频抽样频率44.1KHz,16bit量化,双声道,74分钟。 光盘的容量:44.KHz×16b×2×60s×74min=6118Mb=764MB (2)模拟视频信号数字化 NTSC制:像素720×480,16bit量化,每秒30帧。 PAL制:像素720×576,16bt量化,每秒25帧。 1秒钟的信息量 NTSC制:16×720×480×30=158Mb=1978MB PAL制:16×720×576×25=158Mbt=1978MB 若用CD盘装载,则播放时间是764MB÷1978MB=386s 若要播放74分钟,则需要对信号压缩
第四章 数字音像压缩技术基础 - 2 - 显示分辨率是指显示屏上能够显示出的显像点(或像素)数目。常有如下两种表示方式: ⑴用显像点的数目表示显示器的显示分辨率。 例如:640×480 表示显示屏能够分成 480 行,每行有 640 个显像点。也可以表示成 300kpx,其中“px”表示显像点。 说明:若显示分辨率为 640×480,则一幅 320×240 的图片只占全屏面积的 1/4。 ⑵用点距表示显示器的显示分辨率。 例如:0.28mm、0.26mm、0.24mm 等。点距越小,分辨率越高。 二、关于音像压缩的几个标准 1.与音像压缩技术有关的组织及其标准 ISO(International Standards Organization):国际标准化组织。 IEC(International Electrotechnic Committee):国际电工委员会。 CCIR(International Radio Consultative Committee):国际无线电咨询委员会 JPEG(Joint Photographic Experts Group):联合图片专家组,又称由 ISO 和 IEC 组 成的“静止图像专家组”。 MPEG(Moving Picture Expers Group):由 ISO 和 IEC 组成的“活动图像专家组”。 CCIR-601(现改名为 ITU-RT.601)标准:由 CCIR 制定的广播级质量的数字电视编码标 准。 2.数据压缩的必要性 ⑴CD 光盘的容量 音频抽样频率 44.1KHz,16bit 量化,双声道,74 分钟。 光盘的容量:44.1KHz×16bit×2×60s×74min=6118Mbit=764MB ⑵模拟视频信号数字化 NTSC 制:像素 720×480,16bit 量化,每秒 30 帧。 PAL 制:像素 720×576,16bit 量化,每秒 25 帧。 1 秒钟的信息量: NTSC 制:16×720×480×30=158Mbit=19.78 MB PAL 制:16×720×576×25=158Mbit=19.78 MB 若用 CD 盘装载,则播放时间是 764MB÷19.78 MB=38.6s 若要播放 74 分钟,则需要对信号压缩
第四章数字音像压缩技术基础 压缩比:CR=386÷(60×74)=1/20 ICD的比率:158Mb:120=1.3167Mbps。MPEG-1要求比特率在15MbDs以下。 (3)实际应用 实际应用中,对彩色电视信号的编码有两种方式:复合编码、分量编码 复合编码:对彩色电视信号直接编码 数码率:4×4.43×8=142Mbps 孙量编碍:对亮度信号和两各色差信号分别进行编码。 数码率:(13.5+6.75×2)×8=216Mbps 以这样髙的速率传输是不切实际的,需进行频带压缩,目前,一路电视信号可被压缩成 3~10Mbps进行传输。 三、VCD、DD图像参数 1.VCD图像参数(见课本P45表41 ()MPEG-1标准:按照广播级的标准,行与列的像素都减半。 (2)根据大面积着色原理,色差信号的像素数为亮度像素数的1/4。 (3)亮度带宽3.IMHz,色差带宽0.5MHz 2.DVD图像参数(见课本P45表4-2) (1MPEG-2标准:照广播级的标准。亮度像素数为MPEG-1标准的2倍;色差像素数为 MPEG-1标准的4倍 (2)比特率为MPEG-1的4倍以上。 (3)图像质量达到广播级。 第二节MPEG视频数字压缩技术 MPEG图像压缩技术的思路: ①在图像空间上采用JPEG压缩算法去掉冗余信息; ②在时间方面采用移动补偿压缩算法去掉冗余信息。 帧内数字压缩技术 在图像空间上采用JPEG压缩算法去掉冗余信息 电视活动画面实际上是由多幅静止的画面组成的。JPEG技术对静止的图像进行压缩 即帧内压缩。JPEG算法分成四个阶段。(见课本P46图44)
第四章 数字音像压缩技术基础 - 3 - 压缩比:CR=38.6÷(60×74)=1/120 VCD 的比特率:158Mbit÷120=1.3167Mbps。MPEG-1 要求比特率在 1.5 Mbps 以下。 ⑶实际应用 实际应用中,对彩色电视信号的编码有两种方式:复合编码、分量编码。 复合编码:对彩色电视信号直接编码。 数码率:4×4.43×8=142 Mbps 分量编码:对亮度信号和两各色差信号分别进行编码。 数码率: (13.5+6.75×2)×8=216 Mbps 以这样高的速率传输是不切实际的,需进行频带压缩,目前,一路电视信号可被压缩成 3~10 Mbps 进行传输。 三、VCD、DVD 图像参数 1.VCD 图像参数 (见课本 P45 表 4-1) ⑴MPEG-1 标准:按照广播级的标准,行与列的像素都减半。 ⑵根据大面积着色原理,色差信号的像素数为亮度像素数的 1/4。 ⑶亮度带宽 3.1MHz,色差带宽 0.5 MHz。 2.DVD 图像参数 (见课本 P45 表 4-2) ⑴MPEG-2 标准:照广播级的标准。亮度像素数为 MPEG-1 标准的 2 倍;色差像素数为 MPEG-1 标准的 4 倍 ⑵比特率为 MPEG-1 的 4 倍以上。 ⑶图像质量达到广播级。 第二节 MPEG 视频数字压缩技术 MPEG 图像压缩技术的思路: ①在图像空间上采用 JPEG 压缩算法去掉冗余信息; ②在时间方面采用移动补偿压缩算法去掉冗余信息。 一、帧内数字压缩技术 在图像空间上采用 JPEG 压缩算法去掉冗余信息。 电视活动画面实际上是由多幅静止的画面组成的。JPEG 技术对静止的图像进行压缩, 即帧内压缩。JPEG 算法分成四个阶段。(见课本 P46 图 4-4)
第四章数字音像压缩技术基础 MPEG-1图像的编码解码处理过程 RGB三基色信号一一转变为Y和Cr、Cb一两维离散余弦变换DCT—一量化一一编码 解码一一逆量化一一反向DCT变换一一还原Y和Cr、Cb-—RGB三基色信号。 1.对静止图像进行细化(见课本P47图45 一帧图像一一横切成片(18/15片)一一纵切成宏块(宏块图像处理基本单元,每片2222 宏块,共有39%630宏块)一一宏块中的亮度信息分成4块(每块64个像素,每个像素8bt: 每宏块256个像素) 说:① PAL/NTSC ②“宏块”与“块”是不同的两个概念,“宏块”中的亮度信息分成4“块”。 2.离散余弦变换DCT(见课本P47图46) 物理意义:把由空间域表示的图像变成频率域中的系数;将像块中像点的幅度量化值转 换成图像信号的频谱系数,即用图像信号中的谐波分量来表示。8×8个样值变成8×8个系 数 3.量化 对经过DCT编码后的频率系数进行量化。 对8×8个系数逐一除以一个量化值(见课本P48表43、4-4),(左上角小些,右下角大 些),得到8×8个系数。64个像素空间的图像内容非常简单,高次谐波很少,因此,右下角 的系数大部分为0 编码 用可变字长编码器对量化系数进行编码。量化后取出按照Z字形的扫描顺序,使得后面 连续出现多个0,可以用一个短码表示“连续0”。用极少的比特数来表示连续多个0的情况。 园CD与DVD的视频编码格式不同见课本P49表45,VCD图像分辨率仅为DVD 的1/4。 帧间数字压缩编码 在时间方面采用移动补偿压缩算法去掉冗余信息。 1.图像类型 MPEG图像压缩过程种,并不是将图像逐帧传递,而是采用一种独特的方式 连续画面的相邻帧具有相关性,取出相邻帧的预测差值予以传输处理,相邻帧的相同部
第四章 数字音像压缩技术基础 - 4 - MPEG-1 图像的编码解码处理过程: RGB 三基色信号——转变为 Y 和 Cr、Cb——两维离散余弦变换 DCT——量化——编码 ——解码——逆量化——反向 DCT 变换——还原 Y 和 Cr、Cb——RGB 三基色信号。 1.对静止图像进行细化 (见课本 P47 图 4-5) 一帧图像——横切成片(18/15 片)——纵切成宏块(宏块图像处理基本单元,每片 22/22 宏块,共有 396/330 宏块)——宏块中的亮度信息分成 4 块(每块 64 个像素,每个像素 8bit, 每宏块 256 个像素) 说明:①PAL/NTSC ②“宏块”与“块”是不同的两个概念,“宏块”中的亮度信息分成 4“块”。 2.离散余弦变换 DCT (见课本 P47 图 4-6) 物理意义:把由空间域表示的图像变成频率域中的系数;将像块中像点的幅度量化值转 换成图像信号的频谱系数,即用图像信号中的谐波分量来表示。8×8 个样值变成 8×8 个系 数。 3.量化 对经过 DCT 编码后的频率系数进行量化。 对 8×8 个系数逐一除以一个量化值 (见课本 P48 表 4-3、4-4),(左上角小些,右下角大 些),得到 8×8 个系数。64 个像素空间的图像内容非常简单,高次谐波很少,因此,右下角 的系数大部分为 0。 4.编码 用可变字长编码器对量化系数进行编码。量化后取出按照 Z 字形的扫描顺序,使得后面 连续出现多个 0,可以用一个短码表示“连续 0”。用极少的比特数来表示连续多个 0 的情况。 说明:VCD 与 DVD 的视频编码格式不同(见课本 P49 表 4-5),VCD 图像分辨率仅为 DVD 的 1/4。 二、帧间数字压缩编码 在时间方面采用移动补偿压缩算法去掉冗余信息。 1.图像类型 MPEG 图像压缩过程种,并不是将图像逐帧传递,而是采用一种独特的方式。 连续画面的相邻帧具有相关性,取出相邻帧的预测差值予以传输处理,相邻帧的相同部
第四章数字音像压缩技术基础 分不传输。 为了实现MPEG压缩编码,将图像帧定义为I、P、B三种。(见课本P50图47) (1)帧内编码帧(I帧) Ⅰ帧意为全帧编码传输帧 采用帧内DCT量化及变字长编码。 PAL制中,每12帧至少有一个I帧:NTSC制中,每15帧至少有一个I帧。 (2)前向预测帧(P帧) P帧意为前向预测编码帧。 P帧只传送与它前面I帧(或P帧)不同的图像信息部分,如图像中运动物体比变化部 分 P帧需要前面I帧(或P帧)提供前向动态预测。 (3)双向预测帧(B帧) B帧意为双向预测内插编码帧。 B帧传送它前面I帧(或P帧)与后面I帧(或P帧)之间的预测误差。 I帧与P帧或P帧与P帧之间,可以插入2个B帧。 处理时,先处理I、P帧,再处理B帧。 嘐I帧含有全部信息,P、B帧只含有信息差,B帧信息量最少,达到了压缩的目的 编译码电路较复杂 2.运动补偿 对象为宏块。 用消除帧间预测图像的时间冗余来提高压缩比 步骤: ①找出编码图像中的宏块相对于参考图像中的宏块所移动的距离和方向一一移动矢量 ②找出两个宏块之间的最小差值(赵最佳匹配) ③按照JPEG方法对差值编码,对移动矢量进行霍夫曼编码(变字长编码的一种,对概 率小的符号给长码)。 三、MPEG视频数据信号结构 数据流的排列方式为6层式结构。(见课本P1图48) 1.序列层
第四章 数字音像压缩技术基础 - 5 - 分不传输。 为了实现 MPEG 压缩编码,将图像帧定义为 I、P、B 三种。(见课本 P50 图 4-7) ⑴帧内编码帧(I 帧) I 帧意为全帧编码传输帧。 采用帧内 DCT 量化及变字长编码。 PAL 制中,每 12 帧至少有一个 I 帧;NTSC 制中,每 15 帧至少有一个 I 帧。 ⑵前向预测帧(P 帧) P 帧意为前向预测编码帧。 P 帧只传送与它前面 I 帧(或 P 帧)不同的图像信息部分,如图像中运动物体比变化部 分。 P 帧需要前面 I 帧(或 P 帧)提供前向动态预测。 ⑶双向预测帧(B 帧) B 帧意为双向预测内插编码帧。 B 帧传送它前面 I 帧(或 P 帧)与后面 I 帧(或 P 帧)之间的预测误差。 I 帧与 P 帧或 P 帧与 P 帧之间,可以插入 2 个 B 帧。 处理时,先处理 I、P 帧,再处理 B 帧。 说明:I 帧含有全部信息,P、B 帧只含有信息差,B 帧信息量最少,达到了压缩的目的。 编译码电路较复杂。 2.运动补偿 对象为宏块。 用消除帧间预测图像的时间冗余来提高压缩比。 步骤: ①找出编码图像中的宏块相对于参考图像中的宏块所移动的距离和方向——移动矢量; ②找出两个宏块之间的最小差值(赵最佳匹配); ③按照 JPEG 方法对差值编码,对移动矢量进行霍夫曼编码(变字长编码的一种,对概 率小的符号给长码)。 三、MPEG 视频数据信号结构 数据流的排列方式为 6 层式结构。 (见课本 P51 图 4-8) 1.序列层
第四章数字音像压缩技术基础 是编码结构的顶层,由码头(SH)及一个或多个图像组组成。对象是图像组。 SH定义了图像的宽度及高度、像素的长宽比、帧速率、码流速率等, 2.图像组(GOP)层 由码头(SH)及一系列图像组成。豺象是各帧图像。 SH定义了时间及编辑信息 编辑时,PAL制帧组:1个I帧、2个P帧、2个B帧。5个帧。 NTSC制帧组:1个I帧、2个P帧、3个B帧。6个帧 3.图像层 是序列中最原始的编码单元,相当于运动视频或电影的帧 由码头(SH)及一条或多条切片组成。对象是切片 SH定义了时间、图像类型及编码信息 4.切片层 由码头(SH)及一个或多个连续的宏块组成。豺象是宏块。 5.宏块 由码头(SH)及8×8的像素块组成。对象是热 SH定义了量化级及运动补偿信息 6.块 是基本的编码单元。 第三节MPEG视频编码与解码 MPEG编码器的结构原理 以MPEG-1编码器为例。(见课本P52图49) 编码器的左端帧输入为图像的多个帧,顺序为 IBBPBP(NISC制)、 IBPBP(PAL制)。由 于B帧是前后预测编码得到的,故帧重排后,B应放在P之后,即 IPBBPB(NTSC制)、 IPBPB (PAL制) 1.I帧编码 “帧重排”输出Ⅰ帧时,S1、S2置于上方,S3置于右边,编码器处于Ⅰ帧编码模式。 对Ⅰ帧编码:DCT变换、量化、编码、反馈调节(编码测试处理、量化自动调节)、传 输缓存。 量化自动调节为正常值,保证信号的质量
第四章 数字音像压缩技术基础 - 6 - 是编码结构的顶层,由码头(SH)及一个或多个图像组组成。对象是图像组。 SH 定义了图像的宽度及高度、像素的长宽比、帧速率、码流速率等。 2.图像组(GOP)层 由码头(SH)及一系列图像组成。对象是各帧图像。 SH 定义了时间及编辑信息。 编辑时,PAL 制帧组:1 个 I 帧、2 个 P 帧、2 个 B 帧。 5 个帧。 NTSC 制帧组:1 个 I 帧、2 个 P 帧、3 个 B 帧。6 个帧。 3.图像层 是序列中最原始的编码单元,相当于运动视频或电影的帧。 由码头(SH)及一条或多条切片组成。对象是切片。 SH 定义了时间、图像类型及编码信息。 4.切片层 由码头(SH)及一个或多个连续的宏块组成。对象是宏块。 5.宏块 由码头(SH)及 8×8 的像素块组成。对象是块。 SH 定义了量化级及运动补偿信息。 6.块 是基本的编码单元。 第三节 MPEG 视频编码与解码 一、MPEG 编码器的结构原理 以 MPEG-1 编码器为例。(见课本 P52 图 4-9) 编码器的左端帧输入为图像的多个帧,顺序为 IBBPBP(NTSC 制)、IBPBP(PAL 制)。由 于 B 帧是前后预测编码得到的,故帧重排后,B 应放在 P 之后,即 IPBBPB (NTSC 制)、IPBPB (PAL 制)。 1.I 帧编码 “帧重排”输出 I 帧时,S1、S2 置于上方,S3 置于右边,编码器处于 I 帧编码模式。 对 I 帧编码:DCT 变换、量化、编码、反馈调节(编码测试处理、量化自动调节)、传 输缓存。 量化自动调节为正常值,保证信号的质量
第四章数字音像压缩技术基础 2.P帧编码 帧重排”输出P帧时,S1、S2置于下方,S3置于右边。量化自动调节为粗精度方式。 P帧宏块(I帧存储器)一一运动估计器一一预测运动矢量、得到相近宏块 3.B帧编码 “帧重排”输出B帧时,S1置于下方,S2置于上方,S3置于左边。 二、MPEG解码器的结构原理 以MPEG-1解码器为例。(见课本P54图4-11) I帧解码 2.P帧解码 3.B帧解码 三、VCD、DⅤVD信号记录流程 流程图(见课本P55图412) 三种编码方式 1.信源编码:提高信号再传输/储过程中的有效性。 VCD-—MPEG-1 VD→MPEG-2。 2.格式编码:规定每行像素数、每帧行数、每秒场数和帧数等 VCD-- CD-ROMXA规范 DⅤDISO9660标准。 3.信道编码:提高信号再传输/储过程中的可靠 VCD→一CIRC编码和EFM调制 DVD——RS-PC编码和 EFM-plus调制 第四节MPEG音频编码与解码 、掩蔽效应 听阈:指人耳刚刚能听得见的声音强度,其与频率有关。人耳对4KHz的声音最敏感
第四章 数字音像压缩技术基础 - 7 - 2.P 帧编码 “帧重排”输出 P 帧时,S1、S2 置于下方,S3 置于右边。量化自动调节为粗精度方式。 P 帧宏块(I 帧存储器)——运动估计器——预测运动矢量、得到相近宏块 3.B 帧编码 “帧重排”输出 B 帧时,S1 置于下方,S2 置于上方,S3 置于左边。 二、MPEG 解码器的结构原理 以 MPEG-1 解码器为例。(见课本 P54 图 4-11) 1.I 帧解码 2.P 帧解码 3.B 帧解码 三、VCD、DVD 信号记录流程 流程图(见课本 P55 图 4-12) 三种编码方式: 1.信源编码:提高信号再传输/存储过程中的有效性。 VCD——MPEG-1; DVD——MPEG-2。 2.格式编码:规定每行像素数、每帧行数、每秒场数和帧数等。 VCD——CD-ROM XA 规范; DVD——ISO9660 标准。 3.信道编码:提高信号再传输/存储过程中的可靠性。 VCD——CIRC 编码和 EFM 调制; DVD——RS-PC 编码和 EFM-plus 调制。 第四节 MPEG 音频编码与解码 一、掩蔽效应 听阈:指人耳刚刚能听得见的声音强度,其与频率有关。人耳对 4KHz 的声音最敏感
第四章数字音像压缩技术基础 阈值曲线(见课本P56图413)。 掩蔽效应:指在某种强音影响下,听不到另一种声音了的现象, 1.频域掩蔽(见课本P57图4-14(b) 频率相近的两个声音,弱音易被强音掩蔽。 图中B、C听不见。 掩藏效果与两种声音的幅度悬殊程度、频率相差远近有关。 2.时域掩蔽(见课本P57图414(a) 时间上相邻的声音之间存在的掩蔽现象 超前掩蔽:2~5ms 滞后掩蔽:100ms 图中E、F听不见。 掩蔽效果与两种声音的幅度悬殊程度、时间相差远近有关。 骘论:人们听不见的信号都在掩蔽线以下,可以去掉,把比特安排给必需的信号部分, 节约了比特,这就是音频压缩的基本原理。 MPEG利用的是人的听觉系统的感知特性一—“心理升学模型”。去掉人耳听不见的细 节一一实现了高压缩率,对仪器测量来讲存在失真,对于人耳而言,不存在失真。 二、音频压缩过程和分层 MPEG音频压缩编码(见课本P57图4-15) MPEG音频压缩的三个层次 1.MP1(层1)双声道 2.MP2(层2)双声道 3.MP3(层3)双声道 一张MP3光盘容量650MB,存储150首歌曲,播放600多分钟,音质接近CD。 样本帧 比特率压缩比 应用 MP1384384~256Kbit14|DCC数字盒式磁带 MP2 1152256~192Kbt17 数字广播、VCD MP3 1152 128~64Kbit1/11 ISDN 、MPEG音频编码与解码
第四章 数字音像压缩技术基础 - 8 - 阈值曲线(见课本 P56 图 4-13)。 掩蔽效应:指在某种强音影响下,听不到另一种声音了的现象。 1.频域掩蔽 (见课本 P57 图 4-14(b)) 频率相近的两个声音,弱音易被强音掩蔽。 图中 B、C 听不见。 掩蔽效果与两种声音的幅度悬殊程度、频率相差远近有关。 2.时域掩蔽 (见课本 P57 图 4-14 (a)) 时间上相邻的声音之间存在的掩蔽现象。 超前掩蔽:2~5ms; 滞后掩蔽:100ms。 图中 E、F 听不见。 掩蔽效果与两种声音的幅度悬殊程度、时间相差远近有关。 结论:人们听不见的信号都在掩蔽线以下,可以去掉,把比特安排给必需的信号部分, 节约了比特,这就是音频压缩的基本原理。 MPEG 利用的是人的听觉系统的感知特性——“心理升学模型”。去掉人耳听不见的细 节——实现了高压缩率,对仪器测量来讲存在失真,对于人耳而言,不存在失真。 二、音频压缩过程和分层 MPEG 音频压缩编码(见课本 P57 图 4-15) MPEG 音频压缩的三个层次: 1.MP1(层 1) 双声道 2.MP2(层 2) 双声道 3.MP3(层 3) 双声道 一张 MP3 光盘容量 650MB,存储 150 首歌曲,播放 600 多分钟,音质接近 CD。 样本/帧 比特率 压缩比 应用 MP1 384 384~256Kbit 1/4 DCC 数字盒式磁带 MP2 1152 256~192Kbit 1/7 数字广播、VCD MP3 1152 128~64Kbit 1/11 ISDN 三、MPEG 音频编码与解码
第四章数字音像压缩技术基础 1.VCD机的音频编解码(见课本P59图4-16) (1)编码:采用MP2压缩方式,压缩比为6 (2)解码:数据信号处理一一解压缩一—D/A转换 2.DⅴD机的音频编解码 MPEG-2兼容MPEG-1,最多支持8个声道 作业:思考题
第四章 数字音像压缩技术基础 - 9 - 1.VCD 机的音频编解码 (见课本 P59 图 4-16) ⑴编码:采用 MP2 压缩方式,压缩比为 6。 ⑵解码:数据信号处理——解压缩——D/A 转换 2.DVD 机的音频编解码 MPEG-2 兼容 MPEG-1,最多支持 8 个声道。 作业:思考题