西安电子科技大学：《多媒体通信技术》课程电子教案（PPT教学课件）第2章多媒体信息编码

2.1引言 2.2基本编码方法 2.3图像编码标准 2.4语音编码标准

团购合买资源类别：文库，文档格式：PPT，文档页数：75，文件大小：980.5KB

第?幸多媒纬信息編码第2章多媒体信息編码 2,1引言 2,2基本编码方法 23图像编码标准 2,4语音编码标准 BACK

第2章多媒体信息编码第2章多媒体信息编码 2.1 引言 2.2 基本编码方法 2.3 图像编码标准 2.4 语音编码标准

第?幸多媒纬信息編码 21引言表21连续媒体数据类型特征举例媒体类型数据速率说明语音质量音频 64 kb/s 1个信道,8kH条样速率,8位量化 CD质量音频 14Mbs2个信道,441kHz条样速率,16位量化 MPEG-2编码视频336Mbs640*480像素帧24位像素,30帧/秒 NTSC质量视 216Mb/s640*480像素帧24位像素,30帧秒 HDV质量视频648Mbs12800720像素帧24位像素,30帧/秒

第2章多媒体信息编码 2.1 引言表2.1 连续媒体数据类型特征举例媒体类型数据速率说明 CD MPEG-2编码视频 NTSC HDTV质量视频 64 kb/s 1.4 Mb/s 3.36 Mb/s 216 Mb/s 648 Mb/s 1个信道, 8 kHz条样速率, 8 2个信道, 44.1 kHz条样速率, 16 640*480像素/帧, 24位/像素, 30帧/ 640*480像素/帧, 24位/像素, 30帧/ 1280*720像素/帧, 24位/像素, 30帧/秒

第?幸多媒纬信息編码数据压缩处理一般由两个过程组成:一是编码过程,即对原始数据进行编码压缩,以便存储和传输;二是解码过程,即对压缩的数据进行解压,恢复成可用的数据。根据解压后数据的保真度, 数据压缩技术可分为无损压缩编码和有损压缩编码两大类。无损压缩编码是指解码后的数据与原始数据完全相同,无任何偏差。这种编码通常基于信息熵原理,常用的编码有哈夫曼编码、算术编码、行程编码等。它的压缩能力与所处理数据的类型有关,压缩比通常比较低,一般在2:1~5:1。主要用于要求数据无损压缩存储和传输的场合,如传真机、文本文件传输等

第2章多媒体信息编码数据压缩处理一般由两个过程组成: 一是编码过程, 即对原始数据进行编码压缩, 以便存储和传输; 二是解码过程, 即对压缩的数据进行解压, 恢复成可用的数据。根据解压后数据的保真度, 数据压缩技术可分为无损压缩编码和有损压缩编码两大类。无损压缩编码是指解码后的数据与原始数据完全相同, 无任何偏差。这种编码通常基于信息熵原理, 常用的编码有哈夫曼编码、算术编码、行程编码等。它的压缩能力与所处理数据的类型有关, 压缩比通常比较低, 一般在2∶1～5∶1。主要用于要求数据无损压缩存储和传输的场合, 如传真机、文本文件传输等

第?幸多媒纬信息編码有损压缩编码是指解码后的数据与原始数据相比有一定的偏差,但仍可保持一定的视听质量和效果。它主要利用人的视、听觉特性,在保持一定保真度下对数据进行压缩,其压缩比可达 100:1。压缩比愈高,其解压缩后的视、音频质量就愈低。这种编码方法有很多种,如基于线性预测原理的预测编码、基于正交变换原理的正交变换编码、基于向量量化原理的向量量化编码、基于分层处理的分层编码以及基于频带分割原理的子带编码等。主要用于对音频和视频数据的压缩

第2章多媒体信息编码有损压缩编码是指解码后的数据与原始数据相比有一定的偏差, 但仍可保持一定的视听质量和效果。它主要利用人的视、听觉特性, 在保持一定保真度下对数据进行压缩, 其压缩比可达 100∶1。压缩比愈高, 其解压缩后的视、音频质量就愈低。这种编码方法有很多种, 如基于线性预测原理的预测编码、基于正交变换原理的正交变换编码、基于向量量化原理的向量量化编码、基于分层处理的分层编码以及基于频带分割原理的子带编码等。主要用于对音频和视频数据的压缩

第?幸多媒纬信息編码多媒体信息编码技术主要侧重于有损压缩编码的研究。经过多年的研究与开发,已经出台了一系列有关的国际标准。其中, 最著名的是国际标准组织(ISO)制定的JPEG和MPEG。JPEG 是静止图像的压缩标准,其压缩比可达40:1。MPEG(MPEG-1、 MPEG-2及MPEG-4)是动态图像的压缩标准,采用MPEG-2标准对NTSC质量视频进行压缩后,网络带宽需求可降低到3.36Mb/s。其它的标准还有国际电信联合会(ITU)制定的用于可视电话会议电视的H261和H263;用于音频的G711、G721、G728等

第2章多媒体信息编码多媒体信息编码技术主要侧重于有损压缩编码的研究。经过多年的研究与开发, 已经出台了一系列有关的国际标准。其中, 最著名的是国际标准组织（ISO）制定的JPEG和MPEG。JPEG 是静止图像的压缩标准, 其压缩比可达40∶1。 MPEG（MPEG-1、 MPEG-2及MPEG-4）是动态图像的压缩标准, 采用MPEG-2标准对NTSC质量视频进行压缩后, 网络带宽需求可降低到3.36 Mb/s。其它的标准还有国际电信联合会（ITU）制定的用于可视电话、会议电视的H.261和H.263; 用于音频的G.711、 G.721、 G.728等

第?幸多媒纬信息編码 2,2基本编码方法 22.1行程编码行程编码是一种简单的无损压缩编码方法,它通过压缩原始数据中相同的字节序列实现数据压缩。在图像和声音数据中可能包含大量的相同字节连续重复的序列,通过行程编码可以将这些重复字节压缩掉,取而代之的是一个更加紧密的字节序列。例如, 个原始数据字符串为 RTTTTTTTTABBCDGHJK,采用行程编码后的字符串为R#8 TABBCDGHJK,这里用#8T替换掉8个T字符, 符号“#”是特殊标识符,用于表示行程编码。如果原始数据字符串也包含了“#”符号,则必须用两个“#”符号替换掉原始数据字符串中的

第2章多媒体信息编码 2.2 基本编码方法 2.2.1 行程编码行程编码是一种简单的无损压缩编码方法, 它通过压缩原始数据中相同的字节序列实现数据压缩。在图像和声音数据中可能包含大量的相同字节连续重复的序列, 通过行程编码可以将这些重复字节压缩掉, 取而代之的是一个更加紧密的字节序列。例如, 一个原始数据字符串为RTTTTTTTTABBCDGHJK, 采用行程编码后的字符串为R＃8TABBCDGHJK, 这里用＃8T替换掉8个T字符, 符号“＃”是特殊标识符, 用于表示行程编码。如果原始数据字符串也包含了“＃” 符号, 则必须用两个“＃” 符号替换掉原始数据字符串中的“＃” 符号

第2多媒体信息编码 222哈夫曼编码哈夫曼( Huffman)编码是一种无损压缩编码方法,它根据信源符号出现的概率大小进行排序,出现的概率大的符号分配短码,反之分配长码。在分配代码过程中,需要建立一个n阶二叉树,其编码过程如下 ①对信源符号按其出现的概率进行递减排序; ②将两个最小的概率相加,其和作为新符号的概率 ③重复①和②,直到概率之和达到1为止 ④每次合并消息时,将被合并的消息赋予1和0或者0和1 ⑤寻找从每个信源符号到概率为1处的路径,记录下路径上的1和0; ⑥从树根节点到叶子节点,对每个信源符号列出0、1序列

第2章多媒体信息编码 2.2.2 哈夫曼编码哈夫曼(Huffman)编码是一种无损压缩编码方法, 它根据信源符号出现的概率大小进行排序, 出现的概率大的符号分配短码, 反之分配长码。在分配代码过程中, 需要建立一个n阶二叉树, 其编码过程如下: ① 对信源符号按其出现的概率进行递减排序; ② 将两个最小的概率相加, 其和作为新符号的概率; ③ 重复①和②, 直到概率之和达到1为止; ④ 每次合并消息时, 将被合并的消息赋予1和0或者0和1; ⑤ 寻找从每个信源符号到概率为1处的路径, 记录下路径上的1和0; ⑥ 从树根节点到叶子节点, 对每个信源符号列出0、 1序列

第2多媒体信息编码例如,A、B、C、D四个字符出现的概率分别为:P(A=34 P(B)=18;P(O)=1/16;P⑦D)=1/16,按照上述编码过程将生成如图2.1所示的二叉树,获得的编码结果是:H(A)=1;H(B)=01; H(C)=001;H(D)=000该结果存放在哈夫曼表中。 P(ABCD= 0 P(BCD=1/4 0 P(CD)=1/8 0 P(A)=3/4 P(B)=18 P(C)=/6|P(D=1/16 图2.1哈夫曼编码生成的二叉树

第2章多媒体信息编码例如, A、B、C、D四个字符出现的概率分别为: P(A)=3/4; P(B)=1/8; P(C)= 1/16; P(D)=1/16, 按照上述编码过程将生成如图2.1所示的二叉树, 获得的编码结果是: H(A)=1; H(B)=01; H(C)=001; H(D)=000, 该结果存放在哈夫曼表中。图 2.1 哈夫曼编码生成的二叉树

第?幸多媒纬信息編码 223离散余弦变换编码变换编码主要有离散傅立叶变换(DFT编码、离散余弦变换 (DCD编码等。其中,DCT编码方法被普遍使用,在JPEG MPEG和H261等标准中都采用了DCT编码。由于声音信号只有个时间维,因此音频信号压缩采用一维DCT编码,而图像压缩必须考虑水平和垂直两个方向,因此图像压缩则采用二维DCT编码

第2章多媒体信息编码 2.2.3 离散余弦变换编码变换编码主要有离散傅立叶变换(DFT)编码、离散余弦变换 (DCT)编码等。其中, DCT编码方法被普遍使用, 在JPEG、 MPEG和H.261等标准中都采用了DCT编码。由于声音信号只有一个时间维, 因此音频信号压缩采用一维DCT编码, 而图像压缩必须考虑水平和垂直两个方向, 因此图像压缩则采用二维DCT编码

第?幸多媒纬信息編码 DCT编码方法是对一个8×8图像块灰度样本数据流进行压缩,而彩色图像压缩可看成是压缩图像的多个分量。在编码器中,首先将源图像8×8样本数据块(像素块)的取值范围由 [0,2D-1](无符号)转换成[-2p1,D1-1](有符号),其中p 为样本定义的精度。然后对8×8样本数据块进行正向离散余弦变换(FDCT)。在解码器中,利用逆向离散余弦变换(IDCT) 重建8×8样本数据块,恢复图像。FDCT和IDCT的数学表达式如(1)式和(2)式所示

第2章多媒体信息编码 DCT编码方法是对一个8×8图像块灰度样本数据流进行压缩, 而彩色图像压缩可看成是压缩图像的多个分量。在编码器中, 首先将源图像8×8样本数据块（像素块）的取值范围由［0, 2 p -1］（无符号）转换成［-2 p-1 , 2 p-1 -1］（有符号）, 其中p 为样本定义的精度。然后对8×8样本数据块进行正向离散余弦变换（FDCT）。在解码器中, 利用逆向离散余弦变换（IDCT）重建8×8样本数据块, 恢复图像。 FDCT和IDCT的数学表达式如(1)式和(2)式所示:

点击下载完整版文档（PPT格式）

共75页，可试读20页，点击继续阅读 ↓↓

点击下载（PPT格式）

浏览记录