MPEG基础和协议分析指南 (包括DVB和ATSC) tektronix Enabling Innovation
MPEG 基础和协议分析指南 (包括 DVB 和 ATSC)
MPEG基础和协议分析指南 初级读本 目录 第一章MPEG概述 整合…… ,,,++++, 压缩的必要性… …… 压缩原理 压维在电视中的应用…… 5数字视频压缔简介 1.6音频压维简介………… ……5 17MPEG码流……… 监视和分析的必要性…… 压缩带来的问题… 第二章视频压缩 ……8 是空间域编码还是时间域编码?…… 2.2 空间域编码…… 加权………… “ 24扫描读取…… aaaaaa 2.5 间域编码番 27 时间域缡码 2.8 运动补偿 14 双向编码 16 2.101PB图象… 2.|1MPEG压器…… 212预处理 213小波变换… +++ 第三章音频压缩…… 听觉机理…………… 带编妈 ………24 3.3 MPEG层1 3.4 MPEG层云2………… …26 换编妈 36MPFG层3…… ……………297 37 MPFG音频 PG-4音赖 第四章MPEG标准 …………………………………………………………………………………………29 么是MFF MPFG 4.3.1MPEG-2的类和级… MPEG-4. 4.4.1MPG4标准文件…… 4.4.2对象编码 4.4.3视频和音频编码 4.4.4可分级性…………… 丰4 4.4.5MPEG4的其它方面 4.45MPEG-4的未来…… www.toktrorix.com/vidco_audoo
MPEG基础和协议分析指南 初级读本 第五章基本码流………………… ,,来 视基本码流句法 4 5.2 音频基本码流 第六章打包的基本码流(PES)… 42 42 2时间标 第七章节目流 记录与传 节日流筒介 第八章传输流……………………………………………………………………………45 传输流的⊥作过程……… 45 82 传输流包 83 节月时钟基准(PP)… 包识别符[PD 节目专用信忘(PS…………… 第九数字调制 调制原理 模拟调制 父调制… …………………50 简单数字调制系统……… ………51 相移键控 9.6 正交幅度调制(QAM)… 97残留边带调制(SB)………………………………………………… ………53 编妈止交频分复用( CO FDM) 综合业务数据广播(sDB) …5 9.91SDB-S卩星系统 9.92|5DBc有线系统 993SDR-T地面调制 9941SUB小结 第十章DVB和ATS概述…………… …156 再复用 10 业务信息G 577 104误码校正 105信道编码 ,息, ·,, 3966 107数字发射 www.tektronix.comwvideoar
MPEG基础和协议分析指南 初级读本 第十一章数据广播… …62 数据广播应用 111.1节目相关数据 111.2机会数据 11.1.3网络数据…… 11.1.4增强电视 111.5立百电视 112 内容封装 Content Encapsulation)………… 1121MPEG数据封装… ,·,+,++·++++++, 1121.1数据管道 ata piping) 11.2.1.2数据流… 11213DsMG(数字存储媒体指令和控制)… 11214MPE(多协议封) 112.15传送带…… 11216数据传送带……………………………………… 1121.7对象传送带…………………………………………………………………………………………………66 11918对象传送带的广播……………… 11.21.9MPEG-2数据同步 1122DVB数据封装 68 1123ATCA90数据封装… 1124AR|B数据封装 数据内容传送……… ,,.,. 113.1DVB公告 70 1132ATSC公告……………… 114 内容提交 114.1机顶盒中问什 114.2DB多柴体家庭平台MHP)……………… 1143ATV匚DA高级电视增强沦坛和数宇电视应用软件环境… 1144DASE数字电视应用软件坏境………… 第十二章MPEG测试… 12. 測试妥求…………………… 122 传输流分析………… 层图示 124解释性图示…… 76 125 句法和GRC分析…… 126 过滤 定时分析 128 基本码流测试 9 129 萨尔谐大顺应性比特流……………… 1210 甚本码流分析 ……………………………………………………………………80 传翰流的创建 81 1212PCR不准确度信号的发生…… 术语汇编
MPEG基础和协议分析指南 初级读本 @www.tektronix.com/video_audio
MPEG 基础和协议分析指南 初级读本 iv www.tektronix.com/video_audio
MPEG基础和协议分析指南 初级读本 第一章MPEG概述 MPEG是目前最常用的一项音频/视频压缩技术,它实际性工作站,这项应用对于模拟来说是不可能的。另一个 上并不是一个单一的标准,而是包括了适合于各种不同例子是将音频、视频、图形、文字和数据存储在同一介质 应用的一系列标准,但这些标准是以一些共同理论为基的多媒体技术,这在模拟域中也是无法实现的。 础的。MPEG是活动图象专家组的缩写词,该专家组是联 合技术委员会 Joint technical committee,mcn)的一部分,12压缩的必要性 JTc1是由0国际标准化组织)和EC国际电工委员会)建数字视频首先在后期制作应用中获得了成功。在后期制 立的。JTC1负责信息技术,在JTC1中,下设有负责“音作中,虽然数字视频的代价高昂,但它可以复制无限次 频、图象编码以及多媒体和超媒体信息”的子组SG29。在而无损伤。然而,后期制作中所使用的标准数字视频,其 SG29子组中,又设有多个工作小组,其中就包括PEG(联数据率高达每秒200兆比特以上,这就需要大容量的存储 合图片专家组和负责活动图象压缩的工作组WG11。因器和宽带传输。只有在存储器和带宽需求容易满足的情 此,可以认为MPEG是 SO/EC JTC1/sG29/WG1 况下,数字视频才有可能获得广泛的应用。压缩的目的 既然把MPEG描述为多个词首字母的组合,那么,就其工正在于此 作过程而言,正如欧洲电信标准学会所说:“条件接收表压缩就是使数字视音频具有较低数据率的一种方式。压 CAT引导综合接收机/解码器去寻找与所使用的条件接缩具有以下优点 收A)系统相关的授权管理信息(EMM)”。如果您能够理卜对于给定的信源素材,它只需要较少的存储量。 解这句话,您就不需要这本书了! 在实时工作时,压缩可降低所需带宽。此处,压缩可以使数 据在存储介质间的传输速度更快,例如,在磁带和硬盘之间 1.1整合 可以实现数据的快速传输 数字技术在音频和视频上已经取得了迅速的进展,这是≯采用压缩记录格式可以减少记录密度,这样就可以降低记录 由多种因素决定的。其中一个重要因素就是数字信息的设备对环境因素和设备维护的要求 可靠性更高,可以通过编码以消除信息中的错误。这就 意味着数字技术能够消除在记录和传输过程中所产生的13压缩原理 损耗。激光唱盘(cD)就是采用数字技术的第一个消费类在传递信息内容时,为了减少所需数据量,可以采用两 种不同的基本技术。在实用的压缩系统中,常常是这两 相对早期的聚乙烯唱盘,CD的声音质量有了很大的改种技术的组合应用,采用了十分复杂的方式 善。仅仅比较质量是不够的,真正的意义在于:数字记第一种压缩技术是提高编码效率。对于给定的信息,可 录和数字传输技术的应用使内容的处理达到了模拟技术以采用许多编码方式。在最简单的视音频数据中,也包 所不可能达到的程度。一旦音频和视频信号被数字化后,含有一定量的冗余度,这就是下面我们要讨论的“熵”的 其内容就是数据的形式。这种数据和其它任意类型的数概念。 据一样,可以用同样的方式处理。这样,数字视频和数许多编码技术可以减少或除去这种冗余度。例如游程编 字音频就作为数据而进入了计算机技术领域 码和可变字长编码系统(如霍夫曼编码)。如果应用适当, 计算杋和视音频的融合是数据处理和脉冲编码调制PCM)上述编码技术完全是可逆的,这就是说,解压缩后的数 应用的必然结果。数字媒介可以存储任何类型的信息,因据与编码系统的输入数据是相同的。这种类型的压缩称 此,将计算机存储器件应用于数字视频是很容易的。计为无损压缩。存档的计算机程序如 PKZip就采用了这种无 算机技术和数字视音频相融合的第一个应用实例是非线损压缩。 ww tektronix. comwvideo_audio
第一章 MPEG 概述 MPEG 是目前最常用的一项音频 / 视频压缩技术,它实际 上并不是一个单一的标准,而是包括了适合于各种不同 应用的一系列标准,但这些标准是以一些共同理论为基 础的。MPEG是活动图象专家组的缩写词,该专家组是联 合技术委员会(Joint Technical Committee,JTC1)的一部分, JTC1是由ISO(国际标准化组织)和IEC(国际电工委员会)建 立的。JTC1负责信息技术,在JTC1 中,下设有负责“音 频、图象编码以及多媒体和超媒体信息”的子组SG29。在 SG29子组中,又设有多个工作小组,其中就包括JPEG(联 合图片专家组)和负责活动图象压缩的工作组 WG11。因 此,可以认为 MPEG 是 ISO/IEC JTC1/SG29/WG11。 既然把MPEG描述为多个词首字母的组合,那么,就其工 作过程而言,正如欧洲电信标准学会所说:“条件接收表 (CAT)引导综合接收机 / 解码器去寻找与所使用的条件接 收(CA)系统相关的授权管理信息(EMM)”。如果您能够理 解这句话,您就不需要这本书了! 1.1 整合 数字技术在音频和视频上已经取得了迅速的进展,这是 由多种因素决定的。其中一个重要因素就是数字信息的 可靠性更高,可以通过编码以消除信息中的错误。这就 意味着数字技术能够消除在记录和传输过程中所产生的 损耗。激光唱盘 (CD) 就是采用数字技术的第一个消费类 产品。 相对早期的聚乙烯唱盘, CD 的声音质量有了很大的改 善。仅仅比较质量是不够的,真正的意义在于:数字记 录和数字传输技术的应用使内容的处理达到了模拟技术 所不可能达到的程度。一旦音频和视频信号被数字化后, 其内容就是数据的形式。这种数据和其它任意类型的数 据一样,可以用同样的方式处理。这样,数字视频和数 字音频就作为数据而进入了计算机技术领域。 计算机和视音频的融合是数据处理和脉冲编码调制(PCM) 应用的必然结果。数字媒介可以存储任何类型的信息,因 此,将计算机存储器件应用于数字视频是很容易的。计 算机技术和数字视音频相融合的第一个应用实例是非线 性工作站,这项应用对于模拟来说是不可能的。另一个 例子是将音频、视频、图形、文字和数据存储在同一介质 的多媒体技术,这在模拟域中也是无法实现的。 1.2 压缩的必要性 数字视频首先在后期制作应用中获得了成功。在后期制 作中,虽然数字视频的代价高昂,但它可以复制无限次 而无损伤。然而,后期制作中所使用的标准数字视频,其 数据率高达每秒200兆比特以上,这就需要大容量的存储 器和宽带传输。只有在存储器和带宽需求容易满足的情 况下,数字视频才有可能获得广泛的应用。压缩的目的 正在于此。 压缩就是使数字视音频具有较低数据率的一种方式。压 缩具有以下优点: 对于给定的信源素材,它只需要较少的存储量。 在实时工作时,压缩可降低所需带宽。此处,压缩可以使数 据在存储介质间的传输速度更快,例如,在磁带和硬盘之间 可以实现数据的快速传输。 采用压缩记录格式可以减少记录密度,这样就可以降低记录 设备对环境因素和设备维护的要求。 1.3 压缩原理 在传递信息内容时,为了减少所需数据量,可以采用两 种不同的基本技术。在实用的压缩系统中,常常是这两 种技术的组合应用,采用了十分复杂的方式。 第一种压缩技术是提高编码效率。对于给定的信息,可 以采用许多编码方式。在最简单的视音频数据中,也包 含有一定量的冗余度,这就是下面我们要讨论的“熵”的 概念。 许多编码技术可以减少或除去这种冗余度。例如游程编 码和可变字长编码系统(如霍夫曼编码)。如果应用适当, 上述编码技术完全是可逆的,这就是说,解压缩后的数 据与编码系统的输入数据是相同的。这种类型的压缩称 为无损压缩。存档的计算机程序如PKZip就采用了这种无 损压缩。 MPEG 基础和协议分析指南 初级读本 www.tektronix.com/video_audio 1
MPEG基础和协议分析指南 初级读本 很明显,无损压缩虽然十分理想,但它却不能提供视音色信息的三倍一就需要三个单色通道传输彩色信息 频应用所需要的数据压缩量。然而,正因为它是无损压为了解决这一问题,第一步就是将GBR信号转换为一个 缩,所以它可用于系统的任意点,通常可用在有损压缩 亮度信号(通常以Y表示)和两个色差信号即U和V信号 器的数据输出端。 或/和Q信号。抽取亮度信号是在解决与单色接收机的兼 如果除去信息中的冗余度并不能满足所需要的数据压缩容性问题上前进了一大步,然而,信号带宽的减小主要 量,那就必须要丢弃某些(非冗余的)信息。有损压缩系还是来自于色差信号的处理 统就是通过去除不相关的信息或相关性较低的信息来实 现在来考察人的视觉系统。人眼对亮度敏感,可以“看 现所需要的压缩量。不存在对任意数据流均为适用的通 见”分辨率很高的图象。其它的彩色信息,人眼的分辨率 用的有损压缩技术:因为对相关性的评价只能就应用内 就要低得多。这样的综合效果就是,在受到某种限制的 容本身才能确定,在压缩时应当了解数据代表什么,它 又是如何使用的。在电视情况下,图象和声音的再现是 情况下,如果将代表亮度场景的、清晰的单色图象与模 糊的(低带宽)彩色信息相重叠,那么仍将出现清晰的彩 为人眼系统和听觉系统而提供的,因此,在设计一个有色图象。这一优点在处理GBR信号时是不可能具备的,因 效的压缩系统时,就必须充分考虑人的主观感受因素 为GBR中的每一种信号既包含亮度信息,又包含彩色信 在视频信号中,某些信息是不能被人的视觉系统所察觉息。然而,在YⅣV域中,大多数亮度信息被Y信号所传送, 的,因此,这样的信息内容就是真正的无关信息。只丢极少量的信息由色差信号传送。这样,就有可能滤除 弃无关图象信息的压缩系统可称为视觉无损压缩系统。部分彩色色差信号以大幅度地降低所需传送的信息。 以上是消除(大多数)无关信息的一个例子。在通常的观 1.4 在电视中的应用 电视信号,无论是模拟还是数字,总包含有大量的信息。看条件下,人的视觉系统不能显著地感受到色差信号中 的高频信息,因此,色差信号中的高频信息也可以被放 在电视发展的早期实际上已经在使用带宽压缩技术了。弃。在NS电视传输中,每路色差信号中只传送大约 最早的例子或许是隔行扫描。对于给定的行数和给定 图象刷新速率,隔行扫描使信号的所需带宽压缩了一半 500KHz以内的信号频率分量,但在许多应用中,图象仍 然是相当清晰的 隔行扫描是有损处理,在隔行扫描中,由于垂直信息和 瞬态信息之间的干扰而有所失真,从而降低了图象中的在NSC和PAL处理过程中,压缩带宽的最后一步是将色 垂直清晰度。不过,所丢弃的大多数信息主要是无关信差信号“隐藏”在单色信号频谱中的未用部分。尽管这种 因此,在电视发展的早期,在清晰度和带宽均可接处理严格说来不是无损的,但它可以提高信号的编码效 受的情况下,隔行扫描是一项简单的、成功的技术。然率。 而,在复杂的数字压缩处理过程中,隔行扫描及其失真与模拟技术相比较,数字域技术有相当大的差别,但有 却带来了新的问题。MPEG2技术中的一些复杂性,就是些原理是一样的。例如,MPEG可将信号转换为不同的域 因为需要处理隔行扫描信号而带来的。与处理逐行扫描以分离无关信息,但仍然将信号转换为色差域,在数字处 信号相比较,编码效率要低些,信号损失也要大些。理中可以滤除一部分色差信号以降低垂直分辨率。 在电视发展过程中,彩色的出现又带来了新的课题。彩 摄像机产生的是GBR信号,这样,彩色信息量就是单 @www.tektronix.com/video_audio
很明显,无损压缩虽然十分理想,但它却不能提供视音 频应用所需要的数据压缩量。然而,正因为它是无损压 缩,所以它可用于系统的任意点,通常可用在有损压缩 器的数据输出端。 如果除去信息中的冗余度并不能满足所需要的数据压缩 量,那就必须要丢弃某些(非冗余的)信息。有损压缩系 统就是通过去除不相关的信息或相关性较低的信息来实 现所需要的压缩量。不存在对任意数据流均为适用的通 用的有损压缩技术;因为对相关性的评价只能就应用内 容本身才能确定,在压缩时应当了解数据代表什么,它 又是如何使用的。在电视情况下,图象和声音的再现是 为人眼系统和听觉系统而提供的,因此,在设计一个有 效的压缩系统时,就必须充分考虑人的主观感受因素。 在视频信号中,某些信息是不能被人的视觉系统所察觉 的,因此,这样的信息内容就是真正的无关信息。只丢 弃无关图象信息的压缩系统可称为视觉无损压缩系统。 1.4 压缩在电视中的应用 电视信号,无论是模拟还是数字,总包含有大量的信息。 在电视发展的早期实际上已经在使用带宽压缩技术了。 最早的例子或许是隔行扫描。对于给定的行数和给定的 图象刷新速率,隔行扫描使信号的所需带宽压缩了一半。 隔行扫描是有损处理,在隔行扫描中,由于垂直信息和 瞬态信息之间的干扰而有所失真,从而降低了图象中的 垂直清晰度。不过,所丢弃的大多数信息主要是无关信 息,因此,在电视发展的早期,在清晰度和带宽均可接 受的情况下,隔行扫描是一项简单的、成功的技术。然 而,在复杂的数字压缩处理过程中,隔行扫描及其失真 却带来了新的问题。MPEG-2 技术中的一些复杂性,就是 因为需要处理隔行扫描信号而带来的。与处理逐行扫描 信号相比较,编码效率要低些,信号损失也要大些。 在电视发展过程中,彩色的出现又带来了新的课题。彩 色摄像机产生的是 GBR 信号,这样,彩色信息量就是单 MPEG 基础和协议分析指南 初级读本 色信息的三倍-就需要三个单色通道传输彩色信息。 为了解决这一问题,第一步就是将 GBR 信号转换为一个 亮度信号(通常以Y表示)和两个色差信号即U和V信号, 或I和Q信号。抽取亮度信号是在解决与单色接收机的兼 容性问题上前进了一大步,然而,信号带宽的减小主要 还是来自于色差信号的处理。 现在来考察人的视觉系统。人眼对亮度敏感,可以“看 见”分辨率很高的图象。其它的彩色信息,人眼的分辨率 就要低得多。这样的综合效果就是,在受到某种限制的 情况下,如果将代表亮度场景的、清晰的单色图象与模 糊的(低带宽)彩色信息相重叠,那么仍将出现清晰的彩 色图象。这一优点在处理GBR信号时是不可能具备的,因 为 GBR 中的每一种信号既包含亮度信息,又包含彩色信 息。然而,在YUV域中,大多数亮度信息被Y信号所传送, 极少量的信息由色差信号传送。这样,就有可能滤除一 部分彩色色差信号以大幅度地降低所需传送的信息。 以上是消除(大多数)无关信息的一个例子。在通常的观 看条件下,人的视觉系统不能显著地感受到色差信号中 的高频信息,因此,色差信号中的高频信息也可以被放 弃。在 NTSC 电视传输中,每路色差信号中只传送大约 500KHz 以内的信号频率分量,但在许多应用中,图象仍 然是相当清晰的。 在NTSC和PAL处理过程中,压缩带宽的最后一步是将色 差信号“隐藏”在单色信号频谱中的未用部分。尽管这种 处理严格说来不是无损的,但它可以提高信号的编码效 率。 与模拟技术相比较,数字域技术有相当大的差别,但有 些原理是一样的。例如,MPEG可将信号转换为不同的域 以分离无关信息, 但仍然将信号转换为色差域,在数字处 理中可以滤除一部分色差信号以降低垂直分辨率。 2 www.tektronix.com/video_audio
MPEG基础和协议分析指南 初级读本 模拟复合 摄像机 矩阵 复合输出 编码器 (PAL, NTSC 或 SECAM) 数字压缩 输出 口摄像机B矩阵BA0 岸E MPEG 编码器 SDI 图1-1 图1-1a表示的是传统的电视系统,GBR摄像机信号变换1.5数字视频压缩简介 为Y、Pb、P1分量信号以用于制作,而后编码为模拟复合在所有的实际节目素材中,存在着两种类型的信号分量 信号以用于传输。图1-1b表示的是目前正在使用的(与即异常的、不可预见的信号分量和可以预见的信号分量 传统电视系统对应的)系统。Y、Pb、P信号经数字化后异常分量称为熵,它是信号中的真正信息。其余部分称 变为Y、Cb、C信号,并以SD形式通过制作系统,再经为冗余,因为它不是必需的信息。冗余可以是空间性的, PEG编码后用于传输。显然,MPEG在这里只是作为传如在图象的大片区域中,邻近象素几乎具有相同的数值。 输复合信号的一种更有效的替代手段。此外,MPEG具有冗余也可以是时间性的,例如连续图象之间的相似部分。 更大的灵活性,因为可以按照其应用需要调整到合适的在所有的压缩系统编码器中都是将熵与冗余相分离,只 传输比特率。较低的比特率就意味着较低的分辨率,这样有熵被编码和传输,而在解码器中再从编码器的发送的 的MPEG图象可用于视频会议和视频电话。 信号中计算出冗余。图12a表示了这一过程。 数字视频广播(DVB)和先进电视制式委员会(ATSC)一即在一个理想的编码器可以抽取所有的熵并只将熵传输到解 欧洲和美国提出的数字电视广播标准中,信号必须要经码器。理想的解码器能够从熵中恢复原始信号。然而实 过压缩,否则需要太宽的频带。压缩技术延长了υⅦυ、数际上,这种理想的编码解码器是不可能实现的。因为这 字电视/通用光盘)的重放时间,整场电影可以存储在一个种理想的编码器在技术上很复杂,而且为了使用时间性 单独的光盘上。压缩也降低了电子新闻采集和其它电视冗余而造成很长的延时。在某些应用中,例如节目记录 制作应用的成本。DB、ATSC和数字视频光盘oVD)等均或某些广播传输中,有些延时还是可以接受的,但在视 是基于MPEG2压缩技术 频会议中却是不允许的。还有,一个非常复杂的编码器 在磁带记录中,允许采用适度的压缩可以提高数字 在价格上也是很昂贵的。这也就是说,不存在一个理想 Betacam和Dga系统的可靠性,然而在SX、 DVB, DVCPF的压缩系统。 和 DVCAM中,采用压缩技术有利于实现系统设备小型化 在基于硬盘的视频服务器中,压缩可以降低存储器的成 本。通过压缩减少了传输带宽,这样就能允许更多的用户 去访问一个给定的服务器。这项特性对于VoD(视频按需 点播)应用也是重要的 wwtektronix. com/video_ audio
MPEG 基础和协议分析指南 初级读本 图 1-1. 图 1-1a 表示的是传统的电视系统,GBR 摄像机信号变换 为 Y、Pb、Pr 分量信号以用于制作,而后编码为模拟复合 信号以用于传输。图1-1b表示的是目前正在使用的(与 传统电视系统对应的)系统。Y、Pb、Pr 信号经数字化后 变为 Y、Cb、Cr 信号,并以 SDI 形式通过制作系统,再经 MPEG 编码后用于传输。显然,MPEG 在这里只是作为传 输复合信号的一种更有效的替代手段。此外,MPEG具有 更大的灵活性,因为可以按照其应用需要调整到合适的 传输比特率。较低的比特率就意味着较低的分辨率,这样 的 MPEG 图象可用于视频会议和视频电话。 数字视频广播(DVB)和先进电视制式委员会(ATSC)-即在 欧洲和美国提出的数字电视广播标准中,信号必须要经 过压缩,否则需要太宽的频带。压缩技术延长了DVD(数 字电视/通用光盘)的重放时间,整场电影可以存储在一个 单独的光盘上。压缩也降低了电子新闻采集和其它电视 制作应用的成本。DVB、ATSC和数字视频光盘(DVD)等均 是基于 MPEG-2 压缩技术。 在磁带记录中,允许采用适度的压缩可以提高数字 Betacam和Digital-S系统的可靠性,然而在SX、DVB、DVCPRO 和DVCAM中,采用压缩技术有利于实现系统设备小型化。 在基于硬盘的视频服务器中,压缩可以降低存储器的成 本。通过压缩减少了传输带宽,这样就能允许更多的用户 去访问一个给定的服务器。这项特性对于VOD(视频按需 点播)应用也是重要的。 1.5 数字视频压缩简介 在所有的实际节目素材中,存在着两种类型的信号分量: 即异常的、不可预见的信号分量和可以预见的信号分量。 异常分量称为熵,它是信号中的真正信息。其余部分称 为冗余,因为它不是必需的信息。冗余可以是空间性的, 如在图象的大片区域中,邻近象素几乎具有相同的数值。 冗余也可以是时间性的,例如连续图象之间的相似部分。 在所有的压缩系统编码器中都是将熵与冗余相分离,只 有熵被编码和传输,而在解码器中再从编码器的发送的 信号中计算出冗余。图 1-2a 表示了这一过程。 一个理想的编码器可以抽取所有的熵并只将熵传输到解 码器。理想的解码器能够从熵中恢复原始信号。然而实 际上,这种理想的编码解码器是不可能实现的。因为这 种理想的编码器在技术上很复杂,而且为了使用时间性 冗余而造成很长的延时。在某些应用中,例如节目记录 或某些广播传输中,有些延时还是可以接受的,但在视 频会议中却是不允许的。还有,一个非常复杂的编码器 在价格上也是很昂贵的。这也就是说,不存在一个理想 的压缩系统。 www.tektronix.com/video_audio 3 摄像机 矩 阵 复 合 编码器 模拟复合 输 出 (PAL, NTSC 或 SECAM) 摄像机 矩 阵 制 作 处 理 MPEG 编码器 数字压缩 输 出 G B R Y Pr Pb a) b) G B R Y Pr Pb Y Cr Cb Y Cr Cb ADC SDI
MPEG基础和协议分析指南 初级读本 PcM视频 理想编码器非理想编码器 短时延编码器 只发送熵需发送较多信息需发送更多信息 图象质量差 图象质量差 图象质量好 图象质量好 b) 复杂性 c) 编解码所需时间 在实际应用中,需要各种各样的编码器,它们有着不同然而,压缩过程中所包含的各种变化因素使得压缩因子 的时延,复杂程度也不一样。MPEG之所以有着广泛的应的确定是一件非常困难的事。图1-2a表示的是一个理 用,就在于它不是一个单一的压缩格式,而是可以灵活想的编码器,如果全部熵均被发送,那么图象质量很好 地组合在一起的各种标准化的编码工具,这样可以满足不过,如果为了减少编码器的输出比特率而提高压缩因 各种应用需求。在被压缩的数据中,也包含了所采用的子,将造成有一部分熵不能被发送,图象质量也会下降。 编码方式,这样,无论编码器使用什么编码方式,解码注意,在压缩系统中如果出现图象质量下降,说明压缩 器都能自动地进行处理 过大(图1-2b)。如果可用的比特率不够,较好的方法是 在MPEG2和MPEG4编码中,可以按照复杂程度的不同降低输入图象的熵以避开这个区域。这可以用滤波器来 而划分为几类,每一类可以有不同的级,级与输入图象实现。在主观上,将滤波器所造成的分辨率下降与压缩 的分辨率相关。第四章将对类和级作详细介绍。 失真造成的图象损伤相比较,人们宁愿接受前者 既然有许多不同的数字视频格式,也就有不同的比特率。为了识别楠的完整性,就会使理想压缩器变得十分复杂。 例如,高清晰度系统的比特率是标准清晰度系统的6倍。出于经济上的原因,实际应用的压缩器应当不太复杂但 仅仅了解编码器的输出比特率是不够的,更重要的是压应能发送较多的数据,以保证所有的熵均被发送。图1 缩因子,它是编码器的输入比特率与已压缩的比特率之2b表示出了编码器的复杂度与压缩性能之间的关系。在 例如压缩因子为21,5:1等等 保证一定的图象质量下,所需的压缩因子愈高,则编码 器就愈是复杂 Owww.tektronix.com/video_audio
MPEG 基础和协议分析指南 初级读本 图 1-2 在实际应用中,需要各种各样的编码器,它们有着不同 的时延,复杂程度也不一样。MPEG之所以有着广泛的应 用,就在于它不是一个单一的压缩格式,而是可以灵活 地组合在一起的各种标准化的编码工具,这样可以满足 各种应用需求。在被压缩的数据中,也包含了所采用的 编码方式,这样,无论编码器使用什么编码方式,解码 器都能自动地进行处理。 在 MPEG-2 和 MPEG-4 编码中,可以按照复杂程度的不同 而划分为几类,每一类可以有不同的级,级与输入图象 的分辨率相关。第四章将对类和级作详细介绍。 既然有许多不同的数字视频格式,也就有不同的比特率。 例如,高清晰度系统的比特率是标准清晰度系统的6倍。 仅仅了解编码器的输出比特率是不够的,更重要的是压 缩因子,它是编码器的输入比特率与已压缩的比特率之 比,例如压缩因子为 2:1, 5:1 等等。 然而,压缩过程中所包含的各种变化因素使得压缩因子 的确定是一件非常困难的事。图1 - 2a 表示的是一个理 想的编码器,如果全部熵均被发送,那么图象质量很好。 不过,如果为了减少编码器的输出比特率而提高压缩因 子,将造成有一部分熵不能被发送,图象质量也会下降。 注意,在压缩系统中如果出现图象质量下降,说明压缩 过大(图1-2b)。如果可用的比特率不够,较好的方法是 降低输入图象的熵以避开这个区域。这可以用滤波器来 实现。在主观上,将滤波器所造成的分辨率下降与压缩 失真造成的图象损伤相比较,人们宁愿接受前者。 为了识别熵的完整性,就会使理想压缩器变得十分复杂。 出于经济上的原因,实际应用的压缩器应当不太复杂但 应能发送较多的数据,以保证所有的熵均被发送。图1- 2b 表示出了编码器的复杂度与压缩性能之间的关系。在 保证一定的图象质量下,所需的压缩因子愈高,则编码 器就愈是复杂。 4 www.tektronix.com/video_audio PCM 视频 熵 理想编码器 只发送熵 非理想编码器 需发送较多信息 短时延编码器 需发送更多信息 图象质量差 图象质量好 复杂性 编解码所需时间 图象质量好 图象质量差 a) b) c)
MPEG基础和协议分析指南 初级读本 视频信号中的熵是不断变化的。在记录播音员报导新闻位移量和垂直位移量(它们统称为运动矢量所决定。传送 的场景时,信息中有较大的冗余度,压缩也比较容易。与运动矢量的所需数据率要低于传送图象差的数据率 此不同的是,在对风中飘动的树叶或不停奔跑的足球运 MPEG编码既可用于隔行扫描图象也可用于非隔行扫描图 动员的场景进行压缩记录时就要困难的多,这是因为此象。时间轴上的某点图象称为“画面”,而不管它是一场 时信息的冗余度较低(信息量较大或熵较大)。在后两种情还是一帧。隔行扫描不是理想的数字压缩信号源,因为 况下,如果有些熵未被发送,图象的质量就会降低。不它本身就是一种压缩技术。时间域编码更为复杂,因为 及通道中的图象质量保持不变而比特率可变之间作出选某一场中的象素会处于下一场的不同位置 择。电讯通信网络工作人员在实际应用中倾向于保持传运动补偿能够减少但不能消除连续画面之间的差别。这 输比特率不变 使用缓冲存储器来平均熵的变化,只种图象差本身是空间性的,可以采用上述基于帧内编码 要所产生的延迟能被接受即可。但在记录时,可变比特的变换编码。运动补偿只是简单地减少差值图象中的数 率更便于处理,DVD就是使用可变比特率,它是通过缓存据量。 以平均比特率,使数据率保持在光盘系统的可接受范围采用较大的时间跨度可以提高时间域编码器的效率。图 之内。 1-2c表明,如果需要更高的压缩因子,则在处理过程中 帧内编码是利用空间性冗余度的一项技术,即冗余度就必须有更长的时间跨度,但这样会产生较长的编码延迟 在该图象之内;帧间编码是利用时间性冗余度。帧内编很明显,时间域编码信号在编辑时也较难于处理,因为 码可以单独使用,如用于静止图象的JPEG标准,它也可某一给定输出图象的内容有可能是基于早先发送的图象 以和帧间编码结合使用,如MPEG标准 数据。要使编辑得以正常进行,制作系统将不得不对时 帧内编码利用了典型图象的两种特性。首先,并非所有间域编码作出一定的限制,当然,对时间域编码的限制 的空间域频率均同时存在:其次,空间域频率愈高,匆也就限制了压缩因子的可用范围。 其幅度可能愈小帧内编码需要对图象中的空间域频率16音频压缩简介 进行分析,这种分析是便于变换,例如小波变换和 DCT PCM数字音频通道的比特率大约只有每秒15兆比特,它 离散余弦变换)。变换所产生的系数是用于描述每个空大约为422数字视频的05%在适度的视频压缩方案中 间域频率的幅度。在一般情况下,许多系数为零,或者如数字 Betacam,音频压缩是不必要的。但是,随着视频 接近于零,这些系数可以忽略,从而可以减少数据率。压缩因子的提升,音频压缩随之也日益受到关注。 帧间编码是利用连续画面之间的相似性。如果某幅画面 音频压缩可利用它的两个特点。第一,在典型的音频信 可被解码器使用,那么解码器只须利用图象差即可得到 号中,并非所有的频率均同时存在。第二,由于存在着掩 下一个画面。随着图象中目标的运动,图象差也会增加,蔽效应,人耳不可能分辨出音频信号中的每个细节。音 但是这种变化可以通过运动补偿来获取,因为一股而言,颏压缩是通过滤波或变换将音频频谱分散到各个频带中, 从一个画面过渡到下一画面时运动目标不会有太大的变 在描述较低电平的频带时只使用少量的数据。低电平频 化。如果这种运动可以被测量,那么利用前一画面中目带中的的掩蔽效应可以消除或降低特定频带的可听度 标移动到新位置的信息就可以得出与当前画面非常接近这样可以只需发送较少的数据 的目标位置。这种移动过程由发送至解码器的一对水平 ww.tektronix.com/video_audio
MPEG 基础和协议分析指南 初级读本 视频信号中的熵是不断变化的。在记录播音员报导新闻 的场景时,信息中有较大的冗余度,压缩也比较容易。与 此不同的是,在对风中飘动的树叶或不停奔跑的足球运 动员的场景进行压缩记录时就要困难的多,这是因为此 时信息的冗余度较低(信息量较大或熵较大)。在后两种情 况下,如果有些熵未被发送,图象的质量就会降低。不 过,我们可以在通道比特率保持不变但图象质量可变以 及通道中的图象质量保持不变而比特率可变之间作出选 择。电讯通信网络工作人员在实际应用中倾向于保持传 输比特率不变,可以使用缓冲存储器来平均熵的变化,只 要所产生的延迟能被接受即可。但在记录时,可变比特 率更便于处理,DVD就是使用可变比特率,它是通过缓存 以平均比特率,使数据率保持在光盘系统的可接受范围 之内。 帧内编码是利用空间性冗余度的一项技术,即冗余度就 在该图象之内;帧间编码是利用时间性冗余度。帧内编 码可以单独使用,如用于静止图象的JPEG标准,它也可 以和帧间编码结合使用,如 MPEG 标准。 帧内编码利用了典型图象的两种特性。首先,并非所有 的空间域频率均同时存在;其次,空间域频率愈高,则 其幅度可能愈小。帧内编码需要对图象中的空间域频率 进行分析,这种分析是便于变换,例如小波变换和 DCT (离散余弦变换)。变换所产生的系数是用于描述每个空 间域频率的幅度。在一般情况下,许多系数为零,或者 接近于零,这些系数可以忽略,从而可以减少数据率。 帧间编码是利用连续画面之间的相似性。如果某幅画面 可被解码器使用,那么解码器只须利用图象差即可得到 下一个画面。随着图象中目标的运动,图象差也会增加, 但是这种变化可以通过运动补偿来获取,因为一般而言, 从一个画面过渡到下一画面时运动目标不会有太大的变 化。如果这种运动可以被测量,那么利用前一画面中目 标移动到新位置的信息就可以得出与当前画面非常接近 的目标位置。这种移动过程由发送至解码器的一对水平 位移量和垂直位移量(它们统称为运动矢量)所决定。传送 运动矢量的所需数据率要低于传送图象差的数据率。 MPEG编码既可用于隔行扫描图象也可用于非隔行扫描图 象。时间轴上的某点图象称为“画面”,而不管它是一场 还是一帧。隔行扫描不是理想的数字压缩信号源,因为 它本身就是一种压缩技术。时间域编码更为复杂,因为 某一场中的象素会处于下一场的不同位置。 运动补偿能够减少但不能消除连续画面之间的差别。这 种图象差本身是空间性的,可以采用上述基于帧内编码 的变换编码。运动补偿只是简单地减少差值图象中的数 据量。 采用较大的时间跨度可以提高时间域编码器的效率。图 1-2c 表明,如果需要更高的压缩因子,则在处理过程中 必须有更长的时间跨度,但这样会产生较长的编码延迟。 很明显,时间域编码信号在编辑时也较难于处理,因为 某一给定输出图象的内容有可能是基于早先发送的图象 数据。要使编辑得以正常进行,制作系统将不得不对时 间域编码作出一定的限制,当然,对时间域编码的限制 也就限制了压缩因子的可用范围。 1.6 音频压缩简介 PCM数字音频通道的比特率大约只有每秒1.5兆比特,它 大约为4:2:2数字视频的0.5%。在适度的视频压缩方案中, 如数字Betacam,音频压缩是不必要的。但是,随着视频 压缩因子的提升,音频压缩随之也日益受到关注。 音频压缩可利用它的两个特点。第一,在典型的音频信 号中,并非所有的频率均同时存在。第二,由于存在着掩 蔽效应,人耳不可能分辨出音频信号中的每个细节。音 频压缩是通过滤波或变换将音频频谱分散到各个频带中, 在描述较低电平的频带时只使用少量的数据。低电平频 带中的的掩蔽效应可以消除或降低特定频带的可听度, 这样可以只需发送较少的数据。 www.tektronix.com/video_audio 5