《MPEG 基础和协议分析指南》（包括 DVB 和 ATSC）

MPEG 是目前最常用的一项音频 / 视频压缩技术，它实际上并不是一个单一的标准，而是包括了适合于各种不同应用的一系列标准，但这些标准是以一些共同理论为基础的。MPEG是活动图象专家组的缩写词，该专家组是联合技术委员会(Joint Technical Committee，JTC1)的一部分， JTC1是由ISO(国际标准化组织)和IEC(国际电工委员会)建立的。JTC1负责信息技术，在JTC1 中，下设有负责“音频、图象编码以及多媒体和超媒体信息”的子组SG29。

团购合买资源类别：文库，文档格式：PDF，文档页数：91，文件大小：8.68MB

MPEG基础和协议分析指南初级读本第一章MPEG概述 MPEG是目前最常用的一项音频/视频压缩技术,它实际性工作站,这项应用对于模拟来说是不可能的。另一个上并不是一个单一的标准,而是包括了适合于各种不同例子是将音频、视频、图形、文字和数据存储在同一介质应用的一系列标准,但这些标准是以一些共同理论为基的多媒体技术,这在模拟域中也是无法实现的。础的。MPEG是活动图象专家组的缩写词,该专家组是联合技术委员会 Joint technical committee,mcn)的一部分,12压缩的必要性 JTc1是由0国际标准化组织)和EC国际电工委员会)建数字视频首先在后期制作应用中获得了成功。在后期制立的。JTC1负责信息技术,在JTC1中,下设有负责“音作中,虽然数字视频的代价高昂,但它可以复制无限次频、图象编码以及多媒体和超媒体信息”的子组SG29。在而无损伤。然而,后期制作中所使用的标准数字视频,其 SG29子组中,又设有多个工作小组,其中就包括PEG(联数据率高达每秒200兆比特以上,这就需要大容量的存储合图片专家组和负责活动图象压缩的工作组WG11。因器和宽带传输。只有在存储器和带宽需求容易满足的情此,可以认为MPEG是 SO/EC JTC1/sG29/WG1 况下,数字视频才有可能获得广泛的应用。压缩的目的既然把MPEG描述为多个词首字母的组合,那么,就其工正在于此作过程而言,正如欧洲电信标准学会所说:“条件接收表压缩就是使数字视音频具有较低数据率的一种方式。压 CAT引导综合接收机/解码器去寻找与所使用的条件接缩具有以下优点收A)系统相关的授权管理信息(EMM)”。如果您能够理卜对于给定的信源素材,它只需要较少的存储量。解这句话,您就不需要这本书了! 在实时工作时,压缩可降低所需带宽。此处,压缩可以使数据在存储介质间的传输速度更快,例如,在磁带和硬盘之间 1.1整合可以实现数据的快速传输数字技术在音频和视频上已经取得了迅速的进展,这是≯采用压缩记录格式可以减少记录密度,这样就可以降低记录由多种因素决定的。其中一个重要因素就是数字信息的设备对环境因素和设备维护的要求可靠性更高,可以通过编码以消除信息中的错误。这就意味着数字技术能够消除在记录和传输过程中所产生的13压缩原理损耗。激光唱盘(cD)就是采用数字技术的第一个消费类在传递信息内容时,为了减少所需数据量,可以采用两种不同的基本技术。在实用的压缩系统中,常常是这两相对早期的聚乙烯唱盘,CD的声音质量有了很大的改种技术的组合应用,采用了十分复杂的方式善。仅仅比较质量是不够的,真正的意义在于:数字记第一种压缩技术是提高编码效率。对于给定的信息,可录和数字传输技术的应用使内容的处理达到了模拟技术以采用许多编码方式。在最简单的视音频数据中,也包所不可能达到的程度。一旦音频和视频信号被数字化后,含有一定量的冗余度,这就是下面我们要讨论的“熵”的其内容就是数据的形式。这种数据和其它任意类型的数概念。据一样,可以用同样的方式处理。这样,数字视频和数许多编码技术可以减少或除去这种冗余度。例如游程编字音频就作为数据而进入了计算机技术领域码和可变字长编码系统(如霍夫曼编码)。如果应用适当, 计算杋和视音频的融合是数据处理和脉冲编码调制PCM)上述编码技术完全是可逆的,这就是说,解压缩后的数应用的必然结果。数字媒介可以存储任何类型的信息,因据与编码系统的输入数据是相同的。这种类型的压缩称此,将计算机存储器件应用于数字视频是很容易的。计为无损压缩。存档的计算机程序如 PKZip就采用了这种无算机技术和数字视音频相融合的第一个应用实例是非线损压缩。 ww tektronix. comwvideo_audio

第一章 MPEG 概述 MPEG 是目前最常用的一项音频 / 视频压缩技术，它实际上并不是一个单一的标准，而是包括了适合于各种不同应用的一系列标准，但这些标准是以一些共同理论为基础的。MPEG是活动图象专家组的缩写词，该专家组是联合技术委员会(Joint Technical Committee，JTC1)的一部分， JTC1是由ISO(国际标准化组织)和IEC(国际电工委员会)建立的。JTC1负责信息技术，在JTC1 中，下设有负责“音频、图象编码以及多媒体和超媒体信息”的子组SG29。在 SG29子组中，又设有多个工作小组，其中就包括JPEG(联合图片专家组)和负责活动图象压缩的工作组 WG11。因此，可以认为 MPEG 是 ISO/IEC JTC1/SG29/WG11。既然把MPEG描述为多个词首字母的组合，那么，就其工作过程而言，正如欧洲电信标准学会所说：“条件接收表 (CAT)引导综合接收机 / 解码器去寻找与所使用的条件接收(CA)系统相关的授权管理信息(EMM)”。如果您能够理解这句话，您就不需要这本书了！ 1.1 整合数字技术在音频和视频上已经取得了迅速的进展，这是由多种因素决定的。其中一个重要因素就是数字信息的可靠性更高，可以通过编码以消除信息中的错误。这就意味着数字技术能够消除在记录和传输过程中所产生的损耗。激光唱盘 (CD) 就是采用数字技术的第一个消费类产品。相对早期的聚乙烯唱盘， CD 的声音质量有了很大的改善。仅仅比较质量是不够的，真正的意义在于：数字记录和数字传输技术的应用使内容的处理达到了模拟技术所不可能达到的程度。一旦音频和视频信号被数字化后，其内容就是数据的形式。这种数据和其它任意类型的数据一样，可以用同样的方式处理。这样，数字视频和数字音频就作为数据而进入了计算机技术领域。计算机和视音频的融合是数据处理和脉冲编码调制(PCM) 应用的必然结果。数字媒介可以存储任何类型的信息，因此，将计算机存储器件应用于数字视频是很容易的。计算机技术和数字视音频相融合的第一个应用实例是非线性工作站，这项应用对于模拟来说是不可能的。另一个例子是将音频、视频、图形、文字和数据存储在同一介质的多媒体技术，这在模拟域中也是无法实现的。 1.2 压缩的必要性数字视频首先在后期制作应用中获得了成功。在后期制作中，虽然数字视频的代价高昂，但它可以复制无限次而无损伤。然而，后期制作中所使用的标准数字视频，其数据率高达每秒200兆比特以上，这就需要大容量的存储器和宽带传输。只有在存储器和带宽需求容易满足的情况下，数字视频才有可能获得广泛的应用。压缩的目的正在于此。压缩就是使数字视音频具有较低数据率的一种方式。压缩具有以下优点：对于给定的信源素材，它只需要较少的存储量。在实时工作时，压缩可降低所需带宽。此处，压缩可以使数据在存储介质间的传输速度更快，例如，在磁带和硬盘之间可以实现数据的快速传输。采用压缩记录格式可以减少记录密度，这样就可以降低记录设备对环境因素和设备维护的要求。 1.3 压缩原理在传递信息内容时，为了减少所需数据量，可以采用两种不同的基本技术。在实用的压缩系统中，常常是这两种技术的组合应用，采用了十分复杂的方式。第一种压缩技术是提高编码效率。对于给定的信息，可以采用许多编码方式。在最简单的视音频数据中，也包含有一定量的冗余度，这就是下面我们要讨论的“熵”的概念。许多编码技术可以减少或除去这种冗余度。例如游程编码和可变字长编码系统（如霍夫曼编码）。如果应用适当，上述编码技术完全是可逆的，这就是说，解压缩后的数据与编码系统的输入数据是相同的。这种类型的压缩称为无损压缩。存档的计算机程序如PKZip就采用了这种无损压缩。 MPEG 基础和协议分析指南初级读本 www.tektronix.com/video_audio 1

MPEG基础和协议分析指南初级读本很明显,无损压缩虽然十分理想,但它却不能提供视音色信息的三倍一就需要三个单色通道传输彩色信息频应用所需要的数据压缩量。然而,正因为它是无损压为了解决这一问题,第一步就是将GBR信号转换为一个缩,所以它可用于系统的任意点,通常可用在有损压缩亮度信号(通常以Y表示)和两个色差信号即U和V信号器的数据输出端。或/和Q信号。抽取亮度信号是在解决与单色接收机的兼如果除去信息中的冗余度并不能满足所需要的数据压缩容性问题上前进了一大步,然而,信号带宽的减小主要量,那就必须要丢弃某些(非冗余的)信息。有损压缩系还是来自于色差信号的处理统就是通过去除不相关的信息或相关性较低的信息来实现在来考察人的视觉系统。人眼对亮度敏感,可以“看现所需要的压缩量。不存在对任意数据流均为适用的通见”分辨率很高的图象。其它的彩色信息,人眼的分辨率用的有损压缩技术:因为对相关性的评价只能就应用内就要低得多。这样的综合效果就是,在受到某种限制的容本身才能确定,在压缩时应当了解数据代表什么,它又是如何使用的。在电视情况下,图象和声音的再现是情况下,如果将代表亮度场景的、清晰的单色图象与模糊的(低带宽)彩色信息相重叠,那么仍将出现清晰的彩为人眼系统和听觉系统而提供的,因此,在设计一个有色图象。这一优点在处理GBR信号时是不可能具备的,因效的压缩系统时,就必须充分考虑人的主观感受因素为GBR中的每一种信号既包含亮度信息,又包含彩色信在视频信号中,某些信息是不能被人的视觉系统所察觉息。然而,在YⅣV域中,大多数亮度信息被Y信号所传送, 的,因此,这样的信息内容就是真正的无关信息。只丢极少量的信息由色差信号传送。这样,就有可能滤除弃无关图象信息的压缩系统可称为视觉无损压缩系统。部分彩色色差信号以大幅度地降低所需传送的信息。以上是消除(大多数)无关信息的一个例子。在通常的观 1.4 在电视中的应用电视信号,无论是模拟还是数字,总包含有大量的信息。看条件下,人的视觉系统不能显著地感受到色差信号中的高频信息,因此,色差信号中的高频信息也可以被放在电视发展的早期实际上已经在使用带宽压缩技术了。弃。在NS电视传输中,每路色差信号中只传送大约最早的例子或许是隔行扫描。对于给定的行数和给定图象刷新速率,隔行扫描使信号的所需带宽压缩了一半 500KHz以内的信号频率分量,但在许多应用中,图象仍然是相当清晰的隔行扫描是有损处理,在隔行扫描中,由于垂直信息和瞬态信息之间的干扰而有所失真,从而降低了图象中的在NSC和PAL处理过程中,压缩带宽的最后一步是将色垂直清晰度。不过,所丢弃的大多数信息主要是无关信差信号“隐藏”在单色信号频谱中的未用部分。尽管这种因此,在电视发展的早期,在清晰度和带宽均可接处理严格说来不是无损的,但它可以提高信号的编码效受的情况下,隔行扫描是一项简单的、成功的技术。然率。而,在复杂的数字压缩处理过程中,隔行扫描及其失真与模拟技术相比较,数字域技术有相当大的差别,但有却带来了新的问题。MPEG2技术中的一些复杂性,就是些原理是一样的。例如,MPEG可将信号转换为不同的域因为需要处理隔行扫描信号而带来的。与处理逐行扫描以分离无关信息,但仍然将信号转换为色差域,在数字处信号相比较,编码效率要低些,信号损失也要大些。理中可以滤除一部分色差信号以降低垂直分辨率。在电视发展过程中,彩色的出现又带来了新的课题。彩摄像机产生的是GBR信号,这样,彩色信息量就是单 @www.tektronix.com/video_audio

很明显，无损压缩虽然十分理想，但它却不能提供视音频应用所需要的数据压缩量。然而，正因为它是无损压缩，所以它可用于系统的任意点，通常可用在有损压缩器的数据输出端。如果除去信息中的冗余度并不能满足所需要的数据压缩量，那就必须要丢弃某些（非冗余的）信息。有损压缩系统就是通过去除不相关的信息或相关性较低的信息来实现所需要的压缩量。不存在对任意数据流均为适用的通用的有损压缩技术；因为对相关性的评价只能就应用内容本身才能确定，在压缩时应当了解数据代表什么，它又是如何使用的。在电视情况下，图象和声音的再现是为人眼系统和听觉系统而提供的，因此，在设计一个有效的压缩系统时，就必须充分考虑人的主观感受因素。在视频信号中，某些信息是不能被人的视觉系统所察觉的，因此，这样的信息内容就是真正的无关信息。只丢弃无关图象信息的压缩系统可称为视觉无损压缩系统。 1.4 压缩在电视中的应用电视信号，无论是模拟还是数字，总包含有大量的信息。在电视发展的早期实际上已经在使用带宽压缩技术了。最早的例子或许是隔行扫描。对于给定的行数和给定的图象刷新速率，隔行扫描使信号的所需带宽压缩了一半。隔行扫描是有损处理，在隔行扫描中，由于垂直信息和瞬态信息之间的干扰而有所失真，从而降低了图象中的垂直清晰度。不过，所丢弃的大多数信息主要是无关信息，因此，在电视发展的早期，在清晰度和带宽均可接受的情况下，隔行扫描是一项简单的、成功的技术。然而，在复杂的数字压缩处理过程中，隔行扫描及其失真却带来了新的问题。MPEG-2 技术中的一些复杂性，就是因为需要处理隔行扫描信号而带来的。与处理逐行扫描信号相比较，编码效率要低些，信号损失也要大些。在电视发展过程中，彩色的出现又带来了新的课题。彩色摄像机产生的是 GBR 信号，这样，彩色信息量就是单 MPEG 基础和协议分析指南初级读本色信息的三倍－就需要三个单色通道传输彩色信息。为了解决这一问题，第一步就是将 GBR 信号转换为一个亮度信号（通常以Y表示）和两个色差信号即U和V信号，或I和Q信号。抽取亮度信号是在解决与单色接收机的兼容性问题上前进了一大步，然而，信号带宽的减小主要还是来自于色差信号的处理。现在来考察人的视觉系统。人眼对亮度敏感，可以“看见”分辨率很高的图象。其它的彩色信息，人眼的分辨率就要低得多。这样的综合效果就是，在受到某种限制的情况下，如果将代表亮度场景的、清晰的单色图象与模糊的（低带宽）彩色信息相重叠，那么仍将出现清晰的彩色图象。这一优点在处理GBR信号时是不可能具备的，因为 GBR 中的每一种信号既包含亮度信息，又包含彩色信息。然而，在YUV域中，大多数亮度信息被Y信号所传送，极少量的信息由色差信号传送。这样，就有可能滤除一部分彩色色差信号以大幅度地降低所需传送的信息。以上是消除（大多数）无关信息的一个例子。在通常的观看条件下，人的视觉系统不能显著地感受到色差信号中的高频信息，因此，色差信号中的高频信息也可以被放弃。在 NTSC 电视传输中，每路色差信号中只传送大约 500KHz 以内的信号频率分量，但在许多应用中，图象仍然是相当清晰的。在NTSC和PAL处理过程中，压缩带宽的最后一步是将色差信号“隐藏”在单色信号频谱中的未用部分。尽管这种处理严格说来不是无损的，但它可以提高信号的编码效率。与模拟技术相比较，数字域技术有相当大的差别，但有些原理是一样的。例如，MPEG可将信号转换为不同的域以分离无关信息, 但仍然将信号转换为色差域，在数字处理中可以滤除一部分色差信号以降低垂直分辨率。 2 www.tektronix.com/video_audio

MPEG基础和协议分析指南初级读本模拟复合摄像机矩阵复合输出编码器 (PAL, NTSC 或 SECAM) 数字压缩输出口摄像机B矩阵BA0 岸E MPEG 编码器 SDI 图1-1 图1-1a表示的是传统的电视系统,GBR摄像机信号变换1.5数字视频压缩简介为Y、Pb、P1分量信号以用于制作,而后编码为模拟复合在所有的实际节目素材中,存在着两种类型的信号分量信号以用于传输。图1-1b表示的是目前正在使用的(与即异常的、不可预见的信号分量和可以预见的信号分量传统电视系统对应的)系统。Y、Pb、P信号经数字化后异常分量称为熵,它是信号中的真正信息。其余部分称变为Y、Cb、C信号,并以SD形式通过制作系统,再经为冗余,因为它不是必需的信息。冗余可以是空间性的, PEG编码后用于传输。显然,MPEG在这里只是作为传如在图象的大片区域中,邻近象素几乎具有相同的数值。输复合信号的一种更有效的替代手段。此外,MPEG具有冗余也可以是时间性的,例如连续图象之间的相似部分。更大的灵活性,因为可以按照其应用需要调整到合适的在所有的压缩系统编码器中都是将熵与冗余相分离,只传输比特率。较低的比特率就意味着较低的分辨率,这样有熵被编码和传输,而在解码器中再从编码器的发送的的MPEG图象可用于视频会议和视频电话。信号中计算出冗余。图12a表示了这一过程。数字视频广播(DVB)和先进电视制式委员会(ATSC)一即在一个理想的编码器可以抽取所有的熵并只将熵传输到解欧洲和美国提出的数字电视广播标准中,信号必须要经码器。理想的解码器能够从熵中恢复原始信号。然而实过压缩,否则需要太宽的频带。压缩技术延长了υⅦυ、数际上,这种理想的编码解码器是不可能实现的。因为这字电视/通用光盘)的重放时间,整场电影可以存储在一个种理想的编码器在技术上很复杂,而且为了使用时间性单独的光盘上。压缩也降低了电子新闻采集和其它电视冗余而造成很长的延时。在某些应用中,例如节目记录制作应用的成本。DB、ATSC和数字视频光盘oVD)等均或某些广播传输中,有些延时还是可以接受的,但在视是基于MPEG2压缩技术频会议中却是不允许的。还有,一个非常复杂的编码器在磁带记录中,允许采用适度的压缩可以提高数字在价格上也是很昂贵的。这也就是说,不存在一个理想 Betacam和Dga系统的可靠性,然而在SX、 DVB, DVCPF的压缩系统。和 DVCAM中,采用压缩技术有利于实现系统设备小型化在基于硬盘的视频服务器中,压缩可以降低存储器的成本。通过压缩减少了传输带宽,这样就能允许更多的用户去访问一个给定的服务器。这项特性对于VoD(视频按需点播)应用也是重要的 wwtektronix. com/video_ audio

MPEG 基础和协议分析指南初级读本图 1-1. 图 1-1a 表示的是传统的电视系统，GBR 摄像机信号变换为 Y、Pb、Pr 分量信号以用于制作，而后编码为模拟复合信号以用于传输。图1－1b表示的是目前正在使用的（与传统电视系统对应的）系统。Y、Pb、Pr 信号经数字化后变为 Y、Cb、Cr 信号，并以 SDI 形式通过制作系统，再经 MPEG 编码后用于传输。显然，MPEG 在这里只是作为传输复合信号的一种更有效的替代手段。此外，MPEG具有更大的灵活性，因为可以按照其应用需要调整到合适的传输比特率。较低的比特率就意味着较低的分辨率，这样的 MPEG 图象可用于视频会议和视频电话。数字视频广播(DVB)和先进电视制式委员会(ATSC)－即在欧洲和美国提出的数字电视广播标准中，信号必须要经过压缩，否则需要太宽的频带。压缩技术延长了DVD(数字电视/通用光盘)的重放时间，整场电影可以存储在一个单独的光盘上。压缩也降低了电子新闻采集和其它电视制作应用的成本。DVB、ATSC和数字视频光盘(DVD)等均是基于 MPEG-2 压缩技术。在磁带记录中，允许采用适度的压缩可以提高数字 Betacam和Digital-S系统的可靠性，然而在SX、DVB、DVCPRO 和DVCAM中，采用压缩技术有利于实现系统设备小型化。在基于硬盘的视频服务器中，压缩可以降低存储器的成本。通过压缩减少了传输带宽，这样就能允许更多的用户去访问一个给定的服务器。这项特性对于VOD（视频按需点播）应用也是重要的。 1.5 数字视频压缩简介在所有的实际节目素材中，存在着两种类型的信号分量：即异常的、不可预见的信号分量和可以预见的信号分量。异常分量称为熵，它是信号中的真正信息。其余部分称为冗余，因为它不是必需的信息。冗余可以是空间性的，如在图象的大片区域中，邻近象素几乎具有相同的数值。冗余也可以是时间性的，例如连续图象之间的相似部分。在所有的压缩系统编码器中都是将熵与冗余相分离，只有熵被编码和传输，而在解码器中再从编码器的发送的信号中计算出冗余。图 1-2a 表示了这一过程。一个理想的编码器可以抽取所有的熵并只将熵传输到解码器。理想的解码器能够从熵中恢复原始信号。然而实际上，这种理想的编码解码器是不可能实现的。因为这种理想的编码器在技术上很复杂，而且为了使用时间性冗余而造成很长的延时。在某些应用中，例如节目记录或某些广播传输中，有些延时还是可以接受的，但在视频会议中却是不允许的。还有，一个非常复杂的编码器在价格上也是很昂贵的。这也就是说，不存在一个理想的压缩系统。 www.tektronix.com/video_audio 3 摄像机矩阵复合编码器模拟复合输出 (PAL, NTSC 或 SECAM) 摄像机矩阵制作处理 MPEG 编码器数字压缩输出 G B R Y Pr Pb a) b) G B R Y Pr Pb Y Cr Cb Y Cr Cb ADC SDI

MPEG基础和协议分析指南初级读本 PcM视频理想编码器非理想编码器短时延编码器只发送熵需发送较多信息需发送更多信息图象质量差图象质量差图象质量好图象质量好 b) 复杂性 c) 编解码所需时间在实际应用中,需要各种各样的编码器,它们有着不同然而,压缩过程中所包含的各种变化因素使得压缩因子的时延,复杂程度也不一样。MPEG之所以有着广泛的应的确定是一件非常困难的事。图1-2a表示的是一个理用,就在于它不是一个单一的压缩格式,而是可以灵活想的编码器,如果全部熵均被发送,那么图象质量很好地组合在一起的各种标准化的编码工具,这样可以满足不过,如果为了减少编码器的输出比特率而提高压缩因各种应用需求。在被压缩的数据中,也包含了所采用的子,将造成有一部分熵不能被发送,图象质量也会下降。编码方式,这样,无论编码器使用什么编码方式,解码注意,在压缩系统中如果出现图象质量下降,说明压缩器都能自动地进行处理过大(图1-2b)。如果可用的比特率不够,较好的方法是在MPEG2和MPEG4编码中,可以按照复杂程度的不同降低输入图象的熵以避开这个区域。这可以用滤波器来而划分为几类,每一类可以有不同的级,级与输入图象实现。在主观上,将滤波器所造成的分辨率下降与压缩的分辨率相关。第四章将对类和级作详细介绍。失真造成的图象损伤相比较,人们宁愿接受前者既然有许多不同的数字视频格式,也就有不同的比特率。为了识别楠的完整性,就会使理想压缩器变得十分复杂。例如,高清晰度系统的比特率是标准清晰度系统的6倍。出于经济上的原因,实际应用的压缩器应当不太复杂但仅仅了解编码器的输出比特率是不够的,更重要的是压应能发送较多的数据,以保证所有的熵均被发送。图1 缩因子,它是编码器的输入比特率与已压缩的比特率之2b表示出了编码器的复杂度与压缩性能之间的关系。在例如压缩因子为21,5:1等等保证一定的图象质量下,所需的压缩因子愈高,则编码器就愈是复杂 Owww.tektronix.com/video_audio

MPEG 基础和协议分析指南初级读本图 1-2 在实际应用中，需要各种各样的编码器，它们有着不同的时延，复杂程度也不一样。MPEG之所以有着广泛的应用，就在于它不是一个单一的压缩格式，而是可以灵活地组合在一起的各种标准化的编码工具，这样可以满足各种应用需求。在被压缩的数据中，也包含了所采用的编码方式，这样，无论编码器使用什么编码方式，解码器都能自动地进行处理。在 MPEG-2 和 MPEG-4 编码中，可以按照复杂程度的不同而划分为几类，每一类可以有不同的级，级与输入图象的分辨率相关。第四章将对类和级作详细介绍。既然有许多不同的数字视频格式，也就有不同的比特率。例如，高清晰度系统的比特率是标准清晰度系统的6倍。仅仅了解编码器的输出比特率是不够的，更重要的是压缩因子，它是编码器的输入比特率与已压缩的比特率之比，例如压缩因子为 2:1, 5:1 等等。然而，压缩过程中所包含的各种变化因素使得压缩因子的确定是一件非常困难的事。图1 － 2a 表示的是一个理想的编码器，如果全部熵均被发送，那么图象质量很好。不过，如果为了减少编码器的输出比特率而提高压缩因子，将造成有一部分熵不能被发送，图象质量也会下降。注意，在压缩系统中如果出现图象质量下降，说明压缩过大（图1-2b）。如果可用的比特率不够，较好的方法是降低输入图象的熵以避开这个区域。这可以用滤波器来实现。在主观上，将滤波器所造成的分辨率下降与压缩失真造成的图象损伤相比较，人们宁愿接受前者。为了识别熵的完整性，就会使理想压缩器变得十分复杂。出于经济上的原因，实际应用的压缩器应当不太复杂但应能发送较多的数据，以保证所有的熵均被发送。图1－ 2b 表示出了编码器的复杂度与压缩性能之间的关系。在保证一定的图象质量下，所需的压缩因子愈高，则编码器就愈是复杂。 4 www.tektronix.com/video_audio PCM 视频熵理想编码器只发送熵非理想编码器需发送较多信息短时延编码器需发送更多信息图象质量差图象质量好复杂性编解码所需时间图象质量好图象质量差 a) b) c)

MPEG基础和协议分析指南初级读本视频信号中的熵是不断变化的。在记录播音员报导新闻位移量和垂直位移量(它们统称为运动矢量所决定。传送的场景时,信息中有较大的冗余度,压缩也比较容易。与运动矢量的所需数据率要低于传送图象差的数据率此不同的是,在对风中飘动的树叶或不停奔跑的足球运 MPEG编码既可用于隔行扫描图象也可用于非隔行扫描图动员的场景进行压缩记录时就要困难的多,这是因为此象。时间轴上的某点图象称为“画面”,而不管它是一场时信息的冗余度较低(信息量较大或熵较大)。在后两种情还是一帧。隔行扫描不是理想的数字压缩信号源,因为况下,如果有些熵未被发送,图象的质量就会降低。不它本身就是一种压缩技术。时间域编码更为复杂,因为及通道中的图象质量保持不变而比特率可变之间作出选某一场中的象素会处于下一场的不同位置择。电讯通信网络工作人员在实际应用中倾向于保持传运动补偿能够减少但不能消除连续画面之间的差别。这输比特率不变使用缓冲存储器来平均熵的变化,只种图象差本身是空间性的,可以采用上述基于帧内编码要所产生的延迟能被接受即可。但在记录时,可变比特的变换编码。运动补偿只是简单地减少差值图象中的数率更便于处理,DVD就是使用可变比特率,它是通过缓存据量。以平均比特率,使数据率保持在光盘系统的可接受范围采用较大的时间跨度可以提高时间域编码器的效率。图之内。 1-2c表明,如果需要更高的压缩因子,则在处理过程中帧内编码是利用空间性冗余度的一项技术,即冗余度就必须有更长的时间跨度,但这样会产生较长的编码延迟在该图象之内;帧间编码是利用时间性冗余度。帧内编很明显,时间域编码信号在编辑时也较难于处理,因为码可以单独使用,如用于静止图象的JPEG标准,它也可某一给定输出图象的内容有可能是基于早先发送的图象以和帧间编码结合使用,如MPEG标准数据。要使编辑得以正常进行,制作系统将不得不对时帧内编码利用了典型图象的两种特性。首先,并非所有间域编码作出一定的限制,当然,对时间域编码的限制的空间域频率均同时存在:其次,空间域频率愈高,匆也就限制了压缩因子的可用范围。其幅度可能愈小帧内编码需要对图象中的空间域频率16音频压缩简介进行分析,这种分析是便于变换,例如小波变换和 DCT PCM数字音频通道的比特率大约只有每秒15兆比特,它离散余弦变换)。变换所产生的系数是用于描述每个空大约为422数字视频的05%在适度的视频压缩方案中间域频率的幅度。在一般情况下,许多系数为零,或者如数字 Betacam,音频压缩是不必要的。但是,随着视频接近于零,这些系数可以忽略,从而可以减少数据率。压缩因子的提升,音频压缩随之也日益受到关注。帧间编码是利用连续画面之间的相似性。如果某幅画面音频压缩可利用它的两个特点。第一,在典型的音频信可被解码器使用,那么解码器只须利用图象差即可得到号中,并非所有的频率均同时存在。第二,由于存在着掩下一个画面。随着图象中目标的运动,图象差也会增加,蔽效应,人耳不可能分辨出音频信号中的每个细节。音但是这种变化可以通过运动补偿来获取,因为一股而言,颏压缩是通过滤波或变换将音频频谱分散到各个频带中, 从一个画面过渡到下一画面时运动目标不会有太大的变在描述较低电平的频带时只使用少量的数据。低电平频化。如果这种运动可以被测量,那么利用前一画面中目带中的的掩蔽效应可以消除或降低特定频带的可听度标移动到新位置的信息就可以得出与当前画面非常接近这样可以只需发送较少的数据的目标位置。这种移动过程由发送至解码器的一对水平 ww.tektronix.com/video_audio

MPEG 基础和协议分析指南初级读本视频信号中的熵是不断变化的。在记录播音员报导新闻的场景时，信息中有较大的冗余度，压缩也比较容易。与此不同的是，在对风中飘动的树叶或不停奔跑的足球运动员的场景进行压缩记录时就要困难的多，这是因为此时信息的冗余度较低(信息量较大或熵较大)。在后两种情况下，如果有些熵未被发送，图象的质量就会降低。不过，我们可以在通道比特率保持不变但图象质量可变以及通道中的图象质量保持不变而比特率可变之间作出选择。电讯通信网络工作人员在实际应用中倾向于保持传输比特率不变，可以使用缓冲存储器来平均熵的变化，只要所产生的延迟能被接受即可。但在记录时，可变比特率更便于处理，DVD就是使用可变比特率，它是通过缓存以平均比特率，使数据率保持在光盘系统的可接受范围之内。帧内编码是利用空间性冗余度的一项技术，即冗余度就在该图象之内；帧间编码是利用时间性冗余度。帧内编码可以单独使用，如用于静止图象的JPEG标准，它也可以和帧间编码结合使用，如 MPEG 标准。帧内编码利用了典型图象的两种特性。首先，并非所有的空间域频率均同时存在；其次，空间域频率愈高，则其幅度可能愈小。帧内编码需要对图象中的空间域频率进行分析，这种分析是便于变换，例如小波变换和 DCT （离散余弦变换）。变换所产生的系数是用于描述每个空间域频率的幅度。在一般情况下，许多系数为零，或者接近于零，这些系数可以忽略，从而可以减少数据率。帧间编码是利用连续画面之间的相似性。如果某幅画面可被解码器使用，那么解码器只须利用图象差即可得到下一个画面。随着图象中目标的运动，图象差也会增加，但是这种变化可以通过运动补偿来获取，因为一般而言，从一个画面过渡到下一画面时运动目标不会有太大的变化。如果这种运动可以被测量，那么利用前一画面中目标移动到新位置的信息就可以得出与当前画面非常接近的目标位置。这种移动过程由发送至解码器的一对水平位移量和垂直位移量(它们统称为运动矢量)所决定。传送运动矢量的所需数据率要低于传送图象差的数据率。 MPEG编码既可用于隔行扫描图象也可用于非隔行扫描图象。时间轴上的某点图象称为“画面”，而不管它是一场还是一帧。隔行扫描不是理想的数字压缩信号源，因为它本身就是一种压缩技术。时间域编码更为复杂，因为某一场中的象素会处于下一场的不同位置。运动补偿能够减少但不能消除连续画面之间的差别。这种图象差本身是空间性的，可以采用上述基于帧内编码的变换编码。运动补偿只是简单地减少差值图象中的数据量。采用较大的时间跨度可以提高时间域编码器的效率。图 1-2c 表明，如果需要更高的压缩因子，则在处理过程中必须有更长的时间跨度，但这样会产生较长的编码延迟。很明显，时间域编码信号在编辑时也较难于处理，因为某一给定输出图象的内容有可能是基于早先发送的图象数据。要使编辑得以正常进行，制作系统将不得不对时间域编码作出一定的限制，当然，对时间域编码的限制也就限制了压缩因子的可用范围。 1.6 音频压缩简介 PCM数字音频通道的比特率大约只有每秒1.5兆比特，它大约为4:2:2数字视频的0.5%。在适度的视频压缩方案中，如数字Betacam，音频压缩是不必要的。但是，随着视频压缩因子的提升，音频压缩随之也日益受到关注。音频压缩可利用它的两个特点。第一，在典型的音频信号中，并非所有的频率均同时存在。第二，由于存在着掩蔽效应，人耳不可能分辨出音频信号中的每个细节。音频压缩是通过滤波或变换将音频频谱分散到各个频带中，在描述较低电平的频带时只使用少量的数据。低电平频带中的的掩蔽效应可以消除或降低特定频带的可听度，这样可以只需发送较少的数据。 www.tektronix.com/video_audio 5

点击下载完整版文档（PDF格式）

共91页，可试读20页，点击继续阅读 ↓↓

点击下载（PDF格式）

浏览记录