第5章彩色数字图像基础 冰水水冰本水冰水水水冰水水水本水冰本客*冰水水水水冰本水冰水水水水水水冰本冰客水冰水水水冰客水冰本水水水水水冰水水冰本水冰水水水水水水水*客 5.1视角系统对颜色的感知 5.2图像的颜色模型 5.2.1显示彩色图像用RGB相加混色模型 5.2.2打印彩色图像用CMY相减混色模型 5.3图像的三个基本属性 5.3.1分辨率 5.3.2像素深度 5.3.3真彩色、伪彩色与直接色 5.4图像的种类 5.4.1矢量图与点位图 5.4.2灰度图与彩色图 5.5伽马qy)校正 的概念 5.5.2y校正 5.6JPEG压缩编码 5.6.1JPEG算法概要 5.6.2JPEG算法的主要计算步骤 5.6.3应用JPEG算法举例 5.7图像文件格式 5.7.1BMP文件格式 5.7.2GIF文件格式 5.7.3JPEG格式 5.7.4PNG格式 5.8图像文件后缀一览表 练习与思考题 参考文献和站点 水水水本水水水水水冰客*水冰*客水水水水冰水客水冰水水水水水水水水*水冰水水水冰冰水冰水水冰水水水水水水水冰水本水冰水水水水冰冰 图像是多媒体中携带信息的极其重要的媒体,有人发表过统计资料,认为人们获取的信 息的70%来自视觉系统,实际就是图像和电视。但是,图像数字化之后的数据量非常大,在 因特网上传输时很费时间,在盘上存储时很占“地盘”,因此就必须要对图像数据进行压缩 压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价是大量的计算。几十年来, 许多科技工作者一直在孜孜不倦地寻找更有效的方法,用比较少的数据量表达原始的图像。 图像数据压缩主要是根据下面两个基本事实来实现的。一个事实是图像数据中有许多重 复的数据,使用数学方法来表示这些重复数据就可以减少数据量:另一个事实是人的眼睛对 图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的 利用前一个事实的压缩技术叫做无损数据压缩技术,利用后一个事实的压缩技术叫做有损压 缩技术。实际的图像压缩是综合使用各种有损和无损数据压缩技术来实现的 本章将介绍表示数字彩色图像所需要的基本知识、使用得相当广泛的JPEG压缩标准和图 像文件的存储格式。在介绍过程中,要涉及到有关颜色的度量和颜色空间的转换问题,这些 比较深入的问题将在第6章“颜色的度量体系”和第7章“颜色空间变换”中作比较详细的介 绍。读者也可先看这两章的内容,然后再阅读这章的内容
第5章 彩色数字图像基础 *************************************************************************** 5.1 视角系统对颜色的感知 5.2 图像的颜色模型 5.2.1 显示彩色图像用RGB相加混色模型 5.2.2 打印彩色图像用CMY相减混色模型 5.3 图像的三个基本属性 5.3.1 分辨率 5.3.2 像素深度 5.3.3 真彩色、伪彩色与直接色 5.4 图像的种类 5.4.1 矢量图与点位图 5.4.2 灰度图与彩色图 5.5 伽马( )校正 5.5.1 γ的概念 5.5.2 γ校正 5.6 JPEG压缩编码 5.6.1 JPEG算法概要 5.6.2 JPEG算法的主要计算步骤 5.6.3 应用JPEG算法举例 5.7 图像文件格式 5.7.1 BMP文件格式 5.7.2 GIF文件格式 5.7.3 JPEG格式 5.7.4 PNG格式 5.8 图像文件后缀一览表 练习与思考题 参考文献和站点 *************************************************************************** 图像是多媒体中携带信息的极其重要的媒体,有人发表过统计资料,认为人们获取的信 息的70%来自视觉系统,实际就是图像和电视。但是,图像数字化之后的数据量非常大,在 因特网上传输时很费时间,在盘上存储时很占“地盘”,因此就必须要对图像数据进行压缩。 压缩的目的就是要满足存储容量和传输带宽的要求,而付出的代价是大量的计算。几十年来, 许多科技工作者一直在孜孜不倦地寻找更有效的方法,用比较少的数据量表达原始的图像。 图像数据压缩主要是根据下面两个基本事实来实现的。一个事实是图像数据中有许多重 复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个事实是人的眼睛对 图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的。 利用前一个事实的压缩技术叫做无损数据压缩技术,利用后一个事实的压缩技术叫做有损压 缩技术。实际的图像压缩是综合使用各种有损和无损数据压缩技术来实现的。 本章将介绍表示数字彩色图像所需要的基本知识、使用得相当广泛的JPEG压缩标准和图 像文件的存储格式。在介绍过程中,要涉及到有关颜色的度量和颜色空间的转换问题,这些 比较深入的问题将在第6章“颜色的度量体系”和第7章“颜色空间变换”中作比较详细的介 绍。读者也可先看这两章的内容,然后再阅读这章的内容
第5章彩色数字图像基础 5.1视角系统对颜色的感知 人们认为颜色是视觉系统对可见光的感知结果。可见光是波长在380mm~780m之间的 电磁波,我们看到的大多数光不是一种波长的光,而是由许多不同波长的光组合成的。人们 在研究眼睛对颜色的感知过程中普通认为,人的视网膜有对红、绿、蓝颜色敏感程度不同的 三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只 存在于眼睛和大脑。在计算机图像处理中,杆状细胞还没有扮演什么角色。 人的视觉系统对颜色的感知可归纳出如下几个特性 1.眼睛本质上是一个照相机。人的视网膜( human retina)通过神经元来感知外部世界 的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏 感的杆状体(rod) 2.红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度 也不同。这就意味着,人们可以使用数字图像处理技术来降低表示图像的数据量而 不使人感到图像质量明显下降 3.自然界中的任何一种颜色都可以由R,G,B这3种颜色值之和来确定,它们构成一个 3维的RGB矢量空间。这就是说,R,G,B的数值不同,混合得到的颜色就不同,也 就是光波的波长不同。 5.2图像的颜色模型 颜色模型( color model)是用简单方法描述所有颜色的一套规则和定义,例如RGB,CMY, YCrCb等都是表示颜色的颜色模型 5.2.1显示彩色图像用RGB相加混色模型 个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,并且使用RGB 相加混色模型。电视机和计算机显示器使用的阴极射线管( cathode ray tube,CRT)就是 个有源物体。CRT使用3个电子枪分别产生红(Red)、绿( Green)和蓝(Blue)三种波长的光,并 以各种不同的相对强度综合起来产生颜色,如图5-01所示。组合这三种光波以产生特定颜色 就叫做相加混色,因为这种相加混色是利用R,G和B颜色分量产生颜色,所以称为RGB相加混 色模型。相加混色是计算机应用中定义颜色的基本方法。 ··· 000 电子枪 00000 0●00●● 掩蔽罩 0000000 荧光涂层屏幕 图5-01彩色显像产生颜色的原理 从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到。三种颜色的光 强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同,没有光到 达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜 色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述 颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)
第5章 彩色数字图像基础 2 5.1 视角系统对颜色的感知 人们认为颜色是视觉系统对可见光的感知结果。可见光是波长在380 nm~780 nm之间的 电磁波,我们看到的大多数光不是一种波长的光,而是由许多不同波长的光组合成的。人们 在研究眼睛对颜色的感知过程中普通认为,人的视网膜有对红、绿、蓝颜色敏感程度不同的 三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只 存在于眼睛和大脑。在计算机图像处理中,杆状细胞还没有扮演什么角色。 人的视觉系统对颜色的感知可归纳出如下几个特性: 1. 眼睛本质上是一个照相机。人的视网膜(human retina)通过神经元来感知外部世界 的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏 感的杆状体(rod)。 2. 红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度 也不同。这就意味着,人们可以使用数字图像处理技术来降低表示图像的数据量而 不使人感到图像质量明显下降。 3. 自然界中的任何一种颜色都可以由R,G,B这3种颜色值之和来确定,它们构成一个 3维的RGB矢量空间。这就是说,R,G,B的数值不同,混合得到的颜色就不同,也 就是光波的波长不同。 5.2 图像的颜色模型 颜色模型(color model)是用简单方法描述所有颜色的一套规则和定义,例如RGB,CMY, YCrCb等都是表示颜色的颜色模型。 5.2.1 显示彩色图像用RGB相加混色模型 一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,并且使用RGB 相加混色模型。电视机和计算机显示器使用的阴极射线管(cathode ray tube,CRT)就是一 个有源物体。CRT使用3个电子枪分别产生红(Red)、绿(Green)和蓝(Blue)三种波长的光,并 以各种不同的相对强度综合起来产生颜色,如图5-01所示。组合这三种光波以产生特定颜色 就叫做相加混色,因为这种相加混色是利用R,G和B颜色分量产生颜色,所以称为RGB相加混 色模型。相加混色是计算机应用中定义颜色的基本方法。 图5-01 彩色显像产生颜色的原理 从理论上讲,任何一种颜色都可用三种基本颜色按不同的比例混合得到。三种颜色的光 强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同,没有光到 达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜 色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述: 颜色=R(红色的百分比)+G(绿色的百分比)+B(蓝色的百分比)
第5章彩色数字图像基础 当三基色等量相加时,得到白色:等量的红绿相加而蓝为0值时得到黄色;等量的红蓝 相加而绿为0时得到品红色:等量的绿蓝相加而红为0时得到青色。这些三基色相加的结果如 图5-02所示 绿 白 红{品红)蓝 图5-02相加混色 幅彩色图像可以看成由许多的点组成的,如图5-03所示。图像中的单个点称为像素 ( pixel),每个像素都有一个值,称为像素值,它表示特定颜色的强度。一个像素值往往用R, G,B三个分量表示。如果每个像素的每个颜色分量用二进制的1位来表示,那末每个颜色的 分量只有“1”和“0”这两个值。这也就是说,每种颜色的强度是100%,或者是0%。在这种 情况下,每个像素所显示的颜色是8种可能出现的颜色之一,如表5-01所示。 图5-03一幅图像由许多像素组成 表5-01相加色 RGB 颜色 010 011 蓝绿青红招黄 l11 对于标准的电视图形阵列( Video graphics array,WGA)适配卡的16种标准颜色,其对 应的R,G,B值如表5-02所示。在 Microsoft公司的 Windows中,用代码0~15表示。在表中
第5章 彩色数字图像基础 3 当三基色等量相加时,得到白色;等量的红绿相加而蓝为0值时得到黄色;等量的红蓝 相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。这些三基色相加的结果如 图5-02所示。 图5-02 相加混色 一幅彩色图像可以看成由许多的点组成的,如图5-03所示。图像中的单个点称为像素 (pixel),每个像素都有一个值,称为像素值,它表示特定颜色的强度。一个像素值往往用R, G,B三个分量表示。如果每个像素的每个颜色分量用二进制的1位来表示,那末每个颜色的 分量只有“1”和“0”这两个值。这也就是说,每种颜色的强度是100%,或者是0%。在这种 情况下,每个像素所显示的颜色是8种可能出现的颜色之一,如表5-01所示。 图5-03 一幅图像由许多像素组成 表5-01相加色 RGB 颜色 000 黑 001 蓝 010 绿 011 青 100 红 101 品红 110 黄 111 白 对于标准的电视图形阵列(Video graphics array,VGA)适配卡的16种标准颜色,其对 应的R,G,B值如表5-02所示。在Microsoft公司的Windows中,用代码0~15表示。在表中
第5章彩色数字图像基础 代码1~6表示的颜色比较暗,它们是用最大光强值的一半产生的颜色:9~15是用最大光强 值产生的 表5-0216色WG调色板的值 160 00黑(Back) 60蓝(Bue) 240 0绿( Green) 200 240 60品红( Magenta) 128 240 60褐色( Dark yellow) 192 192 160 180白( Light gray) 128128 160 120淡蓝 (Light blue 255 120淡绿( Light green) 255 240 120淡青( Light cyan) 240 120淡红( Light Red 13 255 200 240 120淡品红 (Light 240 120黄( (yellow) 15255 240高亮白( Bright white 在表5-02中,每种基色的强度是用8位表示的,因此可产生22=16777216种颜色。但实 际上要用一千六百多万种颜色的场合是很少的。在多媒体计算机中,除用RGB来表示图像之 外,还用色调-饱和度-亮度(hue- saturation- lightness,HSL)颜色模型 在HSL模型中,H定义颜色的波长,称为色调:S定义颜色的强度( intensity),表示颜色 的深浅程度,称为饱和度;L定义掺入的白光量,称为亮度。用HSL表示颜色的重要性,是因 为它比较容易为画家所理解。若把S和L的值设置为1,当改变H时就是选择不同的纯颜色:减 小饱和度S时,就可体现掺入白光的效果:降低亮度时,颜色就暗,相当于掺入黑色。因此 在 Windows中也用了HSL表示法,16色VGA调色板的值也表示在表5-02中。 5.2.2打印彩色图像用OM相减混色模型 个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用 OMY相减混色模型。用彩色墨水或颜料进行混合,绘制的图画就是一种无源物体,用这种方 法生成的颜色称为相减色。在理论上说,任何一种颜色都可以用三种基本颜料按一定比例混 合得到。这三种颜色是青色(Cyan)、品红( Magenta)和黄色( Yellow),通常写成CMY,称为CMY 模型。用这种方法产生的颜色之所以称为相减色,乃是因为它减少了为视觉系统识别颜色所 需要的反射光 在相减混色中,当三基色等量相减时得到黑色:等量黄色(Y)和品红(M相减而青色(C) 为0时,得到红色(R):等量青色(C)和品红(M相减而黄色(Y)为0时,得到蓝色(B):等量黄 色(Y)和青色(C)相减而品红(M为0时,得到绿色(G)。三基色相减结果如图5-04所示
第5章 彩色数字图像基础 4 代码1~6表示的颜色比较暗,它们是用最大光强值的一半产生的颜色;9~15是用最大光强 值产生的。 表5-02 16色VGA调色板的值 代码 R G B H S L 颜色 0 0 0 0 160 0 0 黑(Black) 1 0 0 128 160 240 60 蓝(Blue) 2 0 128 0 80 240 60 绿(Green) 3 0 128 128 120 240 60 青(Cyan) 4 128 0 0 0 240 60 红(Red) 5 128 0 128 200 240 60 品红(Magenta) 6 128 128 0 40 240 60 褐色(Dark yellow) 7 192 192 192 160 0 180 白(Light gray) 8 128 128 128 160 0 120 深灰(Dark Gray) 9 0 0 255 160 240 120 淡蓝(Light blue) 10 0 255 0 80 240 120 淡绿(Light green) 11 0 255 255 120 240 120 淡青(Light cyan) 12 255 0 0 0 240 120 淡红(Light Red) 13 255 0 255 200 240 120 淡品红(Light Magenta) 14 255 255 0 40 240 120 黄(yellow) 15 255 255 255 160 0 240 高亮白(Bright white) 在表5-02中,每种基色的强度是用8位表示的,因此可产生2 24=16 777 216种颜色。但实 际上要用一千六百多万种颜色的场合是很少的。在多媒体计算机中,除用RGB来表示图像之 外,还用色调-饱和度-亮度(hue-saturation-lightness,HSL)颜色模型 在HSL模型中,H定义颜色的波长,称为色调;S定义颜色的强度(intensity),表示颜色 的深浅程度,称为饱和度;L定义掺入的白光量,称为亮度。用HSL表示颜色的重要性,是因 为它比较容易为画家所理解。若把S和L的值设置为1,当改变H时就是选择不同的纯颜色;减 小饱和度S时,就可体现掺入白光的效果;降低亮度时,颜色就暗,相当于掺入黑色。因此 在Windows中也用了HSL表示法,16色VGA调色板的值也表示在表5-02中。 5.2.2 打印彩色图像用CMY相减混色模型 一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用 CMY相减混色模型。用彩色墨水或颜料进行混合,绘制的图画就是一种无源物体,用这种方 法生成的颜色称为相减色。在理论上说,任何一种颜色都可以用三种基本颜料按一定比例混 合得到。这三种颜色是青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY 模型。用这种方法产生的颜色之所以称为相减色,乃是因为它减少了为视觉系统识别颜色所 需要的反射光。 在相减混色中,当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C) 为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄 色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。三基色相减结果如图5-04所示
第5章彩色数字图像基础 黄 绿 红 黑 青\蓝/品红 品红 图5-04相减混色 彩色打印机采用的就是这种原理,印刷彩色图片也是采用这种原理。按每个像素每种颜 色用1位表示,相减法产生的8种颜色如表5-03所示。由于彩色墨水和颜料的化学特性,用等 量的三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色( black ink) 所以CMY又写成CMYK。 表5-03相减色 青色 黄色 相减色 100 0101010 红青绿蓝黑 相加色与相减色之间有一个直接关系,如表5-04所示。利用它们之间的关系,可以把显 示的颜色转换成输出打印的颜色。相加混色和相减混色之间成对出现互补色。例如,当RGB 为1:1:1时,在相加混色中产生白色,而CMY为1:1:1时,在相减混色中产生黑色。从另 个角度也可以看它们的互补性。从表5-04中可以看到,在RGB中的颜色为1的地方,在CMY 对应的位置上,其颜色值为0。例如RGB为0:1:0时,对应CMY为1:0:1 表5-04相加色与相减色的关系 相加混色 相减混色 生成的颜色 000 110 010 101 011 100 011 101 010 110 111
第5章 彩色数字图像基础 5 图5-04 相减混色 彩色打印机采用的就是这种原理,印刷彩色图片也是采用这种原理。按每个像素每种颜 色用1位表示,相减法产生的8种颜色如表5-03所示。由于彩色墨水和颜料的化学特性,用等 量的三基色得到的黑色不是真正的黑色,因此在印刷术中常加一种真正的黑色(black ink), 所以CMY又写成CMYK。 表5-03 相减色 青色 品红 黄色 相减色 0 0 0 白 0 0 1 黄 0 1 0 品红 0 1 1 红 1 0 0 青 1 0 1 绿 1 1 0 蓝 1 1 1 黑 相加色与相减色之间有一个直接关系,如表5-04所示。利用它们之间的关系,可以把显 示的颜色转换成输出打印的颜色。相加混色和相减混色之间成对出现互补色。例如,当RGB 为1∶1∶1时,在相加混色中产生白色,而CMY为1∶1∶1时,在相减混色中产生黑色。从另 一个角度也可以看它们的互补性。从表5-04中可以看到,在RGB中的颜色为1的地方,在CMY 对应的位置上,其颜色值为0。例如RGB为0∶1∶0时,对应CMY为1∶0∶1。 表5-04 相加色与相减色的关系 相加混色 相减混色 生成的颜色 RGB CMY 000 111 黑 001 110 蓝 010 101 绿 011 100 青 100 011 红 101 010 品红 110 001 黄 111 000 白
第5章彩色数字图像基础 5.3图像的三个基本属性 箱述一幅图像需要使用图像的属性。图像的属性包含分辨率、像素深度、真伪伤彩色、 的表示法和种类等。本节介绍前面三个特性。 5.3.1分辨率 我们经常遇到的分辨率有两种:显示分辨率和图像分辨率。 1.显示分辨率 显示分辨率是指显示屏上能够显示出的像素数目。例如,显示分辨率为640×480表示显 示屏分成480行,每行显示640个像素,整个显示屏就含有307200个显像点。屏幕能够显示的 像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。除象手提式那样的计算 机用液晶显示LCD( liquid crystal display)外,一般都采用CRT显示,它类似于彩色电视机 中的CRT。显示屏上的每个彩色像点由代表R,G,B三种模拟信号的相对强度决定,这些彩色 像点就构成一幅彩色图像 计算机用的CRT和家用电视机用的CRT之间的主要差别是显像管玻璃面上的孔眼掩模和 所涂的荧光物不同。孔眼之间的距离称为点距( dot pitch)。因此常用点距来衡量一个显示 屏的分辨率。电视机用的CRT的平均分辨率为0.76mm,而标准SVGA显示器的分辨率为0.28mm 孔眼越小,分辨率就越高,这就需要更小更精细的荧光点。这也就是为什么同样尺寸的计算 机显示器比电视机的价格贵得多的原因 早期用的计算机显示器的分辨率是0.41mm,随着技术的进步,分辨率由0.41→0.38→ 0.35→0.31→0.28直到0.26m以下。显示器的价格主要集中体现在分辨率上,因此在购 买显示器时应在价格和性能上综合考虑 2.图像分辨率 图像分辨率是指组成一幅图像的像素密度的度量方法。对同样大小的一幅图,如果组成 该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越 粗糙 在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点( dots per inch,DPⅠ)表示。如果用300DPI来扫描一幅8″×10″的彩色图像,就得到一幅2400×3000 个像素的图像。分辨率越高,像素就越多 图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数 目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为640×480,那末一幅 320×240的图像只占显示屏的1/4:相反,2400×3000的图像在这个显示屏上就不能显示 个完整的画面 这里顺便说一下,在显示一幅图像时,有可能会出现图像的宽高比( aspect radio)与显 示屏上显示出的图像的宽高比不一致这种现象。这是由于显示设备中定义的宽高比与图像的 宽高比不一致造成的。例如一幅200×200像素的方形图,有可能在显示设备上显示的图不再 是方形图,而变成了矩形图。这种现象在20世纪80年代的显示设备上经常遇到。 5.3.2像素深度 像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。像素深度决定 彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。例 如,一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素共 用24位表示,就说像素的深度为24,每个像素可以是2=16777216种颜色中的一种。在这 个意义上,往往把像素深度说成是图像深度。表示一个像素的位数越多,它能表达的颜色数 目就越多,而它的深度就越深 虽然像素深度或图像深度可以很深,但各种VGA的颜色深度却受到限制。例如,标准VGA 支持4位16种颜色的彩色图像,多媒体应用中推荐至少用8位256种颜色。由于设备的限制, 加上人眼分辨率的限制,一般情况下,不一定要追求特别深的像素深度。此外,像素深度越 深,所占用的存储空间越大。相反,如果像素深度太浅,那也影响图像的质量,图像看起来 让人觉得很粗糙和很不自然
第5章 彩色数字图像基础 6 5.3 图像的三个基本属性 描述一幅图像需要使用图像的属性。图像的属性包含分辨率、像素深度、真/伪彩色、 图像的表示法和种类等。本节介绍前面三个特性。 5.3.1 分辨率 我们经常遇到的分辨率有两种:显示分辨率和图像分辨率。 1. 显示分辨率 显示分辨率是指显示屏上能够显示出的像素数目。例如,显示分辨率为640×480表示显 示屏分成480行,每行显示640个像素,整个显示屏就含有307200个显像点。屏幕能够显示的 像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。除象手提式那样的计算 机用液晶显示LCD(liquid crystal display)外,一般都采用CRT显示,它类似于彩色电视机 中的CRT。显示屏上的每个彩色像点由代表R,G,B三种模拟信号的相对强度决定,这些彩色 像点就构成一幅彩色图像。 计算机用的CRT和家用电视机用的CRT之间的主要差别是显像管玻璃面上的孔眼掩模和 所涂的荧光物不同。孔眼之间的距离称为点距(dot pitch)。因此常用点距来衡量一个显示 屏的分辨率。电视机用的CRT的平均分辨率为0.76 mm,而标准SVGA显示器的分辨率为0.28 mm。 孔眼越小,分辨率就越高,这就需要更小更精细的荧光点。这也就是为什么同样尺寸的计算 机显示器比电视机的价格贵得多的原因。 早期用的计算机显示器的分辨率是0.41 mm,随着技术的进步,分辨率由0.41→0.38→ 0.35→0.31→0.28一直到0.26 mm以下。显示器的价格主要集中体现在分辨率上,因此在购 买显示器时应在价格和性能上综合考虑。 2. 图像分辨率 图像分辨率是指组成一幅图像的像素密度的度量方法。对同样大小的一幅图,如果组成 该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越 粗糙。 在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点(dots per inch,DPI)表示。如果用300 DPI来扫描一幅8″×10″的彩色图像,就得到一幅2400×3000 个像素的图像。分辨率越高,像素就越多。 图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数 目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为640×480,那末一幅 320×240的图像只占显示屏的1/4;相反,2400×3000的图像在这个显示屏上就不能显示一 个完整的画面。 这里顺便说一下,在显示一幅图像时,有可能会出现图像的宽高比(aspect radio)与显 示屏上显示出的图像的宽高比不一致这种现象。这是由于显示设备中定义的宽高比与图像的 宽高比不一致造成的。例如一幅200×200像素的方形图,有可能在显示设备上显示的图不再 是方形图,而变成了矩形图。这种现象在20世纪80年代的显示设备上经常遇到。 5.3.2 像素深度 像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。像素深度决定 彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。例 如,一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素共 用24位表示,就说像素的深度为24,每个像素可以是2 24=16 777 216种颜色中的一种。在这 个意义上,往往把像素深度说成是图像深度。表示一个像素的位数越多,它能表达的颜色数 目就越多,而它的深度就越深。 虽然像素深度或图像深度可以很深,但各种VGA的颜色深度却受到限制。例如,标准VGA 支持4位16种颜色的彩色图像,多媒体应用中推荐至少用8位256种颜色。由于设备的限制, 加上人眼分辨率的限制,一般情况下,不一定要追求特别深的像素深度。此外,像素深度越 深,所占用的存储空间越大。相反,如果像素深度太浅,那也影响图像的质量,图像看起来 让人觉得很粗糙和很不自然
第5章彩色数字图像基础 在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加 位或几位作为属性( Attribute)位。例如,RGB5:5:5表示一个像素时,用2个字节共16位 表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而图 像深度为15位。 属性位用来指定该像素应具有的性质。例如在CD-I系统中,用RGB5:5:5表示的像素 共16位,其最高位(bs)用作属性位,并把它称为透明( Transparency)位,记为T。T的含义 以这样来理解:假如显示屏上已经有一幅图存在,当这幅图或者这幅图的一部分要重叠在上 面时,T位就用来控制原图是否能看得见。例如定义T=1,原图完全看不见:T=0,原图能完 全看见。 在用32位表示一个像素时,若R,G,B分别用8位表示,剩下的8位常称为a通道( alpha channel)位,或称为覆盖 (overlay)位、中断位或属性位。它的用法可用一个预乘a通道 ( premultiplied alpha)的例子说明。假如一个像素(A,R,G,B的四个分量都用规一化的 数值表示,(A,R,G,B为(1,1,0,0)时显示红色。当像素为(0.5,1,0,0)时,预乘的结 果就变成(0.5,0.5,0,0),这表示原来该像素显示的红色的强度为1,而现在显示的红色的强 度降了一半。 用这种办法定义一个像素的属性在实际中很有用。例如在一幅彩色图像上叠加文字说 明,而又不想让文字把图覆盖掉,就可以用这种办法来定义像素,而该像素显示的颜色又有 人把它称为混合色( key color)。在图像产品生产中,也往往把数字电视图像和计算机生产 的图像混合在一起,这种技术称为视图混合( video keying)技术,它也采用a通道 5.3.3真彩色、伪彩色与直接色 搞清真彩色、伪彩色与直接色的含义,对于编写图像显示程序、理解图像文件的存储格 式有直接的指导意义,也不会对出现诸如这样的现象感到困惑:本来是用真彩色表示的图像 但在VGA显示器上显示的图像颜色却不是原来图像的颜色 1.真彩色( true color) 真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色 分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB5:5:5表示 的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得 到的彩色是真实的原图彩色 如果用RGB8:8:8方式表示一幅彩色图像,就是R,G,B都用8位来表示,每个基色分量 占一个字节,共3个字节,每个像素的颜色就是由这3个字节中的数值直接决定,可生成的颜 色数就是24=16777216种。用3个字节表示的真彩色图像所需要的存储空间很大,而人的 眼睛是很难分辨出这么多种颜色的,因此在许多场合往往用RGB5:5:5来表示,每个彩色分 量占5个位,再加1位显示属性控制位共2个字节,生成的真颜色数目为25=32K。 在许多场合,真彩色图通常是指RGB8:8:8,即图像的颜色数等于22,也常称为全彩色 ( full color)图像。但在显示器上显示的颜色就不一定是真彩色,要得到真彩色图像需要有 真彩色显示适配器,目前在PC上用的VGA适配器是很难得到真彩色图像的。 2.伪彩色( pseudo color) 伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像 素值当作彩色査找表( color1ook- up table,CLUT)的表项入口地址,去查找一个显示图像 时使用的R,G,B值,用查找出的R,G,B值产生的彩色称为伪彩色 彩色查找表CLUT是一个事先做好的表,表项入口地址也称为索引号,如图图6-08(c)所 示。例如256种颜色的查找表,0号索引对应黑色,,255号索引对应白色。彩色图像本 身的像素数值和彩色查找表的索引号有一个变换关系,这个关系可以使用 Windows95/98定 义的变换关系,也可以使用你自己定义的变换关系。使用查找得到的数值显示的彩色是真的, 但不是图像本身真正的颜色,它没有完全反映原图的彩色
第5章 彩色数字图像基础 7 在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加1 位或几位作为属性(Attribute)位。例如,RGB 5∶5∶5表示一个像素时,用2个字节共16位 表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而图 像深度为15位。 属性位用来指定该像素应具有的性质。例如在CD-I系统中,用RGB 5∶5∶5表示的像素 共16位,其最高位(b15)用作属性位,并把它称为透明(Transparency)位,记为T。T的含义可 以这样来理解:假如显示屏上已经有一幅图存在,当这幅图或者这幅图的一部分要重叠在上 面时,T位就用来控制原图是否能看得见。例如定义T=1,原图完全看不见;T=0,原图能完 全看见。 在用32位表示一个像素时,若R,G,B分别用8位表示,剩下的8位常称为α通道(alpha channel)位,或称为覆盖(overlay)位、中断位或属性位。它的用法可用一个预乘α通道 (premultiplied alpha)的例子说明。假如一个像素(A,R,G,B)的四个分量都用规一化的 数值表示,(A,R,G,B)为(1,1,0,0)时显示红色。当像素为(0.5,1,0,0)时,预乘的结 果就变成(0.5,0.5,0,0),这表示原来该像素显示的红色的强度为1,而现在显示的红色的强 度降了一半。 用这种办法定义一个像素的属性在实际中很有用。例如在一幅彩色图像上叠加文字说 明,而又不想让文字把图覆盖掉,就可以用这种办法来定义像素,而该像素显示的颜色又有 人把它称为混合色(key color)。在图像产品生产中,也往往把数字电视图像和计算机生产 的图像混合在一起,这种技术称为视图混合(video keying)技术,它也采用α通道。 5.3.3 真彩色、伪彩色与直接色 搞清真彩色、伪彩色与直接色的含义,对于编写图像显示程序、理解图像文件的存储格 式有直接的指导意义,也不会对出现诸如这样的现象感到困惑:本来是用真彩色表示的图像, 但在VGA显示器上显示的图像颜色却不是原来图像的颜色。 1. 真彩色(true color) 真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色 分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB 5∶5∶5表示 的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得 到的彩色是真实的原图彩色。 如果用RGB 8:8:8方式表示一幅彩色图像,就是R,G,B都用8位来表示,每个基色分量 占一个字节,共3个字节,每个像素的颜色就是由这3个字节中的数值直接决定,可生成的颜 色数就是2 24 =16 777 216种。用3个字节表示的真彩色图像所需要的存储空间很大,而人的 眼睛是很难分辨出这么多种颜色的,因此在许多场合往往用RGB 5:5:5来表示,每个彩色分 量占5个位,再加1位显示属性控制位共2个字节,生成的真颜色数目为2 15 = 32K。 在许多场合,真彩色图通常是指RGB 8:8:8,即图像的颜色数等于2 24,也常称为全彩色 (full color)图像。但在显示器上显示的颜色就不一定是真彩色,要得到真彩色图像需要有 真彩色显示适配器,目前在PC上用的VGA适配器是很难得到真彩色图像的。 2. 伪彩色(pseudo color) 伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像 素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像 时使用的R,G,B值,用查找出的R,G,B值产生的彩色称为伪彩色。 彩色查找表CLUT是一个事先做好的表,表项入口地址也称为索引号,如图图6-08(c)所 示。例如256种颜色的查找表,0号索引对应黑色,... ,255号索引对应白色。彩色图像本 身的像素数值和彩色查找表的索引号有一个变换关系,这个关系可以使用Windows 95/98定 义的变换关系,也可以使用你自己定义的变换关系。使用查找得到的数值显示的彩色是真的, 但不是图像本身真正的颜色,它没有完全反映原图的彩色
第5章彩色数字图像基础 3.直接色( direct color) 每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相 应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它 的特点是对每个基色进行变换。 用这种系统产生颜色与真彩色系统相比,相同之处是都采用R,G,B分量决定基色强度, 不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定 因而这两种系统产生的颜色就有差别。试验结果表明,使用直接色在显示器上显示的彩色图 像看起来真实、很自然。 这种系统与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R,G,B分 量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换 5.4图像的种类 5.4.1矢量图与点位图 在计算机中,表达图像和计算机生成的图形图像有两种常用的方法:一种叫做是矢量图 ( vector based image)法,另一种叫点位图( bit mapped image)法。虽然这两种生成图的方 法不同,但在显示器上显示的结果几乎没有什么差别。 矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等 这种方法实际上是数学方法来描述一幅图,然后变成许多的数学表达式,再编程,用语言来 表达。在计算显示图时,也往往能看到画图的过程。绘制和显示这种图的软件通常称为绘图 程序( draw programs) 矢量图有许多优点。例如,当需要管理每一小块图像时,矢量图法非常有效;目标图像 的移动、缩小放大、旋转、拷贝、属性的改变(如线条变宽变细、颜色的改变)也很容易做到 相同的或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可以加速画 的生成,而且可以减小矢量图文件的大小 然而,当图变得很复杂时,计算机就要花费很长的时间去执行绘图指令。此外,对于 幅复杂的彩色照片(例如一幅真实世界的彩照),恐怕就很难用数学来描述,因而就不用矢量 法表示,而是采用点位图法表示 点位图法与矢量图法很不相同。其实,点位图已经在前面几节作了详细介绍,它是把 幅彩色图分成许多的像素,每个像素用若干个二进制位来指定该像素的颜色、亮度和属性。 因此一幅图由许多描述每个像素的数据组成,这些数据通常称为图像数据,而这些数据作为 个文件来存储,这种文件又称为图像文件。如要画点位图,或者编辑点位图,则用类似于 绘制矢量图的软件工具,这种软件称为画图程序( paint programs) 点位图的获取通常用扫描仪,以及摄像机、录相机、激光视盘与视频信号数字化卡一类 设备,通过这些设备把模拟的图像信号变成数字图像数据 介绍的图像分辨率和像素深度。分辨率越高,就是组成一幅图的像素越多,则图像文件越大 像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大。而矢量图文 件的大小则主要取决图的复杂程度 矢量图与点位图相比,显示点位图文件比显示矢量图文件要快:矢量图侧重于“绘制”、 去创造,而点位图偏重于“获取”、去“复制”:矢量图和点位图之间可以用软件进行转换, 由矢量图转换成点位图采用光栅化( rasterizing)技术,这种转换也相对容易;由点位图转 换成矢量图用跟踪( tracing)技术,这种技术在理论上说是容易,但在实际中很难实现,对 复杂的彩色图像尤其如此 5.4.2灰度图与彩色图 灰度图(gray- scale image)按照灰度等级的数目来划分。只有黑白两种颜色的图像称为 单色图像( monochrome image),如图5-05所示的标准图像。图中的每个像素的像素值用1位 存储,它的值只有“0”或者“1”,一幅640×480的单色图像需要占据37.5KB的存储空间
第5章 彩色数字图像基础 8 3. 直接色(direct color) 每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相 应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它 的特点是对每个基色进行变换。 用这种系统产生颜色与真彩色系统相比,相同之处是都采用R,G,B分量决定基色强度, 不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定。 因而这两种系统产生的颜色就有差别。试验结果表明,使用直接色在显示器上显示的彩色图 像看起来真实、很自然。 这种系统与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R,G,B分 量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。 5.4 图像的种类 5.4.1 矢量图与点位图 在计算机中,表达图像和计算机生成的图形图像有两种常用的方法:一种叫做是矢量图 (vector based image)法,另一种叫点位图(bit mapped image)法。虽然这两种生成图的方 法不同,但在显示器上显示的结果几乎没有什么差别。 矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。 这种方法实际上是数学方法来描述一幅图,然后变成许多的数学表达式,再编程,用语言来 表达。在计算显示图时,也往往能看到画图的过程。绘制和显示这种图的软件通常称为绘图 程序(draw programs)。 矢量图有许多优点。例如,当需要管理每一小块图像时,矢量图法非常有效;目标图像 的移动、缩小放大、旋转、拷贝、属性的改变(如线条变宽变细、颜色的改变)也很容易做到; 相同的或类似的图可以把它们当作图的构造块,并把它们存到图库中,这样不仅可以加速画 的生成,而且可以减小矢量图文件的大小。 然而,当图变得很复杂时,计算机就要花费很长的时间去执行绘图指令。此外,对于一 幅复杂的彩色照片(例如一幅真实世界的彩照),恐怕就很难用数学来描述,因而就不用矢量 法表示,而是采用点位图法表示。 点位图法与矢量图法很不相同。其实,点位图已经在前面几节作了详细介绍,它是把一 幅彩色图分成许多的像素,每个像素用若干个二进制位来指定该像素的颜色、亮度和属性。 因此一幅图由许多描述每个像素的数据组成,这些数据通常称为图像数据,而这些数据作为 一个文件来存储,这种文件又称为图像文件。如要画点位图,或者编辑点位图,则用类似于 绘制矢量图的软件工具,这种软件称为画图程序(paint programs)。 点位图的获取通常用扫描仪,以及摄像机、录相机、激光视盘与视频信号数字化卡一类 设备,通过这些设备把模拟的图像信号变成数字图像数据。 点位图文件占据的存储器空间比较大。影响点位图文件大小的因素主要有两个:即前面 介绍的图像分辨率和像素深度。分辨率越高,就是组成一幅图的像素越多,则图像文件越大; 像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大。而矢量图文 件的大小则主要取决图的复杂程度。 矢量图与点位图相比,显示点位图文件比显示矢量图文件要快;矢量图侧重于“绘制”、 去创造,而点位图偏重于“获取”、去“复制”;矢量图和点位图之间可以用软件进行转换, 由矢量图转换成点位图采用光栅化(rasterizing)技术,这种转换也相对容易;由点位图转 换成矢量图用跟踪(tracing)技术,这种技术在理论上说是容易,但在实际中很难实现,对 复杂的彩色图像尤其如此。 5.4.2 灰度图与彩色图 灰度图(gray-scale image)按照灰度等级的数目来划分。只有黑白两种颜色的图像称为 单色图像(monochrome image),如图5-05所示的标准图像。图中的每个像素的像素值用1位 存储,它的值只有“0”或者“1”,一幅640×480的单色图像需要占据37.5 KB的存储空间
第5章彩色数字图像基础 图5-06是一幅标准灰度图像。如果每个像素的像素值用一个字节表示,灰度值级数就等 于256级,每个像素可以是0~255之间的任何一个值,一幅640×480的灰度图像就需要占据 300KB的存储空间。 图5-05标准单色图 图5-06标准灰度图 彩色图像( color image)可按照颜色的数目来划分,例如256色图像和真彩色(2=1677 216种颜色)等。图5-07是一幅用256色标准图像转换成的256级灰度图像,彩色图像的每个像 素的R、G和B值用一个字节来表示,一幅640×480的8位彩色图像需要300KB的存储空间:图 5-08是一幅真彩色图像转换成的256级灰度图像,每个像素的R,G,B分量分别用一个字节表 示,一幅640×480的真彩色图像需要900KB的存储空间。 许多24位彩色图像是用32位存储的,这个附加的8位叫做 alpha通道,它的值叫做 alpha 值,它用来表示该像素如何产生特技效果 使用真彩色表示的图像需要很大的存储空间,在网络传输也很费时间。由于人的视角系 统的颜色分辨率不高,因此在没有必要使用真彩色的情况下就尽可能不用。 图5-07256色标准图像转换成的灰度图 图5-0824位标准图像转换成的灰度图
第5章 彩色数字图像基础 9 图5-06是一幅标准灰度图像。如果每个像素的像素值用一个字节表示,灰度值级数就等 于256级,每个像素可以是0~255之间的任何一个值,一幅640×480的灰度图像就需要占据 300 KB的存储空间。 图5-05 标准单色图 图5-06 标准灰度图 彩色图像(color image)可按照颜色的数目来划分,例如256色图像和真彩色(224=16 777 216种颜色)等。图5-07是一幅用256色标准图像转换成的256级灰度图像,彩色图像的每个像 素的R、G和B值用一个字节来表示,一幅640×480的8位彩色图像需要300 KB的存储空间;图 5-08是一幅真彩色图像转换成的256级灰度图像,每个像素的R,G,B分量分别用一个字节表 示,一幅640×480的真彩色图像需要900 KB的存储空间。 许多24位彩色图像是用32位存储的,这个附加的8位叫做alpha通道,它的值叫做alpha 值,它用来表示该像素如何产生特技效果。 使用真彩色表示的图像需要很大的存储空间,在网络传输也很费时间。由于人的视角系 统的颜色分辨率不高,因此在没有必要使用真彩色的情况下就尽可能不用。 图5-07 256色标准图像转换成的灰度图 图5-08 24位标准图像转换成的灰度图
第5章彩色数字图像基础 5.5伽马(y)校正 5.5.1y的概念 如果电子摄像机的输出电压与场景中光的强度成正比,如果CRT发射的光的强度与输入 电压成正比,…,凡是生成和显示图像的所有部件都是线性的话,那么图像处理就会变得比 较容易,图像程序员也就不会那么辛苦了!然而,现实世界并不是那样,目前几乎所有的CRT 显示设备、摄影胶片和许多电子照相机的光电转换特性都是非线性的。幸好这些非线性部件 都有一个能够反映各自特性的幂函数,它的一般形式是 y=x”→输出=(输入) 式中的y( gamma)是幂函数的指数,它用来衡量非线性部件的转换特性。这种特性称为幂 律( power-law)转换特性。按照惯例,“输入”和“输出”都缩放到0~1之间。其中,0表示 黑电平,1表示颜色分量的最高电平。对于特定的部件,人们可以度量它的输入与输出之间 的函数关系,从而找出γ值。 实际的图像系统是由多个部件组成的,这些部件中可能会有几个非线性部件。如果所有 部件都有幂函数的转换特性,那么整个系统的传递函数就是一个幂函数,它的指数y等于所 有单个部件的y的乘积。如果图像系统的整个y=1,输出与输入就成线性关系。这就意味在 重现图像中任何两个图像区域的强度之比率与原始场景的两个区域的强度之比率相同,这似 乎是图像系统所追求的目标:真实地再现原始场景。但实际情况却不完全是这样。 当这种再生图像在“明亮环境”下,也就是在其他白色物体的亮度与图像中白色部分的 亮度几乎相同的环境下观看时,γ=1的系统的确可使图像看起来像“原始场景”一样。但 是某些图像有时在“黑暗环境”下观看所获得的效果会更好,放映电影和投影幻灯片就属于 这种情况。在这种情况下,y值不是等于1而通常认为y≈1.5,人的视角系统所看到的场景 就好像是“原始场景”。根据这种观点,投影幻灯片的γ值就设计为1.5左右,而不是1。 还有一种环境称为中间环境的“暗淡环境”,这种环境就像房间中的其他东西能够看到, 但比图像中白色部分的亮度更暗。看电视的环境和计算机房的环境就属于这种情况。在这种 情况下,通常认为再现图像需要γ≈1.25才能看起来像“原始场景” 55.2y校正 所有CRT显示设备都有幂-律转换特性,如果生产厂家不加说明,那么它的y值大约等于 2.5。用户对发光的磷光材料的特性可能无能为力去改变,因而也很难改变它的y值。为使 整个系统的γ值接近于使用所要求的γ值,起码就要有一个能够提供γ校正的非线性部件 用来补偿CRT的非线性特性 在所有广播电视系统中,γ校正是在摄像机中完成的。最初的NTSC电视标准需要摄像机 具有y=1/2.2=0.45的幂函数,现在采纳y=0.5的幂函数。PAL和 SECAM电视标准指定摄像 机需要具有γ=1/2.8=0.36的幂函数,但这个数值已显得太小,因此实际的摄像机很可能 会设置成=0.45或者0.5。使用这种摄像机得到的图像就预先做了校正,在y=2.5的CRT 屏幕上显示图像时,屏幕图像相对于原始场景的γ大约等于1.25。这个值适合“暗淡环境” 下观看。 过去的时代是“模拟时代”,而今已进入“数字时代”,进入计算机的电视图像依然带 有y=0.5的校正,这一点可不要忘记。虽然带有γ值的电视在数字时代工作得很好,尤其 是在特定环境下创建的图像在相同环境下工作,可是在其他环境下工作时,往往会使显示的 图像让人看起来显得太亮或者太暗,因此在可能条件下就要做y校正 在什么地方做γ校正是人们所关心的问题。从获取图像、存储成图像文件、读出图像文 件直到在某种类型的显示屏幕上显示图像,这些个环节中至少有5个地方可有非线性转换函 数存在并可引入γ值。例如 camera_ gamma:摄像机中图像传感器的γ(通常y=0.4或者0.5) encoding_ gamma:编码器编码图像文件时引入γ decoding_ gamma:译码器读图像文件时引入y
第5章 彩色数字图像基础 10 5.5 伽马( )校正 5.5.1 γ的概念 如果电子摄像机的输出电压与场景中光的强度成正比,如果CRT发射的光的强度与输入 电压成正比,…,凡是生成和显示图像的所有部件都是线性的话,那么图像处理就会变得比 较容易,图像程序员也就不会那么辛苦了!然而,现实世界并不是那样,目前几乎所有的CRT 显示设备、摄影胶片和许多电子照相机的光电转换特性都是非线性的。幸好这些非线性部件 都有一个能够反映各自特性的幂函数,它的一般形式是: n y x = 输出=(输入) γ 式中的γ(gamma)是幂函数的指数,它用来衡量非线性部件的转换特性。这种特性称为幂- 律(power-law)转换特性。按照惯例,“输入”和“输出”都缩放到0~1之间。其中,0表示 黑电平,1表示颜色分量的最高电平。对于特定的部件,人们可以度量它的输入与输出之间 的函数关系,从而找出γ值。 实际的图像系统是由多个部件组成的,这些部件中可能会有几个非线性部件。如果所有 部件都有幂函数的转换特性,那么整个系统的传递函数就是一个幂函数,它的指数γ等于所 有单个部件的γ的乘积。如果图像系统的整个=1,输出与输入就成线性关系。这就意味在 重现图像中任何两个图像区域的强度之比率与原始场景的两个区域的强度之比率相同,这似 乎是图像系统所追求的目标:真实地再现原始场景。但实际情况却不完全是这样。 当这种再生图像在“明亮环境”下,也就是在其他白色物体的亮度与图像中白色部分的 亮度几乎相同的环境下观看时,γ=1的系统的确可使图像看起来像“原始场景”一样。但 是某些图像有时在“黑暗环境”下观看所获得的效果会更好,放映电影和投影幻灯片就属于 这种情况。在这种情况下,γ值不是等于1而通常认为γ1.5,人的视角系统所看到的场景 就好像是“原始场景”。根据这种观点,投影幻灯片的γ值就设计为1.5左右,而不是1。 还有一种环境称为中间环境的“暗淡环境”,这种环境就像房间中的其他东西能够看到, 但比图像中白色部分的亮度更暗。看电视的环境和计算机房的环境就属于这种情况。在这种 情况下,通常认为再现图像需要γ1.25才能看起来像“原始场景”。 5.5.2 γ校正 所有CRT显示设备都有幂-律转换特性,如果生产厂家不加说明,那么它的γ值大约等于 2.5。用户对发光的磷光材料的特性可能无能为力去改变,因而也很难改变它的γ值。为使 整个系统的γ值接近于使用所要求的γ值,起码就要有一个能够提供γ校正的非线性部件, 用来补偿CRT的非线性特性。 在所有广播电视系统中,γ校正是在摄像机中完成的。最初的NTSC电视标准需要摄像机 具有γ=1/2.2=0.45的幂函数,现在采纳γ=0.5的幂函数。PAL和SECAM电视标准指定摄像 机需要具有γ=1/2.8=0.36的幂函数,但这个数值已显得太小,因此实际的摄像机很可能 会设置成γ=0.45或者0.5。使用这种摄像机得到的图像就预先做了校正,在γ=2.5的CRT 屏幕上显示图像时,屏幕图像相对于原始场景的γ大约等于1.25。这个值适合“暗淡环境” 下观看。 过去的时代是“模拟时代”,而今已进入“数字时代”,进入计算机的电视图像依然带 有γ=0.5的校正,这一点可不要忘记。虽然带有γ值的电视在数字时代工作得很好,尤其 是在特定环境下创建的图像在相同环境下工作,可是在其他环境下工作时,往往会使显示的 图像让人看起来显得太亮或者太暗,因此在可能条件下就要做γ校正。 在什么地方做γ校正是人们所关心的问题。从获取图像、存储成图像文件、读出图像文 件直到在某种类型的显示屏幕上显示图像,这些个环节中至少有5个地方可有非线性转换函 数存在并可引入γ值。例如, ⚫ camera_gamma:摄像机中图像传感器的γ(通常γ=0.4或者0.5) ⚫ encoding_gamma:编码器编码图像文件时引入γ ⚫ decoding_gamma :译码器读图像文件时引入γ