第八章纹理 8.1概述 8.1.1纹理的定义 8.12纹理的描述和分析方法 8.1.3纹理基元与影调 8.1.4纹理研究的领域 82人类视觉系统的纹理分割模式 8.3纹理描述 83.1测量纹理特性的统计方法 832纹理的空间频率特性 83.3纹理描述的结构方法 81概述 811纹理的定义 尽管纹理在图象分类和图象分析中是很重要的特性,并且它几乎无所不在,从多光谱卫 星图片到细胞组织的图象都可以看到纹理,但目前对纹理还没有精确的定义。图81中的 D34图是通过把特定的子图象有规则地重复,由人工产生的纹理。图8.1中的其它部分 图8.1人造和自然纹理图案 则是更为复杂的自然纹理。图象纹理可定性地用以下一种或几种描述来表征:粗的、细的、 平滑的、颗粒状的、随机的、线划状的或斑驳杂色的、不规则的和波纹状的。从图8.1所示 的纹理可看到纹理是一种有组织的区域现象,它的基本特征是移不变性( shift invariance) 也即对纹理的视觉感知基本上与其在图象中的位置无关。移不变性可被描述成是确定性的
160 第八章 纹 理 8.1 概述 8.1.1 纹理的定义 8.1.2 纹理的描述和分析方法 8.1.3 纹理基元与影调 8.1.4 纹理研究的领域 8.2 人类视觉系统的纹理分割模式 8.3 纹理描述 8.3.1 测量纹理特性的统计方法 8.3.2 纹理的空间频率特性 8.3.3 纹理描述的结构方法 8.1 概述 8.1.1 纹理的定义 尽管纹理在图象分类和图象分析中是很重要的特性,并且它几乎无所不在,从多光谱卫 星图片到细胞组织的图象都可以看到纹理,但目前对纹理还没有精确的定义。图 8.1 中的 D34 图是通过把特定的子图象有规则地重复,由人工产生的纹理。图 8.1 中的其它部分 图 8.1 人造和自然纹理图案 则是更为复杂的自然纹理。图象纹理可定性地用以下一种或几种描述来表征:粗的、细的、 平滑的、颗粒状的、随机的、线划状的或斑驳杂色的、不规则的和波纹状的。从图 8.1 所示 的纹理可看到纹理是一种有组织的区域现象,它的基本特征是移不变性(shift invariance), 也即对纹理的视觉感知基本上与其在图象中的位置无关。移不变性可被描述成是确定性的
(规则的或结构的)或是随机的(不规则的),但很可能存在着介于这两者之间的类别。确 定性的图案通常是人造的,并且由线条、三角形、矩形、圆、多边形有规律的排列组成,而 随机图象则通常是自然界产生的。 812纹理的描述和分析方法 描述纹理图象ρ的简单数学模型是 P=R(SK 其中R是位移(或关系)规则,Sk是象素的小区域,它构成了纹理基元(元素)。Sk本身 又是输入图象I(,〕的函数。以下对纹理的研究也是从纹理基元和位移或关系规则这两方面 进行的。由于纹理基元的重要性,下面我们将先对它进行单独讨论 纹理分析方法主要有两类,一类是统计的方法,另一类是结构分析的方法。统计的方 法对纹理进行分析,并描述图案p的特征。结构分析的方法则试图通过研究(8-1)式中的R和 Sk的特性来揭示纹理的细节。这样做显然要困难得多,这也是为什么人们倾向于采用统计 方法的原因。但是,如果R和Sk有明碓的定义或已知,那么用结构分析的方法就很简单。 按方程(8-1)的观点,可以从两个方面描述纹理。第一个方面用于描述组成纹理的基元 第二个方面用于描述纹理基元之间的空间联系或相互影响。第一个方面与纹理区域中的影调 基本分布情况(称为影调基元)或局部特性有关。第二个方面与影调基元的空间组织有关。 纹理区域 纹理基元 纹理基元之间 属性 的空间关系 度属性 区域属性 基元区域 空间组织方式 类型 均值其它 形状‖其它 结构的函数的 极值 面积 极值 统计的 图82纹理分析方法 影调基元是具有确定影调特性的区域,可以用诸如平均灰度,或区域中的最大和最小灰 度这样的特性来描述。把具有给定影调特性的象素最大程度地连接起来就组成了影调基元 可以按它的面积和形状来评价影调基元。影调基元不但包括它的灰度而且包括它的影调的区 域特性。 纹理可用纹理基元的数量和类型以及这些基元的空间组织或排列来描述。纹理的空间组 织可能是随机的,也可能一个基元对相邻基元有成对的依赖关系,或者几个基元同时相互关 联。这样的关联可能是结构的、概率的或是函数的。纹理分析的方法可用示意图82表示 813纹理基元与影调 个纹理基元(不严格地说)是一个具有一定的不变特性的视觉基元。这些不变特性在 给定区域内的不同位置上,以不同的变形和不同的方向重复出现。纹理基元最基本的不变特 性之一是区域内象素的灰度分布,在更为复杂的情况下可能还有与形状有关的特性,而影 也是表示灰度的明暗分布。因此,我们认为影调和纹理不是独立的概念,它们之间的关系很 象光波中的粒子性与波动性之间的关系。光在任何时候都有粒子性和波动性,但是根据具体
161 (规则的或结构的)或是随机的(不规则的),但很可能存在着介于这两者之间的类别。确 定性的图案通常是人造的,并且由线条、三角形、矩形、圆、多边形有规律的排列组成,而 随机图象则通常是自然界产生的。 8.1.2 纹理的描述和分析方法 描述纹理图象 的简单数学模型是: = R Sk ( ) (8-1) 其中 R 是位移(或关系)规则, Sk 是象素的小区域,它构成了纹理基元(元素)。 Sk 本身 又是输入图象 I(i, j)的函数。以下对纹理的研究也是从纹理基元和位移或关系规则这两方面 进行的。由于纹理基元的重要性,下面我们将先对它进行单独讨论。 纹理分析方法主要有两类, 一类是统计的方法,另一类是结构分析的方法。统计的方 法对纹理进行分析,并描述图案 的特征。结构分析的方法则试图通过研究(8-1)式中的 R 和 Sk 的特性来揭示纹理的细节。这样做显然要困难得多,这也是为什么人们倾向于采用统计 方法的原因。但是,如果 R 和 Sk 有明碓的定义或已知,那么用结构分析的方法就很简单。 按方程(8-1)的观点,可以从两个方面描述纹理。第一个方面用于描述组成纹理的基元; 第二个方面用于描述纹理基元之间的空间联系或相互影响。第一个方面与纹理区域中的影调 基本分布情况(称为影调基元)或局部特性有关。第二个方面与影调基元的空间组织有关。 纹理区域 纹理基元之间 的空间关系 纹理基元 属性 灰度属性 区域属性 其它 极值 平均值 其它 面积 形状 基元区域 空间组织方式 类型 极值 函数的 统计的 结构的 图 8.2 纹理分析方法 影调基元是具有确定影调特性的区域,可以用诸如平均灰度,或区域中的最大和最小灰 度这样的特性来描述。把具有给定影调特性的象素最大程度地连接起来就组成了影调基元, 可以按它的面积和形状来评价影调基元。影调基元不但包括它的灰度而且包括它的影调的区 域特性。 纹理可用纹理基元的数量和类型以及这些基元的空间组织或排列来描述。纹理的空间组 织可能是随机的,也可能一个基元对相邻基元有成对的依赖关系,或者几个基元同时相互关 联。这样的关联可能是结构的、概率的或是函数的。纹理分析的方法可用示意图 8.2 表示。 8.1.3 纹理基元与影调 一个纹理基元(不严格地说)是一个具有一定的不变特性的视觉基元。这些不变特性在 给定区域内的不同位置上,以不同的变形和不同的方向重复出现。纹理基元最基本的不变特 性之一是区域内象素的灰度分布,在更为复杂的情况下可能还有与形状有关的特性,而影调 也是表示灰度的明暗分布。因此,我们认为影调和纹理不是独立的概念,它们之间的关系很 象光波中的粒子性与波动性之间的关系。光在任何时候都有粒子性和波动性,但是根据具体
情况粒子性或是波动性可能占主导地位。相似地,在图象中总存在影调和纹理,只是有时 种特性相对于另一种特性占优势。在实际问题的处理中,为了简便,我们经常倾向于认为只 有影调或只有纹理。因此,当我们定义影调和纹理时,我们不是定义两种概念,而是定义影 调一纹理概念 影调一纹理概念内部的基本关系如下所述:当在图象的一定面积区域中影调基元的变化 很小时,这个区域的主导特性是影调。当在小面积区域中含大量不同的影调,这个区域占主 导的特性是纹理。按这种区分方法,关键点是小面积区域的大小,影调基元的相对大小和类 型以及可区分的影调数量的多少。事实上,当小面积区域小到只有一个分辨率单元大小,以 至只有一种独立的特性时,表现出来的唯一特性就是简单的灰度影调。当小面积区域中可区 分的影调基元数量增加时,纹理特性将占主导。当影调基元中的空间图案是随机的,以及基 元之间的灰度影调的变化范围很广时,这就得到精细的纹理。当空间图案变得较为确定以及 影调区域涉及较多的象素时,就得到粗糙的纹理 图象表现出的影调一纹理特性与图象的分辨率密切相关。因为在纹理基元定义中的一个 重要部分是基元要在给定区域中重复出现,问题是重复多少次?为了定性地回答这个问题, 可以想象把一个近似等于我们视场的窗口迭加到一个很大的纹理区域上。随着这个窗口逐渐 变小,这相当于移动视点逐渐靠近纹理,这时包含在窗口内的纹理越来越少。到某一距离时 窗口内的图象不再出现纹理。如果窗口逐渐增大,这相当于视场逐渐远离图象,也会发生类 似的效果。当增大到某一距离时,纹理细节逐渐模糊,变成连续的影调,当窗口平移时,再 也看不到重复的纹理基元。因此,在定义纹理时需要有合适分辨率的概念。在此合适分辨率 之下,纹理将是明显的,而且随视场在纹理区域内移动时,纹理“看起来是一样的”。通常 合适分辨率并不知道,但必须计算出来。 ConnorsICon8l提出一种通过检查图象中重复的最大 值来计算合适分辨率的方法。 纹理可以是分级的。不同级相应于不同的分辨率。“砖墙”纹理可以说明这样的分级性 质。在某一分辨率之下,可明显看到由砖组成的结构性很强的图象,而分辨率更高时,则可 看到每块砖表面的细致纹理 814纹理研究的领域 纹理研究的领域大致可分成三种类型。第一类是纹理的描述和分类。这类问题在图象识 别中有重要应用,因此已经引起了广泛的重视。例如,在医学图象处理中利用纹理特性来区 别正常细胞和癌细胞。这时,就要先抽取这两种细胞图象的纹理特性,然后进行分类识别。 第二类是以纹理为特征的图象分割。第三类是利用纹理信息推断物体的深度信息或表面方 向 纹理可提供关于可见表面几何结构的重要信息。首先研究这个问题的是 Gibson gib50.6 因为图象本身不能提供求解所需的足够信息,为此要对纹理的几何特性作出假设。 Gibson 假设纹理基元在物体平面上的分布密度是均匀的。他发现这时根据图象中纹理基元密度的梯 度可以确定表面的方向。如图8.3所示,在纹理基元分布均匀的条件下,表面倾斜方向在图 象中的投影就是局部纹理密度变化量大的方向,或者说是垂直于纹理基元分布最均匀的那个 方向。在图83(b)所示的情况下,按后一种方法就是寻找与透视直线等间隔相交的直线方向 (见图8.3(c)。但是, StevensITe。的研究发现在透视投影的条件下纹理密度梯度既取决于 表面方向,又取决于物体的距离和位置。因此纹理基元密度并不是表面方向的良好测量。由 于纹理对恢度表面方向的重要性,所以在这方面已进行了大量研究。详见[Baj76][Wit8l [ Ken 80
162 情况粒子性或是波动性可能占主导地位。相似地,在图象中总存在影调和纹理,只是有时一 种特性相对于另一种特性占优势。在实际问题的处理中,为了简便,我们经常倾向于认为只 有影调或只有纹理。因此,当我们定义影调和纹理时,我们不是定义两种概念,而是定义影 调—纹理概念。 影调—纹理概念内部的基本关系如下所述:当在图象的一定面积区域中影调基元的变化 很小时,这个区域的主导特性是影调。当在小面积区域中含大量不同的影调,这个区域占主 导的特性是纹理。按这种区分方法,关键点是小面积区域的大小,影调基元的相对大小和类 型以及可区分的影调数量的多少。事实上,当小面积区域小到只有一个分辨率单元大小,以 至只有一种独立的特性时,表现出来的唯一特性就是简单的灰度影调。当小面积区域中可区 分的影调基元数量增加时,纹理特性将占主导。当影调基元中的空间图案是随机的,以及基 元之间的灰度影调的变化范围很广时,这就得到精细的纹理。当空间图案变得较为确定以及 影调区域涉及较多的象素时,就得到粗糙的纹理。 图象表现出的影调—纹理特性与图象的分辨率密切相关。因为在纹理基元定义中的一个 重要部分是基元要在给定区域中重复出现,问题是重复多少次?为了定性地回答这个问题, 可以想象把一个近似等于我们视场的窗口迭加到一个很大的纹理区域上。随着这个窗口逐渐 变小,这相当于移动视点逐渐靠近纹理,这时包含在窗口内的纹理越来越少。到某一距离时, 窗口内的图象不再出现纹理。如果窗口逐渐增大,这相当于视场逐渐远离图象,也会发生类 似的效果。当增大到某一距离时,纹理细节逐渐模糊,变成连续的影调,当窗口平移时,再 也看不到重复的纹理基元。因此,在定义纹理时需要有合适分辨率的概念。在此合适分辨率 之下,纹理将是明显的,而且随视场在纹理区域内移动时,纹理“看起来是一样的”。通常 合适分辨率并不知道,但必须计算出来。Connors[Con 81]提出一种通过检查图象中重复的最大 值来计算合适分辨率的方法。 纹理可以是分级的。不同级相应于不同的分辨率。“砖墙”纹理可以说明这样的分级性 质。在某一分辨率之下,可明显看到由砖组成的结构性很强的图象,而分辨率更高时,则可 看到每块砖表面的细致纹理。 8.1.4 纹理研究的领域 纹理研究的领域大致可分成三种类型。第一类是纹理的描述和分类。这类问题在图象识 别中有重要应用,因此已经引起了广泛的重视。例如,在医学图象处理中利用纹理特性来区 别正常细胞和癌细胞。这时,就要先抽取这两种细胞图象的纹理特性,然后进行分类识别。 第二类是以纹理为特征的图象分割。第三类是利用纹理信息推断物体的深度信息或表面方 向。 纹理可提供关于可见表面几何结构的重要信息。首先研究这个问题的是 Gibson[Gib 50, 66]。 因为图象本身不能提供求解所需的足够信息,为此要对纹理的几何特性作出假设。Gibson 假设纹理基元在物体平面上的分布密度是均匀的。他发现这时根据图象中纹理基元密度的梯 度可以确定表面的方向。如图 8.3 所示,在纹理基元分布均匀的条件下,表面倾斜方向在图 象中的投影就是局部纹理密度变化量大的方向,或者说是垂直于纹理基元分布最均匀的那个 方向。在图 8.3(b)所示的情况下,按后一种方法就是寻找与透视直线等间隔相交的直线方向 (见图 8.3(c))。但是,Stevens[Ste 80]的研究发现在透视投影的条件下纹理密度梯度既取决于 表面方向,又取决于物体的距离和位置。因此纹理基元密度并不是表面方向的良好测量。由 于纹理对恢度表面方向的重要性,所以在这方面已进行了大量研究。详见[Baj 76] [Wit 81] [Ken 80]
号 图83根据纹理基元密度梯度恢度表面方向 82人类视觉系统的纹理分割模型 根据已有的证据,人类视觉系统是以图84中所示的方式进行纹理分割的。首先假设, 输入的图象是以并行的方式在多通道中进行处理的。表示输入图象在不同频率范围中特性的 输出向量被用于计算一定面积内的粗细度、对比度和边缘方向。这三个特性是影响聚集 粗细序A1 测量 图象 I(,j) A S=Sx 多通道 边缘方 模型 向测量 逻辑谓 对比度]43 词P 测量 低层特 计算的 性 属性 图84纹理分割的模型 过程的主要因素。多通道模型的输出是一组区域S={Sk},k=1,2,…,m,这些区域是根 据逻辑谓词P对图象I(,j的采样网格X进行分割的结果。逻辑谓词定义了进行聚集的条件。 163
163 图 8.3 根据纹理基元密度梯度恢度表面方向 8.2 人类视觉系统的纹理分割模型 根据已有的证据,人类视觉系统是以图 8.4 中所示的方式进行纹理分割的。首先假设, 输入的图象是以并行的方式在多通道中进行处理的。表示输入图象在不同频率范围中特性的 输出向量被用于计算一定面积内的粗细度、对比度和边缘方向。这三个特性是影响聚集 A1 I(i, j) 低层特 性 图象 逻辑谓 词 P 边缘方 向测量 对比度 测量 粗细度 测量 多通道 模型 A2 A3 S=Sx 计算的 属性 图 8.4 纹理分割的模型 过程的主要因素。多通道模型的输出是一组区域 S = Sk, k = 1, 2, ,m ,这些区域是根 据逻辑谓词 P 对图象 I(I, j)的采样网格 X 进行分割的结果。逻辑谓词定义了进行聚集的条件
按照图8-4所示的模型,纹理分析是一个通用的处理过程,也就是说它与图象内容特定的应 用范围无关,这也符合低层视觉处理的定义。这可能意味着在人类视觉中纹理的辨别是在双 目立体视觉融合以后,发生在大脑皮层 人们可用来描述纹理的性质有,均匀性( Uniformity)、密度( density)、粗细度 ( Coarseness)、粗糙度( roughness、规律性( regularity)、线性度( linearity)、定向性 ( directionality)、方向性( direction)、频率( frequency)和相位( phase)。这些性质的理想 化如图8.5所示。显然,这些性质是相互联系的。虽然,目前还不完全清楚人类视觉系统中 实际应用多少种性质来描述纹理,但可比较有把握地说,上述性质中的大多数并未用到。所 以在图84的模型中仅限于三种性质的量测 人们用来描述纹理最常用的词藻是粗的或细的[am78]。什么是粗的纹理、什么是细的 纹理目前还无精确的定义。粗略地讲,我们通过观察组成图案的纹理基元,如果这些基元的 尺寸较大,或有许多重复的基元,则给人总的印象是粗的。例如,图8.1中的D98和D111 所示的纹理。已有人提出了检测纹理粗、细程度的多通道模型。[she80的做法是在一个小 区域里检査一组不同频率通道的输出,选择其中响应最强的通道。空间频率最低的通道被认 为表示是粗的纹理,那么高空间频率通道就被认为表示细的纹理。由于通道的响应大小不但 由基元的大小,而且由分布规律所决定。所以还需要在一个领域里作出每个通道响应的直方 图曲线[ zucKer75],通过分析这些曲线的特性就能确定纹理的粗细。 (a) Uniformity (b)Density (c) Coarseness (d) Roughness 夏 (e)regularit (f)Linearity = (g) Directionality (h) Direction (i) Frequency (j)Phase 图8.5描述纹理的性质 描述纹理的第二个特性是边缘元素的方向,或斜率。心理物理学的实验研究表明这个特 性非常重要。图8.6(a)中的实验表明了基元斜率对区别纹理的强烈影响。正放的和倾斜的T 形之间很容易区分。L形和正放的T形之间在形状上很不同,但似乎可以聚集成一个区域 图8.6(b中证明了相似的效应。图中包括猫、旋转的猫和猫的镜象。当要求被试验者确定图
164 按照图 8-4 所示的模型,纹理分析是一个通用的处理过程,也就是说它与图象内容特定的应 用范围无关,这也符合低层视觉处理的定义。这可能意味着在人类视觉中纹理的辨别是在双 目立体视觉融合以后,发生在大脑皮层。 人们可用来描述纹理的性质有,均匀性(Uniformity)、密度(density)、粗细度 (Coarseness)、粗糙度(roughness)、规律性(regularity)、线性度(linearity)、定向性 (directionality)、方向性(direction)、频率(frequency)和相位(phase)。这些性质的理想 化如图 8.5 所示。显然,这些性质是相互联系的。虽然,目前还不完全清楚人类视觉系统中 实际应用多少种性质来描述纹理,但可比较有把握地说,上述性质中的大多数并未用到。所 以在图 8.4 的模型中仅限于三种性质的量测。 人们用来描述纹理最常用的词藻是粗的或细的[Tam 78]。什么是粗的纹理、什么是细的 纹理目前还无精确的定义。粗略地讲,我们通过观察组成图案的纹理基元,如果这些基元的 尺寸较大,或有许多重复的基元,则给人总的印象是粗的。例如,图 8.1 中的 D98 和 D111 所示的纹理。已有人提出了检测纹理粗、细程度的多通道模型。[she 80]的做法是在一个小 区域里检查一组不同频率通道的输出,选择其中响应最强的通道。空间频率最低的通道被认 为表示是粗的纹理,那么高空间频率通道就被认为表示细的纹理。由于通道的响应大小不但 由基元的大小,而且由分布规律所决定。所以还需要在一个领域里作出每个通道响应的直方 图曲线[zucKer 75],通过分析这些曲线的特性就能确定纹理的粗细。 图 8.5 描述纹理的性质 描述纹理的第二个特性是边缘元素的方向,或斜率。心理物理学的实验研究表明这个特 性非常重要。图 8.6(a)中的实验表明了基元斜率对区别纹理的强烈影响。正放的和倾斜的 T 形之间很容易区分。L 形和正放的 T 形之间在形状上很不同,但似乎可以聚集成一个区域。 图 8.6(b)中证明了相似的效应。图中包括猫、旋转的猫和猫的镜象。当要求被试验者确定图
象中的边界时,最常发生的是选择右边的边界[Beck82]。虽然从单个来看,中间的猫与右 面猫的镜象比与左面旋转的猫相比更相似些。 我们可以把纹理分成有方向性的和无方向性的两种。同样地,纹理基元的形状和分布规 律都会影响我们对纹理方向性的感知。这里仍采用多通道模型,对多通道的输出信号用边缘 检测算子产生在特定方向θ上的边缘段。然后求出边缘方向的直方图,直方图的形状就可以 说明纹理的方向性。如果直方图上具有尖锐和较大的高峰,那么说明这是方向性的纹理:如 果直方图较平坦,那么就是非方向性纹理 第三个被研究的重要特性是图象的对比度。对比度可以根据图象的灰度分布求得。在人 类视觉的纹理感知中粗细度和方向性的作用己得到实验的有力支持。对比度在其中的作用得 到某些实验结果的支持,但它占的重要性还未完全清楚。通常认为图象灰度直方图的形状不 应影响对纹理的感知,而灰度直方图又是与图象的对比度有关。因此这个问题还有待进一步 研究 入入、入 入 入入 入入 入 入 」TT千X入入入 ttt111214E 官t宫t玄1311【 图86影响纹理区分的因素 (a)基元斜率的影响,(b)图形的镜象由于斜率不同于原始图形,更容易与原始图象相区分 83纹理的描述 831测量纹理特性的统计方法 最早是用自相关函数来作纹理特性的测量,然后又采用功率谱、马尔可夫过程和并发 矩阵(co- occurrence matrⅸx)来统计。纹理特性的统计方法测量主要用于在航测照片中自动 识别草地、水面、树林、田野等自然景物的种类。用统计方法分析纹理的过程如图87所示 I(,j) ,YT 输入图象 标量,向量 纹理特性 或矩阵 图87统计方法分析纹理的过程 图中通过T变换测量图象中纹理的统计特性,它的输出Y可是标量、向量或是矩阵。这 165
165 象中的边界时,最常发生的是选择右边的边界[Beck 82]。虽然从单个来看,中间的猫与右 面猫的镜象比与左面旋转的猫相比更相似些。 我们可以把纹理分成有方向性的和无方向性的两种。同样地,纹理基元的形状和分布规 律都会影响我们对纹理方向性的感知。这里仍采用多通道模型,对多通道的输出信号用边缘 检测算子产生在特定方向上的边缘段。然后求出边缘方向的直方图,直方图的形状就可以 说明纹理的方向性。如果直方图上具有尖锐和较大的高峰,那么说明这是方向性的纹理;如 果直方图较平坦,那么就是非方向性纹理。 第三个被研究的重要特性是图象的对比度。对比度可以根据图象的灰度分布求得。在人 类视觉的纹理感知中粗细度和方向性的作用已得到实验的有力支持。对比度在其中的作用得 到某些实验结果的支持,但它占的重要性还未完全清楚。通常认为图象灰度直方图的形状不 应影响对纹理的感知,而灰度直方图又是与图象的对比度有关。因此这个问题还有待进一步 研究。 图 8.6 影响纹理区分的因素 (a) 基元斜率的影响,(b) 图形的镜象由于斜率不同于原始图形,更容易与原始图象相区分 8.3 纹理的描述 8.3.1 测量纹理特性的统计方法 最早是用自相关函数来作纹理特性的测量,然后又采用 功率谱、马尔可夫过程和并发 矩阵(co-occurrence matrix)来统计。纹理特性的统计方法测量主要用于在航测照片中自动 识别草地、水面、树林、田野等自然景物的种类。用统计方法分析纹理的过程如图 8.7 所示。 I(i, j) A(i, j) 输入图象 标量,向量 纹理特性 或矩阵 T1 T2 Y 图 8.7 统计方法分析纹理的过程 图中通过 T1 变换测量图象中纹理的统计特性,它的输出 Y 可是标量、向量或是矩阵。这
取决于所采用的方法。如果是向量或矩阵,那么这样的数据还要经过聚集处理,以得到单 的测量。这就是图中T2处理的作用,它的输出是求得的纹理属性A(ij)。大多数情况下Ai j)是一个标量。如前所述,通常认为纹理的观察与光照无关。对计算机来说为达到相似的效 果,通常先用等概率量化EPQ( Equal Probability Quantization)对图象作预处理"os。如果 假设用摄象机、照相机底片、或扫描器作输入的图象系统中的各个阶段都可用单调函数关系 来表示的话,那么用EPQ可以使各种处理图象的对比度规整化。因为如果两幅图象的灰度 互为单调变换,那么经过EPQ规整处理以后就具有相同的概率分布函数田町列。这样的预处 理的作用尚不清楚,因为对人的心理物理学实验证明事实上人利用对比度来区分纹理。由于 经过EPQ处理后,图象之间在一阶统计量上的区别被消除了,所以一阶统计量的区分作用 被大为降低。这时二阶统计量就成为主要的测量。 832纹理的空间频率特性 如果我们把纹理理想化地看成是由形状相似的基元在空间均匀分布产生的,那么纹理分 布的规律性就可以用自相关函数、 Fourier变换和功率谱密度函数来量测 1.自相关函数 自相关函数可用来表示纹理基元的大小和分布情况。设想把同一张纹理图象复制到两张 透明胶片上。开始时把这两张胶片对齐迭放,并置于均匀光照之下,然后把其中一张胶片相 对于另一张沿某一特定方向作相对位移,并记录这时两张重迭胶片的透光量。透光量随胶片 相对位移的变化函数就是图象的自相关函数。根据自相关函数的峰点和谷点分布就可以分析 纹理基元的大小和分布情况 二维自相关函数被定义为 ∑ (,j)l(+Ax,j+△y) △ (8-2) ∑[(, 其中i和j被限于特定的窗口,这相当于假设在此区域以外的图象为零。增量位移 d=(△x,△y),这个值可以是负的。对给定图象来说,自相关函数在d=0时为最大值1,并 随正向和负向位移以指数函数下降。中央峰点的斜率可表示纹理的粗细度。如果纹理基元较 大,则自相关函数的下降相对缓慢:与此相反,基元较小,则下降迅速。当是周期性的或规 则的纹理图案时,那么Y(Ax,Δy)就会周期性地出现最大值。而当自相关函数是圆对称时就 表示纹理是各向同性的。遗憾的是对于自然纹理的区别来说,已发现自相关函数不是一个很 好的测量指标。因为不同自然纹理的自相关函数曲线相差不多。 自相关函数是个线性的模型。相似的还可用自回归函数( autoregressionI eg8。但这种方 法无法描述具有重复微细结构的纹理lmod8l 2.空间 Fourier变换和功率谱函数 用二维空间 Fourier变换来描述纹理的优点是这种方法容易发现图象在空间域中的特 性,例如,可检测纹理基元的大致大小和基元的空间组织。但缺点是对EPQ这样的线性变 换来说, Fourier变换不能保持不变性。而更为严重的困难是,为了正确地检测纹理的特性 在作变换时要求足够大的图象矩阵。而在进行纹理分割时,这是难以实现的。 功率谱的方法是以图象I(,j的 Fourier变换为基础的: F(u1)=∑∑1(i)eM(m+m) =0,1,…,N-1,v=0,…,N
166 取决于所采用的方法。如果是向量或矩阵,那么这样的数据还要经过聚集处理,以得到单一 的测量。这就是图中 T2 处理的作用,它的输出是求得的纹理属性 A(i, j)。大多数情况下 A(i, j)是一个标量。如前所述,通常认为纹理的观察与光照无关。对计算机来说为达到相似的效 果,通常先用等概率量化 EPQ(Equal Probability Quantization)对图象作预处理[Con 78]。如果 假设用摄象机、照相机底片、或扫描器作输入的图象系统中的各个阶段都可用单调函数关系 来表示的话,那么用 EPQ 可以使各种处理图象的对比度规整化。因为如果两幅图象的灰度 互为单调变换,那么经过 EPQ 规整处理以后就具有相同的概率分布函数 [Har 79]。这样的预处 理的作用尚不清楚,因为对人的心理物理学实验证明事实上人利用对比度来区分纹理。由于 经过 EPQ 处理后,图象之间在一阶统计量上的区别被消除了,所以一阶统计量的区分作用 被大为降低。这时二阶统计量就成为主要的测量。 8.3.2 纹理的空间频率特性 如果我们把纹理理想化地看成是由形状相似的基元在空间均匀分布产生的,那么纹理分 布的规律性就可以用自相关函数、Fourier 变换和功率谱密度函数来量测。 1. 自相关函数 自相关函数可用来表示纹理基元的大小和分布情况。设想把同一张纹理图象复制到两张 透明胶片上。开始时把这两张胶片对齐迭放,并置于均匀光照之下,然后把其中一张胶片相 对于另一张沿某一特定方向作相对位移,并记录这时两张重迭胶片的透光量。透光量随胶片 相对位移的变化函数就是图象的自相关函数。根据自相关函数的峰点和谷点分布就可以分析 纹理基元的大小和分布情况。 二维自相关函数被定义为: ( ) Y x y I i j I i x j y I i j ij ij , ( , ) ( , ) ( , ) = + + 2 (8-2) 其中 i 和 j 被限于特定的窗口,这相当于假设在此区域以外的图象为零。增量位移 d = (x, y) ,这个值可以是负的。对给定图象来说,自相关函数在 d=0 时为最大值 1,并 随正向和负向位移以指数函数下降。中央峰点的斜率可表示纹理的粗细度。如果纹理基元较 大,则自相关函数的下降相对缓慢;与此相反,基元较小,则下降迅速。当是周期性的或规 则的纹理图案时,那么 Y(x, y) 就会周期性地出现最大值。而当自相关函数是圆对称时就 表示纹理是各向同性的。遗憾的是对于自然纹理的区别来说,已发现自相关函数不是一个很 好的测量指标。因为不同自然纹理的自相关函数曲线相差不多。 自相关函数是个线性的模型。相似的还可用自回归函数(autoregression)[Deg 78]。但这种方 法无法描述具有重复微细结构的纹理[mod 81]。 2. 空间 Fourier 变换和功率谱函数 用二维空间 Fourier 变换来描述纹理的优点是这种方法容易发现图象在空间域中的特 性,例如,可检测纹理基元的大致大小和基元的空间组织。但缺点是对 EPQ 这样的线性变 换来说,Fourier 变换不能保持不变性。而更为严重的困难是,为了正确地检测纹理的特性, 在作变换时要求足够大的图象矩阵。而在进行纹理分割时,这是难以实现的。 功率谱的方法是以图象 I(i, j) 的 Fourier 变换为基础的: 0,1, , 1, 0,1, , 1 ( ) 2 1 ( , ) exp 1 ( , ) 1 0 1 0 = − = − + − − = − = − = u N v N iu jv N I i j N F u v N i N j (8-3)
F(uv)的幅度就是图象I(,j的功率谱,即 P(v)=R, F(upP)+[ vp (8-4) 其中R[F()和[F(n)分别表示的F()实部和虚部。图象(,八的相位谱 P(u, v)=arctan R F(u,v) 纹理的粗细度可用P(lv)的分布特性来表示。如果P(v)中幅度高的部分集中在 (u,v)=(0,0)附近,这表示是粗的纹理。因为低频分量与大的基元相联系。相反,如果P(l,v) 主要分布在远离(0,0)处,这时高频区域的P(uy)有较高的幅度,这表示纹理中包含较细致 的图案。纹理的方向性也可以由P(Lν)来表示。功率谱不随位移变化,但随纹理的方向变 化。因此,它可以反映纹理的方向信息。如果纹理图象具有较强的朝某一方向的分量,那么 P(u1ν)的高幅度值将排列在某个特定方向上,这个方向与图案的走向垂直。如果纹理无明 显的走向,那么Pu,v)也无显著的定向性 为了简化功率谱的解释,可把二维的功率谱函数压缩成一维的表示形式。为此需要采用 极坐标系(r,φ),其中r是以原点为中心的圆周半径,φ是极位角。这时我们可分别计算在 半径为r的圆周上功率谱P(r,φ)的平均值的功率谱。我们先来计算在圆环中的功率谱P(r)。 在半径为r的圆周上功率谱Pr,d)中平均值为 P(r)=F(r,l'do (8-6) 在内径为,外径为n2的圆环上的功率谱为 P()=「F(pb 在离散情况下,对NXN的图象公式为: P(n,n2)=∑F(x) (8-8) n≤+v≤n2,0≤l,v≤N-1 这样就得到了功率谱随频率域内圆环半径变化的一维表示形式。圆环半径与空间频率成 正比,因此这种表示方法可更方便地说明功率谱的分布与纹理粗细之间的关系。 为检测功率谱分布的方向性,可计算扇形区内的功率谱P(1,p2) (8-9) 其中φ和φ2是规定扇形区范围的两个角度。 在离散的情况下 sac()<中2,0<arsN-1 (8-10) 这样就得到了功率谱随角度φ变化的一维表示形式P(φ)。P(φ)的分布情况直接说明了纹理 的方向性。图88所示为某纹理的P(n1n2)和P(,2)。图中的频率1,2,4,81664对应的 纹理基元的大小分别为128,64,32,16,8,4,2,和1。扇形区的角度为36°
167 F(u, v) 的幅度就是图象 I(i, j) 的功率谱,即 2 1 2 2 P(u,v) R F(u,v) I F(u,v) = e + e (8-4) 其中 ReF(u, v) 和 Ie F(u, v) 分别表示的 F(u, v) 实部和虚部。图象 I(i, j) 的相位谱 = ( , ) ( , ) ( , ) arctan R F u v I F u v u v e e (8-5) 纹理的粗细度可用 P(u, v) 的分布特性来表示。如果 P(u, v) 中幅度高的部分集中在 (u, v) = (0, 0) 附近,这表示是粗的纹理。因为低频分量与大的基元相联系。相反,如果 P(u, v) 主要分布在远离 (0, 0) 处,这时高频区域的 P(u, v) 有较高的幅度,这表示纹理中包含较细致 的图案。纹理的方向性也可以由 P(u, v) 来表示。功率谱不随位移变化,但随纹理的方向变 化。因此,它可以反映纹理的方向信息。如果纹理图象具有较强的朝某一方向的分量,那么 P(u, v) 的高幅度值将排列在某个特定方向上,这个方向与图案的走向垂直。如果纹理无明 显的走向,那么 P(u, v) 也无显著的定向性。 为了简化功率谱的解释,可把二维的功率谱函数压缩成一维的表示形式。为此需要采用 极坐标系 (r, ) ,其中 r 是以原点为中心的圆周半径, 是极位角。这时我们可分别计算在 半径为 r 的圆周上功率谱 P(r, ) 的平均值的功率谱。我们先来计算在圆环中的功率谱 P(r) 。 在半径为 r 的圆周上功率谱 P(r, ) 中平均值为: P(r) = F(r, ) d 2 0 2 (8-6) 在内径为 r1 ,外径为 r2 的圆环上的功率谱为 P r r F r d dr r r ( , ) ( , ) 1 2 2 0 2 1 2 = (8-7) 在离散情况下,对 N×N 的图象公式为: P r r F(u v) r u v r u v N ( , ) , , , 1 2 2 1 2 2 2 2 2 0 1 = + − (8-8) 这样就得到了功率谱随频率域内圆环半径变化的一维表示形式。圆环半径与空间频率成 正比,因此这种表示方法可更方便地说明功率谱的分布与纹理粗细之间的关系。 为检测功率谱分布的方向性,可计算扇形区内的功率谱 P( , ) 1 2 P( , ) F(r, ) d dr 1 2 2 0 1 2 = (8-9) 其中 1 和 2 是规定扇形区范围的两个角度。 在离散的情况下: 1 2 0 1 arctan , , − v u u v N (8-10) 这样就得到了功率谱随角度 变化的一维表示形式 P() 。 P() 的分布情况直接说明了纹理 的方向性。图 8.8 所示为某纹理的 P(r , r ) 1 2 和 P( , ) 1 2 。图中的频率 1, 2, ,4, 8, 16, 64,对应的 纹理基元的大小分别为 128, 64, 32, 16, 8, 4, 2, 和 1。扇形区的角度为 36
D20 D20 l68
168
5678910 x2 Sestet Kane 图8.8纹理的功率谱和P(φ,p2 (a)纹理原图,(b)Fori变换,()o{P,h2)18号圆环的半径周围分别为0,1[ 2],[2,4][48,[8,16[16,32][3264和64,128],(d)bog[P(φ12)角度在180—180°范围 内均匀等分。 需要说明的是,利用 Fourier变换来描述纹理特性的前提是假设图象l(,j)是周期性的, 但实际上纹理不是严格周期性的,这就局限了这种方法的有效性。同时由于图象边界处的不 连续性会在变换的水平和垂直方向上产生虚假的分量,为减弱这个效应,可在处理的纹理区
169 图 8.8 纹理的功率谱和 P( , ) 1 2 (a) 纹理原图,(b) Fourier 变换,(c) logP(r1 , r2 ) 1-8 号圆环的半径周围分别为[0, 1], [1, 2], [2, 4], [4, 8], [8, 16], [16, 32], [32, 64]和[64, 128],(d) log ( , ) P 1 2 角度在-180—180范围 内均匀等分。 需要说明的是,利用 Fourier 变换来描述纹理特性的前提是假设图象 I(i, j) 是周期性的, 但实际上纹理不是严格周期性的,这就局限了这种方法的有效性。同时由于图象边界处的不 连续性会在变换的水平和垂直方向上产生虚假的分量,为减弱这个效应,可在处理的纹理区