象中的影调信息获得物体的形状?”,“在解决视觉问题中光度学可起什么作用?”,“如 果应用光度学还不足以解决问题,那么对环境的本质需做什么假设,以便用作求解时的约束 条件”等。相比之下,在图象处理中经常被采用的松驰标记法所涉及的问题是根据应用环境 把合理的约束直接写入到算法中去,它只不过是一种编写程序的风格而已,并不涉及视觉理 论本身。因此,对松驰标记法的研究是属于信息处理的第二个层次,它不应是人工智能领域 中研究的重点。 2.1.2视觉系统的表象( representation) 如前所述,Mar认为视觉是一个信息处理任务。Mar同时又指出视觉和处理并不完全 相同。因为如果我们能够认识外部世界有什么东西在什么地方,那么我们的大脑必须以某种 方式表象( representating)这种信息——以尽可能丰富的色彩、形状、美感、运动和细节等 多方面来表象这种信息。所以,视觉研究不仅必须探讨我们是如何从图象中提取外部世界中 对我们有用的各个方面,而且还必须探讨内部的表象。所谓表象是指一种能把某种实体或某 几类信息表达清楚的形式化系统,以及说明该系统如何行使其职能的若干规则。使用某一种 表象描述一个给定的实体所得到的结果称为该实体在这种表象下的一个描述。例如,阿拉伯 数制,二进制数制,它们都是表象“数”的形式化系统。阿拉伯数字表象由数集(0,1,2,…,8,9) 中所抽取的一串符号组成;构造特定整数n的描述规则是:先把n分解为数符与位值的乘积 之和,位值用10的幂表示,再按幂的大小把数符自左向右排成一行。因此叁拾柒等于3 101+7×10变成37,即该数在阿拉伯制下的描述。这个描述明确表达了数按10的整数幂所 作的分解。在二进制数制中,数叁拾柒的描述是100101:它明确表达的则是数按2的幂所 作的展开,但这样的描述不可能一蹴而就,而要通过构造一连串的表象来实现。这些表象开 始于直接从图象中得出的描述,而每一个表象都将有助于尔后进行的处理工作,经过一步 步的处理,逐步恢复物体形状的越来越客观的物理性质。按照Mar的设想,从图象推得形 状信息的过程分成三个表象阶段:初始简图( primal sketch)、2.5维简图(2.5 dimensional sketch)和三维模型(3 D model) 决定图象亮度的主要因素有四个。它们是:(1)几何关系:(2)可见表面的反射情况 (3)景物的照明情况:(4)观察点的方位;在图象中所有这些因素是混杂在一起的。某些灰 度变化是由某一种因素引起的,而另一些变化则是由另一种因素引起的,还有一些变化则是 由几种因素共同作用的结果。在视觉处理的第一阶段(即低层视觉阶段)所作处理的目的就 是要分清楚哪一些变化是由哪一些因素引起的,进而建立一些表象,用这些表象把上述四个 因素区分开来。大体上说,可通过两个步骤来实现这一目的。第一步,由图象中的变化和结 构获得适当的表象。这包括检测亮度的变化,表象并分析局部的几何结构,以及检测光源 强光部( highlight)和透明度等照明效应。总之,这是关于二维图象性质的表象。这一步得 到的表象称为初始简图。第二步,对初始简图进行一系列处理运算,推导出一个能反映可见 表面几何特征的表象。其中包括表面朝向,观察者的距离,以及朝向和距离的不连续性,表 面的反射情况,以及对主要照明情况的某种粗略的描述。第二步得到的表象称为2.5维简图18 象中的影调信息获得物体的形状?”,“在解决视觉问题中光度学可起什么作用?”,“如 果应用光度学还不足以解决问题,那么对环境的本质需做什么假设,以便用作求解时的约束 条件”等。相比之下,在图象处理中经常被采用的松驰标记法所涉及的问题是根据应用环境 把合理的约束直接写入到算法中去,它只不过是一种编写程序的风格而已,并不涉及视觉理 论本身。因此,对松驰标记法的研究是属于信息处理的第二个层次,它不应是人工智能领域 中研究的重点。 2.1.2 视觉系统的表象(representation) 如前所述,Marr 认为视觉是一个信息处理任务。Marr 同时又指出视觉和处理并不完全 相同。因为如果我们能够认识外部世界有什么东西在什么地方,那么我们的大脑必须以某种 方式表象(representating)这种信息——以尽可能丰富的色彩、形状、美感、运动和细节等 多方面来表象这种信息。所以,视觉研究不仅必须探讨我们是如何从图象中提取外部世界中 对我们有用的各个方面,而且还必须探讨内部的表象。所谓表象是指一种能把某种实体或某 几类信息表达清楚的形式化系统,以及说明该系统如何行使其职能的若干规则。使用某一种 表象描述一个给定的实体所得到的结果称为该实体在这种表象下的一个描述。例如,阿拉伯 数制,二进制数制,它们都是表象“数”的形式化系统。阿拉伯数字表象由数集(0,1,2,…,8,9) 中所抽取的一串符号组成;构造特定整数 n 的描述规则是:先把 n 分解为数符与位值的乘积 之和,位值用 10 的幂表示,再按幂的大小把数符自左向右排成一行。因此叁拾柒等于 3× 101 +7×100 变成 37,即该数在阿拉伯制下的描述。这个描述明确表达了数按 10 的整数幂所 作的分解。在二进制数制中,数叁拾柒的描述是 100101;它明确表达的则是数按 2 的幂所 作的展开,但这样的描述不可能一蹴而就,而要通过构造一连串的表象来实现。这些表象开 始于直接从图象中得出的描述,而每一个表象都将有助于尔后进行的处理工作,经过一步一 步的处理,逐步恢复物体形状的越来越客观的物理性质。按照 Marr 的设想,从图象推得形 状信息的过程分成三个表象阶段:初始简图(primal sketch)、2.5 维简图(2.5 dimensional sketch)和三维模型(3D model)。 决定图象亮度的主要因素有四个。它们是:(1) 几何关系;(2) 可见表面的反射情况; (3) 景物的照明情况;(4) 观察点的方位;在图象中所有这些因素是混杂在一起的。某些灰 度变化是由某一种因素引起的,而另一些变化则是由另一种因素引起的,还有一些变化则是 由几种因素共同作用的结果。在视觉处理的第一阶段(即低层视觉阶段)所作处理的目的就 是要分清楚哪一些变化是由哪一些因素引起的,进而建立一些表象,用这些表象把上述四个 因素区分开来。大体上说,可通过两个步骤来实现这一目的。第一步,由图象中的变化和结 构获得适当的表象。这包括检测亮度的变化,表象并分析局部的几何结构,以及检测光源、 强光部(highlight)和透明度等照明效应。总之,这是关于二维图象性质的表象。这一步得 到的表象称为初始简图。第二步,对初始简图进行一系列处理运算,推导出一个能反映可见 表面几何特征的表象。其中包括表面朝向,观察者的距离,以及朝向和距离的不连续性,表 面的反射情况,以及对主要照明情况的某种粗略的描述。第二步得到的表象称为 2.5 维简图