正在加载图片...
感兴趣的事物。一般生物最注意的是环境中时常变化的事物,忽略固定不变的事物。因为这 样就可以迅速辨别出什么是对自己有益的,什么是对自己有害的。从而作出攫取或躲避反应 另一个重要的特点,如 Gestalt心理学家发现的那样,是人类具有对图象数据进行组织归纳 的能力,也就是在多个层次上发现图象数据的规则性( regularity 性( Coherence) 连续性( Continuity)等整体特性的能力。实验证明,人类视觉系统具有在低层处理中获取 图象拓扑特性的能力学86 Mar^的理论完全不考虑视觉中的选择性和整体性,把初级视觉硏究的目标确定为按照 各种物理模型和附加约束条件,根据图象中各点灰度或其它测量结果,恢复景物中表面的有 关特性,如表面方向、深度、反射率等。但由于图象中各点的灰度是光照,表面材料的反射 特性、表面方向、观察方位等多种因素共同作用的结果。并且在成象过程中失去了各点的距 离信息,所以,根据图象中的测量值(如灰度)恢复相应表面的三维特性(如,深度、方向), 从本质上来说是一个约束不充分( underconstrained)的问题。也就是说,图象的测量值本身 不能提供充分的信息来恢复相应表面的三维信息。因此,为能根据Marr理论恢复表面的三 维信息必须增加附加的约束条件。例如,把物体仅限于刚体的范围,假设表面是连续的,各 向同性的:或更为特殊的约束,如表面是由平面构成,点光源照明,材料的反射率为常数等。 这些约束条件只能在某些人造环境下(例如在所谓的“积木世界”)得到满足,而在自然界 或实际情况下通常是不满足的。而且即使具备了这些条件,目前采用的大多数求解方法类似 于求解经典的边值问题。总的来说性能比较脆弱,容易出错。Mar理论的这些困难在80年 代末已经暴露得较为明显。 由上述分析可知,现有的两种视觉信息的处理理论各自遇到了严重的困难,还都不能自 成系统地、可靠地处理视觉问题。因此,有的硏究者提出了各种设想对上述理论提出了修改, 并试图把这两种方法以取长补短的方式结合起来[ witkin83] 种改进的设想是基于模型的视觉理论[Gb67][Pen86][Gb82]。这种理论认为 信息的概念是与从一组候选的对象中作出选择相联系。如果不知道一组可供选择的刺激或响 应,人们就对刺激或响应无从说起。此外,人们还必须知道定义这组候选物和对这组候选物 的成员进行区别的特性或特征。而且随着要解决的任务不同,这些特征和特性也不同的。例 如,在视觉敏感中,刺激引起在视网膜的一组可能的状态中选择一种状态,并得到一幅图象。 在感知中,选择是根据不变量( Constancies)和参数( Parameters)作出的。如果一个婴儿 能听到声音,但他的感知不变量只包括“安静”和“噪声”的话,那么任何音乐对他来说者 将包括一样多的信息,而这些音乐对一个训练有素的音乐家来说就会包含丰富得多的信息 此外这种视觉理论利用特征检测器的概念作为把点状的图象数据与宏观信息相联系的 桥梁[ Pentland86]。因此,基于模型的视觉理论体现了 Gestalt理论中的选择和整体性 另一种改进的设想是连接主义模型( Connectionist model of vision)[Fel80,82,85][Bal 84,86]。动物的大脑进行计算的方式不同于当前传统的串行计算机。动物神经单元的计算 相对是比较慢的。但它们之间具有复杂的并行连接,形成高度的并行计算结构。当前神经科 学中的许多研究都是关于探索这些连接,以及试图发现这些连接是如何传递信息的。视觉的 连接主义理论的基本前提是认为单个神经元并不传递大量的符号信息,而是通过与许多相似 的神经元以适当方式相连接来完成计算。从点状的图象数据变换成一个整体的描述需要大量 的计算,如前所述,这对目前的串行计算机来说是难以承受的。而上述并行计算结构则提供 了一种可能的途径。连接主义模型的视觉理论认为 Hough变换起重要作用。 Hough变换利 用样板或模型(即圆周、直线、和其它几何形状)和参数(变量)来完成点状传感器数据到 整体描述的聚集。此外, Hough变换从本质上来说是适合于由并行结构来实现。 Ballard还 提出了连接主义模型的计算结构,详见[Bal84 77 感兴趣的事物。一般生物最注意的是环境中时常变化的事物,忽略固定不变的事物。因为这 样就可以迅速辨别出什么是对自己有益的,什么是对自己有害的。从而作出攫取或躲避反应。 另一个重要的特点,如 Gestalt 心理学家发现的那样,是人类具有对图象数据进行组织归纳 的能力,也就是在多个层次上发现图象数据的规则性(regularity)、一致性(Coherence)、 连续性(Continuity)等整体特性的能力。实验证明,人类视觉系统具有在低层处理中获取 图象拓扑特性的能力[钱学森 86]。 Marr 的理论完全不考虑视觉中的选择性和整体性,把初级视觉研究的目标确定为按照 各种物理模型和附加约束条件,根据图象中各点灰度或其它测量结果,恢复景物中表面的有 关特性,如表面方向、深度、反射率等。但由于图象中各点的灰度是光照,表面材料的反射 特性、表面方向、观察方位等多种因素共同作用的结果。并且在成象过程中失去了各点的距 离信息,所以,根据图象中的测量值(如灰度)恢复相应表面的三维特性(如,深度、方向), 从本质上来说是一个约束不充分(underconstrained)的问题。也就是说,图象的测量值本身 不能提供充分的信息来恢复相应表面的三维信息。因此,为能根据 Marr 理论恢复表面的三 维信息必须增加附加的约束条件。例如,把物体仅限于刚体的范围,假设表面是连续的,各 向同性的;或更为特殊的约束,如表面是由平面构成,点光源照明,材料的反射率为常数等。 这些约束条件只能在某些人造环境下(例如在所谓的“积木世界”)得到满足,而在自然界 或实际情况下通常是不满足的。而且即使具备了这些条件,目前采用的大多数求解方法类似 于求解经典的边值问题。总的来说性能比较脆弱,容易出错。Marr 理论的这些困难在 80 年 代末已经暴露得较为明显。 由上述分析可知,现有的两种视觉信息的处理理论各自遇到了严重的困难,还都不能自 成系统地、可靠地处理视觉问题。因此,有的研究者提出了各种设想对上述理论提出了修改, 并试图把这两种方法以取长补短的方式结合起来[witkin 83]。 一种改进的设想是基于模型的视觉理论[Gib 67][Pen 86][Gib82]。这种理论认为 信息的概念是与从一组候选的对象中作出选择相联系。如果不知道一组可供选择的刺激或响 应,人们就对刺激或响应无从说起。此外,人们还必须知道定义这组候选物和对这组候选物 的成员进行区别的特性或特征。而且随着要解决的任务不同,这些特征和特性也不同的。例 如,在视觉敏感中,刺激引起在视网膜的一组可能的状态中选择一种状态,并得到一幅图象。 在感知中,选择是根据不变量(Constancies)和参数(Parameters)作出的。如果一个婴儿 能听到声音,但他的感知不变量只包括“安静”和“噪声”的话,那么任何音乐对他来说者 将包括一样多的信息,而这些音乐对一个训练有素的音乐家来说就会包含丰富得多的信息。 此外这种视觉理论利用特征检测器的概念作为把点状的图象数据与宏观信息相联系的 桥梁[Pentland 86]。因此,基于模型的视觉理论体现了 Gestalt 理论中的选择和整体性。 另一种改进的设想是连接主义模型(Connectionist model of vision)[Fel 80, 82, 85][Bal 84, 86]。动物的大脑进行计算的方式不同于当前传统的串行计算机。动物神经单元的计算 相对是比较慢的。但它们之间具有复杂的并行连接,形成高度的并行计算结构。当前神经科 学中的许多研究都是关于探索这些连接,以及试图发现这些连接是如何传递信息的。视觉的 连接主义理论的基本前提是认为单个神经元并不传递大量的符号信息,而是通过与许多相似 的神经元以适当方式相连接来完成计算。从点状的图象数据变换成一个整体的描述需要大量 的计算,如前所述,这对目前的串行计算机来说是难以承受的。而上述并行计算结构则提供 了一种可能的途径。连接主义模型的视觉理论认为 Hough 变换起重要作用。Hough 变换利 用样板或模型(即圆周、直线、和其它几何形状)和参数(变量)来完成点状传感器数据到 整体描述的聚集。 此外,Hough 变换从本质上来说是适合于由并行结构来实现。Ballard 还 提出了连接主义模型的计算结构,详见[Bal 84]
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有