正在加载图片...
1.2.2基于推理的视觉理论 由于只根据图象数据本身不能对相应的物体空间结构提供充分的约束,也就是说这是 个约束不充分( underconstrained)的问题。因此,为了理解图象的内容必须要有附加的约束 条件。 Gestalt心理学家发现的感知组织现象是一种非常有力的关于象素整体性的附加约束 从而为视觉推理提供了基础。 Gestalt是德文 Gestalt的译音。英文中常译成form(形式)或 shape(形状)。 Gestalt心理学家所研究的出发点是“形”,它是指从由知觉活动组织成的 经验中的整体。换言之,格式塔心理学家认为任何“形”都是知觉进行了积极组织或构造的 结果或功能,而不是客体本身就有的。在视觉研究中 Gestalt理论认为把点状数据聚集成整 体特征的聚集过程是所有其它有意义的处理过程的基础。人的视觉系统具有在对景物中的物 体一无所知的情况下从景物的图象中得到相对的聚集( grouping)和结构的能力。这种能力 被称为感知组织。按 Gestalt理论感知组织的基本原理被称为 Pragman,意即“简约合宜”。 它来源于 Gestalt心理学家发现有些“形”给人的的感受是极为愉悦的。这就是那些在特定 条件下视觉刺激被组织得最好、最规则(对称、统一、和谐)、具有最大限度的简单明了性 的“形”。对这种形他们发明了一个独特的字眼,即 Pragnant,有人把这个词译成“完形”。 人的视觉系统具有很强的检测多种图案和随机的、但又有显著特色的图象元素排列的能力 例如,人可从随机分布的图象元素中立即检测出对称性、集群、共线性、平行性、连通性和 重复纹理等。感知组织把点状的传感数据变换成客观的表象。在这些表象中用于描述的词藻 不是以点状形式定义的图象中的灰度,而是如形状、形态、运动和空间分布这样的描述。由 感知组织完成的这样的变换可被看作与对实函数作 Fourier变换相似。在作 Fourier分析时, 个函数是以 Fourier域中的 Fourier分量来表示的。利用 Fourier分析,我们可以用一组 Fourier系数来描述一个函数。这样做的优点是用一组有限的系数就可提供一个良好的整体 描述,这样使复杂性大为降低。虽然,很可能这个函数没有一个点的值是被正确地表示出来 这里就象是在感知中那样,局部与整体虽然是相互联系的,但本质上是不同的。总之,感知 组织对传感器数据进行了整体的分析,得到一组宏观的表象。这样的宏观表象就是我们在进 行认知活动时使用的基本构件,用它们可构成我们对外部世界的描述 Gestalt理论反映了人类视觉本质的某些方面,但它对感知组织的基本原理只是一种公理 性的描述,而不是一种机理性的描述。因此自从在本世纪二十年代提出以来未能对视觉研究 产生根本性的指导作用。但是研究者对感知组织原理的研究一直没有停止。特别是在80年 代以后, Witkin和 Tenenbaum win83, LowelLowe86l, Pentland[Pen8等人在感知组织的原理, 以及在视觉处理中的应用等方面取得了新的重要研究成果 12.3现有视觉理论的革新 如前所述计算机视觉研究的发展开始于60年代初,在基本研究方面取得显著进展是在 70年代末和80年代。这主要归功于Mar的视觉计算理论的推动。这个理论立足于计算机 科学,系统地概括了心理物理学、神经生理学、临床病理神经学等方面已取得的所有重要成 果,是迄今为止最系统的视觉理论。Mar理论的出现无论对人工智能硏宄和神经科学的发 展都产生了深远的影响。Mar理论的出现使得80年代的计算机视觉的研究与以前相比有显 著不同。主要表现在研究内容和方向集中在与人类视觉系统中的感知独立模块相对应的课题 上,也就是根据影调、运动、立体、轮廓、纹理等线索恢复物体表面的形状。这些硏究极大 地深化了计算机视觉的研究。但是Mar的视觉计算理论还不能被认为是一个完善的理论。 它没能反映人类视觉的某些重要的本质,这就是人类视觉中的选择性和整体性 人类视觉最显著的特点之一是有选择性。这是指观察者的注意力总是有目的地指向他最 66 1.2.2 基于推理的视觉理论 由于只根据图象数据本身不能对相应的物体空间结构提供充分的约束,也就是说这是一 个约束不充分(underconstrained)的问题。因此,为了理解图象的内容必须要有附加的约束 条件。Gestalt 心理学家发现的感知组织现象是一种非常有力的关于象素整体性的附加约束。 从而为视觉推理提供了基础。Gestalt 是德文 Gestalt 的译音。英文中常译成 form(形式)或 shape(形状)。Gestalt 心理学家所研究的出发点是“形”,它是指从由知觉活动组织成的 经验中的整体。换言之,格式塔心理学家认为任何“形”都是知觉进行了积极组织或构造的 结果或功能,而不是客体本身就有的。在视觉研究中 Gestalt 理论认为把点状数据聚集成整 体特征的聚集过程是所有其它有意义的处理过程的基础。人的视觉系统具有在对景物中的物 体一无所知的情况下从景物的图象中得到相对的聚集(grouping)和结构的能力。这种能力 被称为感知组织。按 Gestalt 理论感知组织的基本原理被称为 Pragmant,意即“简约合宜”。 它来源于 Gestalt 心理学家发现有些“形”给人的的感受是极为愉悦的。这就是那些在特定 条件下视觉刺激被组织得最好、最规则(对称、统一、和谐)、具有最大限度的简单明了性 的“形”。对这种形他们发明了一个独特的字眼,即 Pragnant,有人把这个词译成“完形”。 人的视觉系统具有很强的检测多种图案和随机的、但又有显著特色的图象元素排列的能力。 例如,人可从随机分布的图象元素中立即检测出对称性、集群、共线性、平行性、连通性和 重复纹理等。感知组织把点状的传感数据变换成客观的表象。在这些表象中用于描述的词藻 不是以点状形式定义的图象中的灰度,而是如形状、形态、运动和空间分布这样的描述。由 感知组织完成的这样的变换可被看作与对实函数作 Fourier 变换相似。在作 Fourier 分析时, 一个函数是以 Fourier 域中的 Fourier 分量来表示的。利用 Fourier 分析,我们可以用一组 Fourier 系数来描述一个函数。这样做的优点是用一组有限的系数就可提供一个良好的整体 描述,这样使复杂性大为降低。虽然,很可能这个函数没有一个点的值是被正确地表示出来。 这里就象是在感知中那样,局部与整体虽然是相互联系的,但本质上是不同的。总之,感知 组织对传感器数据进行了整体的分析,得到一组宏观的表象。这样的宏观表象就是我们在进 行认知活动时使用的基本构件,用它们可构成我们对外部世界的描述。 Gestalt 理论反映了人类视觉本质的某些方面,但它对感知组织的基本原理只是一种公理 性的描述,而不是一种机理性的描述。因此自从在本世纪二十年代提出以来未能对视觉研究 产生根本性的指导作用。但是研究者对感知组织原理的研究一直没有停止。特别是在 80 年 代以后,Witkin 和 Tenenbaum[Win 83],Lowe[Lowe 86],Pentland[Pen 86]等人在感知组织的原理, 以及在视觉处理中的应用等方面取得了新的重要研究成果。 1.2.3 现有视觉理论的革新 如前所述计算机视觉研究的发展开始于 60 年代初,在基本研究方面取得显著进展是在 70 年代末和 80 年代。这主要归功于 Marr 的视觉计算理论的推动。这个理论立足于计算机 科学,系统地概括了心理物理学、神经生理学、临床病理神经学等方面已取得的所有重要成 果,是迄今为止最系统的视觉理论。Marr 理论的出现无论对人工智能研究和神经科学的发 展都产生了深远的影响。Marr 理论的出现使得 80 年代的计算机视觉的研究与以前相比有显 著不同。主要表现在研究内容和方向集中在与人类视觉系统中的感知独立模块相对应的课题 上,也就是根据影调、运动、立体、轮廓、纹理等线索恢复物体表面的形状。这些研究极大 地深化了计算机视觉的研究。但是 Marr 的视觉计算理论还不能被认为是一个完善的理论。 它没能反映人类视觉的某些重要的本质,这就是人类视觉中的选择性和整体性。 人类视觉最显著的特点之一是有选择性。这是指观察者的注意力总是有目的地指向他最
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有