另一方面,自60年代以来对人类视觉的研究也已取得了一系列重要的成果。 Hubel和 Wiesel,W62,681关于大脑视皮层细脑感受野的论述,以及 Campell和 Robes(cam6关于视觉 系统空间频率通道的论述是其中两项最重要的研究成果。如果把视觉看成是一种信息处理过 程,上述结果就形成了两种不同观点:一些人认为视皮层是特征检测器,另一些人则认为视 皮层是某种空间 Fourier分析器。同时,这两种观点又都有不少无法解释的实验结果。因此, 对人类视觉的研究迫切地需要理论的指导。美国麻省理工学院(MT)人工智能实验室的 DMar教授就是在这种情况下,立足于计算机科学,总结了心理物理学、神经生理学、临 床神经病学等在视觉研究上己取得成果的基础上提出了视觉计算理论。他的理论对人工智能 和神经科学都产生了深远的影响 西方的思维科学来源于逻辑和计算理论,根据这个理论, Newell和 Simonlnew8提出了 物理符号系统的概念。他们认为无论计算机与人脑在硬件结构上如何不同,但从计算理论的 层次上来说它们都是具有产生、操作和处理抽象符号能力的物理符号系统。物理符号系统对 思维科学来说就象进化论对任何生物学那样是基础。在这样的计算理论看来,任何一种复杂 的精神智力活动在本质上都是以离散符号处理为核心的计算过程。这种以逻辑和计算理论为 核心的一系列概念加深了我们对智力本质的认识。Mar提出的视觉计算理论与此是一脉相 通的。他的计算理论使人们对视觉机理的研宄提高到一个新水平。 Mar^的视觉计算理论是首次提出的阐述视觉机理的系统理论,并且对人类视觉和计算 机视觉的研究都产生了深远的推动作用。但它还远未解决建立人类视觉计算理论的问题。如 以后的章节中将会讨论的那样在实践中也已遇到了一些严重困难。因此这个理论还需要通过 研究不断改进和完善。 2.1.1视觉是个信息处理任务 Mar认为“看”就是人通过观察认知有什么东西和它们在什么地方。换句话说,视觉 是一种处理过程,经过这个过程从图象中发现外部世界中有什么东西和它们在什么地方。因 此,视觉首先是一个信息处理任务。一个信息处理任务可以,并且应该从三个不同层次来研 究和理解。Mar指出正是由于不能正确地区分这三个层次中涉及的不同的研究问题阻碍了 人工智能和心理学、神经生理学中对视觉的硏究。第一个层次是信息处理的计算理论。在这 个层次研究的是对什么信息进行计算和为什么要进行这些计算:第二个层次是算法。在这个 层次研究的是如何进行所要求的计算,也就是要设计特定的算法:第三个层次是实现算法的 机制或硬件,在这个层次上研究完成某一特定算法的计算机构。例如,根据 Fourier分析理 论,任意连续函数可用它的 Fourier频谱来表示,因此 Fourier变换是属于第一层的理论。而 计算 Fourier变换的算法,如各种快速 Fourier算法是属于第二个层次的。至于实现快速 Fourier 算法的阵列处理机就属于硬件的层次。在设计实现计算理论的算法以前必须先要有计算理 论。因为只有确切地了解所进行计算的含义以后才能认真考虑设计算法。在视觉研究中有必 要强调上述观点,这样有助于明确研究的目的。在人工智能领域中的研究应该主要在第一个 层次,在这一层次上研究的问题应该是类似于这样的问题:“从原理上讲,如何才能根据图17 另一方面,自 60 年代以来对人类视觉的研究也已取得了一系列重要的成果。Hubel 和 Wiesl[Hub, Wie 62, 68]关于大脑视皮层细脑感受野的论述,以及 Campell 和 Robesn[Cam 68]关于视觉 系统空间频率通道的论述是其中两项最重要的研究成果。如果把视觉看成是一种信息处理过 程,上述结果就形成了两种不同观点:一些人认为视皮层是特征检测器,另一些人则认为视 皮层是某种空间 Fourier 分析器。同时,这两种观点又都有不少无法解释的实验结果。因此, 对人类视觉的研究迫切地需要理论的指导。美国麻省理工学院(MIT)人工智能实验室的 D.Marr 教授就是在这种情况下,立足于计算机科学,总结了心理物理学、神经生理学、临 床神经病学等在视觉研究上已取得成果的基础上提出了视觉计算理论。他的理论对人工智能 和神经科学都产生了深远的影响。 西方的思维科学来源于逻辑和计算理论,根据这个理论,Newell 和 Simon[new 81]提出了 物理符号系统的概念。他们认为无论计算机与人脑在硬件结构上如何不同,但从计算理论的 层次上来说它们都是具有产生、操作和处理抽象符号能力的物理符号系统。物理符号系统对 思维科学来说就象进化论对任何生物学那样是基础。在这样的计算理论看来,任何一种复杂 的精神智力活动在本质上都是以离散符号处理为核心的计算过程。这种以逻辑和计算理论为 核心的一系列概念加深了我们对智力本质的认识。Marr 提出的视觉计算理论与此是一脉相 通的。他的计算理论使人们对视觉机理的研究提高到一个新水平。 Marr 的视觉计算理论是首次提出的阐述视觉机理的系统理论,并且对人类视觉和计算 机视觉的研究都产生了深远的推动作用。但它还远未解决建立人类视觉计算理论的问题。如 以后的章节中将会讨论的那样在实践中也已遇到了一些严重困难。因此这个理论还需要通过 研究不断改进和完善。 2.1.1 视觉是个信息处理任务 Marr 认为“看”就是人通过观察认知有什么东西和它们在什么地方。换句话说,视觉 是一种处理过程,经过这个过程从图象中发现外部世界中有什么东西和它们在什么地方。因 此,视觉首先是一个信息处理任务。一个信息处理任务可以,并且应该从三个不同层次来研 究和理解。Marr 指出正是由于不能正确地区分这三个层次中涉及的不同的研究问题阻碍了 人工智能和心理学、神经生理学中对视觉的研究。第一个层次是信息处理的计算理论。在这 个层次研究的是对什么信息进行计算和为什么要进行这些计算;第二个层次是算法。在这个 层次研究的是如何进行所要求的计算,也就是要设计特定的算法;第三个层次是实现算法的 机制或硬件,在这个层次上研究完成某一特定算法的计算机构。例如,根据 Fourier 分析理 论,任意连续函数可用它的 Fourier 频谱来表示,因此 Fourier 变换是属于第一层的理论。而 计算Fourier 变换的算法,如各种快速Fourier 算法是属于第二个层次的。至于实现快速Fourier 算法的阵列处理机就属于硬件的层次。在设计实现计算理论的算法以前必须先要有计算理 论。因为只有确切地了解所进行计算的含义以后才能认真考虑设计算法。在视觉研究中有必 要强调上述观点,这样有助于明确研究的目的。在人工智能领域中的研究应该主要在第一个 层次,在这一层次上研究的问题应该是类似于这样的问题:“从原理上讲,如何才能根据图