
第一章绪论人类通过视觉感知外界信息.俗话说“百闻不如一见”,就是说视觉感知环境信息的效率很高.人类感知外界信息,80%以上是通过视觉得到的.让计算机或机器人具有视觉,是人类多年以来的梦想.虽然,目前我们还不能让计算机也具有像生物那样高效、灵活的视觉,但这种希望正在逐步实现。人类是通过眼睛与大脑来获取、处理与理解视觉信息的.周围环境中的物体在可见光的照射下,在人眼的视网膜上形成图像,由感光细胞转换成神经脉冲信号,经神经纤维传入大脑皮层进行处理与理解.视觉,不仅指对光信号的感受,它包括了对视觉信息的获取、传输、处理、存储与理解的全过程.信号处理理论与计算机出现以后,人们试图用摄像机获取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程,这样,就形成了一门新兴的学科一计算机视觉,计算机视觉的研究目标是使计算机具有通过二维图像认知三维环境信息的能力.这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解.计算机视觉发展得益于神经生理学、心理学与认知科学对动物视觉系统的研究,但计算机视觉已发展起一套独立的计算理论与算法,它并不刻意去“仿真”生物视觉系统,其原因有三:(1)几十年来,虽然神经生理学、心理学与认知科学对生物视觉系统从解剖学、电生理过程与信息处理等不同角度进行了大量卓越的研究,但对视觉认知过程的认识还远远不够,尤其是对大脑皮层中高层次视觉信息处理的认识还是十分肤浅的。(2)研究表明,大脑神经细胞构成了一个极其复杂的,巨大的互连网络,这种神经网络在体系结构上与当前计算机体系结构有很大的差别,虽然,近年来人工神经网络的研究得到很大的重视(即用计算机或专用芯片去局部仿真神经网络),但这种仿真也只能是近似的、局部的,要实现大量人工神经元的互连网络在技术上目前还是很困难的,另外,不少计算机视觉工作者认为,只要从信息转换的角度真正理解了视觉信息处理过程并发展出一套信息处理的计算理论,用哪种体系结构去实现它是无关紧要的.本书要讲述的内容就是多年来计算机视觉工作者对实现各种视觉功能发展出的一整套计算理论与算法.近年来对神经网络的研究表明,其中许多算法既可以用通用的串行的计算机体系结构实现,也可以用神经网络实现(3)在许多工业应用场合,视觉系统要观察的环境常常比较简单.60年代第一次做的计算机视觉系统的实验[Roberts1965],环境被限制在所谓“积木世界”,即周围的物体都是由多面体组成的,需要识别的物体可以用简单的点、直线、平面的组合表示.计算机视觉的研究工作就是从对这些简单的物体识别与定位开始的.另一方面,用计算机视觉的方法还可以处理与识别更广泛的图像,例如遥感图像、医学图像等,这些图像的处理和识别与一般摄像机的图像有较大的不同,处理与识别的方法也不同

2第一章绪论为了从整体上理解计算机视觉系统的体系结构,我们先从信息处理的角度分析人的视觉系统结构.1.1生物视觉通路简介1.1.1生物视觉通路图1.1为视通路示意图,物体在可见光的照射下经眼的光学系统在眼底视网膜上形成物像,视网膜上的感光细胞又将视网膜上接收的光能转换成神经冲动,经过视交叉部分地交换神经纤维后、形成视束,传到中枢神经系统部分,包括丘脑的外膝体(lateralgenic-ulatenucleus,简称LGN),上丘(superiorcolliculus)和视皮层(visualcortex),上丘只与眼动等视觉反射有关,外膝体和视皮层直接与视知觉有关,外膝体视交叉视束视放线眼视神经视皮层上丘图1.1视通路示意图关于眼、外膝体与视皮层的解学结构,光化学与电生理作用以及它们在视觉信息处理中的基本作用的详细描述可参阅视觉生理学的有关书籍,如阮迪云、寿天德编著的神经生理学[Ruan1992].由视通路可以看到,眼、外膝体与视皮层构成了对视觉信息处理的三个基本层次.进一步的分析表明,外膝体与视皮层,尤其是视皮层还有更为复杂的分块分层结构,分块表明了视觉信息处理的并行性质,不同区域的神经细胞具有不同的功能;分层表明了视觉信息处理的串行性质.因此,生物视觉系统是一个串行与并行处理相结合的复杂系统1.1.2感受野的分层等级假设视通路上各层次的神经细胞,由简单到复杂,它们所处理的信息,分别对应于视网膜上的一个局部区域,层次越深入,该区域就越大,这就是著名的感受野(receptivefield)与感受野等级假设,感受野是支持视觉信息分层申行处理的最重要的生理学证据.以信息处理的第一级为例,视网膜上的神经节细胞(gauglioncell,以下简称GC)将感光细胞上接收到的光信号转换成电信号再由它的轴突传出,但每一个GC细胞只能接收视网膜上一个局部区域的信号,该区域就是GC的感受野,研究表明,GC感受野及其对光信号的转换作用可划分为以下几种:(1)对空间亮度变化敏感的感受野,形状可用两个同心圆表示.如图1.2所示,这种

1.1生物视觉通路简介3同心圆形状的感受野按其对光信号的转换作用又可以分为中心兴奋区、周边抑制区组成的on-中心型以及中心抑制区,周边兴奋区组成的off-中心型.图中还画出了这两种感受野对光信号的响应曲线(图中只画出了沿同心圆直径方向上一个截面上的响应曲线),该曲线近似于两个方差不同的高斯函数的差,具有这种感受野的GC细胞对于在同心圆区域上受到均匀光照的光刺激的反应,为响应曲线的积分,一般讲,GC的输出为响应曲线与光信号乘积的积分,图1.3表示当视网膜上光信号为一边亮一边暗的具有一定对比度的信号时,感受野位于不同空间位置的GC的输出,只有当亮暗边缘线过同心圆中心时,GC的输出与感受野受到均匀光照时一样,设为E,而当边缘线位于同心圆其他位置时,输出分别高于或低于该平均输出E.如将输出看作实际输出减去平均输出E,则当亮暗边缘线过感受野同心圆中心时,输出为零.可见,由GC的输出与感受野的位置可以检测亮暗边缘线,这是本书第三章将要介绍的边缘抽取的生物学基础。OnOff图1.2on-中心型与off-中心型感受野/>EE<E图1.3不同位置感受野的GC细胞对具有黑白对比度的光信号的响应(2)除具有上述响应特征及感受野的GC细胞外(这种GC细胞也称为t型细胞),还有一种型细胞,它的响应不对亮度的空间变化敏感,而是对时间变化敏感,即当感受野

第一章绪论4圆形区域内的亮度随时间变化时,GC输出会增大或减少,y细胞也可划分为on型或off型.这种对局部亮度随时间变化敏感的性质是物体运动分析的基础以上介绍的是视网膜GC细胞的感受野,这是视觉信息处理第一层次的感受野.对于更高层次,包括外膝体细胞与初级视皮层(即视皮层的前几层),也发现了类似的性质,即每一个单个细胞只接受视网膜上的局部信息,但层次越高感受野越大,即信息处理是从局部到更大的区域的,例如外膝体上的一个细胞,可以接受来自空间感受野相邻的多个GC细胞的信息,由于每个GC细胞有一个感受野,多个GC细胞的感受野就组成了二个更大的区域,面且该区域也具有同心圆的形状.这种感受野从局部到整体的层次结构就是著名的感受野层次等级假设[Hubel1979].这种假设一直到初级视皮层还可得到神经生理学与认知心理学的实验证据(对实验证据的解释仍有争论),但这种假设到底能走多远,即进人更高层次以后,甚至到最后层次,是否有一个最复杂的神经细胞,它的感受野已大到图像上的某一个大区域,由该细胞来负责全部该区域信息的综合,最后达到识别该区域上物体的目的,这一点(它被称为祖母细胞假设)尚有很大的争论1.1.3视觉信息处理的多通道、多任务并行处理性质感受野的等级假设与局部性质主要支持视觉信息处理的自下而上的分层次申行处理性质.但视觉系统的任务不是单一的.它要识别物体的形状与额色,要得到三维物体的深度信息,要检测物体的方位与运动参数,另外,物体的空间与时间频率性质也有很大差异,例如较细的表面纹理表现了物体表面较高的空间频率特征;较快的运动,表现为图像较高的时间频率特征.神经生理学的研究表明,视通路的各个层次上存在着基本互相独立的并行通道,分别完成不同的视觉任务,下面我们简要介绍几个不同的并行通道(1)r·y通道在介绍视网膜神经节细胞(GC细胞)的感受野性质时曾提到GC的感受野有工,y之分,进一步分析表明,更深层次的细胞的感受野也有,之分,即某-层次的神经细胞(例如外膝体的神经细胞)只接受来自r(或y)型的GC细胞的信号,使它也具有(或y)型的感受野.由于·y型感受野的不同,r通道传递高空间分辨率的,时间上变化慢速的信息与颜色信息,而型通道传递低空间分辨率的,高时间变化频率的信息(2)空间与时间频率通道虽然,y型细胞分别对具有空间频率或时间频率的信息敏感,心理物理实验证明,外膝体上的某一个神经细胞并不对所有频率的信息敏感,而是对某一频段的信息呈现较强的反应,在视觉皮层也发现了类似的证据,即皮层的某一部分只对某一定频率的信号敏感.这些实验证据表明,在视通路中存在处理不同频道的信号的独立通道,(3)颜色信息通道首先在视网膜上就存在不同的光感受细胞,即锥状细胞与杆状细胞,其中杆状细胞对颜色不敏感,而锥状细胞又分为对不同光谱(红、绿、蓝)敏感的三种细胞,对外膝体与视觉皮层17区的分析也表明,它们都有专门的区域从事颜色信息的处理与识别(4)左右眼信息通道与立体视觉由图1.1的视觉信息通道简图中可见,眼睛,外膝体与视皮层都有左右二侧.分析表

51.2Marr的计算视觉理论框架0明,左右两侧的神经细胞分别处理由左右两眼的半侧来的信息,也就是说,每一个眼睛的左右侧视野的信息是交叉地分别投射到左右侧外膝体与视皮层的.视皮层处理来自两眼1的信息得到双眼视差信息(详见第五章)是立体视觉的基础,也就是说,只有比较来自双眼的信息,才能使我们有深度感,最近的研究表明,直到视皮层的17,18,19区,还存在独立处理不同视差的并行通道(5)空间方位信息通道早期对视觉通路信息处理的研究认为,视皮层细胞对空间几何元素(如直线)的方位敏感,阮迪云[Ruan1992]等对外膝体细胞的研究表明,这种方位敏感性也存在于外膝体细胞,即具有相似最优方位敏感的细胞在外膝体层次已经聚集在一起.可见在视皮层处理之前,外膝体已经对方位信息进行了组织,在视觉通路中存在着处理方位信息的通道(6)视皮层对形状、颜色、运动与深度信息的并行处理对视皮层17至更高层次的研究表明,对物体的形状、颜色、运动、深度等不同视觉信息处理已明显分离开,对视皮层不同区域分别处理什么信息已有大量的研究,最近发展的功能核磁共振(FMRI)与高分辨率脑地形图为分析视皮层各部分的功能提供了技术手段.以上介绍表明,视觉信息处理是一个审行与并行相结合的复杂信息处理过程,目前搞清的仅仅是极小的一部分.而且,从信息处理的角度看,对大多数处理单元我们仅仅知道非常浅的知识,即只知道这个单元对某种信息“敏感”,而信息是如何表征的,如何变换的,则仍不清楚,尤其是较高层信息的处理.关于串行与并行处理进人高级皮层后,信息是如何综合的,更是很有争论的问题.还有一些认知心理实验,观察到与上述有些论述完全不相容的现象,例如陈霖发现[Chen1982,1989],人对大范围拓扑特征感知早于对局部几何特性的感知,并认为这种现象是对当前的视觉计算理论不相容的.总之,对生物视觉系统的认识还很初步,计算机视觉工作者从这些初步的研究结果出发,试图独立建立视觉信息处理各个阶段或各种功能的数学模型,本书中介绍的内容就是20多年来的有关研究成果,其中有些信息处理方法可能与生物视觉系统类似,也有一些可能完全不同。1.2Marr的计算视觉理论框架80年代初,Marr[Marr1982]首次从信息处理的角度综合了图像处理、心理物理学、神经生理学及临床精神病学的研究成果,提出了第一个较为完善的视觉系统框架,这一框架虽然在细节甚至在主导思想方面尚存在大量不完备的方面,许多方面还有许多争议,但至今仍是广大计算机视觉工作者接受的基本框架.计算机视觉这门学科的形成,应该说与-这一理论框架有密切的关系.下面我们从几个方面来描述这一理论框架,Aa1.2.1视觉系统研究的三个层次Marr从信息处理系统的角度出发,认为对此系统的研究应分为三个层次,即计算理论层次、表达(representation)与算法层次、硬件实现层次计算理论层次要回答系统各个部分的计算目的与计算策略,亦即各部分的输人输出

第一章绪论6a是什么,之间的关系是什么变换或具有什么约束.Marr对视觉系统的总的输人输出关系5规定了一个总的目标,即输人是二维图像,输出是由二维图像“重建”(reconstruction)出来的三维物体的位置与形状.Marr认为,视觉系统的任务是对环境中三维物体进行识别、-定位与运动分析,但这仅仅是一种对视觉行为(behavior)的目的性定义,而不是从计算理论层次上的目的性定义,三维物体千差万别,应存在一种计算层次上的一般性目的描述,量达到了这一“目的”,则不管是什么具体的物体,视觉任务均可完成.Marr认为,这一“目的”,就是要通过视觉系统,重建三维物体的形状、位置,而且,如在每一时刻,都能做到这一点,则运动分析也可以做到.对视觉系统的各个层次与模块,Marr也初步给出了计算理论层次上的目标(详见下一节)对于表达与算法层次,视觉系统的研究应给出各部分(或称各模块)的输人、输出和内部的信息表达,以及实现计算理论所规定的目标的算法,算法与表达有关,不同的表达方式,完成同一计算的算法会不同,但Marr认为,算法与表达是比计算理论低一层次的问题,不同的表达与算法,在计算理论层次上可以是相同的,最后一个硬件层次,是要回答“如何用硬件实现以上算法”区分以上三个不同层次,对于深刻理解计算机视觉与生物视觉系统以及它们的关系都是有益的,例如我们在本章开始时就指出,人的视觉系统与目前的计算机视觉系统在“硬件实现”层次上是完全不同的,前者是极为复杂的神经网络,而后者是目前使用的计算机,但它们可能在计算理论层次上完成相同的功能本书的全部内容都是在前两个层次上,即计算理论,表达与算法层次,应该指出,目前计算机视觉的研究工作也主要在这两个层次上,对于硬件实现,目前只有比较成熟的部分,如低层次处理中的去噪声,边缘抽取;对简单二维物体识别及简单场景下的视觉方法,已有专用芯片或其他并行处理体系结构方面的研究与试验产品;从系统上构造一般的视觉系统,虽有一些尝试,但一般并不成功。1.2.2视觉信息处理的三个阶段Marr从视觉计算理论出发,将系统分为自下而上的三个阶段,即视觉信息从最初的原始数据(二维图像数据)到最终对三维环境的表达经历了三个阶段的处理.第一阶段构成所谓“要素图”或“基元图"(primarysketch),基元图由二维图像中的边缘点、直线段、曲线、顶点、纹理等基本几何元素或特征组成;第二阶段,Marr称为对环境的2.5维描述,2.5维描述是一种形象的说法,意即部分的、不完整的三维信息描述,用“计算”的语言来T讲,就是重建三维物体在观察者为中心的坐标系下的三维形状与位置.当人眼或摄像机观察周围环境物体时,观察者对三维物体最初是以自身的坐标系来描述的,另外,我们只能观察到物体的一部分(另一部分是物体的背面或被其他物体遮挡的部分).这样,重建的结=果是以观察者坐标系下描述的部分三维物体形状,称为2.5维描述.这一阶段中存在许多空并行的相对独立的模块,如立体视觉、运动分析、由灰度恢复表面形状等不同处理单元,本书的许多章节都涉及到这一阶段.2.5维描述是不够的,事实上,从各种不同角度去观察物体,观察到的形状都是不完整的,不能设想,人脑中存有同一物体从所有可能的观察角度看到的物体形象,以用来与所谓的物体的2.5维描述进行匹配与比较,因此,2.5维描?

1.3本书各章内容简介7述必须进一步处理以得到物体的完整三维描述,而且必须是物体本身某一固定坐标系下的描述,这一阶段称为第三阶段,即三维阶段以上前两个阶段,有些文献称为视觉的低层次处理,或早期视觉,也有人将第一阶段称为早期视觉,第二阶段称为中期视觉.1.3本书各章内容简介本书主要内容为三维计算机视觉,两维图像的特征检测为三维视觉的第一步,在许多图像处理的专著中已有全面的介绍,本书不作详细论述.但三维视觉的许多方法都是由二维图像的点、线等边缘特征出发的,因此在本书第二章介绍了边缘检测方法,其中有些方法可在图像处理的专著[Gonzalez1987,Rosenfeld1982,Wang1995]中找到,但有些方法,尤其是边缘检测的快速算法与最优边缘检测方法,只是在近年的文献中才能看到.计算机视觉所涉及的数学知识较多,如随机过程、最优化方法、射影几何等,由于国内工科大学一般不讲射影几何,第三章介绍了射影几何的一些常用结论,一般不给证明,有关射影几何的进一步知识,读者可参阅[Semple1949],这一章还介绍了以后各章中常用的各种几何元素的数学表达方法,本书介绍的大多数内容都是由图像定量恢复三维物体形状的方法,要做到这一点,首先需要对摄像机定标,以得到摄像机的内外参数,或者说,对摄像机建模并求取模型参数.本书第四章讲述各种摄像机模型与适用于不同任务的摄像机定标方法.第五章介绍立体视觉方法,即用双摄像机得到的图像(称为立体图对)恢复三维物体深度信息的方法,其中射影几何意义下的重建是近几年来提出来的方法,读者如缺乏射影几何的知识,可以不读这一节.第六至第十章为运动分析,即由序列图像估计三维物体运动参数与形状的方法.除了第六章运动与不确定性描述为运动分析问题的数学基础外,第七至第十章介绍了三种运动分析的方法.运动分析方法可分为两类,即由图像灰度变化求取运动参数的光流法,与由特征几何元素对应求取运动参数的方法,第七章介绍光流法,第八章介绍由序列图像特征儿何元素及运动模型跟踪特征儿何元素的方法,特征跟踪可给出特征儿何元素的对应,是由特征儿何元素求取运动参数的方法的基础,第九章与第十章分别介绍由两维或三维特征几何元素的对应求取物体运动参数与形状的方法.第十一章介绍直接由图像灰度或颜色恢复物体三维形状的方法,图像灰度或颜色与物体表面反射光的强度和光谱有关,由几何光学理论可得到物体表面反射光强度及光谱与物体形状的关系,但反射光强度还与光源方向、强度、光源光谱及物体材料性质有关,为了由图像灰度或颜色恢复物体三维形状需要多幅图像信息或利用物体表面形状的连续性假设,该章介绍了由多个点光源分别照射同一物体得到多幅图像以恢复物体形状的光度立体视觉方法,及由单幅图像与物体表面形状的连续性假设恢复三维物体形状的方法.在恢复(或称重建)物体形状后,为了识别物体,需要预先建立物体的模型,第十二章介绍一些常用的建模方法与识别方法.应该指出,建模与识别属视觉高层处理,对生物视觉系统的信息高层处理,目前还远远缺乏深人的理解,计算机视觉中提出的建模方法与识别方法也都是针对比较简单的物体的.本书第十三章介绍的距离图像获取与处理是计算机视觉的特有方法,以前各章介绍的方法与生物视觉系统都是由两维图像出发的,由两维图像出发恢复三

8第一章绪论维物体形状,计算复杂性很高,当今技术的发展使我们有可能开发直接得到物体三维深度信息的传感器,该章介绍了多种用于计算机视觉的深度传感器(rangefinder)或称距离传感器,由于用这种传感器可以直接得到物体表面密集点的三维信息,从而大大简化了视觉系统的低层处理,因此,虽然这种传感器的成本较高,使用场合也有一定限制,但基于这种传感器的视觉系统已有较广的工业应用.本书最后一章讨论了计算机视觉的系统体系结构与发展前景,针对计算机视觉系统在理论上与实际应用中存在的问题,给出了改善计算机视觉系统在体系结构上应考虑的10个方向目前,研究者们提出了大量的视觉计算方法,许多方法似乎在计算理论层次上很相似,但在计算机实现时在计算复杂性或抗噪声能力上却相差甚远.计算机视觉界普遍认为,视觉计算方法在提出时,必须有严格的实验验证,并与其他方法比较.本书附录给出了一些实验数据的软盘及说明,有条件的读者可由这些数据检验本书给出的算法,或验证自己提出的算法,1.4计算机视觉的现状与阅读本书需注意的问题80年代至今,研究者们按照Marr所提出的基本理论框架,对以上所述的各个研究层次与视觉系统的各个阶段中的各种功能模块,进行了大量的研究.现在,国际上以计算机视觉为主题,或主要以计算机视觉为主题的国际会议有国际计算机视觉会议(ICCV),国际模式识别会议(ICPR),国际计算机视觉与模式识别会议(CVPR),欧洲计算机视觉会议(ECCV)与亚洲计算机视觉会议(ACCV).以计算机视觉为主要内容之一的国际刊物也有很多,如 International Journal of ComputerVision,IEEETrans.onPAMI,IEEETrans.on Robotics and Automation,IEEE Trans. on Image Processing,CVGIP(Com-puter Vision, Graphics and Image Processing), Visual Image Computing,IJPRAI(In-ternational Journal of Pattern Recognition and Artificial Intelligence),Pattern Recogni-tin等,一些相关的会议与刊物就更多了,每年的研究论文不下数千篇,发表的不下数百篇.大体上讲,对计算机视觉系统的各个部分,研究者们都在计算理论、表达与算法及硬件实现等各层次上提出了大量的方法,但总的来讲,这些方法都存在这样或那样的问题,或缺乏通用性,或抗噪声能力低,或存在多解性,其原因可归纳如下:计算机视觉的问题是一个逆问题(inverseproblem),输人的图像为二维图像的灰度,它是三维物体几何特征、光照、物体材料表面性质、物体的颜色、摄像机参数等许多因素的函数,由灰度反推以上各种参数是逆问题.这些问题往往是非线性的,问题的解不具有唯一性,而且对噪声或离散化引起的误差极其敏感.另一个原因是Marr的视觉系统框架是一个自下而上的、模块化的、单向的、数据驱动型的结构.神经生理学的深入研究表明,这种结构与人的视觉系统还有很大差距.虽然对这种差别目前还缺乏深人的理解,但显然人的视觉系统上下各层次之间、各功能模块之间存在着更为复杂的互相作用.更重要的是,由眼动等现象可知,生物视觉系统的认知过程是一种复杂的与外界交互作用的主动性过程,Gibson[Gibson1979]曾指出,感知是一种行动(action)而不仅仅是一种被动式的反应(response).近年来提出的有目的的,主动式视觉或者基于模型的视觉都在这一方面突

参考孝文献9破了Marr视觉理论框架.本书中的某些部分涉及到这方面的研究成果,在本书的最后一章也将对视觉系统的各种系统框架作一些讨论基于以上对视觉系统研究现状的分析,读者在阅读本书中尤其要注意以下几点:(1)本书各章大多数是孤立地介绍视觉功能模块中某一部分的计算理论、表达与算法,一般不涉及到它与其他模块的相互影响,(2)虽然本书大多数内容都是最近的研究成果,但一般都是分析了某一功能模块的输入输出,介绍了一种或几种表达,分析了各种参数的约束条件,从而给出了最近研究中认为比较好的一种或几种算法,但是,这绝不意味着这些方法就是最优的方法了,也不意味着问题已完全解决了.相反,目前的方法一般都没有完美地解决视觉信息处理中的问题,它们都或多或少地有些问题,需要进一步的研究,因此,读者只能将这些方法看作是解决某一问题的思路或目前已有的较好的方法.有关计算机视觉的其他参考书有[Ballard1982,Horn1986,Boyle1988,Kanade1987,Shirai1987,Haralick 1992,Faugeras1993,Wu1993].思考题1.当你在马路上行走时,你的视觉系统应获取环境的什么信息?你认为应如何获取这些信息,即从视网膜上的图像如何得到最终需要的信息?2.当你看到一张熟人的照片时,你认为你是根据什么特征识别的?你认为熟人的形象是以什么方式存储在你的大脑中的?3.刚体的旋转可用旋转矩阵表示,也可以用旋转轴与旋转角表示,请列举一些描述其他某物理或几何性质的不同表达方法,并说明为什么要采取不同的表达方法,4.当物体间互相遮挡时,你是如何由部分物体信息识别物体的?你认为你的识别策略与自下而上的信息处理方式有无矛盾?5.你认为图像中是否包含了理解环境所需要的全部信息?参考文献[Ballard1982]D.H.Ballard and C.M.Brown,ComputerVision,Prentice-Hall,Englewood,Cliffs,NJ 1982.[Boyle1988] R.D.Boyle and R.C.Thomas,Computer Vision,AFirst Course,Blackwell ScientificOxford,1988.[Chen1982] L.Chen,Topological Structure inVisual Perception,Science,218,pp.699—700,1982.[Chen 1989J L.Chen,Topological Perception:AChallenge toComputational Approaches toVision,Connectionism inPerspective,R.Pfeifer, Z.Schreter, E.Fogelman-Soulie and L. Steels,Eds.,Elsevier Science Publishers,B.V.,pp.317—329,1989.[Faugeras 1993]O.D.Faugeras,ThreeDimensional ComputerVision;A GeometricViewpoint,MITPress,Boston,1993.[Gibson1979] J.J.Gibson,TheEcological Approach to Visual Perception,Houghton Mifflin,Boston,1979.[Gonzalez 1987JR.C.Gonzalez and P.Wintz,Digital ImageProcessing,2ndEd.,Addison-Wesley,Reading,MA1987.[Haralick 1992J R.M.Haralick and L.G.Shapiro,Computer and Robot Vision,Vols.1 and 2,Addison-Wesley,1992.[Horn1986]B.K.P.Horn,RobotVision,MITPress,Cambridge,MA,1986.[Hubel 1979] D.H. Hubel &nd T. N.Wiesel, Brain Mechanisms of Vision, The Brain: A Scientific American Book

10第一章绪论NewYork: W.H.Freeman.[Kanade1987] T.Kanade,ThreeDimensionalVision,Kluwer,Boston,1987.[Marr1982]D.Marr,Vision,W.H.FreemanandCompany,SanFrancisco.中译本:视觉计算理论,姚国正、刘磊、汪云九译,科学出版社,1988.[Roberts1965] L.G.Roberts,Machine Perception of Three-Dimensional Solids,Optical and Electro-Optical Informa-tion Processing,J.P.Tippet and al,Eds,pp.159-197,Cambridge,MA,MITPress.[Rosenfeld 1982] A.Rosenfeld and A.Kak,Digital Picture Processing,2nd Ed.,Vols.1 and 2.Computer SeienceandApplied Mathematics,AcademicPress,Orlando,FL,1982.[Ruan1992]阮迪云,寿天德,神经生理学,中国科技大学出版社,1992.[Semple1949] J.P.Semple and L.Roth,Introduction to Algebraic Geometry,Clarendon Press,Oxford,1949.[Shirai 1987] Y.Shirai,Three Dimensional Computer Vision, Symbolic Computation, Springer-Verlag,Berlin,.1987.[Wang1995]王润生,图像理解,国防科技大学出版社,1995.[Wu1993]吴立德,计算机视觉,复且大学出版社,1993