附录A生物视觉信息处理 A.l人类视觉系统概述 A.1.1人类视觉系统的组成 A.1.2眼球的光学系统 A.1.3视网膜 A.1.4视觉通路 A.2生物视觉信息处理 A.2.1视觉信息的空间域处理 A.2.1.1感受野 A.2.1.2生物视觉系统中的特征检测 A2.1.3侧抑制 A.22生理频率分析器 A.1人类视觉系统概述 人的眼睛可以分辨出只有几十个光子的微弱光线:可以判断出垂直线不到1度的倾斜 可以引导人们穿过拥挤的路口:还可以认出图画中物体的名称等。总之眼睛具有许多功能 中国人甚至还有“眼见为实”的谚语。当然,这里所说的眼睛事实上是指眼一脑系统。眼- 脑系统在完成上述这些视觉功能时涉及不同的视觉信息处理过程。人的视觉处理过程的特点 是它是一个从低到高的分层结构。例如,从一幅图画中认出图中的物体就需要不同层次的信 息处理。首先要分辨出表示物体的线条,这涉及低层的视觉信息处理;根据以往的知识和经 验,经过符号解释识别物体的类别就涉及高层的处理。对人类视觉的研究就是试图分辨这些 层次,弄清各个层次所起的作用。为此要进行各种实验研究。在这里我们所感兴趣的是对人 类视觉进行的心理物理学( psychophysical)和神经生理学( neurophysiology)实验;以及这 些实验结果对计算机视觉研究的影响。为了便于区分这两种实验的研究领域,我们来分析 下眼睛和大脑细胞对输入刺激的响应情况。如图A.1所示,生物视觉系统的研究可分成二个 层次。第一层是关于单个神经细胞的特性。它研究当受到某种输入信号的刺激时单个细胞的 反应模式。这是神经生理学主要的研究内容。一般来说,神经生理学主要研究单个或一小簇 神经细胞的行为。这时通常要实验量测神经细胞对输入信号所作的编码输出。其中可能包括 输出编码信号的空间位置、作用频率、响应幅度等。当然,这些神 人值中楼经中神网 L神经生理学 心理物理学 图A.1生物视觉系统的研究层次 经细胞是相互联系,共同配合产生输出的,特别在高层的视觉处理中更是这样的。但要研究 神经网络中的这些细胞是如何相互影响和作用是非常困难的。神经网络对视觉信息处理的作 用是生物视觉系统研究中的第二个层次。对这个层次的研究仅仅是建立在发现输入信息与感
207 附录 A 生物视觉信息处理 A.1 人类视觉系统概述 A.1.1 人类视觉系统的组成 A.1.2 眼球的光学系统 A.1.3 视网膜 A.1.4 视觉通路 A.2 生物视觉信息处理 A.2.1 视觉信息的空间域处理 A.2.1.1 感受野 A.2.1.2 生物视觉系统中的特征检测 A.2.1.3 侧抑制 A.2.2 生理频率分析器 A.1 人类视觉系统概述 人的眼睛可以分辨出只有几十个光子的微弱光线;可以判断出垂直线不到 1 度的倾斜, 可以引导人们穿过拥挤的路口;还可以认出图画中物体的名称等。总之眼睛具有许多功能, 中国人甚至还有“眼见为实”的谚语。当然,这里所说的眼睛事实上是指眼—脑系统。眼— 脑系统在完成上述这些视觉功能时涉及不同的视觉信息处理过程。人的视觉处理过程的特点 是它是一个从低到高的分层结构。例如,从一幅图画中认出图中的物体就需要不同层次的信 息处理。首先要分辨出表示物体的线条,这涉及低层的视觉信息处理;根据以往的知识和经 验,经过符号解释识别物体的类别就涉及高层的处理。对人类视觉的研究就是试图分辨这些 层次,弄清各个层次所起的作用。为此要进行各种实验研究。在这里我们所感兴趣的是对人 类视觉进行的心理物理学(psychophysical)和神经生理学(neurophysiology)实验;以及这 些实验结果对计算机视觉研究的影响。为了便于区分这两种实验的研究领域,我们来分析一 下眼睛和大脑细胞对输入刺激的响应情况。如图 A.1 所示,生物视觉系统的研究可分成二个 层次。第一层是关于单个神经细胞的特性。它研究当受到某种输入信号的刺激时单个细胞的 反应模式。这是神经生理学主要的研究内容。一般来说,神经生理学主要研究单个或一小簇 神经细胞的行为。这时通常要实验量测神经细胞对输入信号所作的编码输出。其中可能包括 输出编码信号的空间位置、作用频率、响应幅度等。当然,这些神 图 A.1 生物视觉系统的研究层次 经细胞是相互联系,共同配合产生输出的,特别在高层的视觉处理中更是这样的。但要研究 神经网络中的这些细胞是如何相互影响和作用是非常困难的。神经网络对视觉信息处理的作 用是生物视觉系统研究中的第二个层次。对这个层次的研究仅仅是建立在发现输入信息与感 单神经元 层次 输入信号 细胞组织 神经网络 感知输出 神经生理学 心理物理学
知输出之间对应关系的基础上,这就是经典的黑箱实验的方法。这第二个研究层次就是心理 物理学的研究范围 我们在这里粗略介绍人类视觉生理的目的是为了向计算机领域的科技人员提供有关背 景知识和材料。因此在许多地方为方便起见采用方块图的表示方法。此外,限于篇幅我们着 重介绍与马尔的视觉计算理论有关的内容 A11人类视觉系统的组成 我们可以把人类视觉系统看成一个有生命的光学变换器和信息处理系统。眼睛就是光学 变换器,并能进行部分处理工作。事实上在进化阶段上越是低级的生物,它们的眼睛越担负 更多的处理功能。为便于说明可把视觉系统分成三部分(图A.2)。这三部分都相当复杂, 但相比而言,第一部分,光学系统,由于有关的神经活动最少,因此最为简单;第二部分是 视网膜。它把光信号转变成电信号,并进行某些细胞一级的处理。第一、第二两部分都在眼 睛里。最后一层是视觉通路,它实质上是代表从视网膜到大脑皮层的视觉通路上所完成的复 杂处理的统称。 在大脑和到大 在眼中 脑的通路中 输入图象光学系统[光信号视网膜[电信号丬视觉通路[感知 传导 处理 图A2视觉系统的组成 A.12眼球的光学系统 人眼的外形接近球形,是一个直径为24毫米的球状体,又称为眼球。眼球壁由巩膜、 脉络膜和视网膜组成(图A.3)。巩膜在眼球壁最外面,它主要起着巩固、保护眼球的作用 巩膜前面有六分之一是透明的,这部分称为角膜。角膜厚度约为1毫米,直径为11毫米 它好象是眼睛的玻璃窗户。光线由角膜射入眼内 緣带 能卖肌 小带纤 先 图A.3人眼模式图 208
208 知输出之间对应关系的基础上,这就是经典的黑箱实验的方法。这第二个研究层次就是心理 物理学的研究范围。 我们在这里粗略介绍人类视觉生理的目的是为了向计算机领域的科技人员提供有关背 景知识和材料。因此在许多地方为方便起见采用方块图的表示方法。此外,限于篇幅我们着 重介绍与马尔的视觉计算理论有关的内容。 A.1.1 人类视觉系统的组成 我们可以把人类视觉系统看成一个有生命的光学变换器和信息处理系统。眼睛就是光学 变换器,并能进行部分处理工作。事实上在进化阶段上越是低级的生物,它们的眼睛越担负 更多的处理功能。为便于说明可把视觉系统分成三部分(图 A..2)。这三部分都相当复杂, 但相比而言,第一部分,光学系统,由于有关的神经活动最少,因此最为简单;第二部分是 视网膜。它把光信号转变成电信号,并进行某些细胞一级的处理。第一、第二两部分都在眼 睛里。最后一层是视觉通路,它实质上是代表从视网膜到大脑皮层的视觉通路上所完成的复 杂处理的统称。 图 A.2 视觉系统的组成 A.1.2 眼球的光学系统 人眼的外形接近球形,是一个直径为 24 毫米的球状体,又称为眼球。眼球壁由巩膜、 脉络膜和视网膜组成(图 A.3)。巩膜在眼球壁最外面,它主要起着巩固、保护眼球的作用。 巩膜前面有六分之一是透明的,这部分称为角膜。角膜厚度约为 1 毫米,直径为 11 毫米, 它好象是眼睛的玻璃窗户。光线由角膜射入眼内。 图 A.3 人眼模式图 光学系统 视网膜 视觉通路 感知 在大脑和到大 在眼中 脑的通路中 输入图象 光信号 电信号 传导 处理
脉络膜紧贴巩膜,起输送养料、滋养眼睛的作用。脉络膜最前面的环状部分为虹膜。眼 的颜色由虹膜中的色素决定。虹膜中央有一个小圆孔,叫做瞳孔。瞳孔能控制进入眼内的光 量,它可随光线的强弱而扩大或缩小,起照相机光圈的作用 虹膜后面为水晶体,它是透明的胶状体,并富有弹性。它将光线聚焦到视网膜上。角膜 与虹膜之间的空间为前房,位于虹膜和水晶体之间的空间为后房。这两个房都充满水样液 水晶体后面的空间充满着叫玻璃体的液体。 眼球的第三层是视网膜,约占眼球内表面的2/3。它含有感光细胞(杆体细胞和锥体细 胞)。从眼睛的构造可知,它的光路是由以下几部分组成:角膜、水样液、虹膜、瞳孔、水 晶体和玻璃体等。光线通过角膜进行眼球,然后经过水样液到达虹膜。虹膜上的瞳孔随着光 线的强度变化它的孔径大小(从2毫米到8毫米)。强光时缩小、弱光时扩大。光线通过瞳 孔后经过水晶体和玻璃体最后到达视网膜。水晶体和玻璃体各有不同的折射率以确何在视网 膜上得到清晰的成象。眼睛的感光系统就是视网膜,它如同照相机的底片。 RocEs Cones 食坚少 TAmari 〔 a Logion cell 图A4视网膜剖面图
209 脉络膜紧贴巩膜,起输送养料、滋养眼睛的作用。脉络膜最前面的环状部分为虹膜。眼 的颜色由虹膜中的色素决定。虹膜中央有一个小圆孔,叫做瞳孔。瞳孔能控制进入眼内的光 量,它可随光线的强弱而扩大或缩小,起照相机光圈的作用。 虹膜后面为水晶体,它是透明的胶状体,并富有弹性。它将光线聚焦到视网膜上。角膜 与虹膜之间的空间为前房,位于虹膜和水晶体之间的空间为后房。这两个房都充满水样液。 水晶体后面的空间充满着叫玻璃体的液体。 眼球的第三层是视网膜,约占眼球内表面的 2/3。它含有感光细胞(杆体细胞和锥体细 胞)。从眼睛的构造可知,它的光路是由以下几部分组成:角膜、水样液、虹膜、瞳孔、水 晶体和玻璃体等。光线通过角膜进行眼球,然后经过水样液到达虹膜。虹膜上的瞳孔随着光 线的强度变化它的孔径大小(从 2 毫米到 8 毫米)。强光时缩小、弱光时扩大。光线通过瞳 孔后经过水晶体和玻璃体最后到达视网膜。水晶体和玻璃体各有不同的折射率以确何在视网 膜上得到清晰的成象。眼睛的感光系统就是视网膜,它如同照相机的底片。 图 A.4 视网膜剖面图
A13视网膜一光电接收器 视网膜的剖面如图A4所示。它包含感光细胞,双极细胞和神经节细胞。视网膜厚度约 为1-0.5毫米。从组织学上可分成10层。但通常可分成三个层次:(1)感光细胞,即杆体细 胞和锥体细胞。锥体细胞是明视器官,它在光亮条件下发生作用,能分辨细节。杆体细胞是 暗视器官对弱光反应灵敏,在低照明情况下发生作用。但它不能感受颜色,对精细物象的辨 别也没有什么贡献。(2)双极细胞。锥体细胞和杆体细胞与双极细胞连接。一般情况是每一 个锥体细胞与一个双极细胞连接,这是为了在光亮条件下便于精细地感受外界的刺激。而杆 体细胞往往是几十个连接到一个双极细胞。这是为了在黑暗条件下能汇集外界微弱的光刺 激。(3)神经节细胞。其细胞的视觉纤维通向大脑,总共有80万个。 在人的视网膜上正对着瞳孔的中央有一个直径为20毫米的黄色区域,叫黄斑。在黄斑 中间有一个小凹,直径为0.4毫米,这是视觉最敏锐的地方。视网膜上总共有一亿二十四万 个杆体细胞和700多万个锥体细胞,主要集中在中央凹附近。在以中央凹为中心大约3度视 角范围内只有锥体细胞,几乎不存在杆体细胞。在黄斑以外,杆体细胞数量增多,而锥体细 胞数量减少。在距中央凹4毫米的鼻侧处是视神经进入眼球内的地方,此处既没有杆体细胞, 也没有锥体细胞。因此,视网膜上这一点是没有光感受的,叫做盲点。 dt'lierte 164) =4 Nasal re: lin 图A5锥体细胞和杆体细胞的分布 210
210 A.1.3 视网膜—光电接收器 视网膜的剖面如图 A.4 所示。它包含感光细胞,双极细胞和神经节细胞。视网膜厚度约 为 1-0.5 毫米。从组织学上可分成 10 层。但通常可分成三个层次:(1) 感光细胞,即杆体细 胞和锥体细胞。锥体细胞是明视器官,它在光亮条件下发生作用,能分辨细节。杆体细胞是 暗视器官对弱光反应灵敏,在低照明情况下发生作用。但它不能感受颜色,对精细物象的辨 别也没有什么贡献。(2) 双极细胞。锥体细胞和杆体细胞与双极细胞连接。一般情况是每一 个锥体细胞与一个双极细胞连接,这是为了在光亮条件下便于精细地感受外界的刺激。而杆 体细胞往往是几十个连接到一个双极细胞。这是为了在黑暗条件下能汇集外界微弱的光刺 激。(3)神经节细胞。其细胞的视觉纤维通向大脑,总共有 80 万个。 在人的视网膜上正对着瞳孔的中央有一个直径为 2.0 毫米的黄色区域,叫黄斑。在黄斑 中间有一个小凹,直径为 0.4 毫米,这是视觉最敏锐的地方。视网膜上总共有一亿二十四万 个杆体细胞和 700 多万个锥体细胞,主要集中在中央凹附近。在以中央凹为中心大约 3 度视 角范围内只有锥体细胞,几乎不存在杆体细胞。在黄斑以外,杆体细胞数量增多,而锥体细 胞数量减少。在距中央凹 4 毫米的鼻侧处是视神经进入眼球内的地方,此处既没有杆体细胞, 也没有锥体细胞。因此,视网膜上这一点是没有光感受的,叫做盲点。 图 A.5 锥体细胞和杆体细胞的分布
A.14视觉通路 光线通过眼球的光学系统到达视网膜,视网膜上的感光细胞完成光电信号的转换,其中 的双极细胞和神经节细胞已涉及某些低层次的处理。这一节将介绍在此以后主要的视觉信息 传导通路。在传导过程中神经细胞对视觉信息进行了不同层次的处理。进行信息处理并且和 其它细胞相互联系的神经细胞称为神经元。 神经元有各种形状,在大脑和小脑内密度为数万/毫米3。其基本形状为从细胞体发出 的突起。其中有一根细长的称为“轴突”或神经纤维,其它多数比较粗短的突起称为“树突” 轴突是把细胞体的兴奋传给其它神经元的通路。它的前部有分枝,而末稍与其它神经元的树 突或细胞体相接触,此接触点称为“突触” 神经元外面包有细胞膜。通常细胞膜内保持比细胞膜外负70毫伏的静息电位。但当细 胞兴奋时它就放出振幅为100毫伏,持续时间不到1毫秒的脉冲电位。此脉冲电位可沿轴突 传送 k服 哭 图A6神经元的结构 当给神经元强刺激时产生脉冲的频率增加,而脉冲的形状和振幅大体恒定, 轴突与其他神经元细胞体或树突相接触处有15~50纳米的间隙,因此两者在电学上是 相互断开的。当脉冲到达轴突的末稍时就向突触间隙释放乙酰胆碱一类的化学物质。由于这 种化学物质的作用,突触后细胞膜的离子通透性发生变化。因此就产生正的或负的电位。这 种突触后产生的电压称为“突触后电位” 视觉通路的传导从视网膜上神经节细胞层的一级神经元开始。一级神经元的轴突形成视 神经即“视東”。视束的神经纤维分成三个子束。一束来自外侧(颞侧)的半个视网膜;另 束来自内侧(鼻侧)的半个视网膜;第三束来自视网膜的中央部分。人的视束纤维在其往 后的过程中有一部分发生交叉一即来自每一视网膜鼻半侧的纤维在视交叉处交叉,而来自视 网膜颞侧部分的神经纤维不交叉(图A.7)。交叉的纤维与另一颞半侧不交叉的纤维合并后 211
211 A.1.4 视觉通路 光线通过眼球的光学系统到达视网膜,视网膜上的感光细胞完成光电信号的转换,其中 的双极细胞和神经节细胞已涉及某些低层次的处理。这一节将介绍在此以后主要的视觉信息 传导通路。在传导过程中神经细胞对视觉信息进行了不同层次的处理。进行信息处理并且和 其它细胞相互联系的神经细胞称为神经元。 神经元有各种形状,在大脑和小脑内密度为数万/毫米 3。其基本形状为从细胞体发出 的突起。其中有一根细长的称为“轴突”或神经纤维,其它多数比较粗短的突起称为“树突”。 轴突是把细胞体的兴奋传给其它神经元的通路。它的前部有分枝,而末稍与其它神经元的树 突或细胞体相接触,此接触点称为“突触”。 神经元外面包有细胞膜。通常细胞膜内保持比细胞膜外负 70 毫伏的静息电位。但当细 胞兴奋时它就放出振幅为 100 毫伏,持续时间不到 1 毫秒的脉冲电位。此脉冲电位可沿轴突 传送。 图 A.6 神经元的结构 当给神经元强刺激时产生脉冲的频率增加,而脉冲的形状和振幅大体恒定。 轴突与其他神经元细胞体或树突相接触处有 15~50 纳米的间隙,因此两者在电学上是 相互断开的。当脉冲到达轴突的末稍时就向突触间隙释放乙酰胆碱一类的化学物质。由于这 种化学物质的作用,突触后细胞膜的离子通透性发生变化。因此就产生正的或负的电位。这 种突触后产生的电压称为“突触后电位”。 视觉通路的传导从视网膜上神经节细胞层的一级神经元开始。一级神经元的轴突形成视 神经即“视束”。视束的神经纤维分成三个子束。一束来自外侧(颞侧)的半个视网膜;另 一束来自内侧(鼻侧)的半个视网膜;第三束来自视网膜的中央部分。人的视束纤维在其往 后的过程中有一部分发生交叉—即来自每一视网膜鼻半侧的纤维在视交叉处交叉,而来自视 网膜颞侧部分的神经纤维不交叉(图 A.7)。交叉的纤维与另一颞半侧不交叉的纤维合并后
继续通向外侧膝状体。另外也有一部分通向上丘。由外侧膝状体发出的纤维称为视放射,最 后到达大脑皮层的枕叶,即纹状区。这是视觉高级中枢部分。这部分受到损伤时会引起视觉 信息分析和综合过程的破环。整个大脑皮层约有101个神经元,其中大约10%在视觉皮层 BIOLOGICAl. VISION SYSTEMS 79 visual ficld Ontic nerve Lateral nuCleu o otlier formatioa nucleus isn!cure心 Visual colex ot the right heailspiu AssOciation cortex 图A.7视觉通路 A2生物视觉信息处理 前一节从生物学的角度介绍了人类视觉系统的组成。以下我们将讨论如果从计算的角度 来研究这个生物图象处理系统将会是怎样的。这时可把视觉系统看成一个黑箱处理器,它的 输入是图象,输出是心理物理学的响应。研究的方法主要是通过神经生理学和心理物理学实 验。首先研究人类视觉系统是如何处理信息幅度的。如同计算机视觉系统那样,人类视觉系 统首先要对信号采样、量化和编码,然后作进一步的处理。信号数字化从本质上看是把信息 从连续的模拟域映射到被采样和量化的数字阵列。人类视觉系统的“数字化器”就是视网膜 阵列。它起的作用就是对输入的图象在时间域和空间域进行采样。这节将讨论生物光接收器 如何进行采样,以及它对以后处理过程的影响。采样过程对人类视觉系统的直接物理影响可 用所谓的人类视觉系统的分辨能力来描述。例如,两条黑色的平行条纹要相隔多远我们才能 把它们区分开?这里有两种研究方法。一种是从空间域,另一种是从频率域。早期的研究仅 限于空间域的方法,而近来提出的输入/输出的频率模型似乎更接近实际情况并得到最新的 实验结果的支持。这些模型导致了关于人类图象处理的非常令人感兴趣的假设 212
212 继续通向外侧膝状体。另外也有一部分通向上丘。由外侧膝状体发出的纤维称为视放射,最 后到达大脑皮层的枕叶,即纹状区。这是视觉高级中枢部分。这部分受到损伤时会引起视觉 信息分析和综合过程的破环。整个大脑皮层约有 1011 个神经元,其中大约 10%在视觉皮层。 图 A.7 视觉通路 A.2 生物视觉信息处理 前一节从生物学的角度介绍了人类视觉系统的组成。以下我们将讨论如果从计算的角度 来研究这个生物图象处理系统将会是怎样的。这时可把视觉系统看成一个黑箱处理器,它的 输入是图象,输出是心理物理学的响应。研究的方法主要是通过神经生理学和心理物理学实 验。首先研究人类视觉系统是如何处理信息幅度的。如同计算机视觉系统那样,人类视觉系 统首先要对信号采样、量化和编码,然后作进一步的处理。信号数字化从本质上看是把信息 从连续的模拟域映射到被采样和量化的数字阵列。人类视觉系统的“数字化器”就是视网膜 阵列。它起的作用就是对输入的图象在时间域和空间域进行采样。这节将讨论生物光接收器 如何进行采样,以及它对以后处理过程的影响。采样过程对人类视觉系统的直接物理影响可 用所谓的人类视觉系统的分辨能力来描述。例如,两条黑色的平行条纹要相隔多远我们才能 把它们区分开?这里有两种研究方法。一种是从空间域,另一种是从频率域。早期的研究仅 限于空间域的方法,而近来提出的输入/输出的频率模型似乎更接近实际情况并得到最新的 实验结果的支持。这些模型导致了关于人类图象处理的非常令人感兴趣的假设
A21视觉信息的空间域处理 A21.感受野( receptive field) 在计算机视觉系统中图象需要经过采样、量化、编码等步骤然后送入下一级作进一步处 理。那么这在人类视觉系统中是如何进行这些处理的呢?物体在眼球中成象以后,在细胞层 次上对信号作处理的是神经节细胞。它所完成的处理与视网膜上的感光细胞在空间上是如何 以所谓“感受野”形式组织起来有关。感受野是指当视网膜上某一特定区域受到光刺激时, 引起视觉通路较高层次上单一神经纤维或单一神经细胞的电反应,这个区域便是该神经纤 维或细胞的感受野。因此,在视觉通路不同层次上的单个细胞都有一定的感受野。这里我们 首先观察出现在形成视束的神经节细胞上的信号,以便研究输入图象在空间是如何被采样 的。更高层次上的细胞的感受野有复杂的几何形状,这便于识别输入图象中特定的图案和特 在探测细胞的感受野时可把微电极插入某一神经节细胞,并用小光点作为刺激来探索和 扫描视网膜,则可以见到在某一区域内给光或撤光可引起这个神经节细胞脉冲发放的增强或 减弱。这个区域就叫做神经节细胞的感受野。对青蛙的感受野的研究发现,大多数感受野呈 圆形,按不同功能可分为三种。如果在给光(或光线增强)时,引起神经节细胞脉冲发放频 率增加,则这种反应称为给光反应(on反应),在感受野图以“+”号表示;如果相反, 给光时无反应,而撤消时引起脉冲发放频率增加,并在撤光以后不保持脉冲发放,则这种反 应叫撤光反应(off反应),用“-”号表示;另外还有一种当给光与撤光时都能引起发放 频率增加,则称为给一撤光反应(on-o反应),用“±”号表示。所以,给光反应的感受 野可以检测照到视网膜上的光线的分布,而撤光反应和给光一撤光反应的感受野则只敏感光 线的变化 "Dif<enter lield 图A8猫的视神经节感受野 对哺乳类动物的感受野的硏究首先从猫开始。κ ufflerl ku 5发现猫的视神经节的感受野虽 然外形也是圆形,但有更复杂的几何结构。它由功能上相互颉顽的两部分,即中心部分和周 边部分组成。有两种感受野:中心部分呈给光反应,而周边部分呈撤光反应的称为给光中心 感受野:中心部分呈撒光反应,而周边部分呈给光反应的称为撤光中心感受野(图A8) 图中右半部分定性地表示了在撤光一给光一撤光过程中各部分的响应特性。 Rodieck65 213
213 A.2.1 视觉信息的空间域处理 A.2.1.1 感受野(receptive field) 在计算机视觉系统中图象需要经过采样、量化、编码等步骤然后送入下一级作进一步处 理。那么这在人类视觉系统中是如何进行这些处理的呢?物体在眼球中成象以后,在细胞层 次上对信号作处理的是神经节细胞。它所完成的处理与视网膜上的感光细胞在空间上是如何 以所谓“感受野”形式组织起来有关。感受野是指当视网膜上某一特定区域受到光刺激时, 引起视觉通路较高层次上单一神经纤维或单一神经细胞的电反应,这个区域便 是该神经纤 维或细胞的感受野。因此,在视觉通路不同层次上的单个细胞都有一定的感受野。这里我们 首先观察出现在形成视束的神经节细胞上的信号,以便研究输入图象在空间是如何被采样 的。更高层次上的细胞的感受野有复杂的几何形状,这便于识别输入图象中特定的图案和特 征。 在探测细胞的感受野时可把微电极插入某一神经节细胞,并用小光点作为刺激来探索和 扫描视网膜,则可以见到在某一区域内给光或撤光可引起这个神经节细胞脉冲发放的增强或 减弱。这个区域就叫做神经节细胞的感受野。对青蛙的感受野的研究发现,大多数感受野呈 圆形,按不同功能可分为三种。如果在给光(或光线增强)时,引起神经节细胞脉冲发放频 率增加,则这种反应称为给光反应(on 反应),在感受野图以“+”号表示;如果相反, 给光时无反应,而撤消时引起脉冲发放频率增加,并在撤光以后不保持脉冲发放,则这种反 应叫撤光反应(off 反应),用“-”号表示;另外还有一种当给光与撤光时都能引起发放 频率增加,则称为给-撤光反应(on-off 反应),用“±”号表示。所以,给光反应的感受 野可以检测照到视网膜上的光线的分布,而撤光反应和给光—撤光反应的感受野则只敏感光 线的变化。 图 A 8 猫的视神经节感受野 对哺乳类动物的感受野的研究首先从猫开始。Kuffler[Ku 53]发现猫的视神经节的感受野虽 然外形也是圆形,但有更复杂的几何结构。它由功能上相互颉顽的两部分,即中心部分和周 边部分组成。有两种感受野:中心部分呈给光反应,而周边部分呈撤光反应的称为给光中心 感受野;中心部分呈撤光反应,而周边部分呈给光反应的称为撤光中心感受野(图 A.8)。 图中右半部分定性地表示了在撤光—给光—撤光过程中各部分的响应特性。Rodieck[Rod 65]
对猫的感受野中各处的响应特性的幅度作了定量的实验研究,发现感爱野中各处的灵敏度特 性的三维轮廓类似于墨西哥草帽。这个实验结果为第二章中叙述的,马尔以ⅴG作为最优 滤波器的概念提供了神经生理学的依据。 感受野不仅映射到神经节细胞的输出,而且映射到外侧膝状体和视觉皮层细胞 ammon!Han3提出了一个简化的感受野分层模型。视觉皮层细胞感受野的组织结构更为灵 活,具有更强的特征检测能力。 如前所述视网膜上的感光细胞数量要比视束中的神经纤维多两个数量级。所以,通过感 受野既对输入信号进行了采样,又在空间组织上作了紧缩。 A212生物视觉系统中的特征检测 Lettvinllet 59在题为“青蛙的眼睛告诉青蛙的大脑什么”的论文中提出了一个令人感兴 趣的观点,即认为在青蛙的视网膜中实际上包含一个可检测图案的特征检测器。这就启发人 们提出了人和动物的视觉系统是把算法硬化了的计算处理器的假设。在青蛙的视觉系统中生 物处理器检测输入图象中的边缘和由边缘组成的特征。这意味着在更高层的信息处理中是对 这些特征、而不是对原始数据进行分析 目前认为存在两类视觉系统。第一类系统在视网膜上就有完成低层处理的神经节细胞。 青蛙、兔、麻雀的视觉系统就是这种类型。这些动物具有敏感边缘、方向、运动方向等特征 的能力:第二类是较为高等的动物,如猫、猴子和人类的视觉系统。在这类系统中神经节被 认为只检测颜色和对比度。值得注意的是有相当充分的神经生理学方面的证据说明猫和猴子 是在脑皮层完成边缘特征计算的。并且,有证据表明这样的计算是分层进行的。因此,从本 质上看,区分这两类视觉系统的基础是看是否具有高度发展的大脑皮层。当然,我们最感兴 趣的是在人的大脑皮层中发生的情况,但在目前的技术水平下无法在人体上进行电生理实 验。我们认为猴子的视觉系统特性与人类的非常相象。在这一节中我们将着重叙述第二类视 觉系统,这一类系统的特点是在大脑皮层中完成复杂的特征分析。Hube和 Wissel Hut63,68 以猫和猴子为对象所进行的开创性研究使他们获得了诺贝尔奖。他们发现猫和猴子的大脑皮 层视区中的神经元根据它们的感受野特性可分成简单型、复杂型和超复杂型等细胞类型 1.简单型细胞 图A9中所示为各种简单型细胞的感受野。图中“+”表示光刺激这个位置时引起兴奋 细胞的输出脉冲频率增加;“一”表示光刺激这个位置时引起抑制,细胞的输出脉冲频率降 低。光同时刺激这两个区域时,则两种效应相互抵消。对与兴奋区大小完全相同的 刺激图案反应最强。简单型细胞敏感的特点可概括成以下几种:(1)检测在特定位置、特定 方位(最适方位)的亮直线。(2)检测在特定方位的暗直线。(3)检测特定方位的边缘。 感受野的最适方位对每个细胞是固有的。移动光刺激图案时,一般可以观察到比给、撤 静止图案时有更强的反应。除了图案的形状和方位,而且运动方向也起重要作用。一般沿与 最适方位垂直的方向运动时输出最大。 图A9中所示的各种感受野是如何形成的呢?一种可能的模型如图A.10所示。图A.10 表示亮线检测器可由神经节或外侧膝状体中的给光中心型神经元通过突触联系而构成
214 对猫的感受野中各处的响应特性的幅度作了定量的实验研究,发现感爱野中各处的灵敏度特 性的三维轮廓类似于墨西哥草帽。这个实验结果为第二章中叙述的,马尔以 2G 作为最优 滤波器的概念提供了神经生理学的依据。 感受野不仅映射到神经节细胞的输出,而且映射到外侧膝状体和视觉皮层细胞。 Hammond[Ham 73]提出了一个简化的感受野分层模型。视觉皮层细胞感受野的组织结构更为灵 活,具有更强的特征检测能力。 如前所述视网膜上的感光细胞数量要比视束中的神经纤维多两个数量级。所以,通过感 受野既对输入信号进行了采样,又在空间组织上作了紧缩。 A.2.1.2 生物视觉系统中的特征检测 Lettvin[Let 59]在题为“青蛙的眼睛告诉青蛙的大脑什么”的论文中提出了一个令人感兴 趣的观点,即认为在青蛙的视网膜中实际上包含一个可检测图案的特征检测器。这就启发人 们提出了人和动物的视觉系统是把算法硬化了的计算处理器的假设。在青蛙的视觉系统中生 物处理器检测输入图象中的边缘和由边缘组成的特征。这意味着在更高层的信息处理中是对 这些特征、而不是对原始数据进行分析。 目前认为存在两类视觉系统。第一类系统在视网膜上就有完成低层处理的神经节细胞。 青蛙、兔、麻雀的视觉系统就是这种类型。这些动物具有敏感边缘、方向、运动方向等特征 的能力;第二类是较为高等的动物,如猫、猴子和人类的视觉系统。在这类系统中神经节被 认为只检测颜色和对比度。值得注意的是有相当充分的神经生理学方面的证据说明猫和猴子 是在脑皮层完成边缘特征计算的。并且,有证据表明这样的计算是分层进行的。因此,从本 质上看,区分这两类视觉系统的基础是看是否具有高度发展的大脑皮层。当然,我们最感兴 趣的是在人的大脑皮层中发生的情况,但在目前的技术水平下无法在人体上进行电生理实 验。我们认为猴子的视觉系统特性与人类的非常相象。在这一节中我们将着重叙述第二类视 觉系统,这一类系统的特点是在大脑皮层中完成复杂的特征分析。Hubel 和 Wissel[Hub 63, 68] 以猫和猴子为对象所进行的开创性研究使他们获得了诺贝尔奖。他们发现猫和猴子的大脑皮 层视区中的神经元根据它们的感受野特性可分成简单型、复杂型和超复杂型等细胞类型。 1. 简单型细胞 图 A.9 中所示为各种简单型细胞的感受野。图中“+”表示光刺激这个位置时引起兴奋, 细胞的输出脉冲频率增加;“一”表示光刺激这个位置时引起抑制,细胞的输出脉冲频率降 低。光同时刺激这两个区域时,则两种效应相互抵消。对与兴奋区大小完全相同的 刺激图案反应最强。简单型细胞敏感的特点可概括成以下几种:(1)检测在特定位置、特定 方位(最适方位)的亮直线。(2) 检测在特定方位的暗直线。(3)检测特定方位的边缘。 感受野的最适方位对每个细胞是固有的。移动光刺激图案时,一般可以观察到比给、撤 静止图案时有更强的反应。除了图案的形状和方位,而且运动方向也起重要作用。一般沿与 最适方位垂直的方向运动时输出最大。 图 A.9 中所示的各种感受野是如何形成的呢?一种可能的模型如图 A.10 所示。图 A.10 表示亮线检测器可由神经节或外侧膝状体中的给光中心型神经元通过突触联系而构成
图A9各种简单型细型的感受野 slit delt<inr 图A.10简单型细胞突触关系的模型 2.复杂型细胞 复杂型细胞仍对刺激图案中的直线和边缘的方位以及运动方向很敏感,但与简单型细胞 不同,对它们的位置不敏感。图A,11表示当条形图案沿最适方向垂直移过复杂细胞感受野 时,在A,B,C位置都有很强的输出,而如果水平移过D时则由于不在最适方向上移动,没有 输出。如果是简单细胞感受野就只在B位置有强的输出时神经元才有强烈反应,而对其它 方向的边缘则无反应。(b)表示只要边缘在感受野之内,则神经元的反应与边缘的位置无关。 图A.12表示复杂型细胞可能如何由简单型细胞和神经节细胞的感受野构成的。 3.超复杂型细胞 迄今为止,在大脑视区的神经细胞中发现的最高层次是超复杂型细胞。它又可分成低级 和高级两种。 I)低级超复杂型细胞。这种细胞可敏感直线和边缘的方向和运动,并且作为刺激的直 线的长度和边缘的宽度都有最适值。如图A.13所示,比最适长度更长的直线或比最适宽度 215
215 图 A.9 各种简单型细型的感受野 图 A.10 简单型细胞突触关系的模型 2. 复杂型细胞 复杂型细胞仍对刺激图案中的直线和边缘的方位以及运动方向很敏感,但与简单型细胞 不同,对它们的位置不敏感。图 A.11 表示当条形图案沿最适方向垂直移过复杂细胞感受野 时,在 A, B, C 位置都有很强的输出,而如果水平移过 D 时则由于不在最适方向上移动,没有 输出。如果是简单细胞感受野就只在 B 位置有强的输出时神经元才有强烈反应,而对其它 方向的边缘则无反应。(b)表示只要边缘在感受野之内,则神经元的反应与边缘的位置无关。 图 A.12 表示复杂型细胞可能如何由简单型细胞和神经节细胞的感受野构成的。 3. 超复杂型细胞 迄今为止,在大脑视区的神经细胞中发现的最高层次是超复杂型细胞。它又可分成低级 和高级两种。 (1) 低级超复杂型细胞。这种细胞可敏感直线和边缘的方向和运动,并且作为刺激的直 线的长度和边缘的宽度都有最适值。如图 A.13 所示,比最适长度更长的直线或比最适宽度
更宽的边缘,如同运动方向不在最适方向上一样都会使其反应受到抑制 NEURAL RESPONSES Complex cell ↓M -HHI 图A.11复杂型细胞的感受野 ○○○ 图A.12复杂型细胞的突触联系模式 (2)高级超复杂型细胞。它可以检测边缘角的运动。如图A14所示,当90度的角从右 向左运动时产生最大的反应。如同在较低层次上看到的那样,人们曾经认为超复杂细胞可由 组复杂细胞来构成。但这样的模型已被最近的实验结果所否定。目前我们还不太清楚上述 特征检测器的细节,以及它们内部是如何连接的,但有一点可以肯定的是在猫的视觉系统中 存在某种形式的特征检测器,并且起着重要作用。我们假设在人的视觉系统中也存在着相似 的机理 A.21.3侧抑制( lateral inhibition) 前面我们研究了视网膜细胞如何组织成感受野,以及这些感受野如何构成一个分层的结 构以便检测直线、边缘、甚至角的特征。到目前为止我们研究的是各个层次上单个细胞与视 网膜细胞之间的空间组织。因此还需要研究同一层次上各个神经元细胞之间的相互作用。同 层次上的各个神经元之间通过紧密的联系完成对信息的处理。这些处理可分成局部的和全 216
216 更宽的边缘,如同运动方向不在最适方向上一样都会使其反应受到抑制。 图 A.11 复杂型细胞的感受野 图 A.12 复杂型细胞的突触联系模式 (2) 高级超复杂型细胞。它可以检测边缘角的运动。如图 A.14 所示,当 90 度的角从右 向左运动时产生最大的反应。如同在较低层次上看到的那样,人们曾经认为超复杂细胞可由 一组复杂细胞来构成。但这样的模型已被最近的实验结果所否定。目前我们还不太清楚上述 特征检测器的细节,以及它们内部是如何连接的,但有一点可以肯定的是在猫的视觉系统中 存在某种形式的特征检测器,并且起着重要作用。我们假设在人的视觉系统中也存在着相似 的机理。 A.2.1.3 侧抑制(lateral inhibition) 前面我们研究了视网膜细胞如何组织成感受野,以及这些感受野如何构成一个分层的结 构以便检测直线、边缘、甚至角的特征。到目前为止我们研究的是各个层次上单个细胞与视 网膜细胞之间的空间组织。因此还需要研究同一层次上各个神经元细胞之间的相互作用。同 一层次上的各个神经元之间通过紧密的联系完成对信息的处理。这些处理可分成局部的和全