正在加载图片...
如果每帧图中的基元是短线段,那么可应用附加的规则,对短线段来说,对应关系不 仅取决于基元之间的距离,而且跟它们的相对长度和方向有关。在其他参数相同时,给定 的线段优先跟另一根有相似长度和方向的线段相匹配,这就要规定线段之间的相似性矩 阵。相似性矩阵是相似性、方位、长度和对比度的函数。每个基元倾向于跟最相似的基元 匹配。这种选择性的简单和著名的例子是运动图象中马车车轮现象,在这样的图中,带辐 条的车轮的表观运动跟车轮的实际方向相反。这种现象是视觉系统从两个相竞争的运动中 优先选择其中距离和角度变化量小的那个的结果 形体( figure)和基元组之间的对应关系不是只以相似性为基础。还存在着在一对一的 基础上匹配基元组这样的倾向,一个基元可能不跟最相似的基元匹配,因为这个基元已经 找到它的对应物,而通常二对一的匹配是要避免的。 标记匹配方案的两个常见的问题跟生理系统和跟计算机视觉系统都有关系。 第一个问题涉及在怎样的水平上建立对应关系。这就是处理的程度和分解标记的复杂 程度。可以在象点、斑点( blobs)、边缘段或短线段这样的简单标记之间建立匹配,也可 以在具有结构形式的甚至已识别物体的图象这样的复杂标记之间建立匹配。应用复杂的标 记可以简化对应过程,因此通常复杂的标记在后续的那帧图象中只有唯一的对应物。与此 相反,原始的标记象短的边缘段通常存在许多相互竞争的可能匹配。但是应用原始标记具 有两个突出的优点。首先是降低了对预处理的要求。这在运动感觉中是非常重要的,因为 这时对计算时间的限制很严格。第二,原始标记允许在各种物体作复杂外形变化的运动时 进行对应关系的匹配。这是因为复杂形体的对应关系是通过构成形体的基元组之间的匹配 来建立的。因此,似乎对应关系应该建立在相当原始的水平上,可能在Mar的完全初始简 图水平。 第二个问题涉及在视觉运动分析的集成系统中基于灰度的方案和基于标记匹配方案可 能起的作用。基于灰度的方案一般比较快和灵敏。例如,人类视觉系统可以探测低到每秒 一视觉弧分( one minute of visual are)的速度。这个速度仅为太阳径过天空速度的4倍。 猫的视觉皮层中的方向选择单元能可靠地对小到0.87弧分的偏离作出响应(大约4米距离 上1毫米)。人类甚至可探测更小的偏离。但另一方面,局部测量的不确定性使得单独地 以灰度为基础的方案来准确求得速度场很困难。从原理上讲,基于标记匹配的方案可以在 长距离范围内跟踪明确定位的标记(象线段的端点),因此可达到高的准确性,这样做的 代价是需要比较费时的标记定位和解决对应问题的过程 根据它们的基本特性,这两种运动测量方案可以完成不同的视觉任务。基于灰度的方 案一般用作为外围的,吸引注意力的和早期警报系统和用于把运动的物体跟背景相分割的 系统。在根据运动发现物体三维结构的任务中标记匹配方案可能起主要作用。在发现三维 结构的任务中要进行在相当长的距离范围内准确跟踪。某个最新的心理物理学的证据说明 在人的视觉系统中长范围过程对根据运动发现结构来说是关键的。第二种可能性是这两种 方案相互作用以便相互补充。例如,长范围对应关系的计算可以由通过短范围方案提供的 附加约束来导引的。 712视觉运动的解释 生理的和基于计算机的运动分析系统有三种用途。这些用途按其复杂性排列如下 1)周围物体的分割 (2)发现三维形状 (3)基于运动的识别 135135 如果每帧图中的基元是短线段,那么可应用附加的规则,对短线段来说,对应关系不 仅取决于基元之间的距离,而且跟它们的相对长度和方向有关。在其他参数相同时,给定 的线段优先跟另一根有相似长度和方向的线段相匹配,这就要规定线段之间的相似性矩 阵。相似性矩阵是相似性、方位、长度和对比度的函数。每个基元倾向于跟最相似的基元 匹配。这种选择性的简单和著名的例子是运动图象中马车车轮现象,在这样的图中,带辐 条的车轮的表观运动跟车轮的实际方向相反。这种现象是视觉系统从两个相竞争的运动中 优先选择其中距离和角度变化量小的那个的结果。 形体(figure)和基元组之间的对应关系不是只以相似性为基础。还存在着在一对一的 基础上匹配基元组这样的倾向,一个基元可能不跟最相似的基元匹配,因为这个基元已经 找到它的对应物,而通常二对一的匹配是要避免的。 标记匹配方案的两个常见的问题跟生理系统和跟计算机视觉系统都有关系。 第一个问题涉及在怎样的水平上建立对应关系。这就是处理的程度和分解标记的复杂 程度。可以在象点、斑点(blobs)、边缘段或短线段这样的简单标记之间建立匹配,也可 以在具有结构形式的甚至已识别物体的图象这样的复杂标记之间建立匹配。应用复杂的标 记可以简化对应过程,因此通常复杂的标记在后续的那帧图象中只有唯一的对应物。与此 相反,原始的标记象短的边缘段通常存在许多相互竞争的可能匹配。但是应用原始标记具 有两个突出的优点。首先是降低了对预处理的要求。这在运动感觉中是非常重要的,因为 这时对计算时间的限制很严格。第二,原始标记允许在各种物体作复杂外形变化的运动时 进行对应关系的匹配。这是因为复杂形体的对应关系是通过构成形体的基元组之间的匹配 来建立的。因此,似乎对应关系应该建立在相当原始的水平上,可能在 Marr 的完全初始简 图水平。 第二个问题涉及在视觉运动分析的集成系统中基于灰度的方案和基于标记匹配方案可 能起的作用。基于灰度的方案一般比较快和灵敏。例如,人类视觉系统可以探测低到每秒 一视觉弧分(one minute of visual are)的速度。这个速度仅为太阳径过天空速度的 4 倍。 猫的视觉皮层中的方向选择单元能可靠地对小到 0.87 弧分的偏离作出响应(大约 4 米距离 上 1 毫米)。人类甚至可探测更小的偏离。但另一方面,局部测量的不确定性使得单独地 以灰度为基础的方案来准确求得速度场很困难。从原理上讲,基于标记匹配的方案可以在 长距离范围内跟踪明确定位的标记(象线段的端点),因此可达到高的准确性,这样做的 代价是需要比较费时的标记定位和解决对应问题的过程。 根据它们的基本特性,这两种运动测量方案可以完成不同的视觉任务。基于灰度的方 案一般用作为外围的,吸引注意力的和早期警报系统和用于把运动的物体跟背景相分割的 系统。在根据运动发现物体三维结构的任务中标记匹配方案可能起主要作用。在发现三维 结构的任务中要进行在相当长的距离范围内准确跟踪。某个最新的心理物理学的证据说明 在人的视觉系统中长范围过程对根据运动发现结构来说是关键的。第二种可能性是这两种 方案相互作用以便相互补充。例如,长范围对应关系的计算可以由通过短范围方案提供的 附加约束来导引的。 7.1.2 视觉运动的解释 生理的和基于计算机的运动分析系统有三种用途。这些用途按其复杂性排列如下: (1) 周围物体的分割 (2) 发现三维形状 (3).基于运动的识别
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有