137 对根据运动发现三维结构的计算问题已进行了许多研究。其中所探索的主要

正在加载图片...

对根据运动发现三维结构的计算问题已进行了许多研究。其中所探索的主要问题是什么条件下从运动得到结构的问题有唯一解,以及研究根据运动发现结构的算法。这些研究的主要结果列出在表1中。如表中所示,对问题的离散形式和连续形式都进行了研究。第个形式在空间和时间上都是离散的。计算是以若干离散的帧,每帧包含许多孤立的点已经证明为了从运动中得到结构的唯一解释只要少数帧和点数就足够了:对包含至少四个不共面点的运动刚体而言,用三帧就可以确定空间运动和点的三维坐标唯一性的证明是很有价值的,因为这将导致根据运动发现结构的可能方案。景物被分成大约每组包含4个基元的组。每组结构是独立地求取的,最后局部的结果在一个附加的步骤中被组合起来。这样的方案是基于垂直投影,通过用发现方案的局部化来处理透视投影。这就是说,对四邻域点,两种类型的投影是相似的。可也能直接利用透视投影。有迹象表明在透视情况下,对唯一的解释来说,可能需要两帧图和5个点就足够了,但这种情况的证明还不知道也可以不是只考虑在若干离散观察中点的位置,而是把点的位置和速度同时作为输入 (表中第二栏)。这可能被考虑为两帧问题,帧间的时间间隔趋于零时的极限情况。这时问题就取以下形式:给出图象中N点的位置和速度,确定这些点是否属于单个运动物体和寻找在空间中的运动和这些点的三维坐标。先期的理论问题是确定能发现问题的唯一解时的最少点数N,从数学观点来看,这个问题仍然没解决。计算方程式的变量和未知数的数目揭示5个点就足够了,一个证明是由 progeny执行的计算机程序。因为计算机程序对输入中的误差很敏感,特别是当被察的物体很小时,似乎强有力的发现算法应需要多于5个点离散点和离散观察帧离散点及其速度速度场和速度场的空间导数 3个垂直投影中4个点单个透视观察投影中5 对纯平移的运动有唯一解 (ullman 1979) 点和它们的速度 (clock SIN 1980) 两个透视投影中的5个点对一般的运动最多可有三个解 (ullman 1979) (longuet-higgins and prageny 1980) 问题的第三种形式是利用速度场和速度场的空间导数。这可被看作是前面形式当点之间的距离趋于零时的特殊情况。在这种问题的简化类型中,空间的运动被限于纯粹平移在这样的假设下,解的唯一性很容易建立。根据所在点的速度和速度场的空间导数可求得每个图象点的表面方位。在包含旋转分量的更为一般的情况则要复杂得多。有一种分析方法认为某一点的速度最多时有三种解释。更准确地说,已被证明对非平面的表面(在点上给出速度和它的一阶和二阶导数)。对这个点上表面方位最多存在三个解。上述的方案是为了根据运动到结构问题的完全解。这就是说,这些方法试图发现所有的运动参数和可见环境的三维结构。与此相反,部分描述要有选择地抽取出某些运动参数。例如若干数学和心理研究试图在图象速度场中孤立出以下这样的变量:这些变量允许分离和独立地发现运动的旋转和平移分量中的每一个。一般来说,这样地分解问题是不可能的。因为图象中的速度场是由所有的运动参数跟可见的物体三维形状的内在相互作用所决定的。因此,似乎不可能在运动场中孤立出一个变量。譬如说跟平移分量无关的旋转运动分量,然而在象纯粹平移这样的特定情况下的部分解变成有吸引力的 3.基于运动的识别人类观察者可单独根据特性运动模式识别某些物体。由 Johansson进行的研究为这种能力提供了强有力的证明。通过对在黑暗中运动的,在其主要关节上装有小光源的演员摄影可提供这样的证明。每个演员由多达13个运动光点来表示。所得到的点的动态模式为运动着的演员造成一种生动的印象。以后的研究已经证明,经常可以把男演员跟女演员相区分,在某些情况下,熟人可以单独根据运动的光点被识出。研究这个问题的策略可把问题分成两步:第一步组织和描述运动模式;第二步把得到的表达跟存在内存中的相似描述比较。第一步被认为是自动的。也就是由通用结构成份 137137 对根据运动发现三维结构的计算问题已进行了许多研究。其中所探索的主要问题是什么条件下从运动得到结构的问题有唯一解，以及研究根据运动发现结构的算法。这些研究的主要结果列出在表 1 中。如表中所示，对问题的离散形式和连续形式都进行了研究。第一个形式在空间和时间上都是离散的。计算是以若干离散的帧，每帧包含许多孤立的点。已经证明为了从运动中得到结构的唯一解释只要少数帧和点数就足够了：对包含至少四个不共面点的运动刚体而言，用三帧就可以确定空间运动和点的三维坐标。唯一性的证明是很有价值的，因为这将导致根据运动发现结构的可能方案。景物被分成大约每组包含 4 个基元的组。每组结构是独立地求取的，最后局部的结果在一个附加的步骤中被组合起来。这样的方案是基于垂直投影，通过用发现方案的局部化来处理透视投影。这就是说，对四邻域点，两种类型的投影是相似的。可也能直接利用透视投影。有迹象表明在透视情况下，对唯一的解释来说，可能需要两帧图和 5 个点就足够了，但这种情况的证明还不知道。也可以不是只考虑在若干离散观察中点的位置，而是把点的位置和速度同时作为输入（表中第二栏）。这可能被考虑为两帧问题，帧间的时间间隔趋于零时的极限情况。这时问题就取以下形式：给出图象中 N 点的位置和速度,确定这些点是否属于单个运动物体和寻找在空间中的运动和这些点的三维坐标。先期的理论问题是确定能发现问题的唯一解时的最少点数 N，从数学观点来看，这个问题仍然没解决。计算方程式的变量和未知数的数目揭示 5 个点就足够了，一个证明是由 progeny 执行的计算机程序。因为计算机程序对输入中的误差很敏感，特别是当被察的物体很小时，似乎强有力的发现算法应需要多于 5 个点。表１离散点和离散观察帧离散点及其速度速度场和速度场的空间导数 3 个垂直投影中 4 个点（ullman 1979）两个透视投影中的 5 个点（ullman 1979）单个透视观察投影中 5 点和它们的速度对纯平移的运动有唯一解（clock SIN 1980）对一般的运动最多可有三个解（longuet-higgins and prageny 1980）问题的第三种形式是利用速度场和速度场的空间导数。这可被看作是前面形式当点之间的距离趋于零时的特殊情况。在这种问题的简化类型中，空间的运动被限于纯粹平移。在这样的假设下，解的唯一性很容易建立。根据所在点的速度和速度场的空间导数可求得每个图象点的表面方位。在包含旋转分量的更为一般的情况则要复杂得多。有一种分析方法认为某一点的速度最多时有三种解释。更准确地说，已被证明对非平面的表面（在点上给出速度和它的一阶和二阶导数）。对这个点上表面方位最多存在三个解。上述的方案是为了根据运动到结构问题的完全解。这就是说，这些方法试图发现所有的运动参数和可见环境的三维结构。与此相反，部分描述要有选择地抽取出某些运动参数。例如若干数学和心理研究试图在图象速度场中孤立出以下这样的变量：这些变量允许分离和独立地发现运动的旋转和平移分量中的每一个。一般来说，这样地分解问题是不可能的。因为图象中的速度场是由所有的运动参数跟可见的物体三维形状的内在相互作用所决定的。因此，似乎不可能在运动场中孤立出一个变量。譬如说跟平移分量无关的旋转运动分量，然而在象纯粹平移这样的特定情况下的部分解变成有吸引力的。 3. 基于运动的识别人类观察者可单独根据特性运动模式识别某些物体。由 Johansson 进行的研究为这种能力提供了强有力的证明。通过对在黑暗中运动的，在其主要关节上装有小光源的演员摄影可提供这样的证明。每个演员由多达 13 个运动光点来表示。所得到的点的动态模式为运动着的演员造成一种生动的印象。以后的研究已经证明，经常可以把男演员跟女演员相区分，在某些情况下，熟人可以单独根据运动的光点被识出。研究这个问题的策略可把问题分成两步：第一步组织和描述运动模式；第二步把得到的表达跟存在内存中的相似描述比较。第一步被认为是自动的。也就是由通用结构成份

<<向上翻页向下翻页>>

点击下载：《计算机视觉》课程教学资源（教材）第七章运动视觉