·96 智能系统学报 第5卷 行为;如何有效地用自然语言解释行为;如何有效地 因为目标假设作为分析图像的限制条件;但是它的 利用训练和匹配算法来处理在空间和时间域中与其 性能很大程度是由产生和校正这些假设的方法来决 有相似的行为模式的差异.但是,如何让机器自动地 定的,为了获得健壮的跟踪效果,需要很多目标假 跟踪目标是计算机视觉领域的一个难点,也是目前 设,而对这些假设进行估计又需要大量的计算.其中 研究的热点之一 后者是目前视觉跟踪的主流方法,但将这2种数学 1视觉跟踪算法的分类 方法结合起来有助于提高跟踪算法的健壮性又可以 减少计算量. 视觉跟踪简单地说就是估计一个对象的运动轨 视觉跟踪算法之间的差别一般有以下几方面: 迹.另外,一个跟踪系统还可以获得被跟踪对象的一 1)跟踪对象的表示; 些信息:对象的运动方向、速度、加速度、位置,从而 2)跟踪对象的外表、运动、形状的表示; 为进一步处理与分析,实现对运动对象的行为理解, 3)图像特征的选择 完成更高一级的任务做准备 传统的跟踪对象可以表示成点、原始的几何形 一个理想的视觉跟踪算法应具有以下特性: 状(如矩形、椭圆形等)、对象的轮廓和投影、骨架模 1)快捷性:视觉跟踪算法应该能够有效地跟踪 型、关节状模型等2) 运动目标,同时对场景的突然变化做出反应,这是视 视觉跟踪算法一般分成基于区域的跟踪算法 觉跟踪算法的根本目的; (region-based tracking algorithm)、基于模型的跟踪 2)鲁棒性:鲁棒性意味着可用性.被跟踪对象 算法(model--based tracking algorithm)、基于特征的 从3-D投影到2-D时会造成信息损失、图像中的噪 跟踪算法(feature-based tracking algorithm)、基于主 声、物体运动的复杂、物体的非刚性或关节的本质、 动轮廓的跟踪算法(active contour-.based tracking al- 部分和全部遮挡造成的信息暂时消失、物体姿态的 gorithm).常用的数学方法有:卡尔曼滤波器(Kal 复杂性、场景的光照变化等,客户希望在这些复杂环 man filter)、Mean shift、粒子滤波器(particle filter)、 境和情况下可以随时应用视觉跟踪算法; 动态贝叶斯网络等3] 3)透明性:视觉跟踪算法对客户应是透明的,客户 1.1基于区域的跟踪算法 得到的结果仅仅是快速的响应和良好的可用性; 基于区域的跟踪首先要分割出视频对象(video 4)高效性:视觉跟踪算法带来的运算开销越小 objects),在连续帧中建立起被分割区域之间的联 越好; 系,进而对视频对象进行跟踪4.它在包含多个对 5)稳定性:视觉跟踪算法不应给后续的运动识 象的场景中能够取得较好的效果,但不能可靠地处 别带来不稳定因素; 理对象之间的遮挡,而且只能获得区域级别的跟踪 6)简单性:视觉跟踪算法越容易实现则越容易 结果,不能获得对象的3-D姿势(3-D姿势由对象的 被普遍接受,一个理想的视觉跟踪配置应简单易行. 位置和方向构成)或轮廓31: 通常,为了更快地运行视觉跟踪算法,减少对资 文献[5]针对对象和摄像机运动无规则的环 源的需求,视觉跟踪算法应该设计得更简单;为了实 境,根据运动显著性检测的机制,提出了新的跟踪方 行更准确的跟踪目标,视觉跟踪算法又往往但要设 法,结合了目标对象的多个空间特征来实现基于区 计得很复杂 域的跟踪任务.基于区域的跟踪模型是:每帧都对每 视觉跟踪的数学解决方法有2类:自底向上和 个目标对象的特征进行更新,产生自适应的模版,如 自顶向下.自底向上方法通常是通过分析图像内容 果匹配错误较少,则运动显著图中的兴趣区域就被 来重建目标状态,如重建参数化的形状.这种方法在 标记成目标对象.但是,它没有考虑遮挡问题, 计算量上是有效的,但它的健壮性很大程度依赖于 文献[6]针对室内环境,利用一些特征来实现 对图像的分析能力.自顶向下方法产生和估计一系 单个人体的跟踪.人体被考虑成由代表人体各个部 列基于目标模型的状态假设,通过估计和校正这些 分(如头、四肢等)的块(blobs)的结合.它采用最大 图像观测的假设来实现跟踪,它通常有4个组成成 后验概率(maximum a posteriori probability,MAP)方 分:目标表示、观测表示、假设的产生和假设的估计. 法,结合先验知识来检测和跟踪人体运动,它对每个 这种方法的健壮性较少依赖于对图像的分析,这是 像素都进行高斯建模处理,然后由分类器决定这个