正在加载图片...
·122· 智能系统学 报 第14卷 的关键技术,由于其重要的学术价值、潜在的商 提高了跟踪准确率。为降低计算复杂度,Ning 业价值和广泛的应用前景迅速成为计算机视觉领 等提出了一种基于双线性结构化的SVM模型, 域研究的热点和难点,已成功应用于智能监控、机 该模型采用的特征图可达到近似非线性核的效 器人、医学成像及人体运动分析等人机交互领域网, 果,因此跟踪性能得到大幅度提升,然而该算法 越来越多的学者和机构在相关方面进行了大量的 的跟踪速度依然限制了其实际应用。因此,Wang 研究工作,同时取得了较好的成就。然而,目标 等6提出了一种高置信度的模板更新策略,能尽 形状变化、快速运动和遮挡一直是限制目标跟踪 可能地避免模板更新引入的背景信息,但目标跟 在实际场合应用的瓶颈。 踪过程中,目标往往不是一成不变的,目标状态 最近,KC以其高效的计算能力成功引起了 的变化会引起当前跟踪框的置信度较小,从而导 众多研究者的重视和青睐,同时在目标跟踪中取 致学习到的模板无法拟合目标的变化。 得了较好的性能。该方法首次将快速Fourier变 以上2种方法致力于设计更复杂的特征或者 换成功应用到目标跟踪中,达到了实时跟踪的效 分类器,在提高跟踪精度的同时,无疑大大增加 果。然而该算法未对遮挡和快速运动中的目标跟 了算法的复杂度,从而限制了视觉跟踪的实时性 踪作进一步处理:同时为了减少训练样本数目少 能,同时,上述方法并没有对目标的快速运动和 的缺陷,每一帧均用于模板更新,以增强模板的 目标遮挡作进一步的处理。 检测性能,但这也使得大量的与目标无关的背景 1跟踪算法新构架 信息被加入到模板更新中,导致跟踪框漂移,目 标跟踪性能下降。针对经典的KCF算法存在的 本文提出了一种自适应模板更新的判别式核 问题,最新的跟踪算法主要从2个方面作改进:一 相关滤波跟踪新构架,如图1所示。能够判断当 种是目标特征表示的优化设计,另一种是鲁棒的 前跟踪状态是否正常,及时恢复丢失的目标,同 分类器的设计。 时能够判断当前跟踪的目标是否发生形状变化, 1)目标新特征的优化设计方法。特征的优化 并制定出不同的机制恢复丢失的目标,实现了高 设计是目标跟踪领域一个非常重要的研究线索, 效的目标跟踪。 该方法主要致力于目标表示的设计,即通过采用 1.1基于判别式模型的跟踪质量判定 机器学习方法或者深度学习方法设计表达能力更 为了实时监督跟踪目标是否发生形状变化或 好的特征,实现目标更详细的描述。文献[4-8]对 者目标丢失的情况,本文提出一种基于外观判别 传统特征进行改进;考虑到深度学习在特征表示 式分类器的跟踪质量判定标准,以判断跟踪结果 中的优越性,文献[9-13]采用深度卷积神经网络挖 的准确性,实现目标的有效跟踪。本文跟踪结果 掘高层卷积特征,以增强跟踪算法的性能。文献9] 判定标准的定义和实现如下: 直接从预训练的深度CNN中提取若干层特征并 1)获取初始帧中目标框的初始信息。采用目 用于学习自适应相关滤波器,保证了跟踪准确率 标检测算法对输入帧执行目标检测,获取目标框 和鲁棒性。进一步地,文献[1O提出了一种基于CNN 的初始信息,包括目标所在位置以及尺寸大小。 的序列训练方法,该方法把每个通道的特征输出 2)构建判别式分类器的样本训练集并分配样 作为单独的跟踪器,最后将分类器的结果级联作 本标签。以一定步长在目标框的周围进行稠密采 为最后的决策输出。目标特征的优化设计方法, 样,获取与目标框大小相同的训练样本;假设样 虽取得了一定成绩,但目标跟踪算法旨在区分出 本图像所在框与目标框之间的重叠阈值为Tp,分 背景和目标区域,该方法所学习到的特征只表示 别计算所有样本图像与目标框的重叠值;当重叠 了目标视频的底层视觉信息,未对背景作进一步 值大于T时,设置该样本图像的标签为1,否则为0。 约束,导致学习到的模板判别能力非常有限。因 3)提取样本的HOG特征在低维空间的特征 此,获取判别性好的目标特征仍是一个比较棘手 表示,即HOG描述子。首先提取所有样本的HOG 的难题。 特征,然后采用PCA-net的思想对HOG特征作 2)鲁棒的分类器的设计方法。鲁棒的分类器 进一步的降维处理,旨在获取更抽象且判别性更 设计方法主要是通过建立优化机制,对需要进行 好的特征表示f。 模板更新的样本作限制,进一步保证了模板对于 4)对所有正负样本重复3),得到所有样本的 目标的检测效果。为了充分利用结构化输出的 低维特征表示,为当前目标学习判别模型svm,并 SVM能够处理复杂输出,如树、序列和集合等优 加入到集合SVM中,SVM为跟踪目标出现的所 势,Hare等首次将该算法应用到跟踪中,大大 有外观状态对应的分类器集合。的关键技术,由于其重要的学术价值、潜在的商 业价值和广泛的应用前景迅速成为计算机视觉领 域研究的热点和难点,已成功应用于智能监控、机 器人、医学成像及人体运动分析等人机交互领域[1-2] , 越来越多的学者和机构在相关方面进行了大量的 研究工作,同时取得了较好的成就。然而,目标 形状变化、快速运动和遮挡一直是限制目标跟踪 在实际场合应用的瓶颈。 最近,KCF[3]以其高效的计算能力成功引起了 众多研究者的重视和青睐,同时在目标跟踪中取 得了较好的性能。该方法首次将快速 Fourier 变 换成功应用到目标跟踪中,达到了实时跟踪的效 果。然而该算法未对遮挡和快速运动中的目标跟 踪作进一步处理;同时为了减少训练样本数目少 的缺陷,每一帧均用于模板更新,以增强模板的 检测性能,但这也使得大量的与目标无关的背景 信息被加入到模板更新中,导致跟踪框漂移,目 标跟踪性能下降。针对经典的 KCF 算法存在的 问题,最新的跟踪算法主要从 2 个方面作改进:一 种是目标特征表示的优化设计,另一种是鲁棒的 分类器的设计。 1) 目标新特征的优化设计方法。特征的优化 设计是目标跟踪领域一个非常重要的研究线索, 该方法主要致力于目标表示的设计,即通过采用 机器学习方法或者深度学习方法设计表达能力更 好的特征,实现目标更详细的描述。文献[4-8]对 传统特征进行改进;考虑到深度学习在特征表示 中的优越性,文献[9-13]采用深度卷积神经网络挖 掘高层卷积特征,以增强跟踪算法的性能。文献[9] 直接从预训练的深度 CNN 中提取若干层特征并 用于学习自适应相关滤波器,保证了跟踪准确率 和鲁棒性。进一步地,文献[10]提出了一种基于 CNN 的序列训练方法,该方法把每个通道的特征输出 作为单独的跟踪器,最后将分类器的结果级联作 为最后的决策输出。目标特征的优化设计方法, 虽取得了一定成绩,但目标跟踪算法旨在区分出 背景和目标区域,该方法所学习到的特征只表示 了目标视频的底层视觉信息,未对背景作进一步 约束,导致学习到的模板判别能力非常有限。因 此,获取判别性好的目标特征仍是一个比较棘手 的难题。 2) 鲁棒的分类器的设计方法。鲁棒的分类器 设计方法主要是通过建立优化机制,对需要进行 模板更新的样本作限制,进一步保证了模板对于 目标的检测效果。为了充分利用结构化输出的 SVM 能够处理复杂输出,如树、序列和集合等优 势,Hare 等 [14]首次将该算法应用到跟踪中,大大 提高了跟踪准确率。为降低计算复杂度,Ning 等 [15]提出了一种基于双线性结构化的 SVM 模型, 该模型采用的特征图可达到近似非线性核的效 果,因此跟踪性能得到大幅度提升,然而该算法 的跟踪速度依然限制了其实际应用。因此,Wang 等 [16]提出了一种高置信度的模板更新策略,能尽 可能地避免模板更新引入的背景信息,但目标跟 踪过程中,目标往往不是一成不变的,目标状态 的变化会引起当前跟踪框的置信度较小,从而导 致学习到的模板无法拟合目标的变化。 以上 2 种方法致力于设计更复杂的特征或者 分类器,在提高跟踪精度的同时,无疑大大增加 了算法的复杂度,从而限制了视觉跟踪的实时性 能,同时,上述方法并没有对目标的快速运动和 目标遮挡作进一步的处理。 1 跟踪算法新构架 本文提出了一种自适应模板更新的判别式核 相关滤波跟踪新构架,如图 1 所示。能够判断当 前跟踪状态是否正常,及时恢复丢失的目标,同 时能够判断当前跟踪的目标是否发生形状变化, 并制定出不同的机制恢复丢失的目标,实现了高 效的目标跟踪。 1.1 基于判别式模型的跟踪质量判定 为了实时监督跟踪目标是否发生形状变化或 者目标丢失的情况,本文提出一种基于外观判别 式分类器的跟踪质量判定标准,以判断跟踪结果 的准确性,实现目标的有效跟踪。本文跟踪结果 判定标准的定义和实现如下: 1) 获取初始帧中目标框的初始信息。采用目 标检测算法对输入帧执行目标检测,获取目标框 的初始信息,包括目标所在位置以及尺寸大小。 Tovp Tovp 2) 构建判别式分类器的样本训练集并分配样 本标签。以一定步长在目标框的周围进行稠密采 样,获取与目标框大小相同的训练样本;假设样 本图像所在框与目标框之间的重叠阈值为 ,分 别计算所有样本图像与目标框的重叠值;当重叠 值大于 时,设置该样本图像的标签为 1,否则为 0。 f 3) 提取样本的 HOG 特征在低维空间的特征 表示,即 HOG 描述子。首先提取所有样本的 HOG 特征,然后采用 PCA-net[17]的思想对 HOG 特征作 进一步的降维处理,旨在获取更抽象且判别性更 好的特征表示 。 svm1 SVMobj SVMobj 4) 对所有正负样本重复 3),得到所有样本的 低维特征表示,为当前目标学习判别模型 ,并 加入到集合 中, 为跟踪目标出现的所 有外观状态对应的分类器集合。 ·122· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有