【机器学习】高斯核函数卷积神经网络跟踪算法

团购合买资源类别：文库，文档格式：PDF，文档页数：7，文件大小：1.39MB

第13卷第3期智能系统学报 Vol.13 No.3 2018年6月 CAAI Transactions on Intelligent Systems Jun.2018 D0:10.11992/tis.201612040 网络出版地址：http:/kns.cnki.net/kcms/detail/23.1538.TP.20170702.0425.018.html 高斯核函数卷积神经网络跟踪算法汪鸿翔，柳培忠'，骆炎民2，杜永兆，陈智 (1.华侨大学工学院.福建泉州362021：2.华侨大学计算机科学与技术学院，福建厦门361021) 摘要：针对深度学习跟踪算法训练样本缺少、训练费时、算法复杂度高等问题，引入高斯核函数进行加速，提出一种无需训练的简化卷积神经网络跟踪算法。首先，对初始帧目标进行归一化处理并聚类提取一系列初始滤波器组，跟踪过程中结合目标背景信息与前景候选目标进行卷积：然后，提取目标简单抽象特征：最后，将简单层的卷积结果进行叠加得到目标的深层次特征表达。通过高斯核函数加速来提高算法中全部卷积运算的速度，利用目标的局部结构特征信息，对网络各阶段滤波器进行更新，结合粒子滤波跟踪框架实现跟踪。在CVP℉2013跟踪数据集上的实验表明，本文方法脱离了繁琐深度学习运行环境，能克服低分辨率下目标局部遮挡与形变等问题，提高复杂背景下的跟踪效率。关键词：视觉跟踪；深度学习；卷积神经网络；高斯核函数；前景目标；背景信息；模板匹配：粒子滤波中图分类号：TP391文献标志码：A文章编号：1673-4785(2018)03-0388-07 中文引用格式：汪鸿翔，柳培忠，骆炎民，等.高斯核函数卷积神经网络跟踪算法J.智能系统学报，2018,13(3)：388-394 英文引用格式：VANG Hongxiang,LIU Peizhong,LUO Yanmin,etal.Convolutional neutral network tracking algorithm acceler-. ated by Gaussian kernel function[J.CAAI transactions on intelligent systems,2018,13(3):388-394. Convolutional neutral network tracking algorithm accelerated by Gaussi- an kernel function WANG Hongxiang',LIU Peizhong',LUO Yanmin',DU Yongzhao',CHEN Zhi' (1.College of Engineering,Huaqiao University,Quanzhou 362021,China;2.College of Computer Science and Technology,Huaqiao University,Xiamen 361021,China) Abstract:In view of such defects existing in the depth learning tracking algorithm as lack of training samples,large time consumption,and high complexity,this paper proposed a simplified convolutional neural network tracking al- gorithm in which training is unnecessary.Moreover,the Gaussian kernel function can be applied to this algorithm to sig- nificantly lower the computing time.Firstly,the initial frame target was normalized and clustered to extract a series of initial filter banks;in the tracking process,the background information of the target and the candidate target for the fore- ground were convoluted;then the simple and abstract features of the target were extracted;finally,all the convolutions of a simple layer were superposed to form a deep-level feature representation.The Gaussian kernel function was used to speed-up the convolution operations:also,the local structural feature information of the target was used to update the fil- ters in every stage of the network;in addition,the tracking was realized by combining the particle filter tracking frame- work.The experimental results on the CVPR2013 tracking datasets show that the method used in this paper can help avoid the typically cumbersome operational environment of deep learning,overcome local object occlusion and deform- ation at low resolution,and improve tracking efficiency under a complex background. Keywords:visual tracking;deep learning,convolutional neural network(CNN);gauss kernel function;foreground ob- ject,background information;template matching;particle filter 收稿日期：2016-12-31.网络出版日期：2017-07-02. 基金项目：国家自然科学基金项目(61203242,61605048)：福建省视觉跟踪是计算机视觉领域的研究热点，在虚自然科学基金项目(2016J01300,2015J01256):华侨大学研究生科研创新能力培育计划资助项目(1511422004). 拟现实、人机交互、智能监控、增强现实、机器感知通信作者：柳培忠.E-mail:pzliu@hqu.edu.cn. 等场景中有着重要的研究与应用价值。视觉跟踪通

DOI: 10.11992/tis.201612040 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20170702.0425.018.html 高斯核函数卷积神经网络跟踪算法汪鸿翔1 ，柳培忠1 ，骆炎民2 ，杜永兆1 ，陈智1 （1. 华侨大学工学院，福建泉州 362021; 2. 华侨大学计算机科学与技术学院，福建厦门 361021）摘要：针对深度学习跟踪算法训练样本缺少、训练费时、算法复杂度高等问题，引入高斯核函数进行加速，提出一种无需训练的简化卷积神经网络跟踪算法。首先，对初始帧目标进行归一化处理并聚类提取一系列初始滤波器组，跟踪过程中结合目标背景信息与前景候选目标进行卷积；然后，提取目标简单抽象特征；最后，将简单层的卷积结果进行叠加得到目标的深层次特征表达。通过高斯核函数加速来提高算法中全部卷积运算的速度，利用目标的局部结构特征信息，对网络各阶段滤波器进行更新，结合粒子滤波跟踪框架实现跟踪。在 CVPR2013 跟踪数据集上的实验表明，本文方法脱离了繁琐深度学习运行环境，能克服低分辨率下目标局部遮挡与形变等问题，提高复杂背景下的跟踪效率。关键词：视觉跟踪；深度学习；卷积神经网络；高斯核函数；前景目标；背景信息；模板匹配；粒子滤波中图分类号：TP391 文献标志码：A 文章编号：1673−4785(2018)03−0388−07 中文引用格式：汪鸿翔, 柳培忠, 骆炎民, 等. 高斯核函数卷积神经网络跟踪算法[J]. 智能系统学报, 2018, 13(3): 388–394. 英文引用格式：WANG Hongxiang, LIU Peizhong, LUO Yanmin, et al. Convolutional neutral network tracking algorithm accelerated by Gaussian kernel function[J]. CAAI transactions on intelligent systems, 2018, 13(3): 388–394. Convolutional neutral network tracking algorithm accelerated by Gaussian kernel function WANG Hongxiang1 ，LIU Peizhong1 ，LUO Yanmin2 ，DU Yongzhao1 ，CHEN Zhi1 (1. College of Engineering, Huaqiao University, Quanzhou 362021, China; 2. College of Computer Science and Technology, Huaqiao University, Xiamen 361021, China) Abstract: In view of such defects existing in the depth learning tracking algorithm as lack of training samples, large time consumption, and high complexity, this paper proposed a simplified convolutional neural network tracking algorithm in which training is unnecessary. Moreover, the Gaussian kernel function can be applied to this algorithm to significantly lower the computing time. Firstly, the initial frame target was normalized and clustered to extract a series of initial filter banks; in the tracking process, the background information of the target and the candidate target for the foreground were convoluted; then the simple and abstract features of the target were extracted; finally, all the convolutions of a simple layer were superposed to form a deep-level feature representation. The Gaussian kernel function was used to speed-up the convolution operations; also, the local structural feature information of the target was used to update the filters in every stage of the network; in addition, the tracking was realized by combining the particle filter tracking framework. The experimental results on the CVPR2013 tracking datasets show that the method used in this paper can help avoid the typically cumbersome operational environment of deep learning, overcome local object occlusion and deformation at low resolution, and improve tracking efficiency under a complex background. Keywords: visual tracking; deep learning; convolutional neural network (CNN); gauss kernel function; foreground object; background information; template matching; particle filter 视觉跟踪是计算机视觉领域的研究热点，在虚拟现实、人机交互、智能监控、增强现实、机器感知等场景中有着重要的研究与应用价值。视觉跟踪通收稿日期：2016−12−31. 网络出版日期：2017−07−02. 基金项目：国家自然科学基金项目 (61203242，61605048)；福建省自然科学基金项目 (2016J01300，2015J01256)；华侨大学研究生科研创新能力培育计划资助项目 (1511422004). 通信作者：柳培忠. E-mail：pzliu@hqu.edu.cn. 第 13 卷第 3 期智能系统学报 Vol.13 No.3 2018 年 6 月 CAAI Transactions on Intelligent Systems Jun. 2018

第3期汪鸿翔，等：高斯核函数卷积神经网络跟踪算法 ·389· 过分析视频图片序列，对检测出的各个候选目标区对。针对卷积神经网络具有强大的特征提取功能，域实施匹配，定位跟踪目标在视频序列中的位置。设计一种无需训练的卷积神经网络特征提取方法，目前跟踪算法已经取得很多研究成果，但在实际中在粒子滤波框架下，利用核函数加速卷积运算，实应对各类复杂场景时仍面临很大挑战，例如面对遮现了一种快速卷积神经网络跟踪算法，通过与其他挡、形变、视频序列分辨率低等影响因素时，如何实算法的对比分析，最终验证了所提出算法的有效性。现更加鲁棒和准确的跟踪仍然是目前研究的核心。视觉跟踪算法一般分为两部分：目标表观建模 1相关工作和跟踪策略。 2013年以来，深度学习算法在跟踪领域已经取 1)目标表观建模得了很大进展。如深度神经网络、卷积神经网络等根据对目标表观的建模方式可分为判别式模型深度学习方法能够挖掘出数据的多层表征，而高层和生成式模型两类2)。判别式模型将跟踪问题建级的表征更能够反映数据更深层的本质，相比传统模为一个二分类问题，用以区分前景和背景。B.Ba 浅层学习特征，基于高层次特征的跟踪算法可以提 benko等提出多示例学习算法(ML),针对跟踪中高目标的跟踪效率6。训练样本不足的问题，引入多示例学习机制，有效 1.1CNN特征提取结构抑制跟踪过程中跟踪器的漂移问题；文献[5]提出具卷积神经网铬(convolutional neural network, 有元认知能力的粒子滤波MCPF)目标跟踪算法， CNN)的网络结构类似于生物神经网络，采用局部通过监控到突变，快速调节决策机制，实现稳定的连接、权值共享和时空下采样的思想降低了网络复目标跟踪。生成式模型不考虑背景信息直接为目标杂度，减少了权值数量，使得CNN在处理高维图像进行建模。文献[6]提出了L1跟踪系统，用稀疏方时更具优势。法表示跟踪目标，但算法运算复杂度高；K.Zhang 卷积神经网络具有多层性，在传统神经网络的等提出了压缩跟踪(CT),用一个稀疏的测量矩阵基础上增加了特征提取的卷积层和保证位移不变的提取特征以建立一个稀疏、健壮的目标表观模型，下采样层。每层由多个二维平面特征映射层组成，取得快速有效、鲁棒性好的跟踪效果；文献[8]引入每个映射层由多个独立的神经元组成。卷积特征的小波纹理特征，改善单纯依靠颜色特征不能很好适提取首先对原始输入图像进行取片操作获取大量小应环境变化的情况，与单一特征相比能够实现更加的局部块，然后应用卷积网络模型对局部块进行训稳健的跟踪。练，得到结果为各个卷积层的神经元卷积滤波器， 2)跟踪策略与新输入的样本图像进行卷积滤波，提取样本图的采用运动模型来估计目标可能的位置，通过先抽象卷积特征从而得到原始图像的深度特征。如验知识来缩小搜索范围。代表性方法有隐马尔可夫图1所示，给出了一个简单卷积特征提取结构，输模型例、卡尔曼滤波、均值漂移算法和粒子滤入图像卷积后在C1层产生若干特征映射图，然后特波等。其中，粒子滤波算法因为对局部极小值相征映射图中每组的若干像素再进行求和，加权值与对不太敏感且计算非常有效而被广泛应用。另外，偏置，通过一个激活函数(Sigmoid、Relu)得到S,层近几年相关滤波跟踪算法在目标领域也取得不错的特征映射图，这些映射图再经过滤波得到C3层，的成绩。D.S.Bolme等首次将相关滤波引入跟踪这个层级结构再和S,一样产生S4。最终，这些像素领域，通过设计一个误差最小平方和滤波器MOSSE), 值全连接成一个向量输入到传统的神经网络，得到输出。在跟踪过程中寻找目标最大响应值来实现跟踪。 J.F.Henriques等提出的CSK算法使用循环矩阵 □☑ 结构进行相邻帧的相关性检测，利用灰度特征空间提高了算法的准确性。文献[15]在CSK的基础上，通过循环偏移构建分类器的训练样本，使数据矩阵变成一个循环矩阵，同时引人HOG、颜色、灰度多通道特征，提高了算法的速度和准确性。 Input输人 S,下采样层S下采样层Output输出传统跟踪算法大多数直接使用视频图像序列中 C卷积层 C,卷积层全连接层的像素值特征进行建模，当跟踪过程中出现复杂场图1卷积特征提取结构景等较大挑战时，浅层的像素级特征无法很好应 Fig.1 Convolution feature extraction structure

过分析视频图片序列，对检测出的各个候选目标区域实施匹配，定位跟踪目标在视频序列中的位置。目前跟踪算法已经取得很多研究成果，但在实际中应对各类复杂场景时仍面临很大挑战，例如面对遮挡、形变、视频序列分辨率低等影响因素时，如何实现更加鲁棒和准确的跟踪仍然是目前研究的核心[1]。视觉跟踪算法一般分为两部分：目标表观建模和跟踪策略。 1) 目标表观建模根据对目标表观的建模方式可分为判别式模型和生成式模型两类[2-3]。判别式模型将跟踪问题建模为一个二分类问题，用以区分前景和背景。B. Babenko 等 [4]提出多示例学习算法 (MIL)，针对跟踪中训练样本不足的问题，引入多示例学习机制，有效抑制跟踪过程中跟踪器的漂移问题；文献[5]提出具有元认知能力的粒子滤波 (MCPF) 目标跟踪算法，通过监控到突变，快速调节决策机制，实现稳定的目标跟踪。生成式模型不考虑背景信息直接为目标进行建模。文献[6]提出了 L1 跟踪系统，用稀疏方法表示跟踪目标，但算法运算复杂度高； K. Zhang 等 [7]提出了压缩跟踪 (CT)，用一个稀疏的测量矩阵提取特征以建立一个稀疏、健壮的目标表观模型，取得快速有效、鲁棒性好的跟踪效果；文献[8]引入小波纹理特征，改善单纯依靠颜色特征不能很好适应环境变化的情况，与单一特征相比能够实现更加稳健的跟踪。 2) 跟踪策略采用运动模型来估计目标可能的位置，通过先验知识来缩小搜索范围。代表性方法有隐马尔可夫模型[9] 、卡尔曼滤波[10] 、均值漂移算法[11]和粒子滤波 [12]等。其中，粒子滤波算法因为对局部极小值相对不太敏感且计算非常有效而被广泛应用。另外，近几年相关滤波跟踪算法在目标领域也取得不错的成绩。D.S. Bolme 等 [13]首次将相关滤波引入跟踪领域，通过设计一个误差最小平方和滤波器 (MOSSE)，在跟踪过程中寻找目标最大响应值来实现跟踪。 J.F. Henriques 等 [14]提出的 CSK 算法使用循环矩阵结构进行相邻帧的相关性检测，利用灰度特征空间提高了算法的准确性。文献[15]在 CSK 的基础上，通过循环偏移构建分类器的训练样本，使数据矩阵变成一个循环矩阵，同时引入 HOG、颜色、灰度多通道特征，提高了算法的速度和准确性。传统跟踪算法大多数直接使用视频图像序列中的像素值特征进行建模，当跟踪过程中出现复杂场景等较大挑战时，浅层的像素级特征无法很好应对。针对卷积神经网络具有强大的特征提取功能，设计一种无需训练的卷积神经网络特征提取方法，在粒子滤波框架下，利用核函数加速卷积运算，实现了一种快速卷积神经网络跟踪算法，通过与其他算法的对比分析，最终验证了所提出算法的有效性。 1 相关工作 2013 年以来，深度学习算法在跟踪领域已经取得了很大进展。如深度神经网络、卷积神经网络等深度学习方法能够挖掘出数据的多层表征，而高层级的表征更能够反映数据更深层的本质，相比传统浅层学习特征，基于高层次特征的跟踪算法可以提高目标的跟踪效率[16]。 1.1 CNN 特征提取结构卷积神经网络 (convolutional neural network， CNN) 的网络结构类似于生物神经网络，采用局部连接、权值共享和时空下采样的思想降低了网络复杂度，减少了权值数量，使得 CNN 在处理高维图像时更具优势。卷积神经网络具有多层性，在传统神经网络的基础上增加了特征提取的卷积层和保证位移不变的下采样层。每层由多个二维平面特征映射层组成，每个映射层由多个独立的神经元组成。卷积特征的提取首先对原始输入图像进行取片操作获取大量小的局部块，然后应用卷积网络模型对局部块进行训练，得到结果为各个卷积层的神经元卷积滤波器，与新输入的样本图像进行卷积滤波，提取样本图的抽象卷积特征从而得到原始图像的深度特征。如图 1 所示，给出了一个简单卷积特征提取结构，输入图像卷积后在 C1 层产生若干特征映射图，然后特征映射图中每组的若干像素再进行求和，加权值与偏置，通过一个激活函数 (Sigmoid、Relu) 得到 S2 层的特征映射图，这些映射图再经过滤波得到 C3 层，这个层级结构再和 S2 一样产生 S4。最终，这些像素值全连接成一个向量输入到传统的神经网络，得到输出。 NN Input输入 C1卷积层 S2下采样层 C3卷积层 S4下采样层全连接层 Output输出图 1 卷积特征提取结构 Fig. 1 Convolution feature extraction structure 第 3 期汪鸿翔，等：高斯核函数卷积神经网络跟踪算法 ·389·

·390· 智能系统学报第13卷 1.2基于深度学习的跟踪算法参数由v变为α，因此，核正则化最小二乘分类器深度学习在跟踪领域面临两个重要问题：1)深 (kernelized regularized least square,KRLS)具有一个度学习网络在训练阶段需要大量的样本，而跟踪领简单的闭式解，即域仅能够提供第一帧的目标进行训练，面临训练样 a=(K+AI)-y (2) 本缺少问题；2)采用深度学习的网络模型运算时间式中：K是核函数矩阵，矩阵元素为K=k(xx:I是复杂度大，跟踪实时性低。单位矩阵；向量y的元素为yo由于K为循环矩阵，则针对以上问题，NY.Wang等提出DLT算法式(2)可转换到DFT域，即首次将深度学习算法应用到跟踪领域，在ImageNet d=×(+) (3) 数据集上使用栈式降噪自编码器离线预训练来获得式中：“是核函数矩阵K的第一行元素组成的向通用的物体表征能力，并在跟踪过程中更新自编码量，符号λ表示傅里叶变换。KRLS分类器的闭式解器实现跟踪；K.Zhang等11结合人脑视觉处理系可利用FFT快速得到。统，简化了卷积网络结构，使用目标区域中随机提 2.2特征提取取的归一化图像块作为卷积神经网络的滤波器，从本文利用卷积网络设计一个分层的目标表示结而实现了不用训练卷积神经网络的快速特征提取。构。在第1帧中，将目标归一化到n×n大小，从中随文献[19]中的MDNet算法提出将训练方法和训练机选取一部分重叠的小图像块组成一系列滤波器，数据交叉运用的思路，在检测任务中重点关注背景用于同第帧候选目标框中所有抽取的图像块进行中的难点样本，显著减轻了跟踪器漂移问题。卷积，得到一系列局部特征的映射，提高候选日标深度学习算法需要搭建专用的深度学习硬件平全局特性的鲁棒性。台，通过大量的前期预训练来训练神经网络提取深简单层特征，通过预处理将图像归一化到度特征，面临样本缺少，算法时间复杂度高，硬件运 n×n大小，对目标区域利用w×w大小的滑动窗口进行平台要求高，跟踪实时性低等显著缺点。本文结行采样，得到长度为L的图像块组X,然后用K 合卷积神经网络在特征提取时能够获得一定的平 means聚类的方法从L=(m-w+1)2个图像块中聚类移、尺度和旋转不变性且能够大幅降低神经网络规出d个图像块滤波器作为卷积核，记作F。= 模的特性，结合文献18]提出的无需训练的卷积特 {F,F,…,FcX。输人图像I对应的响应为征提取方法，采用两层前馈处理方式简化卷积网络 S9=F⑧L,SE RIm-w+ir (4) 结构，通过分层滤波器卷积来抽取目标的高维抽象跟踪目标周围的上下文可为区分目标和背景提特征，利用高斯核函数进行运算加速，提出一种快供大量有用信息，对目标周围的区域随机采样出速卷积神经网络跟踪算法。个样本，同样进行K-means聚类获得一组背景模板： F={F,F的，…，F (5) 2高斯核函数卷积神经网络跟踪算法最后，由目标卷积核减去背景卷积核与输入图针对卷积计算时间复杂度过高问题，本文引入像！做卷积得到简单层的特征表达：高斯核函数进行变换，对算法的卷积运算实现加 S:=S9-S=(F-F的⑧L,ie{1,2,…,d (6) 速；针对深度学习算法训练样本缺少的问题，本文复杂层特征，为了加强对目标的特征表达，本文将d个简单层的特征进行堆叠，构成一个3维张采用简单两层前馈处理网络实现一种无需训练的特量来表示目标的复杂层特征，记作：征提取方法。 C∈Rn-w+Hxm-s+1xd (7) 2.1核函数卷积这种特征具有平移不变特性，由于图像归一化本文的卷积运算采用高斯核函数进行变换加速后，使得特征对目标的尺度具有鲁棒性，且复杂层运算，文献[15]采用子窗口高斯核函数k(x,x')的快速特征保留不同尺度目标的局部几何信息。文献[20] 计算方法，其向量表达式为表明可以通过一个浅层的神经机制实现跟踪，因此 kx,x)=exp(-P+rT-2F'(∑'o》() 本文没有使用高层次的对象模型而是利用一个简单的模板匹配方案，结合粒子滤波实现跟踪。式中：“*”表示复共轭，d表示滤波器的个数。 2.3粒子滤波假设(x)是一个高维核希尔伯特空间的映射，本文基于粒子滤波框架，设第帧时总的观测序则核函数k(x,x)=(p(x),(x)》,权重可表示为v= 列为Z,={31,z2,…,z},则跟踪主要是求出后验概率 ∑ap(x),系数向量为a,其元素为a,最终要求解的 p的最大值，根据贝叶斯理论，可知：

1.2 基于深度学习的跟踪算法深度学习在跟踪领域面临两个重要问题：1) 深度学习网络在训练阶段需要大量的样本，而跟踪领域仅能够提供第一帧的目标进行训练，面临训练样本缺少问题；2) 采用深度学习的网络模型运算时间复杂度大，跟踪实时性低。针对以上问题， N.Y. Wang 等 [17]提出 DLT 算法首次将深度学习算法应用到跟踪领域，在 ImageNet 数据集上使用栈式降噪自编码器离线预训练来获得通用的物体表征能力，并在跟踪过程中更新自编码器实现跟踪；K. Zhang 等 [18]结合人脑视觉处理系统，简化了卷积网络结构，使用目标区域中随机提取的归一化图像块作为卷积神经网络的滤波器，从而实现了不用训练卷积神经网络的快速特征提取。文献[19]中的 MDNet 算法提出将训练方法和训练数据交叉运用的思路，在检测任务中重点关注背景中的难点样本，显著减轻了跟踪器漂移问题。深度学习算法需要搭建专用的深度学习硬件平台，通过大量的前期预训练来训练神经网络提取深度特征，面临样本缺少，算法时间复杂度高，硬件运行平台要求高，跟踪实时性低等显著缺点。本文结合卷积神经网络在特征提取时能够获得一定的平移、尺度和旋转不变性且能够大幅降低神经网络规模的特性，结合文献[18]提出的无需训练的卷积特征提取方法，采用两层前馈处理方式简化卷积网络结构，通过分层滤波器卷积来抽取目标的高维抽象特征，利用高斯核函数进行运算加速，提出一种快速卷积神经网络跟踪算法。 2 高斯核函数卷积神经网络跟踪算法针对卷积计算时间复杂度过高问题，本文引入高斯核函数进行变换，对算法的卷积运算实现加速；针对深度学习算法训练样本缺少的问题，本文采用简单两层前馈处理网络实现一种无需训练的特征提取方法。 2.1 核函数卷积 k(x, x ′ ) 本文的卷积运算采用高斯核函数进行变换加速运算，文献[15]采用子窗口高斯核函数的快速计算方法，其向量表达式为 k(x, x ′ ) = exp(− 1 σ2 (∥x∥ 2 +∥x ′ ∥ 2 −2F −1 ( ∑ d xˆ ∗ ⊙ xˆ ′ ))) (1) 式中：“*”表示复共轭， d 表示滤波器的个数。 φ(x) k(x, x ′ ) = ⟨φ(x),(x ′ )⟩ ∑ i aiφ(xi) α ai 假设是一个高维核希尔伯特空间的映射，则核函数，权重可表示为 v = ，系数向量为，其元素为，最终要求解的参数由 v 变为 α ，因此，核正则化最小二乘分类器 (kernelized regularized least square，KRLS) 具有一个简单的闭式解，即 α = (K +λI) −1 y (2) K Ki, j = k(xi , xj) I y yi K 式中：是核函数矩阵，矩阵元素为；是单位矩阵；向量的元素为。由于为循环矩阵，则式 (2) 可转换到 DFT 域，即 αˆ ∗ = yˆ ×(kˆ xx′ +λ) −1 (3) kˆ xx′ K ∧ 式中：是核函数矩阵的第一行元素组成的向量，符号表示傅里叶变换。KRLS 分类器的闭式解可利用 FFT 快速得到。 2.2 特征提取 n×n t 本文利用卷积网络设计一个分层的目标表示结构。在第 1 帧中，将目标归一化到大小，从中随机选取一部分重叠的小图像块组成一系列滤波器，用于同第帧候选目标框中所有抽取的图像块进行卷积，得到一系列局部特征的映射，提高候选目标全局特性的鲁棒性。 n×n w×w L X L = (n−w+1)2 d { F o 1 ,F o 2 ,··· ,F o d } ⊂ X 简单层特征，通过预处理将图像归一化到大小，对目标区域利用大小的滑动窗口进行采样，得到长度为的图像块组，然后用 Kmeans 聚类的方法从个图像块中聚类出个图像块滤波器作为卷积核，记作 F d = 。输入图像 I 对应的响应为 S o i = F o i ⊗ I, S o i ∈ R (n−w+1)2 (4)l 跟踪目标周围的上下文可为区分目标和背景提供大量有用信息，对目标周围的区域随机采样出个样本，同样进行 K-means 聚类获得一组背景模板： Fl = { F b 1 ,F b 2 ,··· ,F b l } (5) I 最后，由目标卷积核减去背景卷积核与输入图像做卷积得到简单层的特征表达： Si = S o i −S b i = (F o i − F b i )⊗ I, i ∈ {1,2,··· ,d} (6) d 复杂层特征，为了加强对目标的特征表达，本文将个简单层的特征进行堆叠，构成一个 3 维张量来表示目标的复杂层特征，记作： C ∈ R (n−w+1)×(n−w+1)×d (7) 这种特征具有平移不变特性，由于图像归一化后，使得特征对目标的尺度具有鲁棒性，且复杂层特征保留不同尺度目标的局部几何信息。文献[20] 表明可以通过一个浅层的神经机制实现跟踪，因此本文没有使用高层次的对象模型而是利用一个简单的模板匹配方案，结合粒子滤波实现跟踪。 2.3 粒子滤波 t Zt = {z1,z2,··· ,zt} p 本文基于粒子滤波框架，设第帧时总的观测序列为，则跟踪主要是求出后验概率的最大值，根据贝叶斯理论，可知： ·390· 智能系统学报第 13 卷

第3期汪鸿翔，等：高斯核函数卷积神经网络跟踪算法 ·391· p(S.Z)x p(Z.IS,)fp(S,S1)p(S-Z)dS,- (8) 别与匹配。 6)网络更新：采取限定阈值的方式，即当所有式中：S,=[xs,x、y,为目标的位置，s为尺度参粒子中最高的置信值低于阈值时，认为目标特征发数；p(S,S-)为运动模型，用于根据第t-1帧的位置生较大表观变化，当前网络已无法适应，需要进行预测第帧的位置，假设目标状态参数是相互独立更新。利用初始滤波器组，结合跟踪过程中得到前的，可用3个高斯分布来描述，从而运动模型即为景滤波器组，进行加权平均，得到全新的卷积网络布朗运动，于是滤波器。 pS,S-=NS,S-∑) (9) 7)模板更新：以第一帧中目标的中心点为中心，式中：∑=diag(cno,)为对角协方差矩阵；p(SZ) 偏移量为士1个像素点范围内进行等尺寸采样，构成正样本集合。以当前帧目标的远近两类距离采样，为观测模型，用于评估观测结果Z,与目标的相似构成负样本集合。跟踪过程中为了减轻漂移现象，性。观测模型通过测量样本与目标之间的相似度来预设一个更新阈值戶5，目标模板每5帧更新一次。计算： p(Z,S)oc e-lvee(c)-vecc (10) 3实验结果与分析于是，整个跟踪过程就是求最大响应：本文利用MATLAB2014a编程环境，PC配置 S,argmaxp(Z,S )p(S,) (11) 为Inter Core i3-3220,3.3GHz,8GB内存，根据 2.4跟踪算法 Database OTB2013B2中提供的测试视频序列对算前文给出了简单前馈卷积网络的特征提取方法进行了仿真分析。本文仿真参数设置为：滑动窗式，并采用高斯核函数对卷积计算进行加速处理，口取片尺寸为6×6，滤波器个数为100，归一化尺寸获取目标的深层次复杂表示。基于这种卷积特征，为32×32，学习因子设置为0.95，粒子滤波器的目标结合粒子滤波，提出的跟踪算法流程如图2所示。状态的标准偏差设置为：σ.=4，σ，=4，c,=0.01,使用 N=300个粒子。输人读帧 3.1定性分析首帧初始化初始化与预处理更新网络限于论文篇幅，本文仅给出几组代表性的跟踪和模板实验结果。如图3(a)、(b)、(c)、(d)所示，比较的算法预处理提取前景背景样本有CT、KCF1、CNT与本文算法。图示给出提取初始滤波器组深度卷积特征提取 Crossing、Football、Walking、Walking2四组序列，均更新特征匹配与定位存在目标形变问题，其中Crossing、Walking、Walk ing2均是在低分辨率场景下的跟踪，Football、Walk- 输出· 最后一帧 ing、Walking22均存在局部遮挡问题。对于Cross- ing序列，随着目标的运动导致目标本身的尺度变化，在低分辨率监控场景中，在第45帧，目标在行图2跟踪算法流程图 Fig.2 Tracking flow chart 进过程中面临光线的干扰，并且出现运动车辆导致的背景干扰，在所有比较的算法中，同样跟踪成功，跟踪算法的主要步骤：本算法性能都能达到最优。对于Football序列，目 1)输入：输人视频序列，并给定跟踪目标。标在运动过程中，一直伴随着大量的形变问题，整 2)初始化：归一化，粒子滤波，网络规模，样本个视频序列中大量的相似目标导致背景干扰问题，容量等参数设置。在第150帧目标进入人群中导致局部遮挡问题，本 3)初始滤波器提取：利用第一帧的目标，通过文算法在所有算法中表现最优。对于Walking序滑动窗口和K-means聚类提取一个初始滤波器组列，目标在监控的低分辨场景中，目标运动过程中用作后续网络的滤波器使用。伴随着一定的尺度变换，并在第90帧出现柱子遮挡 4)卷积特征提取：利用上文的卷积网络结构提目标的情况，本文算法在所有算法中表现最优。对取出各候选样本的深层抽象特征，并使用高斯核函于Walking.2序列，在监控的低分辨场景中，目标运数进行加速。动途中伴随着尺度变换、遮挡、背景干扰。在第190 5)粒子滤波：按照粒子滤波算法，归一化后生帧与第360帧，目标均面临相似日标的背景干扰与成规定尺寸大小的候选图片样本集，并进行目标识遮挡，本文算法在所有算法中表现最优

p(St |Zt) ∝ p(Zt |St) ∫ p(St |St−1)p(St−1 |Zt−1)dSt−1 (8) S t = [xt yt st] T xt、yt st p(St |St−1) t−1 t 式中：，为目标的位置，为尺度参数；为运动模型，用于根据第帧的位置预测第帧的位置，假设目标状态参数是相互独立的，可用 3 个高斯分布来描述，从而运动模型即为布朗运动，于是 p(St |St−1) = N(St |St−1, ∑ ) (9) ∑ = diag(σx ,σy ,σt) p(St 式中：为对角协方差矩阵； |Zt) 为观测模型，用于评估观测结果 Zt 与目标的相似性。观测模型通过测量样本与目标之间的相似度来计算： p(Zt |S i t ) ∝ e −|vec(Ct)−vec(C i t )| 1 2 (10) 于是，整个跟踪过程就是求最大响应： Sˆ t = argmax {S i t } N i=1 p(Zt |S i t )p(S i t ) (11) 2.4 跟踪算法前文给出了简单前馈卷积网络的特征提取方式，并采用高斯核函数对卷积计算进行加速处理，获取目标的深层次复杂表示。基于这种卷积特征，结合粒子滤波，提出的跟踪算法流程如图 2 所示。跟踪算法的主要步骤： 1) 输入：输入视频序列，并给定跟踪目标。 2) 初始化：归一化，粒子滤波，网络规模，样本容量等参数设置。 3) 初始滤波器提取：利用第一帧的目标，通过滑动窗口和 K-means 聚类提取一个初始滤波器组用作后续网络的滤波器使用。 4) 卷积特征提取：利用上文的卷积网络结构提取出各候选样本的深层抽象特征，并使用高斯核函数进行加速。 5) 粒子滤波：按照粒子滤波算法，归一化后生成规定尺寸大小的候选图片样本集，并进行目标识别与匹配。 6) 网络更新：采取限定阈值的方式，即当所有粒子中最高的置信值低于阈值时，认为目标特征发生较大表观变化，当前网络已无法适应，需要进行更新。利用初始滤波器组，结合跟踪过程中得到前景滤波器组，进行加权平均，得到全新的卷积网络滤波器。 7) 模板更新：以第一帧中目标的中心点为中心，偏移量为±1 个像素点范围内进行等尺寸采样，构成正样本集合。以当前帧目标的远近两类距离采样，构成负样本集合。跟踪过程中为了减轻漂移现象，预设一个更新阈值 f=5，目标模板每 5 帧更新一次。 3 实验结果与分析 σx = 4,σy = 4,σt = 0.01 本文利用 MATLAB2014a 编程环境，PC 配置为 Inter Core i3-3220，3.3 GHz，8 GB 内存，根据 Database OTB2013[3,21]中提供的测试视频序列对算法进行了仿真分析。本文仿真参数设置为：滑动窗口取片尺寸为 6×6，滤波器个数为 100，归一化尺寸为 32×32，学习因子设置为 0.95，粒子滤波器的目标状态的标准偏差设置为：，使用 N = 300 个粒子。 3.1 定性分析限于论文篇幅，本文仅给出几组代表性的跟踪实验结果。如图 3(a)、(b)、(c)、(d) 所示，比较的算法有 CT[7] 、KCF[15] 、CNT[18]与本文算法。图示给出 Crossing、Football、Walking、Walking2 四组序列，均存在目标形变问题，其中 Crossing、Walking、Walking2 均是在低分辨率场景下的跟踪，Football、Walking、Walking2 均存在局部遮挡问题。对于 Crossing 序列，随着目标的运动导致目标本身的尺度变化，在低分辨率监控场景中，在第 45 帧，目标在行进过程中面临光线的干扰，并且出现运动车辆导致的背景干扰，在所有比较的算法中，同样跟踪成功，本算法性能都能达到最优。对于 Football 序列，目标在运动过程中，一直伴随着大量的形变问题，整个视频序列中大量的相似目标导致背景干扰问题，在第 150 帧目标进入人群中导致局部遮挡问题，本文算法在所有算法中表现最优。对于 Walking 序列，目标在监控的低分辨场景中，目标运动过程中伴随着一定的尺度变换，并在第 90 帧出现柱子遮挡目标的情况，本文算法在所有算法中表现最优。对于 Walking2 序列，在监控的低分辨场景中，目标运动途中伴随着尺度变换、遮挡、背景干扰。在第 190 帧与第 360 帧，目标均面临相似目标的背景干扰与遮挡，本文算法在所有算法中表现最优。 ڑ䒿 ࡂ໷݉仂ፓ 䶰ะ⤲ ᣼ं݉໷␐∎ஔ㏰䄧ፓ ⤲䶰ะ̺ࡂ໷݉ ᮛ㗸ᮛᵣ᱘ݹं᣼ ⌝Ꮢࢣ➥厶ᒭ᣼ं ᰬऺ̬ፓ Y 䒿ܦ N ᰠ᫜ Y ᰠ᫜㑽㐈 সὍᲫ ➥ᒭࡥ䙹̺჆ѹ N 图 2 跟踪算法流程图 Fig. 2 Tracking flow chart 第 3 期汪鸿翔，等：高斯核函数卷积神经网络跟踪算法 ·391·

·392· 智能系统学报第13卷 004 ￥n103 (a)Crossing (b)Football (c)Shaking (d④Walking (e)Walking2 OURS CT KCF CNT 图3视频序列跟踪结果示例 Fig.3 Examples of the tracking results on video sequences 可见，本文算法在形变、遮挡、低分辨率等复杂表2距离精度DP 背景干扰下均能取得有效的跟踪效果。 Table 2 Distance Precision % 3.2定量分析视频序列 OURS CT KCF CNT 为了测试算法性能，给出了部分序列的中心位 Crossing 100 100 100 100 置误差与距离精度的具体数据3,2训。中心位置误差 Dancer2 100 100 100 100 (center location error,CLE)表示目标的中心位置与标准中心位置的欧氏距离的误差，表达式为ε= David2 100 100 100 100 日∑C-Cn是图片序列的帧数，C为目标中心 Football 92.8 99.2 91.4 82.6 Shaking 100 12.3 12.9 57.5 位置，C为标准中心位置；距离精度(distance preci- Skater 100 100 100 100 sion,DP)表示中心误差小于一个给定阈值的帧的 Walking 100 100 100 100 相对数量，表达式为DP=m,m为CLE小于某个固 Walking2 100 48.6 75.6 100 定阈值（实验中均选为20像素）的图片序列帧数。表1 Average 99.1 82.51 84.98 92.51 给出了算法的平均中心位置误差的对比数据，表2 给出了算法的距离精度DP的对比数据。为保证对于算法速度，同样采用卷积网络结构提取特数据真实性，本文所示数据均为5次实验后取平征的CNT算法，与本文算法在相同实验环境下进行均值。速度对比，CNT没有采用高斯核函数进行加速，算表1中心位置误差（像素）法速度为1~2s,本文算法采用高斯核函数进行加 Table 1 Center location error(pixels) 速，算法平均速度为5fs。由实验可知，采用高斯视频序列 OURS CT KCF CNT 核函数加速，在不影响跟踪精度的同时能够提升算 Crossing 1.46 5.31 2.25 3.79 法的速度。 Dancer2 6.11 9.51 6.41 7.14 实验中，绘制了4种算法跟踪精度曲线图，跟 David2 2.24 15.4 2.08 2.56 踪精度曲线图首先设定一个目标估计位置与真实位 Football 16.2 21.9 14.6 17 置的阈值距离，在跟踪过程中，统计跟踪算法估计 Shaking 18.8 110 113 45.9 的目标位置与真实位置的距离小于阈值范围的帧 Skater 11 7.24 10.7 11.3 数，并计算帧数占整个视频帧的百分比。图4给出了以上4种算法对应的8个视频序列的跟踪精度曲 Walking 2.11 4.3 3.97 2.21 线，横坐标为阈值，纵坐标为精度，阈值越低而精度 Walking2 3.44 61.3 29 3.78 值越高的跟踪器性能越好。由曲线图可清晰地看 Average 7.67 29.37 22.75 11.71 到，本文算法具有较高的跟踪精度

可见，本文算法在形变、遮挡、低分辨率等复杂背景干扰下均能取得有效的跟踪效果。 3.2 定量分析 1 n ∑n i=1 Ci −C r i Ci C r i DP = m n 为了测试算法性能，给出了部分序列的中心位置误差与距离精度的具体数据[3,21]。中心位置误差 (center location error，CLE) 表示目标的中心位置与标准中心位置的欧氏距离的误差，表达式为 ε = ，n 是图片序列的帧数，为目标中心位置，为标准中心位置；距离精度 (distance precision，DP) 表示中心误差小于一个给定阈值的帧的相对数量，表达式为，m 为 CLE 小于某个固定阈值 (实验中均选为 20 像素) 的图片序列帧数。表 1 给出了算法的平均中心位置误差的对比数据，表 2 给出了算法的距离精度 DP 的对比数据。为保证数据真实性，本文所示数据均为 5 次实验后取平均值。对于算法速度，同样采用卷积网络结构提取特征的 CNT 算法，与本文算法在相同实验环境下进行速度对比，CNT 没有采用高斯核函数进行加速，算法速度为 1~2 f/s，本文算法采用高斯核函数进行加速，算法平均速度为 5 f/s。由实验可知，采用高斯核函数加速，在不影响跟踪精度的同时能够提升算法的速度。实验中，绘制了 4 种算法跟踪精度曲线图[4] ，跟踪精度曲线图首先设定一个目标估计位置与真实位置的阈值距离，在跟踪过程中，统计跟踪算法估计的目标位置与真实位置的距离小于阈值范围的帧数，并计算帧数占整个视频帧的百分比。图 4 给出了以上 4 种算法对应的 8 个视频序列的跟踪精度曲线，横坐标为阈值，纵坐标为精度，阈值越低而精度值越高的跟踪器性能越好。由曲线图可清晰地看到，本文算法具有较高的跟踪精度。表 1 中心位置误差 (像素) Table 1 Center location error(pixels) 视频序列 OURS CT KCF CNT Crossing 1.46 5.31 2.25 3.79 Dancer2 6.11 9.51 6.41 7.14 David2 2.24 15.4 2.08 2.56 Football 16.2 21.9 14.6 17 Shaking 18.8 110 113 45.9 Skater 11 7.24 10.7 11.3 Walking 2.11 4.3 3.97 2.21 Walking2 3.44 61.3 29 3.78 Average 7.67 29.37 22.75 11.71 表 2 距离精度 DP Table 2 Distance Precision % 视频序列 OURS CT KCF CNT Crossing 100 100 100 100 Dancer2 100 100 100 100 David2 100 100 100 100 Football 92.8 99.2 91.4 82.6 Shaking 100 12.3 12.9 57.5 Skater 100 100 100 100 Walking 100 100 100 100 Walking2 100 48.6 75.6 100 Average 99.1 82.51 84.98 92.51 (a) Crossing (b) Football (c) Shaking (d) Walking (e) Walking2 OURS CT KCF CNT 图 3 视频序列跟踪结果示例 Fig. 3 Examples of the tracking results on video sequences ·392· 智能系统学报第 13 卷

第3期汪鸿翔，等：高斯核函数卷积神经网络跟踪算法 ·393· 1.0 1.0 OURS —OURS 0.8 -CT 0.8 ---CT KCF ....KCF 0.6 CNT 06 -..CNT 0.4 0.2 0.2 10 20 30 啊 0 50 10 20 30 阈值國值 (a)Crossing (b)Dancer2 1.0 1.0 URS 0.8 C 0.8 0.6 KCF --CNT OURS 0.4 “-=1 KCF 0.2 0.2 -.-CNT 0 10 20 30 40 50 10 20 30 40 50 國值阀值 (c)David2 (d)Football 1.0 1.0 0.8 0.8 06 0.4 0.2 0.2 10 20 30 40 50 9 20. 30 4050 國值阀值 (e)Shaking (f)Skater 1.0 1.0 0.8 0.8 0.6 0.4 0.2 0.2 0 10 20 30 40 50 0 20 30 4050 國值國值 (g)Walking (h)Walking2 图4跟踪精度曲线图 Fig.4 Tracking accuracy curve 4结束语参考文献：本文针对深度学习跟踪算法训练费时，硬件要 []杨戈，刘宏.视觉跟踪算法综述.智能系统学报，2010，求高等问题，采用高斯核函数加速计算，采用简单 5(2:95-105 两层前馈卷积网络提取目标鲁棒性特征，基于简化 YANG Ge,LIU Hong.Survey of visual tracking algorithms 的卷积神经网络提出跟踪算法，第一层利用K- [J].CAAI transactions on intelligent systems,2010,5(2): means在第一帧中提取归一化图像块作为滤波器组 95-105. 提取目标的简单层特征，第二层将简单的单元特征 [2]黄凯奇，陈晓棠，康运锋，等.智能视频监控技术综述[ 计算机学报，2015,38(6)：1093-1118 图堆叠形成一个复杂的特征映射，并编码目标的局 HUANG Kaiqi,CHEN Xiaotang,KANG Yunfeng,et al.In- 部结构位置信息，在粒子滤波框架下，在目标形变、 telligent visual surveillance:a review[J].Chinese journal of 遮挡、低分辨等场景下，脱离深度学习复杂的硬件 computers..2015.38(6):1093-1118. 环境，仍能取得较好跟踪效果。因为本文的特征提 [3]WU Yi,LIM J,YANG M H.Online object tracking:a 取方式采用卷积神经网络特征，所以本文算法在快 benchmark[Cl//Proceedings of 2013 IEEE Conference on 速运动、目标出界等场景下仍面临很大挑战，在今 Computer Vision and Pattern Recognition.Portland,OR, 后的工作中，将主要致力于解决此类场景的跟踪问题。 USA,2013:2411-2418

4 结束语本文针对深度学习跟踪算法训练费时，硬件要求高等问题，采用高斯核函数加速计算，采用简单两层前馈卷积网络提取目标鲁棒性特征，基于简化的卷积神经网络提出跟踪算法，第一层利用 Kmeans 在第一帧中提取归一化图像块作为滤波器组提取目标的简单层特征，第二层将简单的单元特征图堆叠形成一个复杂的特征映射，并编码目标的局部结构位置信息，在粒子滤波框架下，在目标形变、遮挡、低分辨等场景下，脱离深度学习复杂的硬件环境，仍能取得较好跟踪效果。因为本文的特征提取方式采用卷积神经网络特征，所以本文算法在快速运动、目标出界等场景下仍面临很大挑战，在今后的工作中，将主要致力于解决此类场景的跟踪问题。参考文献：杨戈, 刘宏. 视觉跟踪算法综述[J]. 智能系统学报, 2010, 5(2): 95–105. YANG Ge, LIU Hong. Survey of visual tracking algorithms [J]. CAAI transactions on intelligent systems, 2010, 5(2): 95–105. [1] 黄凯奇, 陈晓棠, 康运锋, 等. 智能视频监控技术综述[J]. 计算机学报, 2015, 38(6): 1093–1118. HUANG Kaiqi, CHEN Xiaotang, KANG Yunfeng, et al. Intelligent visual surveillance: a review[J]. Chinese journal of computers, 2015, 38(6): 1093–1118. [2] WU Yi, LIM J, YANG M H. Online object tracking: a benchmark[C]//Proceedings of 2013 IEEE Conference on Computer Vision and Pattern Recognition. Portland, OR, USA, 2013: 2411-2418. [3] 10 20 30 40 50 0 1.0 OURS CT KCF CNT OURS CT KCF CNT 0.8 0.6 0.4 0.2 阈值阈值阈值阈值阈值阈值阈值阈值 10 20 30 40 50 0 1.0 0.8 0.6 0.4 0.2 10 20 30 40 50 0 1.0 OURS CT KCF CNT OURS CT KCF CNT 0.8 0.6 0.4 0.2 10 20 30 40 50 0 1.0 0.8 0.6 0.4 0.2 10 20 30 40 50 0 1.0 0.8 0.6 0.4 0.2 10 20 30 40 50 0 1.0 0.8 0.6 0.4 0.2 10 20 30 40 50 0 1.0 0.8 0.6 0.4 0.2 10 20 30 40 50 0 1.0 0.8 0.6 0.4 0.2 (a) Crossing (c) David2 (b) Dancer2 (d) Football (e) Shaking (f) Skater (g) Walking (h) Walking2 精度精度精度精度精度精度精度精度图 4 跟踪精度曲线图 Fig. 4 Tracking accuracy curve 第 3 期汪鸿翔，等：高斯核函数卷积神经网络跟踪算法 ·393·

·394· 智能系统学报第13卷 [4]BABENKO B,YANG M H,BELONGIE S.Robust object speed tracking with kernelized correlation filters[J].IEEE tracking with online multiple instance learning[J].IEEE transactions on pattern analysis and machine intelligence, transactions on pattern analysis and machine intelligence, 2015,37(3):583-596. 2011,33(8):1619-1632. [16余凯，贾磊，陈雨强，等.深度学习的昨天、今天和明天 []陈真，王钊.元认知粒子滤波目标跟踪算法[).智能系统 [).计算机研究与发展，2013,50(9y1799-1804 学报，2015,10(3)：387-392. YU Kai,JIA Lei,CHEN Yuqiang,et al.Deep learning: CHEN Zhen,WANG Zhao.Object tracking algorithm with yesterday,today,and tomorrow[J].Journal of computer re- metacognitive model-based particle filters[J].CAAI transac- search and development,2013,50(9):1799-1804. tions on intelligent systems,2015,10(3):387-392. [17]WANG Naiyan,YEUNG D Y.Learning a deep compact 6]MEI Xue,LING Haibin.Robust visual tracking using (1 image representation for visual tracking[C]//Proceedings of minimization[C]//Proceedings of the 12th IEEE Internation- the 26th International Conference on Neural Information al Conference on Computer Vision.Kyoto,Japan,2009: Processing Systems.Lake Tahoe,USA,2013:809-817. 1436-1443. [18]ZHANG Kaihua,LIU Qingshan,WU Yi,et al.Robust [7]ZHANG Kaihua,ZHANG Lei,YANG M H.Real-time visual tracking via convolutional networks without train- compressive tracking[Cl//Proceedings of the 12th European ing[J].IEEE transactions on image processing,2016, Conference on Computer Vision.Berlin,Germany,2012: 25(4:1779-1792 864-877. [19]NAM H,HAN B.Learning multi-domain convolutional [8]韩华，丁永生，郝矿荣.综合颜色和小波纹理特征的免疫 neural networks for visual tracking[C]//Proceedings of 粒子滤波视觉跟踪[).智能系统学报，2011,6(4)：289- 2016 IEEE Conference on Computer Vision and Pattern 294 Recognition.Las Vegas,CA,USA,2016:4293-4302 HAN Hua,DING Yongsheng,HAO Kuangrong.An im- [20]ROSS D A,LIM J,LIN R S,et al.Incremental learning for mune particle filter video tracking method based on color robust visual tracking[J].International journal of computer and wavelet texture[J].CAAI transactions on intelligent sys- vision,2008,771/2/3):125-141 tems,2011,6(4):289-294 [21]WU Yi,LIM J,YANG M H.Object tracking benchmark [9]RABINER L R.A tutorial on hidden Markov models and [J].IEEE transactions on pattern analysis and machine in- selected applications in speech recognition[J].Proceedings of the1EEE,1989,77(2):257-286. telligence,2015,37(9y:1834-1848. [10]BAR-SHALOM Y,FORTMANN T E,CABLE P G. 作者简介： Tracking and data association[J].The journal of the acous- 汪鸿翔，男，1992年生，硕士研究 tical society of America,1990,87(2):918-919. 生，主要研究方向为视频、图像处理、 [11]COMANICIU D.RAMESH V,MEER P.Real-time track- 视觉跟踪、深度学习相关算法。 ing of non-rigid objects using mean shift[C]//Proceedings of 2000 IEEE Conference on Computer Vision and Pattern Recognition.Hilton Head Island,SC,USA,2000:142-149. [12]ISARD M,BLAKE A.CONDENSATION-conditional density propagation for visual tracking[J].International 柳培忠，男，1976年生，副教授 journal of computer vision,1998,29(1):5-28. 美国杜克大学高级访问学者，博土，主要研究方向为仿生智能计算、仿生图 [13]BOLME D S,BEVERIDGE J R,DRAPER B A,et al 像处理技术、多维空间仿生信息学。 Visual object tracking using adaptive correlation filters [C]//Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition.San Francisco,CA,USA, 2010:2544-2550. 骆炎民，男，1975年生，副教授 [14]HENRIQUES J F,CASEIRO R,MARTINS P,et al.Ex- 博士，主要研究方向为智能图像处理 ploiting the circulant structure of tracking-by-detection 机器学习。 with kernels[C]//Proceedings of the 12th European Confer- ence on Computer Vision.Berlin,Germany,2012:702- 715. [15]HENRIQUES J F,CASEIRO R,MARTINS P,et al.High-

BABENKO B, YANG M H, BELONGIE S. Robust object tracking with online multiple instance learning[J]. IEEE transactions on pattern analysis and machine intelligence, 2011, 33(8): 1619–1632. [4] 陈真, 王钊. 元认知粒子滤波目标跟踪算法[J]. 智能系统学报, 2015, 10(3): 387–392. CHEN Zhen, WANG Zhao. Object tracking algorithm with metacognitive model-based particle filters[J]. CAAI transactions on intelligent systems, 2015, 10(3): 387–392. [5] MEI Xue, LING Haibin. Robust visual tracking using ℓ1 minimization[C]//Proceedings of the 12th IEEE International Conference on Computer Vision. Kyoto, Japan, 2009: 1436-1443. [6] ZHANG Kaihua, ZHANG Lei, YANG M H. Real-time compressive tracking[C]//Proceedings of the 12th European Conference on Computer Vision. Berlin, Germany, 2012: 864-877. [7] 韩华, 丁永生, 郝矿荣. 综合颜色和小波纹理特征的免疫粒子滤波视觉跟踪[J]. 智能系统学报, 2011, 6(4): 289– 294. HAN Hua, DING Yongsheng, HAO Kuangrong. An immune particle filter video tracking method based on color and wavelet texture[J]. CAAI transactions on intelligent systems, 2011, 6(4): 289–294. [8] RABINER L R. A tutorial on hidden Markov models and selected applications in speech recognition[J]. Proceedings of the IEEE, 1989, 77(2): 257–286. [9] BAR-SHALOM Y, FORTMANN T E, CABLE P G. Tracking and data association[J]. The journal of the acoustical society of America, 1990, 87(2): 918–919. [10] COMANICIU D, RAMESH V, MEER P. Real-time tracking of non-rigid objects using mean shift[C]//Proceedings of 2000 IEEE Conference on Computer Vision and Pattern Recognition. Hilton Head Island, SC, USA, 2000: 142-149. [11] ISARD M, BLAKE A. CONDENSATION-conditional density propagation for visual tracking[J]. International journal of computer vision, 1998, 29(1): 5–28. [12] BOLME D S, BEVERIDGE J R, DRAPER B A, et al. Visual object tracking using adaptive correlation filters [C]//Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA, 2010: 2544-2550. [13] HENRIQUES J F, CASEIRO R, MARTINS P, et al. Exploiting the circulant structure of tracking-by-detection with kernels[C]//Proceedings of the 12th European Conference on Computer Vision. Berlin, Germany, 2012: 702- 715. [14] [15] HENRIQUES J F, CASEIRO R, MARTINS P, et al. Highspeed tracking with kernelized correlation filters[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(3): 583–596. 余凯, 贾磊, 陈雨强, 等. 深度学习的昨天、今天和明天 [J]. 计算机研究与发展, 2013, 50(9): 1799–1804. YU Kai, JIA Lei, CHEN Yuqiang, et al. Deep learning: yesterday, today, and tomorrow[J]. Journal of computer research and development, 2013, 50(9): 1799–1804. [16] WANG Naiyan, YEUNG D Y. Learning a deep compact image representation for visual tracking[C]//Proceedings of the 26th International Conference on Neural Information Processing Systems. Lake Tahoe, USA, 2013: 809-817. [17] ZHANG Kaihua, LIU Qingshan, WU Yi, et al. Robust visual tracking via convolutional networks without training[J]. IEEE transactions on image processing, 2016, 25(4): 1779–1792. [18] NAM H, HAN B. Learning multi-domain convolutional neural networks for visual tracking[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, CA, USA, 2016: 4293-4302. [19] ROSS D A, LIM J, LIN R S, et al. Incremental learning for robust visual tracking[J]. International journal of computer vision, 2008, 77(1/2/3): 125–141. [20] WU Yi, LIM J, YANG M H. Object tracking benchmark [J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(9): 1834–1848. [21] 作者简介：汪鸿翔，男，1992 年生，硕士研究生，主要研究方向为视频、图像处理、视觉跟踪、深度学习相关算法。柳培忠，男，1976 年生，副教授，美国杜克大学高级访问学者，博士，主要研究方向为仿生智能计算、仿生图像处理技术、多维空间仿生信息学。骆炎民，男，1975 年生，副教授，博士，主要研究方向为智能图像处理、机器学习。 ·394· 智能系统学报第 13 卷

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录