【机器学习】一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：1.72MB

第14卷第2期智能系统学报 Vol.14 No.2 2019年3月 CAAI Transactions on Intelligent Systems Mar.2019 D0:10.11992/tis.201709003 网络出版地址：http:/kns.cnki.net/kcms/detail/23.1538.tp.20180417.1832.013.html 一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法欧伟奇2，尹辉2，许宏丽2，刘志浩2 (1.北京交通大学计算机与信息技术学院，北京100044,2.北京交通大学交通数据分析与挖掘北京市重点实验室，北京100044) 摘要：Egocentric视频具有目标运动剧烈、遮挡频繁、目标尺度差异明显及视角时变性强的特点，给目标跟踪任务造成了极大的困难。本文从重建不同视角Egocentric视频中各目标的运动轨迹出发，提出一种基于Multi-- Egocentric视频运动轨迹重建的多目标跟踪算法，该方法基于多视角同步帧之间的单应性约束解决目标遮挡和丢失问题，然后根据多视角目标空间位置约束关系通过轨迹重建进一步优化目标定位，并采用卡尔曼滤波构建目标运动模型优化目标运动轨迹，在BJMOT、EPLF-campus4数据集上的对比实验验证了本文算法在解决 Multi--Egocentric视频多目标跟踪轨迹不连续问题的有效性。关键词：Multi-egocentric视频；轨迹重建；多目标跟踪；单应性约束；对极几何约束；空间重构；卡尔曼滤波：运动模型中图分类号：TP391.4文献标志码：A文章编号：1673-4785(2019)02-0246-08 中文引用格式：欧伟奇，尹辉，许宏丽，等.一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法J.智能系统学报， 2019,14(2):246-253. 英文引用格式：OU Weiqi,.YIN Hui,XU Hongli,etal.A multi-object tracking algorithm based on trajectory reconstruction on multi-egocentric videoJl.CAAI transactions on intelligent systems,2019,14(2):246-253. A multi-object tracking algorithm based on trajectory reconstruction on multi-egocentric video OU Weiqi2,YIN Hui2,XU Hongli2,LIU Zhihao2 (1.Department of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044,China;2.Beijing Key Lab of Transportation Data Analysis and Mining,Beijing Jiaotong University,Beijing 100044,China) Abstract:In egocentric video,objects have the characteristics of violent motion,frequent occlusion,so it brings much trouble to carrying out the tracking task.In this paper,we propose a multi-object tracking algorithm based on the mo- tion trajectory reconstruction of multi-egocentric video from different visual angles egocentric videos.First,this method is based on the homographic constraint of multi-view synch frames to fix position of occluded and missing object. Second,using the relative position constraint relation of multi-angle target,the trajectory is reconstructed to locate the target position.Meanwhile,the trajectory of the object is optimized by constructing the motion model of object.Then the continuous trajectory of the object is obtained and the problem of the discontinuity trajectory in multi-object track- ing is resolved.In the end,the performance of proposed method has been verified by using the multi-view video dataset which is created by us. Keywords:Multi-Egocentric video;trajectory reconstruction;multi-object tracking;homographic constraint;epipolar geometry constraint;spatial reconstruction;Kalman filter;motion model 收稿日期：2017-09-05.网络出版日期：2018-04-18. 目标跟踪是计算机视觉重要研究领域之一，基金项目：国家自然科学基金项目(61472029,61473031)：科技部国家重点研发计划项目(2017NFB1201104,2016YFB 在智能交通、运动分析、行为识别、人机交互四等 I200100):中央高校基本科研业务费专项资金项目 (2016JBZ005). 方面具有广泛应用。随着可穿戴式相机的普及，通信作者：尹辉.E-mail:hyin@bjtu.edu.cn. 基于Egocentric视频的目标跟踪引起研究人员的

DOI: 10.11992/tis.201709003 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20180417.1832.013.html 一种基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法欧伟奇1,2，尹辉1,2，许宏丽1,2，刘志浩1,2 （1. 北京交通大学计算机与信息技术学院，北京 100044; 2. 北京交通大学交通数据分析与挖掘北京市重点实验室，北京 100044）摘要：Egocentric 视频具有目标运动剧烈、遮挡频繁、目标尺度差异明显及视角时变性强的特点，给目标跟踪任务造成了极大的困难。本文从重建不同视角 Egocentric 视频中各目标的运动轨迹出发，提出一种基于 MultiEgocentric 视频运动轨迹重建的多目标跟踪算法，该方法基于多视角同步帧之间的单应性约束解决目标遮挡和丢失问题，然后根据多视角目标空间位置约束关系通过轨迹重建进一步优化目标定位，并采用卡尔曼滤波构建目标运动模型优化目标运动轨迹，在 BJMOT、EPLF-campus4 数据集上的对比实验验证了本文算法在解决 Multi-Egocentric 视频多目标跟踪轨迹不连续问题的有效性。关键词：Multi-egocentric 视频；轨迹重建；多目标跟踪；单应性约束；对极几何约束；空间重构；卡尔曼滤波；运动模型中图分类号：TP391.4 文献标志码：A 文章编号：1673−4785(2019)02−0246−08 中文引用格式：欧伟奇, 尹辉, 许宏丽, 等. 一种基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法[J]. 智能系统学报, 2019, 14(2): 246–253. 英文引用格式：OU Weiqi, YIN Hui, XU Hongli, et al. A multi-object tracking algorithm based on trajectory reconstruction on multi-egocentric video[J]. CAAI transactions on intelligent systems, 2019, 14(2): 246–253. A multi-object tracking algorithm based on trajectory reconstruction on multi-egocentric video OU Weiqi1,2 ，YIN Hui1,2 ，XU Hongli1,2 ，LIU Zhihao1,2 (1. Department of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China; 2. Beijing Key Lab of Transportation Data Analysis and Mining, Beijing Jiaotong University, Beijing 100044, China) Abstract: In egocentric video, objects have the characteristics of violent motion, frequent occlusion, so it brings much trouble to carrying out the tracking task. In this paper, we propose a multi-object tracking algorithm based on the motion trajectory reconstruction of multi-egocentric video from different visual angles egocentric videos. First, this method is based on the homographic constraint of multi-view synch frames to fix position of occluded and missing object. Second, using the relative position constraint relation of multi-angle target, the trajectory is reconstructed to locate the target position. Meanwhile, the trajectory of the object is optimized by constructing the motion model of object. Then the continuous trajectory of the object is obtained and the problem of the discontinuity trajectory in multi-object tracking is resolved. In the end, the performance of proposed method has been verified by using the multi-view video dataset which is created by us. Keywords: Multi-Egocentric video; trajectory reconstruction; multi-object tracking; homographic constraint; epipolar geometry constraint; spatial reconstruction; Kalman filter; motion model 目标跟踪是计算机视觉重要研究领域之一，在智能交通、运动分析、行为识别、人机交互[1]等方面具有广泛应用。随着可穿戴式相机的普及，基于 Egocentric 视频的目标跟踪引起研究人员的收稿日期：2017−09−05. 网络出版日期：2018−04−18. 基金项目：国家自然科学基金项目 (61472029，61473031)；科技部国家重点研发计划项目 (2017YFB1201104，2016YFB 1200100)；中央高校基本科研业务费专项资金项目 (2016JBZ005). 通信作者：尹辉. E-mail：hyin@bjtu.edu.cn. 第 14 卷第 2 期智能系统学报 Vol.14 No.2 2019 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2019

第2期欧伟奇，等：一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法 ·247· 极大兴趣。由于单视角视野有限，当相机剧烈晃根据所有粒子的权重，利用蒙特卡洛序列方法确动时易造成目标丢失以至于跟踪轨迹的不连续性定状态的后验概率，对跟踪过程中噪声具有一定问题，无法进行全方位的跟踪。Multi-Egocentric 的鲁棒性。Bae等o以及Dicle等跟据轨迹片段视频是由多个处于同一场景中的穿戴式或手持式的置信度进行轨迹关联实现多目标跟踪，但由于相机所拍摄的不同视角、不同运动轨迹的视频。目标轨迹不连续，容易造成短时间的目标误匹配多视角跟踪由于视野范围更大，视角丰富，能够问题。Xiang等2l通过构造马尔可夫决策过程求根据多视角信息有效跟踪目标。相对多固定视角取最优策略的方法来预测目标下一刻状态。上述视频的跟踪任务，Multi-.Egocentric视角随拍摄者算法一定程度上能够解决运动视角下目标的鲁棒移动，一方面带有Egocentric视频背景变化剧烈、性跟踪问题，但对于视角时变性强的Multi--ego 目标尺度差异明显和视角时变性强的特点，另一 centric视频，容易因目标运动不连续性造成跟踪方面由于继承了拍摄者的关注兴趣，能以更好的失败。近年来深度学习方法在目标跟踪领域也有视角拍摄所关注的目标，同时多样化的视角为解广泛应用，其中MDNet算法采用共享层和特定决遮挡、漂移等问题提供了更为丰富的线索。层相结合的深度模型进行目标跟踪，该方法具有目前大多数跟踪算法致力于解决单个Egocen- 很好的鲁棒性和适应性，但对多目标跟踪具有局 tic视角或多个固定视角中存在的目标遮挡、跟踪限性。漂移等问题。为了进行鲁棒的目标跟踪，Xu等针对Multi--egocentric视频的特点，本文从目基于目标表面模型和运动模型，提出层次轨迹关标空间几何关系约束的角度出发，并结合卡尔曼联模型构建有向无环图解决固定多视角下轨迹片滤波算法，提出一种基于运动轨迹重建的多目标段关联问题，将其应用于Multi-Egocentric视频鲁跟踪算法。与以上算法相比，本文算法通过轨迹棒性较差，无法解决目标不连续性问题。Fleuret 重建可以有效解决Multi--egocentric视频中运动目等将颜色、纹理和运动信息3个特征相结合建标轨迹不连续的问题。立目标模型，并通过目标之间的相对位置对目标进行定位，能够有效解决多固定视角下目标遮挡 1基于运动轨迹重建的多目标跟踪问题，但是将其应用于Multi-Egocentric视频跟踪本文针对Multi--egocentric视频的特点，提出任务中，背景变化烈情况会对跟踪结果造成很大影响，常出现轨迹误匹配问题。另外，XMi等一种基于运动轨迹重建的多目标跟踪算法，算法提出的稀疏表示算法采用稀疏线性表示的方法使流程如图1所示。该算法利用多视角之间目标位跟踪器可以应对光照变化、遮挡等问题。在线多置和运动轨迹的几何约束关系降低了目标定位示例学习算法使用图像块的集合表示目标，使误差、目标跟踪漂移以及轨迹不连续等对多目标得跟踪器在目标经历光照变化和遮挡时可以有效跟踪造成的影响，并在Multi--Egocentric视频数据地跟踪目标。Yuxia Wang等采用粒子滤波方集和多固定视角数据集上验证了本文算法的有法，基于贝叶斯滤波理论，解决状态估计问题，再效性。输入视频目标检测单应性几何约束下的初始位置估计跟踪结果单应性矩阵视1 视频1 视频1 对极几何约束下的位置估计相机1 基于空间位置关系的目标区域位置融合同步帧同步帧同步帧目标位：目标位目标位置估计置估计置估计视颜n 视颜n 相机n 视频n 卡尔曼滤波状态更新图1基于运动轨迹重建的多目标跟踪算法流程 Fig.1 Flow chart of multi-target tracking algorithm based on trajectory reconstruction

极大兴趣。由于单视角视野有限，当相机剧烈晃动时易造成目标丢失以至于跟踪轨迹的不连续性问题，无法进行全方位的跟踪。Multi-Egocentric 视频是由多个处于同一场景中的穿戴式或手持式相机所拍摄的不同视角、不同运动轨迹的视频。多视角跟踪由于视野范围更大，视角丰富，能够根据多视角信息有效跟踪目标。相对多固定视角视频的跟踪任务，Multi-Egocentric 视角随拍摄者移动，一方面带有 Egocentric 视频背景变化剧烈、目标尺度差异明显和视角时变性强的特点，另一方面由于继承了拍摄者的关注兴趣，能以更好的视角拍摄所关注的目标，同时多样化的视角为解决遮挡、漂移等问题提供了更为丰富的线索。目前大多数跟踪算法致力于解决单个 Egocentric 视角或多个固定视角中存在的目标遮挡、跟踪漂移等问题[2-5]。为了进行鲁棒的目标跟踪，Xu 等 [4] 基于目标表面模型和运动模型，提出层次轨迹关联模型构建有向无环图解决固定多视角下轨迹片段关联问题，将其应用于 Multi-Egocentric 视频鲁棒性较差，无法解决目标不连续性问题。Fleuret 等 [6]将颜色、纹理和运动信息 3 个特征相结合建立目标模型，并通过目标之间的相对位置对目标进行定位，能够有效解决多固定视角下目标遮挡问题，但是将其应用于 Multi-Egocentric 视频跟踪任务中，背景变化剧烈情况会对跟踪结果造成很大影响，常出现轨迹误匹配问题。另外，X.Mei 等 [7] 提出的稀疏表示算法采用稀疏线性表示的方法使跟踪器可以应对光照变化、遮挡等问题。在线多示例学习算法[8]使用图像块的集合表示目标，使得跟踪器在目标经历光照变化和遮挡时可以有效地跟踪目标。Yuxia Wang 等 [9]采用粒子滤波方法，基于贝叶斯滤波理论，解决状态估计问题，再根据所有粒子的权重，利用蒙特卡洛序列方法确定状态的后验概率，对跟踪过程中噪声具有一定的鲁棒性。Bae 等 [10]以及 Dicle 等 [11]跟据轨迹片段的置信度进行轨迹关联实现多目标跟踪，但由于目标轨迹不连续，容易造成短时间的目标误匹配问题。Xiang 等 [12]通过构造马尔可夫决策过程求取最优策略的方法来预测目标下一刻状态。上述算法一定程度上能够解决运动视角下目标的鲁棒性跟踪问题，但对于视角时变性强的 Multi-egocentric 视频，容易因目标运动不连续性造成跟踪失败。近年来深度学习方法在目标跟踪领域也有广泛应用，其中 MDNet 算法[13]采用共享层和特定层相结合的深度模型进行目标跟踪，该方法具有很好的鲁棒性和适应性，但对多目标跟踪具有局限性。针对 Multi-egocentric 视频的特点，本文从目标空间几何关系约束的角度出发，并结合卡尔曼滤波算法，提出一种基于运动轨迹重建的多目标跟踪算法。与以上算法相比，本文算法通过轨迹重建可以有效解决 Multi-egocentric 视频中运动目标轨迹不连续的问题。 1 基于运动轨迹重建的多目标跟踪本文针对 Multi-egocentric 视频的特点，提出一种基于运动轨迹重建的多目标跟踪算法，算法流程如图 1 所示。该算法利用多视角之间目标位置和运动轨迹的几何约束关系降低了目标定位误差、目标跟踪漂移以及轨迹不连续等对多目标跟踪造成的影响，并在 Multi-Egocentric 视频数据集和多固定视角数据集上验证了本文算法的有效性。基于空间位置关系的目标区域位置融合视频 1 跟踪结果视频 n 视频 1 输入视频视频 n 视频 1 目标检测单应性几何约束下的初始位置估计单应性矩阵相机 1 相机 n 对极几何约束下的位置估计卡尔曼滤波状态更新同步帧目标位置估计同步帧目标位置估计同步帧目标位置估计输入视频 n f j i f j i′ … … … … … … … 图 1 基于运动轨迹重建的多目标跟踪算法流程 Fig. 1 Flow chart of multi-target tracking algorithm based on trajectory reconstruction 第 2 期欧伟奇，等：一种基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法 ·247·

·248· 智能系统学报第14卷与单视角目标跟踪算法不同，多视角目标跟针对这种问题，本文基于具有重叠视野区域踪可以利用多视角之间目标位置的关联关系优化的视角之间存在平面上的单应性约束关系，利目标定位；本文提出基于运动轨迹重建的Multi-- 用多个视角之间目标的相对位置，根据Camera Egocentric视频多目标跟踪算法，首先在目标检测第j帧f∥中的目标轨迹点来估计Camera,第j帧f的基础上，通过求解不同视角间单应性约束解决同目标所在位置。算法具体描述和实现如算法1所示。一时刻目标的遮挡和丢失问题，然后基于多视角算法1多视角单应性约束下的目标位置估计轨迹立体重建算法进行目标定位估计，最后结合输入l)Camera,.第j帧f、Camera,第j帧f、卡尔曼滤波的状态更新实现基于空间位置关系的中被遮挡目标k在f中的轨迹点坐标；目标区域位置融合，得到最佳的目标跟踪结果。 1.1多视角辅助下的目标初始位置估计 2)f的目标所在位置：设f为视角(=1,2，，n)第j帧图像，其中包含 3)采用SIFT角点检测算法对f∥和f两帧提取 m个目标P,其中k=1,2,…,m,B表示目标检测在地面特征点，得到匹配点集合P和P: f的检测框集合，B=bk=1,2,…,m,b={x,y 4)利用匹配点构建方程(2)，并利用RANSAC ,}表示第k个目标的Bounding Box,其中算法剔除误匹配，点求解单应性矩阵：、、分别表示b的左上角横坐标、左上 P=HP (2) 角纵坐标、右下角横坐标、右下角纵坐标，设作式中：H为3×3的单应性矩阵。为检测结果中目标k在视角第帧的轨迹点： 5)根据式(2)把代入求得f中被遮挡目标 t=[,0+)/2] (1) k所在位置：由于Egocentric视频视角时变性的特点，移动输出的目标所在位置视角因剧烈晃动或平移等因素造成单个视角中目通过不同视角同一时刻目标之间存在的单应标消失等运动轨迹的不连续性问题。如图2所性约束关系可以对遮挡和丢失目标进行重新定示，箭头指示两个视角下的相同目标所在位置。位，从而解决单个视角中目标的遮挡和丢失问从Camera,视角方向来看，两个目标在同一个方题。同时由于特征点的检测和匹配误差使得单应向造成目标遮挡，而Camera,的视角中各目标无遮性约束只能粗定位遮挡和丢失的目标，因此本文挡问题。如图3所示，左右两视角都向两边移动通过多视角轨迹重建进一步优化目标位置估计。时，造成单个视角只检测到部分目标，右侧扩充 1.2多视角轨迹重建位置估计区域是对单个视角的视野范围的扩充，用于显示多视角轨迹重建位置估计是根据不同视角同目标之间的相对位置关系。以上两种情况都会因目标丢失导致某些视角跟踪失败。时刻帧目标的像素坐标对应位置关系做空间约束进一步对目标进行定位。根据不同视角同步帧之间重叠视野区域特征点的对应关系采用立体视 Camera, 觉三维重建算法实现同步帧目标位置估计。立体重视觉三维算法示意图如图4所示，相机采用张正视野区域友标定法i获得Camera,内参矩阵K,和Camera,内参矩阵K,然后分别提取∥和f之间重叠区域的匹配点集合P和P,由单应性约束得：图2多视角中目标之间相互遮挡示意图 (P)TEP!=0 (3) Fig.2 Multi-view of the occlusion between targets Ei=(K)TFi Kr (4) 利用PnPI刀和RANSAC算法求出基础矩阵 Camera F和本质矩阵E;当f中目标k在Camera,中没重叠视野扩充有对应位置，把目标轨迹点4代入式(3)可以求区域区域解目标在f}中的扩展匹配坐标位置：，并把和分别加入P和P。对E作SVD分解，可得 Camera,相对于Camera,的旋转矩阵R和平移向量图3多视角移动造成目标丢失示意图 Fig.3 Multi-view movement causes the target to lose the T。然后计算得到目标轨迹点的三维空间坐标位 sketch map 置集合S={5k=1,2,…,mo

与单视角目标跟踪算法不同，多视角目标跟踪可以利用多视角之间目标位置的关联关系优化目标定位；本文提出基于运动轨迹重建的 MultiEgocentric 视频多目标跟踪算法，首先在目标检测基础上，通过求解不同视角间单应性约束解决同一时刻目标的遮挡和丢失问题，然后基于多视角轨迹立体重建算法进行目标定位估计，最后结合卡尔曼滤波的状态更新实现基于空间位置关系的目标区域位置融合，得到最佳的目标跟踪结果。 1.1 多视角辅助下的目标初始位置估计 f j i i i j m Pk ,其中k = 1,2,··· ,m B j i f j i B j i = {b j ik|k = 1,2,··· ,m} b j ik = {x j ik, y j ik, x˜ j ik, y˜ j ik} k x j ik、y j ik、x˜ j ik、y˜ j ik b j ik t j ik k i j 设为视角 ( =1,2,···,n) 第帧图像，其中包含个目标，表示目标检测在的检测框集合，，表示第个目标的 Bounding Box ，其中分别表示的左上角横坐标、左上角纵坐标、右下角横坐标、右下角纵坐标，设作为检测结果中目标在视角第帧的轨迹点： t j ik = [ ˜x j ik,(y j ik+y˜ j ik)/2] (1) 由于 Egocentric 视频视角时变性的特点，移动视角因剧烈晃动或平移等因素造成单个视角中目标消失等运动轨迹的不连续性问题。如图 2 所示，箭头指示两个视角下的相同目标所在位置。从 Camerai 视角方向来看，两个目标在同一个方向造成目标遮挡，而 Camerai'的视角中各目标无遮挡问题。如图 3 所示，左右两视角都向两边移动时，造成单个视角只检测到部分目标，右侧扩充区域是对单个视角的视野范围的扩充，用于显示目标之间的相对位置关系。以上两种情况都会因目标丢失导致某些视角跟踪失败。 j f j i j f j i ′ 针对这种问题，本文基于具有重叠视野区域的视角之间存在平面上的单应性约束关系[14] ，利用多个视角之间目标的相对位置，根据 Camerai 第帧中的目标轨迹点来估计 Camerai'第帧的目标所在位置。算法具体描述和实现如算法 1 所示。算法 1 多视角单应性约束下的目标位置估计 j f j i j f j i ′ f j i ′ f j i t j ik 输入 1) Camerai 第帧、Camerai'第帧、中被遮挡目标 k 在中的轨迹点坐标； f j i ′ t j i ′k 2) 的目标所在位置； f j i f j i ′ P j i P j i ′ 3) 采用 SIFT 角点检测算法对和两帧提取地面特征点，得到匹配点集合和； 4) 利用匹配点构建方程 (2)，并利用 RANSAC[15] 算法剔除误匹配点求解单应性矩阵； P j i = HPj i ′ (2) 式中： H 为 3×3 的单应性矩阵。 t j ik f j i ′ k t j i ′k 5) 根据式 (2) 把代入求得中被遮挡目标所在位置； f j i ′ t j i ′ 输出的目标所在位置 k 通过不同视角同一时刻目标之间存在的单应性约束关系可以对遮挡和丢失目标进行重新定位，从而解决单个视角中目标的遮挡和丢失问题。同时由于特征点的检测和匹配误差使得单应性约束只能粗定位遮挡和丢失的目标，因此本文通过多视角轨迹重建进一步优化目标位置估计。 1.2 多视角轨迹重建位置估计 i Ki Ki ′ f j i f j i ′ P j i P j i ′ 多视角轨迹重建位置估计是根据不同视角同一时刻帧目标的像素坐标对应位置关系做空间约束进一步对目标进行定位。根据不同视角同步帧之间重叠视野区域特征点的对应关系采用立体视觉三维重建算法实现同步帧目标位置估计。立体视觉三维算法示意图如图 4 所示，相机采用张正友标定法[16]获得 Camerai 内参矩阵和 Camerai'内参矩阵，然后分别提取和之间重叠区域的匹配点集合和，由单应性约束得： (P j i ) TF j i,i ′ P j i ′ = 0 (3) E j i,i ′ = (Ki) TF j i,i ′Ki ′ (4) F j i,i ′ E j i,i ′ f j i f j i t j ik f j i ′ t j i ′′k t j ik t j i ′′k P j i P j i ′ E j i,i ′ R j i T j i S j i = {s j ik|k = 1,2,··· ,m} 利用 PnP[17]和 RANSAC 算法求出基础矩阵和本质矩阵；当中目标 k 在 Camerai'中没有对应位置，把目标轨迹点代入式 (3) 可以求解目标在中的扩展匹配坐标位置，并把和分别加入和。对作 S VD 分解，可得 Camerai'相对于 Camerai 的旋转矩阵和平移向量。然后计算得到目标轨迹点的三维空间坐标位置集合。 Z X Camerai P1 Y Camerai′ 重叠视野区域 P2 图 2 多视角中目标之间相互遮挡示意图 Fig. 2 Multi-view of the occlusion between targets X Z Y Camerai P1 Camerai′ 重叠视野区域扩充区域扩充区域 P2 图 3 多视角移动造成目标丢失示意图 Fig. 3 Multi-view movement causes the target to lose the sketch map ·248· 智能系统学报第 14 卷

第2期欧伟奇，等：一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法 ·249· 目标1，目标2，…，目标m 最优估计值。 PnP+RANSAC] 各匹配点 14基于空间位置关系的目标区域位置融合基础矩阵了由以上3个部分的结果，结合单应性约束目标位置估计结果，多视角轨迹重建估计结果和相机旋转矩阵R和 amera. 2D 平移矩阵T 卡尔曼滤波当前时刻的最优估计值，求解目标 2) k在j时刻的最优位置0：相机坐标X 0=w+w2+w (7) 世界坐标x,y乙☑团 1+2+=1 式中w、2和分别表示b以、和s的权重。图4同步帧目标位置估计算法图 Fig.4 Sketch map of synchronous frame target location 2实验结果与分析 estimation algorithm 由上述方法得到目标三维坐标S,再根据像本文提出的基于Multi--Egocentric视频运动轨素坐标与相机坐标之间的关系，把三维跟踪轨迹迹重建的多目标跟踪算法是针对Multi--Egocentric 转换成像素坐标系中的二维坐标S。多视角轨迹视频的，目前尚无针对此任务的公开评价数据重建利用不同视角同步帧的目标空间位置一致性集，为了验证算法的有效性，设计并拍摄了针对对同步帧目标位置进行了优化，下一步利用同一多目标跟踪任务的Multi-Egocentric视频数据集视角的运动连续性对目标位置进行跟踪。 BMOT。由于数据集采集规模所限，该视频数据 1.3基于轨迹重建的多目标跟踪集包含两个视角的视频，由两个拍摄者佩戴相同设置目标的运动状态参数为某一帧目标的位规格的运动相机拍摄，场景中有两个以上的自由置和速度。定义卡尔曼滤波1第k个目标在j时运动目标，各视频经同步后，每个视频时长为45s, 刻状态是一个四维向量r()=(px,Py,), 帧率为每秒25帧，并从每个视频各提取220帧进 pr,x,Py,y分别表示目标在x轴和y轴上的位行了人工标注作为ground-truth。同时为了验证本置和速度，设单位时间T内假设目标是匀速运文算法的适应性，还在固定多视角的数据集EPLF 动、初始位置为s、初始速度设为0、T(O)=(m campus44进行了跟踪实验，表1为两个数据集的 0,m,O)T;其中下一步预测方程为相关信息。 -=Aut+Bc+w (5) 表1实验采用的数据集式中：为目标k在第j-1时刻到j时刻的先验 Table 1 Experimental data sets information 状态估计；为在第j-1时刻的后验状态估计；数据集视角特征帧数视角 c~为第j-1时刻的控制输入；w为第j-1时刻的 BJMOT 移动视角222 Camera1;Camera2 激励噪声；A为状态转移矩阵；B为系统控制矩 EPLF-campus4 固定视角20 1 Camera1:Camera 阵。定义状态转移矩阵A为 [1T001 本文采用的目标检测方法为ACF算法1咧，并 0 10 0 将算法与MDP算法2和CMOT算法I进行了对 0 01T 比说明。实验评价指标采用中心位置误差和重 0 001 叠率两种度量方式。中心位置误差是跟踪结果由系统方程和观测状态定义矩阵B为和实际情况中心点间的欧式距离，重叠率是PAS [10001 B= CAL中目标检测的评分标准20，即对于给定的跟 0010 踪目标框为，和ground-truth为r,定义中心位置误卡尔曼滤波状态更新方程为差为 u=in-+Ki-Hi] (6) EI=(rx-rx)+(ry-rgy) (8) 式中：为第j时刻的观测值，-H沙为观测过程残差，K为时刻的卡尔曼残差增益，H为观测式中：x和ry分别表示，的中心横坐标和纵坐矩阵；由既往时刻的估计值和当前时刻的观测标，rgx和ry分别表示r的中心横坐标和纵坐标，值，利用无偏最小均方差准则，得到当前时刻的定义目标框的重叠率为

S j i s j i 由上述方法得到目标三维坐标，再根据像素坐标与相机坐标之间的关系，把三维跟踪轨迹转换成像素坐标系中的二维坐标。多视角轨迹重建利用不同视角同步帧的目标空间位置一致性对同步帧目标位置进行了优化，下一步利用同一视角的运动连续性对目标位置进行跟踪。 1.3 基于轨迹重建的多目标跟踪 rk(j) = (px j k , vx j k , py j k , vy j k ) px j k , vx j k , py j k , vy j k s j k rk(0) = (x ′ k,pos 0, yk,pos ,0)T 设置目标的运动状态参数为某一帧目标的位置和速度。定义卡尔曼滤波[18]第 k 个目标在 j 时刻状态是一个四维向量，分别表示目标在 x 轴和 y 轴上的位置和速度，设单位时间 T 内假设目标是匀速运动、初始位置为、初始速度设为 0、；其中下一步预测方程为 uˆ j/ j−1 k = Au j−1 k + Bc j−1 k +w j−1 k (5) uˆ j/ j−1 k j−1 u j−1 k j−1 c j−1 k j−1 w j−1 k j−1 A B A 式中：为目标 k 在第时刻到 j 时刻的先验状态估计；为在第时刻的后验状态估计；为第时刻的控制输入；为第时刻的激励噪声；为状态转移矩阵；为系统控制矩阵。定义状态转移矩阵为 A =   1 T 0 0 0 1 0 0 0 0 1 T 0 0 0 1   由系统方程和观测状态定义矩阵 B 为 B = [ 1 0 0 0 0 0 1 0 ] 卡尔曼滤波状态更新方程为 u j k = uˆ j/ j−1 k +K j k [z j k − Huˆ j/ j−1 k ] (6) z j k j z j k − Huˆ j/ j−1 k K j k j H 式中：为第时刻的观测值，为观测过程残差，为时刻的卡尔曼残差增益，为观测矩阵；由既往时刻的估计值和当前时刻的观测值，利用无偏最小均方差准则，得到当前时刻的 u j 最优估计值 k。 1.4 基于空间位置关系的目标区域位置融合 t j k s j k u j k k j O j k 由以上 3 个部分的结果，结合单应性约束目标位置估计结果，多视角轨迹重建估计结果和卡尔曼滤波当前时刻的最优估计值，求解目标在时刻的最优位置： { O j k = ω1 t j k +ω2 s j k +ω3u j k ω1 +ω2 +ω3 = 1 (7) ω1、ω2和ω3 b j k t j k s j 式中分别表示、和 k的权重。 2 实验结果与分析本文提出的基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法是针对 Multi-Egocentric 视频的，目前尚无针对此任务的公开评价数据集，为了验证算法的有效性，设计并拍摄了针对多目标跟踪任务的 Multi-Egocentric视频数据集 BJMOT。由于数据集采集规模所限，该视频数据集包含两个视角的视频，由两个拍摄者佩戴相同规格的运动相机拍摄，场景中有两个以上的自由运动目标，各视频经同步后，每个视频时长为 45 s，帧率为每秒 25 帧，并从每个视频各提取 220 帧进行了人工标注作为 ground-truth。同时为了验证本文算法的适应性，还在固定多视角的数据集 EPLFcampus4 进行了跟踪实验，表 1 为两个数据集的相关信息。表 1 实验采用的数据集 Table 1 Experimental data sets information 数据集视角特征帧数视角 BJMOT 移动视角 222 Camera1 ;Camera2 EPLF-campus4 固定视角 201 Camera1 ;Camera2 rt rg 本文采用的目标检测方法为 ACF 算法[19] ，并将算法与 MDP 算法[12]和 CMOT 算法[10]进行了对比说明。实验评价指标采用中心位置误差和重叠率两种度量方式。中心位置误差是跟踪结果和实际情况中心点间的欧式距离，重叠率是 PASCAL 中目标检测的评分标准[20] ，即对于给定的跟踪目标框为和 ground-truth 为，定义中心位置误差为 Err = √ (rt .x−rg.x) 2 +(rt .y−rg.y) 2 (8) rt .x rt .y rt rg.x rg.y rg 式中：和分别表示的中心横坐标和纵坐标，和分别表示的中心横坐标和纵坐标，定义目标框的重叠率为世界坐标Xj , Yj , Zj 相机坐标Xj , Yj 相机旋转矩阵Ri , 平移矩阵Ti 基础矩阵 F PnP+RANSAC 算法各匹配点 Camera1 Camerai Cameran 2D 2D 2D 3D 目标 1, 目标 2,···, 目标 m j j 图 4 同步帧目标位置估计算法图 Fig. 4 Sketch map of synchronous frame target location estimation algorithm 第 2 期欧伟奇，等：一种基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法 ·249·

·250· 智能系统学报第14卷 area(r,nrg） Score= (9) 表2本文算法在BJMOT上的平均中心误差和平均重 area(r,Urg) 叠率 Table 2 The mean center error and the average overlap 2.1在BMOT数据集上的实验结果 rate of the proposed algorithm over BJMOT 本文算法在BJMOT数据集上的平均中心误视角单应性约束平均中心误差平均重叠率差如图5所示，表2为平均重叠率和平均中心误差的统计结果，对于部分目标丢失的情况不在计无 7.7 0.76 Camera 算中心误差范围之内。实验过程中，对、ω2和有 7.3 0.89 3分别取值为w1=0.64,2=0.23,=0.13。相比无 7.6 0.73 缺少单应性约束条件的实验结果，结合单应性约有 7.1 0.82 束的目标初始位置估计和多视角轨迹重建的方法下，本文算法实验结果的平均重叠率在第一个视部分典型帧在Camera,和Camera2上的实验角和第二个视角分别提高了13%和9%，能够有结果分别如图6~7所示，图6~7中给出正常情况、效降低遮挡或部分丢失等因素造成的不连续因素部分遮挡情况、完全遮挡情况、部分消失和完全对跟踪的影响。消失情况等5种典型情况下的目标跟踪实验结果。其中第1行表示目标检测结果或单应性约束 15 +Camera, 目标位置估计结果，行中实线框表示目标检测结 .Camera, 果，虚线框表示单应性约束计算结果；第2行中虚线框为多视角轨迹重建估计结果；第3行中虚线框为卡尔曼滤波当前时刻的最优估计值；第四行 5 表示最终结果。第5列中由于目标缺失，在跟踪过程中通过运动一致性可以有效定位目标所在位置，算法计算出的结果在扩展视野区域；并且从 0 4 68102141618202210 图6中第2行第3列也可以看出，通过轨迹重建帧数得到的目标位置误差较大，实验结果容易受到目图5本文算法在BJMOT数据集的中心误差曲线标检测算法和单应性计算结果的影响；当目标检 Fig.5 The central error curve of the algorithm in BJMOT 测误差较大时，该部分所产生的误差也较大，而 dataset 通过融合对这类误差进行了较好的修正。 7 (a)F005(正常帧) (b)F020(目标部分 (c)F035(目标完全 (d)F106(目标部分 (e)F116(目标完全遮挡) 遮挡) 消失) 消失) 图6本文算法在BJMOT数据集第1个视角视频中的分步实验结果 Fig.6 The experimental results of ours algorithm in the first video sequences of the BJMOT datasets

Score = area(rt ∩rg) area(rt ∪rg) (9) 2.1 在 BJMOT 数据集上的实验结果 ω1、ω2 ω3 ω1 = 0.64,ω2 = 0.23,ω3 = 0.13 本文算法在 BJMOT 数据集上的平均中心误差如图 5 所示，表 2 为平均重叠率和平均中心误差的统计结果，对于部分目标丢失的情况不在计算中心误差范围之内。实验过程中，对和分别取值为。相比缺少单应性约束条件的实验结果，结合单应性约束的目标初始位置估计和多视角轨迹重建的方法下，本文算法实验结果的平均重叠率在第一个视角和第二个视角分别提高了 13% 和 9%，能够有效降低遮挡或部分丢失等因素造成的不连续因素对跟踪的影响。部分典型帧在 Camera1 和 Camera2 上的实验结果分别如图 6~7 所示，图 6~7 中给出正常情况、部分遮挡情况、完全遮挡情况、部分消失和完全消失情况等 5 种典型情况下的目标跟踪实验结果。其中第 1 行表示目标检测结果或单应性约束目标位置估计结果，行中实线框表示目标检测结果，虚线框表示单应性约束计算结果；第 2 行中虚线框为多视角轨迹重建估计结果；第 3 行中虚线框为卡尔曼滤波当前时刻的最优估计值；第四行表示最终结果。第 5 列中由于目标缺失，在跟踪过程中通过运动一致性可以有效定位目标所在位置，算法计算出的结果在扩展视野区域；并且从图 6 中第 2 行第 3 列也可以看出，通过轨迹重建得到的目标位置误差较大，实验结果容易受到目标检测算法和单应性计算结果的影响；当目标检测误差较大时，该部分所产生的误差也较大，而通过融合对这类误差进行了较好的修正。 2 0 5 10 15 Camera1 Camera2 4 6 8 10 12 帧数中心误差 14 16 18 20 22 ×10 图 5 本文算法在 BJMOT 数据集的中心误差曲线 Fig. 5 The central error curve of the algorithm in BJMOT dataset (a) F005 (正常帧) (b) F020 (目标部分遮挡) (c) F035 (目标完全遮挡) (d) F106 (目标部分消失) (e) F116 (目标完全消失) 图 6 本文算法在 BJMOT 数据集第 1 个视角视频中的分步实验结果 Fig. 6 The experimental results of ours algorithm in the first video sequences of the BJMOT datasets 表 2 本文算法在 BJMOT 上的平均中心误差和平均重叠率 Table 2 The mean center error and the average overlap rate of the proposed algorithm over BJMOT 视角单应性约束平均中心误差平均重叠率 Camera1 无 7.7 0.76 有 7.3 0.89 Camera2 无 7.6 0.73 有 7.1 0.82 ·250· 智能系统学报第 14 卷

第2期欧伟奇，等：一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法 ·251· (a)F005(正常帧) (b)F020(目标部分 (c)F035(目标完全 (dF106(目标部分 (e)F116(目标完全遮挡) 遮挡) 消失) 消失) 图7本文算法在BJMOT数据集第2个视角视频中的分步实验结果 Fig.7 The experimental results of ours algorithm in the in the second video sequences of B.MOT datasets 2.2在EPLF-campus.4数据集上的实验结果 20 -·-本文方法本文算法与MDP算法、CMOT算法在EPLF- -CMOT 15 -MDP campus4数据集上的平均重叠率结果对比如表3 所示。表4为3个跟踪器在EPLF-campus4数据集上的平均中心位置误差。从表3中看出，相比其他两种算法，本文算法在Camera,中的重叠率更高，而在Camera.2中的重叠率较低于CMOT算法，其原因是在CMOT算法中目标跟踪框不会随 2 468102141618202登10 着目标大小进行变化，在目标较远时，检测框与帧数目标真实范围重合率较大。从表4可以看出本文图83种算法在Camera1视频中的中心误差曲线的算法的平均中心误差较小。因此从整体来看本 Fig.8 The center error of three tracking algorithms on 文算法在该数据集上优于其他两种算法。图8~9 camera 20r 是3种算法在EPLF-campus44数据集中两个视角的中心误差变化趋势。 15 表33个跟踪算法在EPLF-campus.4上的平均重叠率 Table 3 The average overlap rate of 3 tracking algorithms on EPLF-campus4 视角 MDP☒ CMOTO 本文方法 5 Cameray 0.79 0.83 0.89 Camera 0.74 0.79 0.82 2 68 10214161820210 表43个跟踪算法在EPLF-campus4上的平均中心误差帧数 Table 4 Average center error of 3 tracking algorithms on 图93种算法在Camera2视频中的中心误差曲线 EPLF-campus4 Fig.9 The center error of three tracking algorithms on 视角 MDPl②I CMOTIIO 本文方法 cameraz Camera 9.6 7.1 5.1 在EPLF-campus44数据集上Camera,和Cam- Cameraz 9.5 6.9 5.9 era2的典型帧跟踪结果分别如图10~I1所示。同

2.2 在 EPLF-campus4 数据集上的实验结果本文算法与 MDP 算法、CMOT 算法在 EPLFcampus4 数据集上的平均重叠率结果对比如表 3 所示。表 4 为 3 个跟踪器在 EPLF-campus4 数据集上的平均中心位置误差。从表 3 中看出，相比其他两种算法，本文算法在 Camera1 中的重叠率更高，而在 Camera2 中的重叠率较低于 CMOT 算法，其原因是在 CMOT 算法中目标跟踪框不会随着目标大小进行变化，在目标较远时，检测框与目标真实范围重合率较大。从表 4 可以看出本文的算法的平均中心误差较小。因此从整体来看本文算法在该数据集上优于其他两种算法。图 8~9 是 3 种算法在 EPLF-campus4 数据集中两个视角的中心误差变化趋势。在 EPLF-campus4 数据集上 Camera1 和 Camera2 的典型帧跟踪结果分别如图 10~11 所示。同 (a) F005 (正常帧) (b) F020 (目标部分遮挡) (c) F035 (目标完全遮挡) (d) F106 (目标部分消失) (e) F116 (目标完全消失) 图 7 本文算法在 BJMOT 数据集第 2 个视角视频中的分步实验结果 Fig. 7 The experimental results of ours algorithm in the in the second video sequences of BJMOT datasets 2 5 10 15 20 本文方法 CMOT MDP 4 6 8 10 12 帧数中心误差 14 16 18 20 22 ×10 图 8 3 种算法在 Camera1 视频中的中心误差曲线 Fig. 8 The center error of three tracking algorithms on camera1 2 0 5 10 15 20 4 6 8 10 12 帧数中心误差 14 16 18 20 22 ×10 图 9 3 种算法在 Camera2 视频中的中心误差曲线 Fig. 9 The center error of three tracking algorithms on camera2 表 3 3 个跟踪算法在 EPLF-campus4 上的平均重叠率 Table 3 The average overlap rate of 3 tracking algorithms on EPLF-campus4 视角 MDP[12] CMOT[10] 本文方法 Camera1 0.79 0.83 0.89 Camera2 0.74 0.79 0.82 表 4 3 个跟踪算法在 EPLF-campus4 上的平均中心误差 Table 4 Average center error of 3 tracking algorithms on EPLF-campus4 视角 MDP[12] CMOT[10] 本文方法 Camera1 9.6 7.1 5.1 Camera2 9.5 6.9 5.9 第 2 期欧伟奇，等：一种基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法 ·251·

第2期欧伟奇，等：一种基于Multi-Egocentric视频运动轨迹重建的多目标跟踪算法 ·253· 参考文献： neural networks for visual tracking[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern [1]SHAN Caifeng,WEI Yucheng,TAN Tieniu,et al.Real Recognition.Las Vegas.NV.USA.2016:4293-4302. time hand tracking by combining particle filtering and [14]KHAN S M,YAN Pingkun,SHAH M.A homographic mean shift[C]//Proceedings of the 6th IEEE International framework for the fusion of multi-view silhouettes[C]// Conference on Automatic Face and Gesture Recognition. Proceedings of the 11th International Conference on Seoul,South Korea,2004:669-674. Computer Vision.Rio de Janeiro,Brazil,2007:1-8. [2]ZHANG Lei,LI Yuan,NEVATIA R.Global data associ- [15]FISCHLER M A.BOLLES R C.Random sample con- ation for multi-object tracking using network flows[C1// sensus:a paradigm for model fitting with applications to Proceedings of 2008 IEEE Conference on Computer Vis- image analysis and automated cartography[J.Communic- ion and Pattern Recognition.Anchorage,AK.USA.2008:1-8. ations of the ACM,1981,24(6):381-395. [3]AVIDAN S.Ensemble tracking[J].IEEE transactions on [16]ZHANG Z.A flexible new technique for camera calibra- pattern analysis and machine intelligence,2007,29(2): tion[J].IEEE transactions on pattern analysis and ma- 261-271 chine intelligence,2000,22(11):1330-1334. [4]XU Yuanlu,LIU Xiaobai,LIU Yang,et al.Multi-view [17]SCHWEIGHOFER G,PINZ A.Robust pose estimation people tracking via hierarchical trajectory composition[Cl// from a planar target[J].IEEE transactions on pattern ana- Proceedings of 2016 IEEE Conference on Computer Vis- ion and Pattern Recognition.Las Vegas,NV,USA,2016: lysis and machine intelligence,2006,28(12):2024-2030. 4256-4265. [18]BEKIR E.Adaptive Kalman filter for tracking maneuver [5]HE Shengfeng,YANG Qingxiong,LAU R W H,et al. ing targets[J].Journal of guidance,control,and dynamics. Visual tracking via locality sensitive histograms[C]//Pro- 2015,6(5):414-416. ceedings of 2013 IEEE Conference on Computer Vision [19]DOLLAR P.APPEL R.BELONGIE S,et al.Fast feature and Pattern Recognition.Portland,USA,2013:2427-2434. pyramids for object detection[J].IEEE transactions on [6]FLEURET F,BERCLAZ J,LENGAGNE R,et al.Mul- pattern analysis and machine intelligence,2014,36(8): ticamera people tracking with a probabilistic occupancy 1532-1545 map[J].IEEE transactions on pattern analysis and machine [20]BERNARDI K,STIEFELHAGEN R.Evaluating mul- intelligence,2008.30(2):267-282. tiple object tracking performance:the CLEAR MOT met- [7]MEI Xue,LING Haibo.Robust visual tracking using (1 rics[J].EURASIP Journal on image and video processing. minimization[C]//Proceedings of the 12th IEEE Interna- 2008.2008(1):246309 tional Conference on Computer Vision.Kyoto,Japan, 作者简介： 2009:1436-1443 [8]BABENKO B,YANG M H.BELONGIE S.Robust object 欧伟奇，男，1992出生，硕士研究生，主要研究方向为图像处理、机器 tracking with online multiple instance learning[J].IEEE 学习。 transactions on pattern analysis and machine intelligence. 2011.33(8):1619-1632. [9]王宇霞，赵清杰，蔡艺明，等.基于自重构粒子滤波算法的目标跟踪).计算机学报，2016,39(7)：1294-1306. WANG Yuxia,ZHAO Qingjie,CAI Yiming,et al.Track- ing by auto-reconstructing particle filter trackers[J]. 尹辉.女，1972出生，教授，博士， Chinese journal of computers,2016,39(7):1294-1306. 主要研究方向为机器视觉、模式识别 [10]BAE S H,YOON K J.Robust online multi-object track- 和神经计算。主持和参加国家和省部 ing based on tracklet confidence and online discriminat- 级科研项目60余项，发表学术论文 ive appearance learning[C]//Proceedings of 2014 IEEE 20余篇，知识产权18项，获国家科学 Conference on Computer Vision and Pattern Recognition. 技术进步奖一等奖1项，教育部科技 Columbus.OH.USA.2014:1218-1225 进步一等奖1项，中国专利优秀奖 [11]DICLE C,CAMPS O I,SZNAIER M.The way they 1项，中国铁道学会科学技术奖特等奖、二等奖各1项，北京 move:tracking multiple targets with similar appearance[Cl/ 市高等教育教学成果奖二等奖1项。 Proceedings of 2013 IEEE International Conference on Computer Vision.Sydney,NSW,Australia,2013: 许宏丽，女，1963出生.教授，博 2304-2311. 士，主要研究方向为图像处理、机器学 [12]XIANG Yu.ALAHI A,SAVARESE S.Learning to track: 习和认知计算。主持铁道部项目 online multi-object tracking by decision making[C]//Pro- 2项国重项目1项，参与多项国家和省 ceedings of 2015 IEEE International Conference on Com- 部级科研项目，发表学术论文20余 puter Vision.Santiago,Chile,2015:4705-4713. 篇。主持国家精品课程《多媒体技术 [13]NAM H.HAN B.Learning multi-domain convolutional 应用》，获国家教学进步二等奖

参考文献： SHAN Caifeng, WEI Yucheng, TAN Tieniu, et al. Real time hand tracking by combining particle filtering and mean shift[C]//Proceedings of the 6th IEEE International Conference on Automatic Face and Gesture Recognition. Seoul, South Korea, 2004: 669–674. [1] ZHANG Lei, LI Yuan, NEVATIA R. Global data association for multi-object tracking using network flows[C]// Proceedings of 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, AK, USA, 2008: 1–8. [2] AVIDAN S. Ensemble tracking[J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 29(2): 261–271. [3] XU Yuanlu, LIU Xiaobai, LIU Yang, et al. Multi-view people tracking via hierarchical trajectory composition[C]// Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA, 2016: 4256–4265. [4] HE Shengfeng, YANG Qingxiong, LAU R W H, et al. Visual tracking via locality sensitive histograms[C]//Proceedings of 2013 IEEE Conference on Computer Vision and Pattern Recognition. Portland, USA, 2013: 2427–2434. [5] FLEURET F, BERCLAZ J, LENGAGNE R, et al. Multicamera people tracking with a probabilistic occupancy map[J]. IEEE transactions on pattern analysis and machine intelligence, 2008, 30(2): 267–282. [6] MEI Xue, LING Haibo. Robust visual tracking using ℓ1 minimization[C]//Proceedings of the 12th IEEE International Conference on Computer Vision. Kyoto, Japan, 2009: 1436–1443. [7] BABENKO B, YANG M H, BELONGIE S. Robust object tracking with online multiple instance learning[J]. IEEE transactions on pattern analysis and machine intelligence, 2011, 33(8): 1619–1632. [8] 王宇霞, 赵清杰, 蔡艺明, 等. 基于自重构粒子滤波算法的目标跟踪[J]. 计算机学报, 2016, 39(7): 1294–1306. WANG Yuxia, ZHAO Qingjie, CAI Yiming, et al. Tracking by auto-reconstructing particle filter trackers[J]. Chinese journal of computers, 2016, 39(7): 1294–1306. [9] BAE S H, YOON K J. Robust online multi-object tracking based on tracklet confidence and online discriminative appearance learning[C]//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA, 2014: 1218–1225. [10] DICLE C, CAMPS O I, SZNAIER M. The way they move: tracking multiple targets with similar appearance[C]// Proceedings of 2013 IEEE International Conference on Computer Vision. Sydney, NSW, Australia, 2013: 2304–2311. [11] XIANG Yu, ALAHI A, SAVARESE S. Learning to track: online multi-object tracking by decision making[C]//Proceedings of 2015 IEEE International Conference on Computer Vision. Santiago, Chile, 2015: 4705–4713. [12] [13] NAM H, HAN B. Learning multi-domain convolutional neural networks for visual tracking[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA, 2016: 4293–4302. KHAN S M, YAN Pingkun, SHAH M. A homographic framework for the fusion of multi-view silhouettes[C]// Proceedings of the 11th International Conference on Computer Vision. Rio de Janeiro, Brazil, 2007: 1–8. [14] FISCHLER M A, BOLLES R C. Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography[J]. Communications of the ACM, 1981, 24(6): 381–395. [15] ZHANG Z. A flexible new technique for camera calibration[J]. IEEE transactions on pattern analysis and machine intelligence, 2000, 22(11): 1330–1334. [16] SCHWEIGHOFER G, PINZ A. Robust pose estimation from a planar target[J]. IEEE transactions on pattern analysis and machine intelligence, 2006, 28(12): 2024–2030. [17] BEKIR E. Adaptive Kalman filter for tracking maneuvering targets[J]. Journal of guidance, control, and dynamics, 2015, 6(5): 414–416. [18] DOLLÁR P, APPEL R, BELONGIE S, et al. Fast feature pyramids for object detection[J]. IEEE transactions on pattern analysis and machine intelligence, 2014, 36(8): 1532–1545. [19] BERNARDI K, STIEFELHAGEN R. Evaluating multiple object tracking performance: the CLEAR MOT metrics[J]. EURASIP Journal on image and video processing, 2008, 2008(1): 246309. [20] 作者简介：欧伟奇，男，1992 出生，硕士研究生，主要研究方向为图像处理、机器学习。尹辉，女，1972 出生，教授，博士，主要研究方向为机器视觉、模式识别和神经计算。主持和参加国家和省部级科研项目 60 余项，发表学术论文 20 余篇，知识产权 18 项，获国家科学技术进步奖一等奖 1 项，教育部科技进步一等奖 1 项，中国专利优秀奖 1 项，中国铁道学会科学技术奖特等奖、二等奖各 1 项，北京市高等教育教学成果奖二等奖 1 项。许宏丽，女，1963 出生，教授，博士，主要研究方向为图像处理、机器学习和认知计算。主持铁道部项目 2 项,国重项目 1 项,参与多项国家和省部级科研项目,发表学术论文 20 余篇。主持国家精品课程《多媒体技术应用》，获国家教学进步二等奖。第 2 期欧伟奇，等：一种基于 Multi-Egocentric 视频运动轨迹重建的多目标跟踪算法 ·253·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录