正在加载图片...
384 工程科学学报,第42卷,第3期 表1 SiamMask模型目标跟踪效果统计 Table 1 Statistics of target tracking effect of the SiamMask model Video No. Frame number of false detection Analysis on the causes of false inspection Total frames Failure rate/ 0 Little change in this movement 361 0 2 87 Misidentified as dark cloth 288 30.21 3 98 Part of the face is blocked by the hair 192 51.04 4 674 Initialization offset,screen will pop up in recognition 1380 48.84 5 131 The target moves out of the screen slightly and the recognition is lost 240 54.58 6 753 Large proportion of face selection in initialization area 1360 55.37 7 0 Accurate initialization and small action range 241 0 络模型会在以下情况产生误识别现象: 与空间信息,根据对头发目标时空关系的在线学 1)初始化区域选定的面部比例较大时,效果 习预测新的目标位置,并与SiamMask模型的跟踪 存在较多误识别现象, 结果进行匹配校正 2)干扰项出现时若产生误识别现象,在干扰 1.3.1工业视频ROI提取 因素消失时,无法及时恢复目标跟踪.在本文的对 本文所使用的视频来自于实际车工场地监控 象视频中表现为,目标移出视频后再返回则不再 镜头录制的彩色视频,分辨率为1920×1080,帧率 跟踪.由图3所示,目标误识别后,即便目标仍在 为每秒24帧,总帧数截取3427帧.从图5(a)可以 同一区域,也难以校正 看出,视频画面中包含多个机床工位,往来人员较 1.3 SiamMask模型的修正处理 多,这给单个目标的跟踪、检测带来一定干扰.面 针对SiamMask模型的应用不足,提出算法修 对实际情况,针对单个车床目标,需要对获得的视 正.对原始工业视频做ROI提取,并以STC时空 频进行ROI提取操作.其中包括:视频ROI区域设 上下文跟踪法6-7对视频序列进行匹配校正,从 定、全图运动检测两部分 而减少工业环境中的目标漏检、误检率,实现复杂 (1)ROI区域设定 环境中头发区域的精准检测.算法框架图如图4 具体ROI提取步骤中有两个关键点:ROI区 所示.图中,P:为第k帧图像,P为STC预测的第 域起点位置、ROI区域的分辨率.应用先验知识, k帧图像,中为判断函数. 可以确定ROI区域左上角起点像素位置A(x,), 修正1:ROI区域提取.如上文所述,SiamMask ROI区域宽度为lw,高度为h,如式(1)所示: 模型初始Mask对视频后序识别的误差具有积累 x=1w×0.268 性,因此在算法修正时首先对视频进行了识别目 y=×0.502 (1) 标与非相关性背景的分离预处理剧 lw=1v×0.426 修正2:STC匹配校正.STC模型是一种考量 h=%×0.497 了目标与背景相关性的算法理念,具有较高的目 式中,为原画面宽度,为原画面高度 标跟踪精度与速度.本文基于STC算法,结合时间 通过自动获取原始视频的信息,按照式(1)进 ☆Judge Siam mask Video OI prpcessing deep learning sequence processunng P 图4基于SiamMask模型的时空预测移动目标跟踪算法框架图 Fig.4 Framework of spatiotemporal prediction moving target tracking algorithms based on the SiamMask Model络模型会在以下情况产生误识别现象: 1)初始化区域选定的面部比例较大时,效果 存在较多误识别现象. 2)干扰项出现时若产生误识别现象,在干扰 因素消失时,无法及时恢复目标跟踪. 在本文的对 象视频中表现为,目标移出视频后再返回则不再 跟踪. 由图 3 所示,目标误识别后,即便目标仍在 同一区域,也难以校正. 1.3    SiamMask 模型的修正处理 针对 SiamMask 模型的应用不足,提出算法修 正. 对原始工业视频做 ROI 提取,并以 STC 时空 上下文跟踪法[16−17] 对视频序列进行匹配校正,从 而减少工业环境中的目标漏检、误检率,实现复杂 环境中头发区域的精准检测. 算法框架图如图 4 所示. 图中,Pk 为第 k 帧图像,Pk ’为 STC 预测的第 k 帧图像,Φ 为判断函数. 修正 1:ROI 区域提取. 如上文所述,SiamMask 模型初始 Mask 对视频后序识别的误差具有积累 性,因此在算法修正时首先对视频进行了识别目 标与非相关性背景的分离预处理[18] . 修正 2:STC 匹配校正. STC 模型是一种考量 了目标与背景相关性的算法理念,具有较高的目 标跟踪精度与速度. 本文基于 STC 算法,结合时间 与空间信息,根据对头发目标时空关系的在线学 习预测新的目标位置,并与 SiamMask 模型的跟踪 结果进行匹配校正. 1.3.1    工业视频 ROI 提取 本文所使用的视频来自于实际车工场地监控 镜头录制的彩色视频,分辨率为 1920×1080,帧率 为每秒 24 帧,总帧数截取 3427 帧. 从图 5(a)可以 看出,视频画面中包含多个机床工位,往来人员较 多,这给单个目标的跟踪、检测带来一定干扰. 面 对实际情况,针对单个车床目标,需要对获得的视 频进行 ROI 提取操作. 其中包括:视频 ROI 区域设 定、全图运动检测两部分. (1)ROI 区域设定. 具体 ROI 提取步骤中有两个关键点:ROI 区 域起点位置、ROI 区域的分辨率. 应用先验知识, 可以确定 ROI 区域左上角起点像素位置 A(x,y), ROI 区域宽度为 lw,高度为 lh,如式 (1) 所示: x = l ′ w ×0.268 y = l ′ h ×0.502 lw = l ′ w ×0.426 lh = l ′ h ×0.497 (1) l ′ w l ′ 式中, 为原画面宽度, h 为原画面高度. 通过自动获取原始视频的信息,按照式(1)进 表 1  SiamMask 模型目标跟踪效果统计 Table 1 Statistics of target tracking effect of the SiamMask model Video No. Frame number of false detection Analysis on the causes of false inspection Total frames Failure rate/% 1 0 Little change in this movement 361 0 2 87 Misidentified as dark cloth 288 30.21 3 98 Part of the face is blocked by the hair 192 51.04 4 674 Initialization offset, screen will pop up in recognition 1380 48.84 5 131 The target moves out of the screen slightly and the recognition is lost 240 54.58 6 753 Large proportion of face selection in initialization area 1360 55.37 7 0 Accurate initialization and small action range 241 0 Video sequence ROI prpcessing Siam mask deep learning processunng Pk−2 Pk−1 × P′ k Pk Pk P′ k Φ>1 Φ<1 ☆ΦJudge 图 4    基于 SiamMask 模型的时空预测移动目标跟踪算法框架图 Fig.4    Framework of spatiotemporal prediction moving target tracking algorithms based on the SiamMask Model · 384 · 工程科学学报,第 42 卷,第 3 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有