正在加载图片...
386 工程科学学报,第42卷,第3期 式中,o表示所跟踪目标,P为上下文先验模型 将与SiamMask模型该帧目标位置t比对. P(c(2)lo)=Ig-1(2)@(z-t)=hi(t-2) (3) 设计判断函数中=候-)/(-1-k-2 式中,wr()=ae12是一个权重函数,其中,a是 若Φ>1,则第k帧目标图像输出为P,第k帧 归一化参数,取值为[0,1,σ是一个尺度参数,2为 的目标位置输出更新为;若中<1,则追踪目标图 高斯函数方差.h(t-)是时空上下文模型,是傅里 像为Pk,第k帧的目标位置输出更新为 叶变换后的频率域计算变形 2算法研究结果及分析 步骤2:计算k-1帧2.()上下文区域的空间 上下文模型: 2.1算法训练 0=FFb-err%f 与SiamMask!一样,使用Warmup预热学习 (4) F(I(t)wo(t-r) 率的方式,在Davis?2017201数据集中进行训练,并 式中,b是归一化参数,α是尺度参数,B是目标形 在机加工操作数据视频集中进行头部识别测试 状参数 其中,训练输人为图像尺寸127像素×127像素, 步骤3:更新空间上下文c(x)模型: 255像素×255像素,数据增强采用随机抖动与搜 H)(t)=h(t) (5) 索策略,网络初始化权重采用SiamMask模型在 H()=(1-p)H10+ph10 (6) ImageNet--Ik Datasets上预训练的权重,梯度下降策 式中,p为模型更新的学习率 略采用SGD.训练时在开始进行的5轮训练中,先 步骤4:在第k帧计算上下文先验模型及置信图: 将学习率从103线性增长到5×10~3,之后通过15轮 P(c(z)o)=Ig(z)wo(z-1) (7) 训练将学习率以对数规律降为5×10 ck(t)=F-(F(He(t))I(t)@(z-1) (8) 图8为本文算法在训练及测试集中的准确 率、损失率曲线图.可以看到,在训练集上,15轮 步骤5:将第k帧得到的置信图极值点作为目 次左右训练后,准确率及损失率均有效收敛.在测 标在k帧的位置输出: 试集上,由于数据特征更为集中,呈现了更快速的 =arg r c() (9) 收敛性 2.00 90(a) (b) 1.75 80 wwwwwwM [Epoch:88,90.23] 1.50 70 1.25 60 10 0.75 40 0.50 [Epoch:93,0.172] 0.25 AMwLKh 20 20 40 60 80 100 0 20 40 60 80100 Epoch Epoch 90 (c) (d) 1.6 [Epoch:53,92.85刀 1.4 1.2 70 60 0.8 0.6 50 0.4 [Epoch:23,0.18063] % 0.2 0 20 4060 80 100 0 20 4060 80100 Epoch Epoch 图8算法训练测试准确率及损失率曲线.(a)训练集准确率曲线图:(b)训练集损失率曲线图:(c)测试集准确率曲线图:()测试集损失率曲线图 Fig Algorithm training/test accuracy and loss rate curve:(a)training set accuracy curve;(b)training set loss curve;(c)test set accuracy curve (d)test set loss curve式中,o 表示所跟踪目标,P 为上下文先验模型. P(c(z)|o) = Ik−1(z)ωσ(z−t ∗ ) = h sc k−1 (t−z) (3) ωσ(z) = a · e −z 2 /σ2 h sc(t−z) 式中, 是一个权重函数,其中,a 是 归一化参数,取值为 [0,1],σ 是一个尺度参数,σ 2 为 高斯函数方差. 是时空上下文模型,是傅里 叶变换后的频率域计算变形. 步骤 2:计算 k‒1 帧 Ωc (t * ) 上下文区域的空间 上下文模型: h sc k−1 (t) = F −1 ( F(b · e − (t−t ∗ )⧸α β ) F(I(t)ωσ(t−t ∗ )) ) (4) 式中,b 是归一化参数,α 是尺度参数,β 是目标形 状参数. h sc 步骤 3:更新空间上下文 (x) 模型: H sc 2 (t) = h sc 1 (t) (5) H sc k (t) = (1−ρ)H sc k−1 (t)+ρh sc k−1 (t) (6) 式中,ρ 为模型更新的学习率. 步骤 4:在第 k 帧计算上下文先验模型及置信图: P(c(z)|o) = Ik(z)ωσ(z−t ∗ k−1 ) (7) ck(t) = F −1 (F(H sc k (t))⊙ Ik(t)ωσ(z−t ∗ k−1 ) (8) 步骤 5:将第 k 帧得到的置信图极值点作为目 标在 k 帧的位置输出: t ∗ k = arg max x∈Ω(t ∗ ) ck(t) (9) t ∗ k t k Φ= (t ∗ k −tk)/(tk−1 −tk−2) 将 与 SiamMask 模型该帧目标位置 比 对 . 设计判断函数 . Φ > 1 P ′ k t ∗ k Φ < 1 Pk tk 若 ,则第 k 帧目标图像输出为 ,第 k 帧 的目标位置输出更新为 ;若 ,则追踪目标图 像为 ,第 k 帧的目标位置输出更新为 . 2    算法研究结果及分析 2.1    算法训练 与 SiamMask[15] 一样,使用 Warmup 预热学习 率的方式,在 Davis2017[20] 数据集中进行训练,并 在机加工操作数据视频集中进行头部识别测试. 其中,训练输入为图像尺寸 127 像素×127 像素, 255 像素×255 像素,数据增强采用随机抖动与搜 索策略,网络初始化权重采用 SiamMask 模型在 ImageNet-1k Datasets 上预训练的权重,梯度下降策 略采用 SGD. 训练时在开始进行的 5 轮训练中,先 将学习率从 10‒3 线性增长到 5×10‒3,之后通过 15 轮 训练将学习率以对数规律降为 5×10‒4 . 图 8 为本文算法在训练及测试集中的准确 率、损失率曲线图. 可以看到,在训练集上,15 轮 次左右训练后,准确率及损失率均有效收敛. 在测 试集上,由于数据特征更为集中,呈现了更快速的 收敛性. 90 80 70 60 50 40 30 0 40 20 60 Epoch [Epoch: 88,90.23] (a) Accuracy/% 80 100 20 2.00 1.75 1.50 1.25 1.00 0.75 0.50 0.25 0 40 20 60 Epoch [Epoch: 93,0.172] (b) Loss 80 100 90 80 70 60 50 40 0 40 20 60 Epoch [Epoch: 53,92.857] (c) Accuracy/% 80 100 1.6 1.4 1.2 1.0 0.6 0.8 0.4 0.2 0 20 60 40 Epoch [Epoch: 23,0.18063] (d) Loss 80 100 图 8    算法训练/测试准确率及损失率曲线. (a)训练集准确率曲线图;(b)训练集损失率曲线图;(c)测试集准确率曲线图;(d)测试集损失率曲线图 Fig.8    Algorithm training/test accuracy and loss rate curve: (a) training set accuracy curve; (b) training set loss curve; (c) test set accuracy curve; (d) test set loss curve · 386 · 工程科学学报,第 42 卷,第 3 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有