正在加载图片...
·1088· 智能系统学报 第14卷 (x)上进行卷积,相似度大的地方,卷积响应值就 根据猛禽的双凹-眼动特性,设计一种局部 大,对应的就是目标z在x中的位置。 全局的搜索策略,用于长时目标跟踪。图像通过 2.2.3非线性激活层 模拟交叉通路的神经网络得到卷积响应图后,对 神经网络中的非线性激活函数主要是为了给 图像中响应区域求取均值,得到图中个备选目 神经网络加入一些非线性因素,使得神经网络可 标区域。使用非极大值抑制(non-maximum sup- 以更好地解决较为复杂的非线性问题。ReLU pression,NMS)方法,选出当前图像中响应值最 函数实际上是一个分段的线性函数,小于零的输 大的目标,即s,然后选出图像中k个非极大响应 入都会得到零输出,而正值则保持不变,类似于 区域r进行重新排序,得到最终选择的目标备选 单侧抑制。而ReLU的非线性正是通过这种类 序列q有: 似单侧抑制的方法,增加了神经网络参数的稀疏 af(p,Tk) 性。由于ReLU在正数区间为常数形式,在负数 q arg max f(s,r)- (5) 区间为零,所以不存在由于梯度过小而发生梯度 nER 消失的情况.函数形式如下: Relu(x)= x,x>0 式中:f)表示计算两个响应区域之间的相似性, 】0.x≤0 (4) 也即响应大小的差异;R为选择的,个非极大值 式中x为神经元的输出。ReLU非线性激活函数 响应区域的集合;à为控制全部非极大响应区域 相较于需要计算指数的Sigmoid函数来说,实质 对下一帧图像影响的总权重系数;:为控制单个 是一个比较函数,计算量很小,针对神经网络中 非极大响应区域对下一帧图像影响的权重系数。 庞大的神经元计算量来说,大大提高了效率,同 从式(5)可以看出,这一步骤的意义在于当前响 时也避免了梯度消失问题。 应区域和极大响应区域之间计算相似度后,减去 2.3双凹扩大搜索策略的目标跟踪 当前区域与全部备选响应区域相似度的加权和。 在目标跟踪过程中,一个重要的难点就是当 也即,猛禽在利用双凹大视场确定视觉注意区域 目标遇到遮挡或飞出图像后,如何在其再次出现 后,通过快速眼动逐一对比排除非最佳目标的注 或重新进入图像时继续进行跟踪。很多目标跟踪 意区域,并对部分区域进行记忆,用于后续排除 算法为了节省计算时间,提高跟踪帧率,在跟踪 目标。由于每次计算的时间复杂度和空间复杂度 过程中不对跟踪器做在线修改,但是这样就无法 较高,为了降低时间和空间复杂度,根据式(3)可 应对跟踪场景与目标发生剧烈变化的情况。此 将式(5)写为 外,还有一部分跟踪算法在目标丢失时使用局部 Pi 搜索策略,只在最后识别到目标的图像位置附近 q arg max (r) (6) 做搜索,无法应对长时跟踪时难以避免的目标完 nER 全遮挡和离开图像的问题。 O'Rourke对于红尾鹰、库氏鹰和美洲隼这 以学习率B,对目标模板和干扰项进行增量学 3种日行性猛禽的感受野结构的研究结果显示, 习,如式(7): 这些不同物种的日行性猛禽的感受野结构上的差 (s,) Ba an(p.) 异与捕食采用的搜索策略以及在环境中的视觉障 =1 i=1 gr+1 arg max or) 碍角度(例如栖息地的开放程度)相关,而不同物 几E员 种间的眼动角度差异则与觅食策略相关。此外, 22 猛禽双目区域和视觉盲区的大小会由于眼动产生 (7) 巨大差异,物种间的视觉区域和眼动则会影响栖 式(7)通过将现有的相似性矩阵转移到另一 息过程中的搜索和猎物追踪策略。在视场角有 个特定的域内降低计算量,加快了算法的运行速度。 限的情况下,尽量利用双凹的视觉敏锐度可变特 当目标由于遮挡等原因在原位置消失,或脱 性,结合眼动与头动调整最高视觉敏锐度的视野 离图像范围再次进入时,用深凹一浅凹的视觉焦 位置,实现对于目标的搜索”。这种搜索策略不 点转移方式,扩大聚焦范围,重新在浅凹对准的 仅适用于目标不确定情况下的目标分辨,也同样 更大范围内搜索确定目标,也就是目标跟踪过程 适用于目标遮挡或从场景中消失再入的重新搜索 中的再入搜索。在本跟踪方法中,对响应区域的 情况。 得分设定门限值,当图像极大响应区域的得分均φ(x) z x 上进行卷积,相似度大的地方,卷积响应值就 大,对应的就是目标 在 中的位置。 2.2.3 非线性激活层 神经网络中的非线性激活函数主要是为了给 神经网络加入一些非线性因素,使得神经网络可 以更好地解决较为复杂的非线性问题。ReLU 函数实际上是一个分段的线性函数,小于零的输 入都会得到零输出,而正值则保持不变,类似于 单侧抑制[9]。而 ReLU 的非线性正是通过这种类 似单侧抑制的方法,增加了神经网络参数的稀疏 性。由于 ReLU 在正数区间为常数形式,在负数 区间为零,所以不存在由于梯度过小而发生梯度 消失的情况,函数形式如下: Relu(x) = { x, x > 0 0, x ⩽ 0 (4) 式中 x 为神经元的输出。ReLU 非线性激活函数 相较于需要计算指数的 Sigmoid 函数来说,实质 是一个比较函数,计算量很小,针对神经网络中 庞大的神经元计算量来说,大大提高了效率,同 时也避免了梯度消失问题。 2.3 双凹扩大搜索策略的目标跟踪 在目标跟踪过程中,一个重要的难点就是当 目标遇到遮挡或飞出图像后,如何在其再次出现 或重新进入图像时继续进行跟踪。很多目标跟踪 算法为了节省计算时间,提高跟踪帧率,在跟踪 过程中不对跟踪器做在线修改,但是这样就无法 应对跟踪场景与目标发生剧烈变化的情况。此 外,还有一部分跟踪算法在目标丢失时使用局部 搜索策略,只在最后识别到目标的图像位置附近 做搜索,无法应对长时跟踪时难以避免的目标完 全遮挡和离开图像的问题。 O’Rourke 对于红尾鹰、库氏鹰和美洲隼这 3 种日行性猛禽的感受野结构的研究结果显示, 这些不同物种的日行性猛禽的感受野结构上的差 异与捕食采用的搜索策略以及在环境中的视觉障 碍角度 (例如栖息地的开放程度) 相关,而不同物 种间的眼动角度差异则与觅食策略相关。此外, 猛禽双目区域和视觉盲区的大小会由于眼动产生 巨大差异,物种间的视觉区域和眼动则会影响栖 息过程中的搜索和猎物追踪策略[10]。在视场角有 限的情况下,尽量利用双凹的视觉敏锐度可变特 性,结合眼动与头动调整最高视觉敏锐度的视野 位置,实现对于目标的搜索[11]。这种搜索策略不 仅适用于目标不确定情况下的目标分辨,也同样 适用于目标遮挡或从场景中消失再入的重新搜索 情况。 n st k r q 根据猛禽的双凹−眼动特性,设计一种局部− 全局的搜索策略,用于长时目标跟踪。图像通过 模拟交叉通路的神经网络得到卷积响应图后,对 图像中响应区域求取均值,得到图中 个备选目 标区域。使用非极大值抑制 (non-maximum sup￾pression,NMS)[12] 方法,选出当前图像中响应值最 大的目标,即 ,然后选出图像中 个非极大响应 区域 进行重新排序,得到最终选择的目标备选 序列 有: q = argmax rk∈R   f(s,rk)− αˆ ∑n i=1 αi f(pi ,rk) ∑n i=1 αi   (5) f(·) R r αˆ αi 式中: 表示计算两个响应区域之间的相似性, 也即响应大小的差异; 为选择的 个非极大值 响应区域的集合; 为控制全部非极大响应区域 对下一帧图像影响的总权重系数; 为控制单个 非极大响应区域对下一帧图像影响的权重系数。 从式 (5) 可以看出,这一步骤的意义在于当前响 应区域和极大响应区域之间计算相似度后,减去 当前区域与全部备选响应区域相似度的加权和。 也即,猛禽在利用双凹大视场确定视觉注意区域 后,通过快速眼动逐一对比排除非最佳目标的注 意区域,并对部分区域进行记忆,用于后续排除 目标。由于每次计算的时间复杂度和空间复杂度 较高,为了降低时间和空间复杂度,根据式 (3) 可 将式 (5) 写为 q = argmax rk∈R   φ(s)− αˆ ∑n i=1 αiφ(pi) ∑n i=1 αi   ∗φ(rk) (6) 以学习率 βt 对目标模板和干扰项进行增量学 习,如式 (7): qT+1 = argmax rk∈R   ∑T t=1 βtφ(st) ∑T t=1 βt − ∑T t=1 βtαˆ ∑n i=1 αiφ(pi ,t) ∑T t=1 βt ∑n i=1 αi   ∗φ(rk) (7) 式 (7) 通过将现有的相似性矩阵转移到另一 个特定的域内降低计算量,加快了算法的运行速度。 当目标由于遮挡等原因在原位置消失,或脱 离图像范围再次进入时,用深凹−浅凹的视觉焦 点转移方式,扩大聚焦范围,重新在浅凹对准的 更大范围内搜索确定目标,也就是目标跟踪过程 中的再入搜索。在本跟踪方法中,对响应区域的 得分设定门限值,当图像极大响应区域的得分均 ·1088· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有