φ(x) z x 上进行卷积，相似度大的地方，卷积响应值就大，对应的就是

正在加载图片...

·1088· 智能系统学报第14卷 (x)上进行卷积，相似度大的地方，卷积响应值就根据猛禽的双凹-眼动特性，设计一种局部大，对应的就是目标z在x中的位置。全局的搜索策略，用于长时目标跟踪。图像通过 2.2.3非线性激活层模拟交叉通路的神经网络得到卷积响应图后，对神经网络中的非线性激活函数主要是为了给图像中响应区域求取均值，得到图中个备选目神经网络加入一些非线性因素，使得神经网络可标区域。使用非极大值抑制(non-maximum sup- 以更好地解决较为复杂的非线性问题。ReLU pression,NMS)方法，选出当前图像中响应值最函数实际上是一个分段的线性函数，小于零的输大的目标，即s,然后选出图像中k个非极大响应入都会得到零输出，而正值则保持不变，类似于区域r进行重新排序，得到最终选择的目标备选单侧抑制。而ReLU的非线性正是通过这种类序列q有：似单侧抑制的方法，增加了神经网络参数的稀疏 af(p,Tk）性。由于ReLU在正数区间为常数形式，在负数 q arg max f(s,r)- (5) 区间为零，所以不存在由于梯度过小而发生梯度 nER 消失的情况.函数形式如下： Relu(x)= x,x>0 式中：f)表示计算两个响应区域之间的相似性，】0.x≤0 (4) 也即响应大小的差异；R为选择的，个非极大值式中x为神经元的输出。ReLU非线性激活函数响应区域的集合；à为控制全部非极大响应区域相较于需要计算指数的Sigmoid函数来说，实质对下一帧图像影响的总权重系数；：为控制单个是一个比较函数，计算量很小，针对神经网络中非极大响应区域对下一帧图像影响的权重系数。庞大的神经元计算量来说，大大提高了效率，同从式(5)可以看出，这一步骤的意义在于当前响时也避免了梯度消失问题。应区域和极大响应区域之间计算相似度后，减去 2.3双凹扩大搜索策略的目标跟踪当前区域与全部备选响应区域相似度的加权和。在目标跟踪过程中，一个重要的难点就是当也即，猛禽在利用双凹大视场确定视觉注意区域目标遇到遮挡或飞出图像后，如何在其再次出现后，通过快速眼动逐一对比排除非最佳目标的注或重新进入图像时继续进行跟踪。很多目标跟踪意区域，并对部分区域进行记忆，用于后续排除算法为了节省计算时间，提高跟踪帧率，在跟踪目标。由于每次计算的时间复杂度和空间复杂度过程中不对跟踪器做在线修改，但是这样就无法较高，为了降低时间和空间复杂度，根据式(3)可应对跟踪场景与目标发生剧烈变化的情况。此将式(5)写为外，还有一部分跟踪算法在目标丢失时使用局部 Pi 搜索策略，只在最后识别到目标的图像位置附近 q arg max (r) (6) 做搜索，无法应对长时跟踪时难以避免的目标完 nER 全遮挡和离开图像的问题。 O'Rourke对于红尾鹰、库氏鹰和美洲隼这以学习率B,对目标模板和干扰项进行增量学 3种日行性猛禽的感受野结构的研究结果显示，习，如式(7)：这些不同物种的日行性猛禽的感受野结构上的差 (s,) Ba an(p.) 异与捕食采用的搜索策略以及在环境中的视觉障 =1 i=1 gr+1 arg max or) 碍角度（例如栖息地的开放程度）相关，而不同物几E员种间的眼动角度差异则与觅食策略相关。此外， 22 猛禽双目区域和视觉盲区的大小会由于眼动产生 (7) 巨大差异，物种间的视觉区域和眼动则会影响栖式(7)通过将现有的相似性矩阵转移到另一息过程中的搜索和猎物追踪策略。在视场角有个特定的域内降低计算量，加快了算法的运行速度。限的情况下，尽量利用双凹的视觉敏锐度可变特当目标由于遮挡等原因在原位置消失，或脱性，结合眼动与头动调整最高视觉敏锐度的视野离图像范围再次进入时，用深凹一浅凹的视觉焦位置，实现对于目标的搜索”。这种搜索策略不点转移方式，扩大聚焦范围，重新在浅凹对准的仅适用于目标不确定情况下的目标分辨，也同样更大范围内搜索确定目标，也就是目标跟踪过程适用于目标遮挡或从场景中消失再入的重新搜索中的再入搜索。在本跟踪方法中，对响应区域的情况。得分设定门限值，当图像极大响应区域的得分均φ(x) z x 上进行卷积，相似度大的地方，卷积响应值就大，对应的就是目标在中的位置。 2.2.3 非线性激活层神经网络中的非线性激活函数主要是为了给神经网络加入一些非线性因素，使得神经网络可以更好地解决较为复杂的非线性问题。ReLU 函数实际上是一个分段的线性函数，小于零的输入都会得到零输出，而正值则保持不变，类似于单侧抑制[9]。而 ReLU 的非线性正是通过这种类似单侧抑制的方法，增加了神经网络参数的稀疏性。由于 ReLU 在正数区间为常数形式，在负数区间为零，所以不存在由于梯度过小而发生梯度消失的情况，函数形式如下： Relu(x) = { x, x > 0 0, x ⩽ 0 (4) 式中 x 为神经元的输出。ReLU 非线性激活函数相较于需要计算指数的 Sigmoid 函数来说，实质是一个比较函数，计算量很小，针对神经网络中庞大的神经元计算量来说，大大提高了效率，同时也避免了梯度消失问题。 2.3 双凹扩大搜索策略的目标跟踪在目标跟踪过程中，一个重要的难点就是当目标遇到遮挡或飞出图像后，如何在其再次出现或重新进入图像时继续进行跟踪。很多目标跟踪算法为了节省计算时间，提高跟踪帧率，在跟踪过程中不对跟踪器做在线修改，但是这样就无法应对跟踪场景与目标发生剧烈变化的情况。此外，还有一部分跟踪算法在目标丢失时使用局部搜索策略，只在最后识别到目标的图像位置附近做搜索，无法应对长时跟踪时难以避免的目标完全遮挡和离开图像的问题。 O’Rourke 对于红尾鹰、库氏鹰和美洲隼这 3 种日行性猛禽的感受野结构的研究结果显示，这些不同物种的日行性猛禽的感受野结构上的差异与捕食采用的搜索策略以及在环境中的视觉障碍角度 (例如栖息地的开放程度) 相关，而不同物种间的眼动角度差异则与觅食策略相关。此外，猛禽双目区域和视觉盲区的大小会由于眼动产生巨大差异，物种间的视觉区域和眼动则会影响栖息过程中的搜索和猎物追踪策略[10]。在视场角有限的情况下，尽量利用双凹的视觉敏锐度可变特性，结合眼动与头动调整最高视觉敏锐度的视野位置，实现对于目标的搜索[11]。这种搜索策略不仅适用于目标不确定情况下的目标分辨，也同样适用于目标遮挡或从场景中消失再入的重新搜索情况。 n st k r q 根据猛禽的双凹−眼动特性，设计一种局部− 全局的搜索策略，用于长时目标跟踪。图像通过模拟交叉通路的神经网络得到卷积响应图后，对图像中响应区域求取均值，得到图中个备选目标区域。使用非极大值抑制 (non-maximum suppression，NMS)[12] 方法，选出当前图像中响应值最大的目标，即，然后选出图像中个非极大响应区域进行重新排序，得到最终选择的目标备选序列有： q = argmax rk∈R   f(s,rk)− αˆ ∑n i=1 αi f(pi ,rk) ∑n i=1 αi   (5) f(·) R r αˆ αi 式中：表示计算两个响应区域之间的相似性，也即响应大小的差异；为选择的个非极大值响应区域的集合；为控制全部非极大响应区域对下一帧图像影响的总权重系数；为控制单个非极大响应区域对下一帧图像影响的权重系数。从式 (5) 可以看出，这一步骤的意义在于当前响应区域和极大响应区域之间计算相似度后，减去当前区域与全部备选响应区域相似度的加权和。也即，猛禽在利用双凹大视场确定视觉注意区域后，通过快速眼动逐一对比排除非最佳目标的注意区域，并对部分区域进行记忆，用于后续排除目标。由于每次计算的时间复杂度和空间复杂度较高，为了降低时间和空间复杂度，根据式 (3) 可将式 (5) 写为 q = argmax rk∈R   φ(s)− αˆ ∑n i=1 αiφ(pi) ∑n i=1 αi   ∗φ(rk) (6) 以学习率 βt 对目标模板和干扰项进行增量学习，如式 (7)： qT+1 = argmax rk∈R   ∑T t=1 βtφ(st) ∑T t=1 βt − ∑T t=1 βtαˆ ∑n i=1 αiφ(pi ,t) ∑T t=1 βt ∑n i=1 αi   ∗φ(rk) (7) 式 (7) 通过将现有的相似性矩阵转移到另一个特定的域内降低计算量，加快了算法的运行速度。当目标由于遮挡等原因在原位置消失，或脱离图像范围再次进入时，用深凹−浅凹的视觉焦点转移方式，扩大聚焦范围，重新在浅凹对准的更大范围内搜索确定目标，也就是目标跟踪过程中的再入搜索。在本跟踪方法中，对响应区域的得分设定门限值，当图像极大响应区域的得分均 ·1088· 智能系统学报第 14 卷

<<向上翻页向下翻页>>

点击下载：【知识工程】仿猛禽视顶盖信息中转整合的加油目标跟踪