正在加载图片...
第3期 楼传炜,等:无人机群目标搜索的主动感知方法 ·579· 1.0 -文献20] 1.0 0.8 -UPEP 0.8 三0.6 0.4 0.4 03 0.2 0 3 4 56 0 0.20.40.60.81.01.2 栅格访问值 图6SP和UPEP特性曲线对比 图8Pb曲线 Fig.6 Comparison of SP and UPEP characteristic curves Fig.8 Pob curve 由图6可见,UPEP随栅格访问值的升高而升 高,栅格访问值越高,未搜索概率越大,无人机对 5环境信息的更替 此栅格就越有兴趣探索;文献[20]的刺激概率 无人机根据历史环境信息选择了运动方式并 SP曲线中在栅格访问值为2、3、4和5时,其刺激 更新了状态后,需要对其所在栅格以及路径进行 概率均小于栅格访问值等于1时的刺激概率,在 信息更新,形成新的环境信息,因此环境信息分 [1,5]区间内,刺激概率并不具有单调递增性。 目标出现概率Pb和吸引无人机的信息素τ。P 4无人机运动方式选择机制 表示在一定的搜索后,相应栅格中目标出现的概 率,并用热力图的形式将其可视化;无人机上一时 无人机选择运动方式时不能仅对未搜索区域 刻的路径信息由τ表示,由于对信息素的依赖性, 感兴趣,在搜索过的区域中极有可能有与目标相 τ值的高低会直接影响无人机运动方式的选择。 关的历史环境信息,本文基于蚁群算法的状态转 以上2种环境信息皆由当前时刻的无人机目 移概率,将上节的UPEP与信息素相结合,得到各 标捕获状态c决定,信息增量表达式为 运动方式的评价指标P,计算公式为 4g=-30a,c=1 Pu(0=- [i(t)]upij p,c≠1 (1) ∑[rarp. (2) seallowed c-lo dsr 式中:i表示无人机序号;j为无人机所在栅格序 式中:P为信息素挥发因子,作为无人机状态衰减 号;allowed为第i架无人机的第j种运动方式; 值;d表示无人机与目标的欧氏距离;r为无人机 s为这些运动方式的序号;a为信息素重要因子; 感知域半径。由式(2)可见,当d心r时,c=0,即无 1为时间。式(1)会根据未搜索概率对信息素进行 人机捕获目标失败,△σ设定为衰减值,反之,设 衰减,概率越小,衰减越多,计算所得的状态转移 定为增长值,且增长值与衰减值之比为30:1。 概率即为无人机各运动方式选择概率。 5.1目标发现概率 无人机在选择运动方式时只看概率高低会导 某一栅格中目标出现概率为对应概率密度函 致搜索的局部最优,丧失广泛性,因此本文采用 数的双重定积分,即 累积和函数cumsum(~),形成幸运轮盘,图7为轮 盘展开示意图。 y.ndids 根据1.3节的目标描述,在栅格边长不变的 0.52 条件下,目标概率密度函数的自变量只有σ,由 图8可知σ与Pb呈反比趋势。 20% 8% 32% 18% 22% 因此,可以通过改变σ的方式达到调节P的 运动1 运动2 运动3 运动4 运动5 目的。σ的更新方式为 图7轮盘展开示意图 c(t)=c(t-1)+0.05△g Fig.7 Diagram of the roulette's expansion 5.2信息素更新方式 由图8可见,各运动方式根据式(1)计算所得 蚁群算法的信息素用于储存路径信息,并非 概率越高,在此轮盘中所占面积越大;采用随机 存储在栅格中,因此σ无法与信息素对应。无向 函数rand()作为指针并认为此函数产生的伪随 图的邻接矩阵除了建立栅格联系,还可以将矩阵 机数足够接近真正的随机数。如产生的随机数 内的数值细化表征所建联系的强弱,本文以此来 为0.52,则无人机选中第3种运动方式。 进行信息素的更新。1.0 0.8 0.6 0.4 0.2 0 1 2 3 4 5 7 6 栅格访问值 函数值 文献[20] UPEP 图 6 SP 和 UPEP 特性曲线对比 Fig. 6 Comparison of SP and UPEP characteristic curves 由图 6 可见,UPEP 随栅格访问值的升高而升 高,栅格访问值越高,未搜索概率越大,无人机对 此栅格就越有兴趣探索;文献 [20] 的刺激概率 SP 曲线中在栅格访问值为 2、3、4 和 5 时,其刺激 概率均小于栅格访问值等于 1 时的刺激概率,在 [1,5] 区间内,刺激概率并不具有单调递增性。 4 无人机运动方式选择机制 无人机选择运动方式时不能仅对未搜索区域 感兴趣,在搜索过的区域中极有可能有与目标相 关的历史环境信息,本文基于蚁群算法的状态转 移概率,将上节的 UPEP 与信息素相结合,得到各 运动方式的评价指标 P,计算公式为 Pi j(t) = [ τi j(t) ]α ∑ · upi j s∈allowedj [τis (t)] α · upis (1) 式中:i 表示无人机序号;j 为无人机所在栅格序 号;allowedj 为第 i 架无人机的第 j 种运动方式; s 为这些运动方式的序号;α 为信息素重要因子; t 为时间。式 (1) 会根据未搜索概率对信息素进行 衰减,概率越小,衰减越多,计算所得的状态转移 概率即为无人机各运动方式选择概率。 无人机在选择运动方式时只看概率高低会导 致搜索的局部最优,丧失广泛性,因此本文采用 累积和函数 cumsum(·),形成幸运轮盘,图 7 为轮 盘展开示意图。 0.52 20% 8% 32% 18% 22% 运动 1 运动 2 运动 3 运动 4 运动 5 图 7 轮盘展开示意图 Fig. 7 Diagram of the roulette’s expansion 由图 8 可见,各运动方式根据式 (1) 计算所得 概率越高,在此轮盘中所占面积越大;采用随机 函数 rand(·) 作为指针并认为此函数产生的伪随 机数足够接近真正的随机数。如产生的随机数 为 0.52,则无人机选中第 3 种运动方式。 1.0 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1.2 1.0 σ Pob/% 图 8 Pob 曲线 Fig. 8 Pob curve 5 环境信息的更替 无人机根据历史环境信息选择了运动方式并 更新了状态后,需要对其所在栅格以及路径进行 信息更新,形成新的环境信息,因此环境信息分 目标出现概率 Pob 和吸引无人机的信息素 τ。Pob 表示在一定的搜索后,相应栅格中目标出现的概 率,并用热力图的形式将其可视化;无人机上一时 刻的路径信息由 τ 表示,由于对信息素的依赖性, τ 值的高低会直接影响无人机运动方式的选择。 以上 2 种环境信息皆由当前时刻的无人机目 标捕获状态 c 决定,信息增量表达式为 ∆σ = { −30ρ, c = 1 ρ, c , 1 c = { 1, d ⩽ r 0, d > r (2) ∆σ 式中:ρ 为信息素挥发因子,作为无人机状态衰减 值;d 表示无人机与目标的欧氏距离;r 为无人机 感知域半径。由式 (2) 可见,当 d>r 时,c=0,即无 人机捕获目标失败, 设定为衰减值,反之,设 定为增长值,且增长值与衰减值之比为 30∶1。 5.1 目标发现概率 某一栅格中目标出现概率为对应概率密度函 数的双重定积分,即 Pob = w 0.5a −0.5a w 0.5a −0.5a f (x, y,σ)dxdy 根据 1.3 节的目标描述,在栅格边长不变的 条件下,目标概率密度函数的自变量只有 σ,由 图 8 可知 σ 与 Pob 呈反比趋势。 因此,可以通过改变 σ 的方式达到调节 Pob 的 目的。σ 的更新方式为 σ(t) = σ(t−1)+0.05∆σ 5.2 信息素更新方式 蚁群算法的信息素用于储存路径信息,并非 存储在栅格中,因此 σ 无法与信息素对应。无向 图的邻接矩阵除了建立栅格联系,还可以将矩阵 内的数值细化表征所建联系的强弱,本文以此来 进行信息素的更新。 第 3 期 楼传炜,等:无人机群目标搜索的主动感知方法 ·579·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有