第17卷第2期 智能系统学报 Vol.17 No.2 2022年3月 CAAI Transactions on Intelligent Systems Mar.2022 D0:10.11992/tis.202012037 网络出版地址:https:/ns.cnki.net/kcms/detail/23.1538.TP.20211014.1330.002.html 非对称博弈下多UUV基地防卫协同对抗策略 王宏健,于丹,徐欣2,张宏翰,陈涛 (1.哈尔滨工程大学智能科学与工程学院,黑龙江哈尔滨150001,2.浙江大华技术股份有限公司,浙江杭州 310053) 摘要:针对非对称博弈下的水下无人对抗问题,开展对基于基地防卫的多无人水下潜航器(unmanned under-. water vehicles,.UUVs)协同对抗策略研究。在双方能力和数量有差异的非对称博弈情况下,设计UUV基本行 为,分别基于红、蓝方能力设计对抗策略选择方法;本文提出红方多UUV分层决策算法,并设计红方多 UUV角色分配方法:在防卫任务中基于目标偏航角设计两种红方多UUV联合防卫方法:并相应给出设计蓝方 UUV策略及决策方法。最后设计水下对抗仿真实验,从对抗过程的事件决策、UUV机动控制等方面验证了本 文设计的对抗方法对水下非对称条件下的多UUV对抗问题具有有效性。 关键词:非对称博弈;基地防卫;无人水下潜航器:攻防对抗;多UUV协同;分层决策:角色分配:策略 中图分类号:TP391文献标志码:A文章编号:1673-4785(2022)02-0348-12 中文引用格式:王宏健,于丹,徐欣,等.非对称博弈下多UUV基地防卫协同对抗策略J.智能系统学报,2022,17(2): 348-359. 英文引用格式:WANG Hongjian,YU Dan,,XU Xin,etal.MIulti-UUV base defense cooperative countermeasure under the asymmet- ric game condition J].CAAI transactions on intelligent systems,2022,17(2):348-359. Multi-UUV base defense cooperative countermeasure under the asymmetric game condition WANG Hongjian',YU Dan',XU Xin',ZHANG Honghan',CHEN Tao' (1.Department of Intelligent Science and Engineering,Harbin Engineering University,Harbin 150001,China;2.Zhejiang Dahua Technology Co.,Ltd.,Hangzhou 310053,China) Abstract:Aiming at the problem of unmanned underwater warfare under the asymmetric game condition,in this paper, we examine the cooperative countermeasure of multiple unmanned underwater vehicles (UUVs)based on base defense. In an asymmetric game with differences in ability and quantity between the red and blue sides,the basic behaviors of UUVs and the selection methods of the countermeasures of both sides are designed.This paper proposes a hierarchical decision-making algorithm for the red side and designs a role assignment method of its UUVs.In a defense task,two kinds of red-side multi-UUV joint defense methods are designed based on the target yaw angle;the strategy and the de- cision-making method of UUVs of the blue side are given correspondingly.Finally,the simulation experiment of under- water confrontation is designed,and the effectiveness of the proposed method with respect to multi-UUV confrontation under an underwater asymmetric game condition is verified from the aspects of event decision-making and UUV man- euver control in a confrontation. Keywords:asymmetric game;base defense;unmanned underwater vehicle;attack-defense confrontation; multi-UUV coordination;hierarchical decision-making;role assignment;strategy 无人水下航行器(unmanned underwater vehicles,UUV)是小体量、强自主性、高隐蔽性的 水下机器人之一。现阶段正在研究的UUV网可集 收稿日期:2020-12-22.网络出版日期:2021-10-15. 基金项目:国家自然科学基金重点项目(61633008). 成具有打击能力的任务载荷,不仅能够执行探测 通信作者:王宏健.E-mail:cctime99@l63.com 任务,还可以执行攻击任务。在探测信息共享
DOI: 10.11992/tis.202012037 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20211014.1330.002.html 非对称博弈下多 UUV 基地防卫协同对抗策略 王宏健1 ,于丹1 ,徐欣2 ,张宏翰1 ,陈涛1 (1. 哈尔滨工程大学 智能科学与工程学院,黑龙江 哈尔滨 150001; 2. 浙江大华技术股份有限公司,浙江 杭州 310053) 摘 要:针对非对称博弈下的水下无人对抗问题,开展对基于基地防卫的多无人水下潜航器 (unmanned underwater vehicles, UUVs) 协同对抗策略研究。在双方能力和数量有差异的非对称博弈情况下,设计 UUV 基本行 为,分别基于红、蓝方能力设计对抗策略选择方法;本文提出红方多 UUV 分层决策算法,并设计红方多 UUV 角色分配方法;在防卫任务中基于目标偏航角设计两种红方多 UUV 联合防卫方法;并相应给出设计蓝方 UUV 策略及决策方法。最后设计水下对抗仿真实验,从对抗过程的事件决策、UUV 机动控制等方面验证了本 文设计的对抗方法对水下非对称条件下的多 UUV 对抗问题具有有效性。 关键词:非对称博弈;基地防卫;无人水下潜航器;攻防对抗;多 UUV 协同;分层决策;角色分配;策略 中图分类号:TP391 文献标志码:A 文章编号:1673−4785(2022)02−0348−12 中文引用格式:王宏健, 于丹, 徐欣, 等. 非对称博弈下多 UUV 基地防卫协同对抗策略 [J]. 智能系统学报, 2022, 17(2): 348–359. 英文引用格式:WANG Hongjian, YU Dan, XU Xin, et al. Multi-UUV base defense cooperative countermeasure under the asymmetric game condition[J]. CAAI transactions on intelligent systems, 2022, 17(2): 348–359. Multi-UUV base defense cooperative countermeasure under the asymmetric game condition WANG Hongjian1 ,YU Dan1 ,XU Xin2 ,ZHANG Honghan1 ,CHEN Tao1 (1. Department of Intelligent Science and Engineering, Harbin Engineering University, Harbin 150001, China; 2. Zhejiang Dahua Technology Co., Ltd., Hangzhou 310053, China) Abstract: Aiming at the problem of unmanned underwater warfare under the asymmetric game condition, in this paper, we examine the cooperative countermeasure of multiple unmanned underwater vehicles (UUVs) based on base defense. In an asymmetric game with differences in ability and quantity between the red and blue sides, the basic behaviors of UUVs and the selection methods of the countermeasures of both sides are designed. This paper proposes a hierarchical decision-making algorithm for the red side and designs a role assignment method of its UUVs. In a defense task, two kinds of red-side multi-UUV joint defense methods are designed based on the target yaw angle; the strategy and the decision-making method of UUVs of the blue side are given correspondingly. Finally, the simulation experiment of underwater confrontation is designed, and the effectiveness of the proposed method with respect to multi-UUV confrontation under an underwater asymmetric game condition is verified from the aspects of event decision-making and UUV maneuver control in a confrontation. Keywords: asymmetric game; base defense; unmanned underwater vehicle; attack–defense confrontation; multi-UUV coordination; hierarchical decision-making; role assignment; strategy 无人水下航行器[ 1 ] (unmanned underwater vehicles, UUV)是小体量、强自主性、高隐蔽性的 水下机器人之一。现阶段正在研究的 UUV[2] 可集 成具有打击能力的任务载荷,不仅能够执行探测 任务,还可以执行攻击任务。在探测信息共享[3-5] 收稿日期:2020−12−22. 网络出版日期:2021−10−15. 基金项目:国家自然科学基金重点项目(61633008). 通信作者:王宏健. E-mail:cctime99@163.com. 第 17 卷第 2 期 智 能 系 统 学 报 Vol.17 No.2 2022 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2022
第2期 王宏健,等:非对称博弈下多UUV基地防卫协同对抗策略 ·349· 的前提下,在一定范围内通过水声通信能够实现 由于水下对抗环境复杂、通信受限、探测能 多UUV的水下协同对抗,可以克服单UUV的能 力受限,关于水下对抗的研究现阶段还较少。文 力局限,提高完成对抗任务效能向。近期无人机 献[27刀主要研究水下对抗过程中的传感器探测组 在美军中的不断使用也表明:无人平台在军事领 网问题,比较了不同度量条件下的探测性能。文 域内的应用以及利用无人平台配合完成作战任务 献[6]验证粒子群优化对水下多AUV协同对抗的 将成为未来对抗形态的发展趋势。美国捕食者 动态博弈模型求解的有效性。文献[28]研究多 无人机是一种最为典型的察打一体无人机,可 UUV对抗过程,并给出对抗过程中态势评估及策 长时间对重要地面目标和低速低空目标进行侦察、 略选择方案。随着无人系统的不断发展,水下对 识别和监视。LDUUV项目9是美国于2011年开 抗问题正引起国内外诸多学者的广泛关注。 始研制测试的一款可搭载具有打击能力的任务载 从上述研究中可以看出,在诸多已有的研究 荷的大直径重型无人潜航器。 中,对抗问题主要存在以下问题:1)单个UUV策 关于多UUV对抗的研究现阶段较少,开放的 略选择研究多,多UUV协同决策研究少,单方面 文献不多,关于对抗的研究主要集中于多UUV围 策略优化选择研究多,双方策略对抗博弈研究 捕问题。在追逃问题研究中文献[10]在“图清理” 少:2)研究对抗双方无能力差异的情况多,研究 方法的基础上,应用精英遗传算法于围捕问题 “多对一”、“弱对强”的少。本文从无人对抗的角 中。文献[1]提出了一种分散的围捕策略,可以 度考虑水下多UUV对抗存在的通信、自主决策 在有限时间内捕获入侵智能体。文献[12]基于 等问题,设计多UUV对抗过程。针对对抗中的 apolonius圆提出了动态围捕入侵智能体的方法。 策略选择与角色分配问题,以多UUV基地防卫 文献[13]利用生物激励神经网络解决多机器人围 作为对抗任务背景,提出一种基于角色分配的多 捕问题,通过计算并选择相邻细胞神经网络的最 UUV协同对抗策略选择方法,完成多对一攻防对 大活动值,得到参与围捕的机器人的围捕路径, 抗任务仿真。 实现有效围捕。文献[14]设计了对足球机器人团 队角色和任务进行分工的模糊推理系统,主要研究 1基地防卫任务想定与研究约束条件 足球机器人角色和行为切换机制。文献[15]提出 基地防卫任务想定:如图1所示,红色小旗为 一种基于狮群算法多AUV围捕方法,实现在围捕 红方被保护区域,蓝方UUV(图中以黄色UUV示 中最佳围捕者的选择和围捕任务中的角色分配。 意)在本次攻防任务中为攻击方,其任务为破坏 无人系统协同对抗要求“参与者”协调行动, 红方基地,当蓝方UUV成功对红方被保护基地 以获得最大利益为核心目标,根据环境信息、敌 造成破坏,认定红方本次攻防任务失败。红方多 方信息以及我方对抗态势不断选择策略。现阶 UUV通过攻击、防守、围捕等手段保护基地不被 段对于无人系统协同对抗的研究对象多为机器 摧毁,则认定红方本次攻防任务成功。 人、无人机和地面无人车,主要研究集中于对 抗中的任务分配、作战方式、干扰手段。自然进 化计算、社会进化计算、生物智能计算2四、群 集智能计算2]等智能算法也被大量运用于武器 分配、协同搜索、追逃围捕等问题的研究中来。 文献[22]应用空间链路调度算法研究多机器人任 蓝方UUV 务协调分配问题。文献23]提出近似规划方法研 双工通信 究一对一空战,解决无人机空战对抗飞行控制问 红方协同UUV 题。文献[24]讨论无人机对地空战问题,不仅给 红方基地 水下监听阵列 单工通信。 出协同策略,还考虑了武器、无人机数量以及地 图1对抗情形 面防御系统设置等问题。文献[25]研究多无人机 Fig.1 Confrontation situation 对抗,设计多无人机对抗实验案例,对不同角色 本文主要研究在对抗中双方的策略选择问 的无人机设计了行为集,无人机根据对抗过程中 题,因此不考虑红方水声通信时延,多UUV间的 的态势,从行为集里选择最优行为完成对抗过 通信定义为双工实时通信,红方UUV能够通过 程。文献26]研究了有人机和无人机协同作战, 预置的水下监听装置探测到蓝方UUV的位姿信 主要聚焦于对抗期间的飞行路径规划。 息,蓝方则通过被动声呐探测一定范围内的红方
的前提下,在一定范围内通过水声通信能够实现 多 UUV 的水下协同对抗,可以克服单 UUV 的能 力局限,提高完成对抗任务效能[6]。近期无人机 在美军中的不断使用也表明:无人平台在军事领 域内的应用以及利用无人平台配合完成作战任务 将成为未来对抗形态的发展趋势[7]。美国捕食者 无人机[8] 是一种最为典型的察打一体无人机,可 长时间对重要地面目标和低速低空目标进行侦察、 识别和监视。LDUUV 项目[9] 是美国于 2011 年开 始研制测试的一款可搭载具有打击能力的任务载 荷的大直径重型无人潜航器。 关于多 UUV 对抗的研究现阶段较少,开放的 文献不多,关于对抗的研究主要集中于多 UUV 围 捕问题。在追逃问题研究中文献 [10] 在“图清理” 方法的基础上,应用精英遗传算法于围捕问题 中。文献 [11] 提出了一种分散的围捕策略,可以 在有限时间内捕获入侵智能体。文献 [12] 基于 apolonius 圆提出了动态围捕入侵智能体的方法。 文献 [13] 利用生物激励神经网络解决多机器人围 捕问题,通过计算并选择相邻细胞神经网络的最 大活动值,得到参与围捕的机器人的围捕路径, 实现有效围捕。文献 [14] 设计了对足球机器人团 队角色和任务进行分工的模糊推理系统,主要研究 足球机器人角色和行为切换机制。文献 [15] 提出 一种基于狮群算法多 AUV 围捕方法,实现在围捕 中最佳围捕者的选择和围捕任务中的角色分配。 无人系统协同对抗要求“参与者”协调行动, 以获得最大利益为核心目标,根据环境信息、敌 方信息以及我方对抗态势不断选择策略[16]。现阶 段对于无人系统协同对抗的研究对象多为机器 人、无人机[17] 和地面无人车,主要研究集中于对 抗中的任务分配、作战方式、干扰手段。自然进 化计算[18] 、社会进化计算[19] 、生物智能计算[20] 、群 集智能计算[21] 等智能算法也被大量运用于武器 分配、协同搜索、追逃围捕等问题的研究中来。 文献 [22] 应用空间链路调度算法研究多机器人任 务协调分配问题。文献 [23] 提出近似规划方法研 究一对一空战,解决无人机空战对抗飞行控制问 题。文献 [24] 讨论无人机对地空战问题,不仅给 出协同策略,还考虑了武器、无人机数量以及地 面防御系统设置等问题。文献 [25] 研究多无人机 对抗,设计多无人机对抗实验案例,对不同角色 的无人机设计了行为集,无人机根据对抗过程中 的态势,从行为集里选择最优行为完成对抗过 程。文献 [26] 研究了有人机和无人机协同作战, 主要聚焦于对抗期间的飞行路径规划。 由于水下对抗环境复杂、通信受限、探测能 力受限,关于水下对抗的研究现阶段还较少。文 献 [27] 主要研究水下对抗过程中的传感器探测组 网问题,比较了不同度量条件下的探测性能。文 献 [6] 验证粒子群优化对水下多 AUV 协同对抗的 动态博弈模型求解的有效性。文献 [28] 研究多 UUV 对抗过程,并给出对抗过程中态势评估及策 略选择方案。随着无人系统的不断发展,水下对 抗问题正引起国内外诸多学者的广泛关注。 从上述研究中可以看出,在诸多已有的研究 中,对抗问题主要存在以下问题:1)单个 UUV 策 略选择研究多,多 UUV 协同决策研究少,单方面 策略优化选择研究多,双方策略对抗博弈研究 少;2)研究对抗双方无能力差异的情况多,研究 “多对一”、“弱对强”的少。本文从无人对抗的角 度考虑水下多 UUV 对抗存在的通信、自主决策 等问题,设计多 UUV 对抗过程。针对对抗中的 策略选择与角色分配问题,以多 UUV 基地防卫 作为对抗任务背景,提出一种基于角色分配的多 UUV 协同对抗策略选择方法,完成多对一攻防对 抗任务仿真。 1 基地防卫任务想定与研究约束条件 基地防卫任务想定:如图 1 所示,红色小旗为 红方被保护区域,蓝方 UUV(图中以黄色 UUV 示 意)在本次攻防任务中为攻击方,其任务为破坏 红方基地,当蓝方 UUV 成功对红方被保护基地 造成破坏,认定红方本次攻防任务失败。红方多 UUV 通过攻击、防守、围捕等手段保护基地不被 摧毁,则认定红方本次攻防任务成功。 红方基地 双工通信 红方协同 UUV 单工通信 蓝方 UUV 水下监听阵列 图 1 对抗情形 Fig. 1 Confrontation situation 本文主要研究在对抗中双方的策略选择问 题,因此不考虑红方水声通信时延,多 UUV 间的 通信定义为双工实时通信,红方 UUV 能够通过 预置的水下监听装置探测到蓝方 UUV 的位姿信 息,蓝方则通过被动声呐探测一定范围内的红方 第 2 期 王宏健,等:非对称博弈下多 UUV 基地防卫协同对抗策略 ·349·
·350· 智能系统学报 第17卷 UUV位姿信息。在对抗过程中,双方的攻击方式 武器。为方便理论研究和设计仿真实验,对参与 均为发射任务模块,双方的策略对对方不可知 对抗的UUV的尺寸和机动能力以及武器参数等 的,所有参与对抗的UUV仅能通过声呐探测到 比例地缩小,表1所示为UUV的参数配置。 表1红蓝UUV配置参数 Table 1 Configuration parameters of red and blue UUVs 速度 探测声呐 任务模块 UUV 数量/台 正常航行速 最大航行速 探测范 速度/ 作用距 毁伤半 开角/(°) 数量/枚 度/(ms 度/(ms) 围/m (m's) 离m 径m 红方UUV Vnot Vmax D A 2 Vo L R 蓝方UUV 2Vnot 1.5Vmax 1.5D 1.2A 3 1.5Vm1.2L 1.5R 2设计UUV运动控制器 进行逃逸。如图3所示,设山为任务模块的艏向 角,r为UUV艏向角,任务模块的航向向量为T, 由于本文所研究的多UUV对抗过程中的机 UUV的航向向量为H。此时,若任务模块位于UUV 动行为不包括升潜运动,所以本文利用增量式 左舷,则UUV逃逸方向即此时的期望艏向为 PID根据UUV的控制需求,设计UUV三自由度 π 运动控制器。将控制UUV水平面运动的增量式 中a=or- ×ag (1) PD运动控制器分为两部分:速度控制器和艏向 式中: 控制器。由于本文所研究的UUV是欠驱动的, 无法控制UUV的横向速度,因此,UUV的速度控 e-仕78 TxH<0 制主要是通过控制UUV的纵向推力来控制UUV 的纵向速度,使得UUV的实际纵向速度达到期 望速度。艏向控制器是通过控制UUV的转艏力 Ψa 矩来控制UUV的艏向,使其实际艏向达到期望 艏向。基于增量式PID设计的UUV水平面运动 控制器如图2所示。 红方UUV 多普勒计程仪 来袭任务模块 n实测速度 山4期望速度 速度 UUV 4速度误差 控制器 推进器 图3针对任务模块的逃逸方向 UUV Fig.3 Escape direction for mission modules 华期望艏向 华。脂向误差 赠向 UUV 控制器 方向舵 UUV在针对来袭UUV的逃逸方向选择上借 w实测艏向 鉴人工势场网的思想如图4所示。 罗经 来袭方UUV 图2基于增量式PID的UUV运动控制框图 Fig.2 UUV motion controller based on incremental PID 思 3UUV基本行为定义 蓝方UUV 根据参与对抗的UUV所执行的任务和分配 到的角色将UUV的基本行为划分成以下5种: 来袭方UUV, 1)逃逸 图4针对来袭UUV的逃逸方向 这一基本行为是指当UUV受到任务模块威 Fig.4 Escape direction for incoming UUV 胁时,通过艏向控制,选择最快远离威胁的方向 来袭UUV相当于给己方UUV生成一个斥
UUV 位姿信息。在对抗过程中,双方的攻击方式 均为发射任务模块,双方的策略对对方不可知 的,所有参与对抗的 UUV 仅能通过声呐探测到 武器。为方便理论研究和设计仿真实验,对参与 对抗的 UUV 的尺寸和机动能力以及武器参数等 比例地缩小,表 1 所示为 UUV 的参数配置。 表 1 红蓝 UUV 配置参数 Table 1 Configuration parameters of red and blue UUVs UUV 数量/台 速度 探测声呐 任务模块 正常航行速 度/ (m·s−1) 最大航行速 度/(m·s−1) 探测范 围/m 开角/(°) 数量/枚 速度/ (m·s−1) 作用距 离/m 毁伤半 径/m 红方UUV 3 Vnor Vmax D A 2 Vm L R 蓝方UUV 1 2Vnor 1.5Vmax 1.5D 1.2A 3 1.5Vm 1.2L 1.5R 2 设计 UUV 运动控制器 由于本文所研究的多 UUV 对抗过程中的机 动行为不包括升潜运动,所以本文利用增量式 PID 根据 UUV 的控制需求,设计 UUV 三自由度 运动控制器。将控制 UUV 水平面运动的增量式 PID 运动控制器分为两部分:速度控制器和艏向 控制器。由于本文所研究的 UUV 是欠驱动的, 无法控制 UUV 的横向速度,因此,UUV 的速度控 制主要是通过控制 UUV 的纵向推力来控制 UUV 的纵向速度,使得 UUV 的实际纵向速度达到期 望速度。艏向控制器是通过控制 UUV 的转艏力 矩来控制 UUV 的艏向,使其实际艏向达到期望 艏向。基于增量式 PID 设计的 UUV 水平面运动 控制器如图 2 所示。 速度 控制器 UUV 推进器 多普勒计程仪 ud 期望速度 u 实测速度 ue 速度误差 艏向 控制器 UUV 方向舵 罗经 ψ 实测艏向 ψe 艏向误差 ⊗ ⊗ UUV + + − − ψd 期望艏向 图 2 基于增量式 PID 的 UUV 运动控制框图 Fig. 2 UUV motion controller based on incremental PID 3 UUV 基本行为定义 根据参与对抗的 UUV 所执行的任务和分配 到的角色将 UUV 的基本行为划分成以下 5 种: 1) 逃逸 这一基本行为是指当 UUV 受到任务模块威 胁时,通过艏向控制,选择最快远离威胁的方向 ψtor ψR T H 进行逃逸。如图 3 所示,设 为任务模块的艏向 角, 为 UUV 艏向角,任务模块的航向向量为 , UUV 的航向向量为 。此时,若任务模块位于 UUV 左舷,则 UUV 逃逸方向即此时的期望艏向为 ψd = ψtor − π 2 ×flag (1) 式中: flag = { −1, T × H 0 红方 UUV 来袭任务模块 ψtor ψR ψd 图 3 针对任务模块的逃逸方向 Fig. 3 Escape direction for mission modules UUV 在针对来袭 UUV 的逃逸方向选择上借 鉴人工势场[29] 的思想如图 4 所示。 ψB ψd 蓝方 UUV 来袭方 UUV1 来袭方 UUV2 图 4 针对来袭 UUV 的逃逸方向 Fig. 4 Escape direction for incoming UUV 来袭 UUV 相当于给己方 UUV 生成一个斥 ·350· 智 能 系 统 学 报 第 17 卷
第2期 王宏健,等:非对称博弈下多UUV基地防卫协同对抗策略 ·351 力,力的大小与来袭UUV与己方UUV的距离成 追踪UUV坐标为(x,y),目标UUV当前坐标为 反比,若出现多个来袭目标对UUV,则叠加这些 (Xe,ye)o 目标产生的斥力,得到的合力方向即为UUV的 逃逸方向。斥力计算公式为 0-+0-当 目标UUV d:≤d F:= d d (2) 0,d>d 式中:n为斥力比例系数;d为来袭UUV,与己方 UUV的距离;d为己方UUV的威胁警示范围; n为正整数;(xo,o)为己方UUV的坐标;(x,y)为来 袭UUV的坐标;£与分别为x与y轴的单位向量, 斥力合力的计算公式为 追踪方UUV F=E 图6UUV追踪行为 (3) Fig.6 UUV Tracking Behavior 式中:为来袭UUV的个数。最后,可得到UUV 的逃逸方向为 4 基于任务-角色-行为分层的红方 F 多UUV协同对抗方法设计 a二F (4) 如果UUV在被任务模块威胁的同时探测到 红方策略是一种UUV群体的策略,本文提出 一 有来袭UUV,则不得不同时考虑两种威胁来选择 种基于总任务分解的任务一角色-行为分层的 逃逸方向,则同时计算式(3)、(4)确定逃逸方向。 多UUV协同对抗方法。算法设计的群体策略生 2)UUV向定点运动 成机制如图7所示,根据威胁评估结果将UUV任 这一基本行为是UUV最基本的运动行为,如 务分为,即驱逐、紧急返回、攻击-防卫3种;根据不 图5所示,定点的坐标(M,M),UUV坐标(x,y),则 同的任务将UUV分为4种不同的角色分别为,即 期望艏向角计算公式为 追踪UUV、返航UUV、核心攻击UUV和辅助攻 击UUV。策略适用情况与策略制定理由如表2。 arctar (5) 任剂 驱逐 紧急返回 UUV 攻击·防可任务层 (策略 返航U心V返航UUV 孩心攻击 铺助攻击 UUV UUV 角色层 朝某点 发射任 逃逸 务模块 避碰 追踪 行为层 图5UUV朝某点运动 Fig.5 UUV moving towards a point 图7红方多UUV任务及角色行为示意图 3)基本攻击行为 Fig.7 Red UUVs task and role behavior diagram 这一基本行为指处于可攻状态的UUV计算 4.1考虑目标航向偏角的多UUV协同防卫方法 得到任务模块命中点,并发射任务模块的过程。 设计 4)避碰 确定UUV角色后根据角色和蓝方UUV态势 这一基本行为区别于敌我双方避障,主要针 从而确定红方多UUV的协同防卫策略是红方多 对合作关系的红方UUV需要时刻避免发生位置 UUV基地防卫任务的重点。蓝方UUV航向偏角 冲突。 从一定程度上能够反映威胁意图,航向偏角越 5)追踪 小,威胁意图越强,本文提出基于目标偏航角的 这一基本行为是指使追踪UUV的艏向始终 协同防卫方法。如图8所示,目标航向偏角为 跟随目标UUV的位置,也就是使目标UUV始终 UUV的航向同它与红方基地的连线的夹角Bt)为 位于追踪UUV的0°舷角位置0,如图6所示。设 目标航向偏角
力,力的大小与来袭 UUV 与己方 UUV 的距离成 反比,若出现多个来袭目标对 UUV,则叠加这些 目标产生的斥力,得到的合力方向即为 UUV 的 逃逸方向。斥力计算公式为 Fi = η ( x0 − xi d n i xˆ + y0 −yi d n i yˆ ) , di ⩽ dtr 0, di > dtr (2) η di dtr n (x0, y0) (xi , yi) xˆ yˆ x y 式中: 为斥力比例系数; 为来袭 UUVi 与己方 UUV 的距离; 为己方 UUV 的威胁警示范围; 为正整数; 为己方 UUV 的坐标; 为来 袭 UUV 的坐标; 与 分别为 与 轴的单位向量, 斥力合力的计算公式为 F = ∑ j i=1 Fi (3) 式中: j 为来袭 UUV 的个数。最后,可得到 UUV 的逃逸方向为 ψd = F |F| (4) 如果 UUV 在被任务模块威胁的同时探测到 有来袭 UUV,则不得不同时考虑两种威胁来选择 逃逸方向,则同时计算式 (3)、(4) 确定逃逸方向。 2)UUV 向定点运动 (Mx , My) (x, y) 这一基本行为是 UUV 最基本的运动行为,如 图5所示,定点的坐标 ,UUV 坐标 ,则 期望艏向角计算公式为 ψ = arctan( My −y Mx − x ) (5) M UUV 图 5 UUV 朝某点运动 Fig. 5 UUV moving towards a point 3)基本攻击行为 这一基本行为指处于可攻状态的 UUV 计算 得到任务模块命中点,并发射任务模块的过程。 4)避碰 这一基本行为区别于敌我双方避障,主要针 对合作关系的红方 UUV 需要时刻避免发生位置 冲突。 5)追踪 这一基本行为是指使追踪 UUV 的艏向始终 跟随目标 UUV 的位置,也就是使目标 UUV 始终 位于追踪 UUV 的 0°舷角位置[30] ,如图 6 所示。设 (x, y) (xe , ye) 追踪 UUV 坐标为 ,目标 UUV 当前坐标为 。 目标 UUV 追踪方 UUV 图 6 UUV 追踪行为 Fig. 6 UUV Tracking Behavior 4 基于任务–角色–行为分层的红方 多 UUV 协同对抗方法设计 红方策略是一种 UUV 群体的策略,本文提出 一种基于总任务分解的任务–角色–行为分层的 多 UUV 协同对抗方法。算法设计的群体策略生 成机制如图 7 所示,根据威胁评估结果将 UUV 任 务分为,即驱逐、紧急返回、攻击–防卫 3 种;根据不 同的任务将 UUV 分为 4 种不同的角色分别为,即 追踪 UUV、返航 UUV、核心攻击 UUV 和辅助攻 击 UUV。策略适用情况与策略制定理由如表 2。 逃逸 任务 驱逐 紧急返回 核心攻击 UUV 辅助攻击 UUV 朝某点 追踪 运动 避碰 任务层 (策略) 角色层 行为层 攻击-防卫 返航 UÙV 返航 UUV 发射任 务模块 图 7 红方多 UUV 任务及角色行为示意图 Fig. 7 Red UUVs task and role behavior diagram 4.1 考虑目标航向偏角的多 UUV 协同防卫方法 设计 β(t) 确定 UUV 角色后根据角色和蓝方 UUV 态势 从而确定红方多 UUV 的协同防卫策略是红方多 UUV 基地防卫任务的重点。蓝方 UUV 航向偏角 从一定程度上能够反映威胁意图,航向偏角越 小,威胁意图越强,本文提出基于目标偏航角的 协同防卫方法。如图 8 所示,目标航向偏角为 UUV 的航向同它与红方基地的连线的夹角 为 目标航向偏角。 第 2 期 王宏健,等:非对称博弈下多 UUV 基地防卫协同对抗策略 ·351·
·352· 智能系统学报 第17卷 表2红方多UUV任务选择及相应参数表 Table 2 Red side multi UUV task selection and corresponding parameter table 任务(策略)角色种类 适用情况 具体描述 中、低威胁评估等级且无可攻 选择返航UUV时,优先考虑距离,距离基地最近的红方UUV执 追踪UUV 行返航任务;其余所有UUV均为追踪UUV,任务优先级相同, 1 驱逐 返航UUV 红方UUV 当追踪UUV中出现任务点冲突时,则距离蓝方UUV距离越近 蓝方状态不稳定 的UUV,其优先级越高 所有红方UUV均为返航UUV,执行返回基地保护基地任务。 紧急 返航UUV 高威胁等级且红方无可攻UUV 任务优先级相同,出现冲突时,则距离基地距离越近的UUV, 返回 其优先级越高 攻击 核心攻击 基于“距离最短”分配策略点,在可攻UUV中选择离自身阵位 高威胁等级且红方有可攻UUV 防卫 UUV 点最近的作为核心攻击UUV 攻击辅助攻击 中、低威胁等级且红方有可攻 基于“时间均衡”分配辅助攻击UUV的策略点.求解一组策略 防卫 UUV UUV时 点使得所有辅助攻击UUV到达策略点的时间差异最小 攻击任务,将UUV完成任务需要到达的目标点 R0习 0X0 命名为策略点,核心攻击UUV发射任务模块的 阵位点就是其策略点,任务模块命中点为P2。UUVR 和UUVR为辅助攻击UUV,其策略点为P、P也是 发射任务模块的阵位点。此时,任务优先级设置 d() 为辅助攻击UUV>核心攻击UUV,若辅助攻击 UUV在向策略点运动过程中出现冲突,那么与蓝 图8目标航向偏角与目标距离 方UUV距离近的UUV拥有更高的优先级。 Fig.8 Target heading angle and target distance 由于蓝方机动性能强于红方,因此,若是将本 UUVR 文的多对一对抗过程简化为一对一,当蓝方UUV P 铺助攻击UUV 受到单一威胁,蓝方机动逃逸成功率高,使得红 方UUV整体作战效能差Bu。如图9所示,UUVR UUVB 的任务模块本身并不是有效的,若是UUVB保持 UUVR, 之前航线运动,UUVR,发射的任务模块将有效, 核心攻击UUV 若是UUVB对UUVR,发射的任务模块进行避碰, P,辅助攻击UUV UUVR2的任务模块将变成有效的。所以采取基 红方基地 UUVR; 于目标航向角的联合打击方式对蓝方UUV进行 打击。 图10蓝方UUV大航向偏角红方多UUV联合防卫方法 Fig.10 Blue UUV large heading angle red UUVs joint de- UUVR fense method 在确定核心攻击UUV后,可以得到在核心攻 UUVB 击UUV发射任务模块的任务模块命中点 UUVR2 P(P2x,P2),则P(Px,P)、P(P3x,P)策略点的计算 方式为 P1x=P2.+Lcos(B+π-) P,=P,+Lsin(wa+π-) (6) 图9UUV攻击方式 Fig.9 UUV attack mode P3x=P2.+Lcos(地B-π+) P3y=P+Lsin(ws-π+) (7) 4.1.1蓝方UUV大航向偏角多UUV联合防卫方法 蓝方UUV的航向偏角如图中t)>90时,设 式中:B=arctan(Vm/Vs),其中Vm为红方UUV任务 计如图10所示的联合防卫方式。根据上文设计 模块速度;V为蓝方UUV速度;山s为蓝方UUV艏 的角色分配原则,UUVR2为核心攻击UUV,承担 向角。L为红方UUV的任务模块射距
表 2 红方多 UUV 任务选择及相应参数表 Table 2 Red side multi UUV task selection and corresponding parameter table 任务(策略) 角色种类 适用情况 具体描述 1 驱逐 追踪UUV 返航UUV 中、低威胁评估等级且无可攻 红方UUV 蓝方状态不稳定 选择返航UUV时,优先考虑距离,距离基地最近的红方UUV执 行返航任务;其余所有UUV均为追踪UUV,任务优先级相同, 当追踪UUV中出现任务点冲突时,则距离蓝方UUV距离越近 的UUV,其优先级越高 2 紧急 返回 返航UUV 高威胁等级且红方无可攻UUV 所有红方UUV均为返航UUV,执行返回基地保护基地任务。 任务优先级相同,出现冲突时,则距离基地距离越近的UUV, 其优先级越高 3 攻击 防卫 核心攻击 UUV 高威胁等级且红方有可攻UUV 基于“距离最短”分配策略点,在可攻UUV中选择离自身阵位 点最近的作为核心攻击UUV 攻击 防卫 辅助攻击 UUV 中、低威胁等级且红方有可攻 UUV时 基于“时间均衡”分配辅助攻击UUV的策略点,求解一组策略 点使得所有辅助攻击UUV到达策略点的时间差异最小 β (t) det (t) ve (t) Re (t) 图 8 目标航向偏角与目标距离 Fig. 8 Target heading angle and target distance UUVB UUVR1 由于蓝方机动性能强于红方,因此,若是将本 文的多对一对抗过程简化为一对一,当蓝方 UUV 受到单一威胁,蓝方机动逃逸成功率高,使得红 方 UUV 整体作战效能差[31]。如图 9 所示,UUVR2 的任务模块本身并不是有效的,若是 UUVB 保持 之前航线运动,UUVR1 发射的任务模块将有效, 若是 对 发射的任务模块进行避碰, UUVR2 的任务模块将变成有效的。所以采取基 于目标航向角的联合打击方式对蓝方 UUV 进行 打击。 UUVR1 UUVR2 UUVB 图 9 UUV 攻击方式 Fig. 9 UUV attack mode 4.1.1 蓝方 UUV 大航向偏角多 UUV 联合防卫方法 β(t) > 90◦ UUVR2 蓝方 UUV 的航向偏角如图中 时,设 计如图 10 所示的联合防卫方式。根据上文设计 的角色分配原则, 为核心攻击 UUV,承担 P2 UUVR1 UUVR3 P1 P3 攻击任务,将 UUV 完成任务需要到达的目标点 命名为策略点,核心攻击 UUV 发射任务模块的 阵位点就是其策略点,任务模块命中点为 。 和 为辅助攻击 UUV,其策略点为 、 也是 发射任务模块的阵位点。此时,任务优先级设置 为辅助攻击 UUV>核心攻击 UUV,若辅助攻击 UUV 在向策略点运动过程中出现冲突,那么与蓝 方 UUV 距离近的 UUV 拥有更高的优先级。 P1 红方基地 P2 UUVB UUVR1 UUVR2 UUVR3 P3 核心攻击 UUV 辅助攻击 UUV 辅助攻击 UUV 图 10 蓝方 UUV 大航向偏角红方多 UUV 联合防卫方法 Fig. 10 Blue UUV large heading angle red UUVs joint defense method P2(P2x ,P2y) P1(P1x ,P1y) P3(P3x ,P3y) 在确定核心攻击 UUV 后,可以得到在核心攻 击 U U V 发射任务模块的任务模块命中点 ,则 、 策略点的计算 方式为 { P1x = P2x + Lcos(ψB +π−β) P1y = P2y + Lsin(ψB +π−β) (6) { P3x = P2x + Lcos(ψB −π+β) P3y = P2y + Lsin(ψB −π+β) (7) β = arctan(Vm/VB) Vm VB ψB L 式中: ,其中 为红方 UUV 任务 模块速度; 为蓝方 UUV 速度; 为蓝方 UUV 艏 向角。 为红方 UUV 的任务模块射距。 ·352· 智 能 系 统 学 报 第 17 卷
第2期 王宏健,等:非对称博弈下多UUV基地防卫协同对抗策略 ·353· 4.1.2蓝方UUV中小航向偏角时多UUV联合 得红方UUV发射的任务模块有效威胁蓝方 防卫方法 UUV,提高红方多UUV整体对抗效能;2)在红方 蓝方UUV的航向偏角为0≤()辅助攻击UUV,若辅助攻 题,本文设计基于对抗任务的松散耦合的多UUV 击UUV在向策略点运动过程中出现冲突,那么 体系,提出一种多UUV协同方法一基于任务 同样的与蓝方UUV距离近的红方UUV拥有更高 优先级的多UUV协同角色分配算法。 的优先级。 本文研究的多UUV对抗过程环境态势实时 变化,因此在红方多UUV角色分配时,UUV的角 色也应当是根据实时变化的对抗环境不断变换 轴助攻击UUV UUVR 的。因此需要根据环境和敌我双方态势变化,设 计可以动态调整角色任务的多UUV协同角色分 配算法,使之能够适应对抗性环境和对抗任务。 UUVB P 算法流程如图12所示。 WUVR 开始 U 辅助攻击UUV 威胁评估 △红方基地核心攻击UUV UUVR 判定威胁等级 图11蓝方UUV中小航向偏角红方多UUV联合防卫方法 低、中 高 低、中 Fig.11 Blue side UUV small heading angle red side UUVs joint defense method 追踪 攻击一防卫 紧急返航 确定核心攻击UUV后,可以得到在核心攻 任务 (策略) 击UUV发射任务模块的时刻蓝方UUV的位置 U2(U2x,U2)以及该UUV的阵位点位置U(U,Uv) 与任务模块命中点P(P,P),又已知红方区域的 核心攻击 辅助攻击 追踪UUV 返航UUV UUV UUV 坐标为(Mx,M),定义P(P1,P)为阵位点关于蓝方 角色 UUV航向的对称点,则P(P,Pv)、P(P2,Px)、 P(P,P)策略点的计算公式为 追踪 发射任 务模块 逃逸 向某点 避碰 运动 P2ta(+taU 行为 tan(业s)+1 Pi=2(i-P+t() 对抗结束 (8) tan2(U8)+1 P3y-tan(B)P3x)-Uiy 结束 P2x=P3x+rcos(U8+-B) (9) 图12分层决策算法流程图 P2,=P,+rsin(ws+π-) Fig.12 Role assignment algorithm ∫P2.=P3x+rCos(ws+π-) (10) 分层决策算法的步骤如下: P2,=P+rsin(s+π-B) 1)红方多UUV对当前自身态势进行评估和 式中:B=arctan(Vm/Ws),其中Vm为红方UUV任务 分析,得到当前态势等级分为:低、中、高; 模块速度,Vs为蓝方UUV速度。r为红方UUV的 2)根据上文中提出的多UUV分层决策算法, 任务模块极限射距。 进行多UUV任务分配,确定当前策略; 上述联合攻击策略具有两个优点:1)能够使 3)根据不同UUV的任务,确定UUV角色;
4.1.2 蓝方 UUV 中小航向偏角时多 UUV 联合 防卫方法 0 ⩽ β(t) < 90◦ UUVR3 P3 UUVR1 UUVR2 P1 P2 P ′ 1 P ′ 2 蓝方 UUV 的航向偏角为 时,采用 如图 11 所示的联合防卫。此时承担攻击任务的 核心攻击 UUV 为 , 是命中点。 、 作为辅助攻击 UUV,其策略点仍然是阵位 点为图中的 、 或 、 。此时,任务优先级定 义为核心攻击 UUV>辅助攻击 UUV,若辅助攻 击 UUV 在向策略点运动过程中出现冲突,那么 同样的与蓝方 UUV 距离近的红方 UUV 拥有更高 的优先级。 P1 红方基地 UUVB P2 UUVR1 UUVR2 UUVR3 P3 P′2 辅助攻击 UUV 辅助攻击 UUV 核心攻击 UUV U2 U1 图 11 蓝方 UUV 中小航向偏角红方多 UUV 联合防卫方法 Fig. 11 Blue side UUV small heading angle red side UUVs joint defense method U2(U2x ,U2y) U1(U1x ,U1y) P3(P3x ,P3y) (Mx , My) P1(P1x ,P1y) P1(P1x ,P1y) P2(P2x ,P2y) P ′ 2 (P ′ 2x ,P ′ 2y ) 确定核心攻击 UUV 后,可以得到在核心攻 击 UUV 发射任务模块的时刻蓝方 UUV 的位置 以及该 UUV 的阵位点位置 与任务模块命中点 ,又已知红方区域的 坐标为 ,定义 为阵位点关于蓝方 U U V 航向的对称点,则 、 、 策略点的计算公式为 P1x = 2tan(ψB)(U1y − P3y +tan(ψB)P3x +U1x) tan2 (ψB)+1 −U1x P1y = 2 ( tan2 (ψB)(U1y − P3y +tan(ψB)P3x +U1x) tan2 (ψB)+1 + P3y −tan(ψB)P3x ) −U1y (8) { P2x = P3x +r cos(ψB +π−β) P2y = P3y +rsin(ψB +π−β) (9) { P ′ 2x = P3x +r cos(ψB +π−β) P ′ 2y = P3y +rsin(ψB +π−β) (10) β = arctan(Vm/VB) Vm VB r 式中: ,其中 为红方 UUV 任务 模块速度, 为蓝方 UUV 速度。 为红方 UUV 的 任务模块极限射距。 上述联合攻击策略具有两个优点:1) 能够使 得 红 方 U UV 发射的任务模块有效威胁蓝 方 UUV,提高红方多 UUV 整体对抗效能;2) 在红方 某个 UUV 受到蓝方 UUV 或其发射的任务模块威 胁时,其他 UUV 仍然具有对蓝方 UUV 产生威胁 的能力。 4.2 基于任务优先级的多 UUV 协同角色分配方法 针对从任务层向角色层的角色分配和切换问 题,本文设计基于对抗任务的松散耦合的多 UUV 体系,提出一种多 UUV 协同方法−基于任务 优先级的多 UUV 协同角色分配算法。 本文研究的多 UUV 对抗过程环境态势实时 变化,因此在红方多 UUV 角色分配时,UUV 的角 色也应当是根据实时变化的对抗环境不断变换 的。因此需要根据环境和敌我双方态势变化,设 计可以动态调整角色任务的多 UUV 协同角色分 配算法,使之能够适应对抗性环境和对抗任务。 算法流程如图 12 所示。 任务 (策略) 角色 行为 开始 判定威胁等级 追踪 攻击—防卫 紧急返航 辅助攻击 UUV 追踪 UUV 核心攻击 UUV 返航 UUV 威胁评估 低、中 高 向某点 运动 发射任 务模块 追踪 逃逸 避碰 对抗结束 结束 Y N 低、中 图 12 分层决策算法流程图 Fig. 12 Role assignment algorithm 分层决策算法的步骤如下: 1) 红方多 UUV 对当前自身态势进行评估和 分析,得到当前态势等级分为:低、中、高; 2) 根据上文中提出的多 UUV 分层决策算法, 进行多 UUV 任务分配,确定当前策略; 3) 根据不同 UUV 的任务,确定 UUV 角色; 第 2 期 王宏健,等:非对称博弈下多 UUV 基地防卫协同对抗策略 ·353·
·354· 智能系统学报 第17卷 4)按照角色各个UUV选择基本行为,展开红 仿真水域大小为1050m×1050m,表4所示为 蓝双方对抗的底层行为: 红、蓝双方UUV的初始设置。 5)当前任务是否发生核心攻击UUV失效或 表3蓝方UUV策略选择表 红方对抗任务变化?若是,则说明完成一次联合 Table 3 Blue UUV strategy table 防卫,重新评估威胁等级,转至1)若对抗结束(蓝 策略 适用情况 方或红方对抗总任务失败),结束。 向红方基UUV处于中、低威胁等级,且蓝方未受到任 从图12中可以看出,在追踪和返航策略下 地运动 务模块威胁且无攻击目标 UUV角色是确定的,而在攻击防卫下就需要对UUV 3 攻击红 UUV处于中、低威胁等级,有一个或多个目 角色进行分配。本文基于贪心算法和市场法提出 方UUV 标,选择威胁程度最大的进行攻击 一种角色分配方法,在UUV策略点选择有冲突 UUV处于中、高威胁等级,无攻击能力,蓝 逃逸 时基于贪心算法,对有相同策略点的UUV计算 方为保存实力放弃任务,逃逸 其与策略点的距离,根据距离最短原则确定核心 攻击UUV,其余辅助攻击UUV的策略点分配也 表4红方UUV与蓝方UUV初始速度与位姿 依照这种原则。当策略点没有冲突时,多UUV Table 4 Initial velocity and pose of red and blue UUVs 的策略点分配则如图13所示,按照“时间均衡原 参数UUV 初始速度与位姿 则”。核心攻击UUV,UUV,的当前位置与其任务 红方UUV1 url:Vrl,rd,xrl:yrl;r= [0.5,0,0,400,200,1.2] 点的距离为d。那么辅助攻击UUV,位置(x,)与 其策略点(xmym)之间的距离可以表示为 红方UUV2, u2,V2,r2,x2,y,2,山2= [0.5,0,0,200,600,-1.2] di=V(x;-xom)2+(y;-yem)2 (11) 红方UUV3 ur3,Vr3,r,x3,yr3,0r= [0.5.0,0,850,300,2] 则方差可表示为 蓝方UUV [u6,V6,r6,xhy%,s]= Sm=Vd-d+(d2-d2+…+(dn-d月 (12) [1,0,0,900,700,-2.5] 令F=minS1,S2,…,Sm}策略点匹配方案即为 从图14中的红方UUV威胁评估等级变化曲 所求。 线可以看出,红方UUV威胁等级始终处于低或 ●策略点1 中,说明红方在对抗过程中策略选择适当,红方 UUVB 始终未陷入危险。 分别分析表5中红方UUV对蓝方UUV发起 的3次有效攻击过程。蓝色部分为第1次有效攻 击;橙色部分时第2次有效攻击,白色部分为最 UUVR, 策略点3 ●策略点2 后1次有效攻击。红方多UUV从任务(策略)-角 ●、d 色-行为-运动特性的角度分析,蓝方从态势-策 UUVR, 略-行为-运动特性逻辑流分析: 图13“时间均衡原则”匹配策略点 1)红方多UUV:在t到ts过程中红方UUV,和 Fig.13 Time balance principle UUV,已经逐渐逼近蓝方UUV,此时纵向速度减 5蓝方策略制定 小,到达攻击阵位点时,纵向速度最小。作为第 一次进攻的核心攻击UUV一红方UUV2首先 由于参与对抗的蓝方UUV只有一个,因此蓝 到达阵位点,并发射任务模块,UUV,随后到达发 方只考虑自身利益选择策略,单个UUV的行为 射任务模块,对蓝方UUV产生威胁。蓝方UUV: 就是蓝方参与对抗时所选择的策略。蓝方UUV t时刻蓝方UUV陷入危险,此时根据表5可知, 策略选择表如表3所示。 蓝方UUV采取逃逸策略;同时,在图14、15中可 以分别看出s时刻蓝方UUV推力增大,纵向速度 6仿真分析 增大,艏向发生改变执行逃逸动作。可以看出对 6.1多UUV协同攻防算法有效性分析 抗过程中的第一次正面交锋双方策略选择合理, 仿真实验是在Windows10,QT5.6下进行的。 多UUV角色分配合理,双方运动特性符合所选 设计实验参数:红方被保护区域的坐标为(30,50), 策略下的基本行为
4) 按照角色各个 UUV 选择基本行为,展开红 蓝双方对抗的底层行为; 5) 当前任务是否发生核心攻击 UUV 失效或 红方对抗任务变化?若是,则说明完成一次联合 防卫,重新评估威胁等级,转至 1) 若对抗结束 (蓝 方或红方对抗总任务失败),结束。 d (xi , yi) (xem, yem) 从图 12 中可以看出,在追踪和返航策略下 UUV 角色是确定的,而在攻击防卫下就需要对 UUV 角色进行分配。本文基于贪心算法和市场法提出 一种角色分配方法,在 UUV 策略点选择有冲突 时基于贪心算法,对有相同策略点的 UUV 计算 其与策略点的距离,根据距离最短原则确定核心 攻击 UUV,其余辅助攻击 UUV 的策略点分配也 依照这种原则。当策略点没有冲突时,多 UUV 的策略点分配则如图 13 所示,按照“时间均衡原 则”。核心攻击 UUVj,UUVj 的当前位置与其任务 点的距离为 。那么辅助攻击 UUVi 位置 与 其策略点 之间的距离可以表示为 di = √ (xi − xem) 2 +(yi −yem) 2 (11) 则方差可表示为 S m = √ (d1 −d) 2 +(d2 −d) 2 +···+(dn −d) 2 (12) 令 F = min{S 1,S 2,··· ,S m} 策略点匹配方案即为 所求。 策略点 1 策略点 2 UUVR2 UUVB UUVR1 UUVR3 策略点 3 d3 图 13 “时间均衡原则”匹配策略点 Fig. 13 Time balance principle 5 蓝方策略制定 由于参与对抗的蓝方 UUV 只有一个,因此蓝 方只考虑自身利益选择策略,单个 UUV 的行为 就是蓝方参与对抗时所选择的策略。蓝方 UUV 策略选择表如表 3 所示。 6 仿真分析 6.1 多 UUV 协同攻防算法有效性分析 (30,50) 仿真实验是在 Windows10,QT5.6 下进行的。 设计实验参数:红方被保护区域的坐标为 , 仿真水域大小为 1 050 m×1 050 m,表 4 所示为 红、蓝双方 UUV 的初始设置。 表 3 蓝方 UUV 策略选择表 Table 3 Blue UUV strategy table 策略 适用情况 11 向红方基 地运动 UUV处于中、低威胁等级,且蓝方未受到任 务模块威胁且无攻击目标 22 攻击红 方UUV UUV处于中、低威胁等级,有一个或多个目 标,选择威胁程度最大的进行攻击 33 逃逸 UUV处于中、高威胁等级,无攻击能力,蓝 方为保存实力放弃任务,逃逸 表 4 红方 UUV 与蓝方 UUV 初始速度与位姿 Table 4 Initial velocity and pose of red and blue UUVs 参数UUV 初始速度与位姿 红方UUV1 [ ur1, vr1,rr1, xr1, yr1,ψr1 ] = [0.5,0,0,400,200,1.2] 红方UUV2 [ ur2, vr2,rr2, xr2, yr2,ψr2 ] = [0.5,0,0,200,600,−1.2] 红方UUV3 [ ur3, vr3,rr3, xr3, yr3,ψr3 ] = [0.5,0,0,850,300,2] 蓝方UUV [ ub, vb,rb, xb, yb,ψb ] = [1,0,0,900,700,−2.5] 从图 14 中的红方 UUV 威胁评估等级变化曲 线可以看出,红方 UUV 威胁等级始终处于低或 中,说明红方在对抗过程中策略选择适当,红方 始终未陷入危险。 分别分析表 5 中红方 UUV 对蓝方 UUV 发起 的 3 次有效攻击过程。蓝色部分为第 1 次有效攻 击;橙色部分时第 2 次有效攻击,白色部分为最 后 1 次有效攻击。红方多 UUV 从任务(策略)–角 色–行为–运动特性的角度分析,蓝方从态势–策 略–行为–运动特性逻辑流分析: t4 t5 t5 t5 1)红方多 UUV:在 到 过程中红方 UUV1 和 UUV2 已经逐渐逼近蓝方 UUV,此时纵向速度减 小,到达攻击阵位点时,纵向速度最小。作为第 一次进攻的核心攻击 UUV−红方 UUV2 首先 到达阵位点,并发射任务模块,UUV1 随后到达发 射任务模块,对蓝方 UUV 产生威胁。蓝方 UUV: 时刻蓝方 UUV 陷入危险,此时根据表 5 可知, 蓝方 UUV 采取逃逸策略;同时,在图 14、15 中可 以分别看出 时刻蓝方 UUV 推力增大,纵向速度 增大,艏向发生改变执行逃逸动作。可以看出对 抗过程中的第一次正面交锋双方策略选择合理, 多 UUV 角色分配合理,双方运动特性符合所选 策略下的基本行为。 ·354· 智 能 系 统 学 报 第 17 卷
第2期 王宏健,等:非对称博弈下多UUV基地防卫协同对抗策略 ·355· 表5攻防过程红蓝UUV行为与态势 Table 5 Behavior and situation of red and blue UUVs in attack and defense process 红方UUV: 红方UUV 红方UUV3 时间 红方策略红方态势 蓝方UUV蓝方态势 角色 行为 角色 行为 角色 行为 [0,ti) 追踪 追踪 追踪 追踪 追踪 追踪 驱逐 低 向定点 低 UUV UUV UUV 运动 辅助攻 [41,2) 向定点 核心攻 向定点 辅助攻 向定点 向定点 攻击-防卫 击UUV 运动 击UUV 运动 击UUV 运动 低 运动 低 [t2,t3) 辅助攻 向定点 核心攻 向定点 辅助攻 向定点 低 朝UUV3发 攻击-防卫 中 击UUV 运动 击UUV 运动 击UUV 运动 射任务 [t3,t4) 辅助攻 向定点 核心攻 向定点 辅助攻 朝UUV3发 逃逸 攻击-防卫 低 中 击UUV 运动 击UUV 运动 击UUV 射任务 向定点 向定点 ta,ts) 辅助攻 运动、发射 核心攻 运动、发射 辅助攻 逃逸 攻击-防卫 中 模块、向定 中低 击UUV 击UUV 击UUV 任务模块 任务模块 点运动 逃逸、朝 [t,t6) 追踪 追踪 追踪 追踪 追踪 追踪 驱逐 中 UUV3发射 高低 UUV UUV UUV 任务模块 逃逸、朝 [t6,t) 返航 向定点 追踪 追踪 追踪 追踪 驱逐 中 UUV3发射 中低 UUV 运动 UUV UUV 任务模块 返航 向定点 追踪 追踪 17,18) 追踪 逃逸 驱逐 中 逃逸 中低 UUV 运动 UUV UUV [ts,to) 辅助攻 向定点 辅助攻 向定点 核心攻 发射任 击UUV 运动 击UUV 运动 击UUV 务模块 攻击-防卫 低 逃逸 低 [tg,fo) 追踪 追踪 追踪 追踪 追踪 追踪 驱逐 低 逃逸 中低 UUV UUV UUV 核心攻 发射任 辅助攻 [tio,t) 向定点 辅助攻 向定点 击UUV 务模块 攻击-防卫 低 低 击UUV 运动 击UUV 运动 逃逸 [t11,ti2) 追踪 追踪 追踪 追踪 追踪 追踪 驱逐 逃逸 低 UUV UUV UUV [h2,t3) 返航 向定点 追踪 追踪 追踪 追踪 驱逐 低 逃逸 低 UUV 运动 UUV UUV 朝UUV3发 [t3,hha) 返航 向定点 追踪 追踪 追踪 追踪 驱逐 射任务模 高低 UUV 运动 UUV UUV 低 块、逃逸 [ta,tis) 返航 向定点 追踪 追踪 追踪 逃逸 驱逐 低 逃逸 低 UUV 运动 UUV UUV [tis,116) 返航 向定点 追踪 追踪 向定点 追踪 逃逸 驱逐 低 低 UUV 运动 UUV UUV 运动 返航 向定点 追踪 向定点 [t16,t17) 追踪 追踪 运动 追踪 驱逐 低 低 UUV UUV UUV 运动 核心攻 向定点 辅助攻 向定点 辅助攻 向定点 向定点 [t17,t18) 攻击-防卫 击UUV 低 低 运动 击UUV 运动 击UUV 运动 运动 [t1g,-) 追踪 追踪 追踪 追踪 追踪 追踪 驱逐 低 逃逸 高 UUV UUV UUV
表 5 攻防过程红蓝 UUV 行为与态势 Table 5 Behavior and situation of red and blue UUVs in attack and defense process 时间 红方UUV1 红方UUV2 红方UUV3 红方策略 红方态势 蓝方UUV 蓝方态势 角色 行为 角色 行为 角色 行为 [0,t1) 追踪 UUV 追踪 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 低 向定点 运动 低 [t1,t2) 辅助攻 击UUV 向定点 运动 核心攻 击UUV 向定点 运动 辅助攻 击UUV 向定点 运动 攻击–防卫 低 向定点 运动 低 [t2,t3) 辅助攻 击UUV 向定点 运动 核心攻 击UUV 向定点 运动 辅助攻 击UUV 向定点 运动 攻击–防卫 低 朝UUV3发 射任务 中 [t3,t4) 辅助攻 击UUV 向定点 运动 核心攻 击UUV 向定点 运动 辅助攻 击UUV 逃逸 攻击–防卫 低 朝UUV3发 射任务 中 [t4,t5) 辅助攻 击UUV 向定点 运动、发射 任务模块 核心攻 击UUV 向定点 运动、发射 任务模块 辅助攻 击UUV 逃逸 攻击–防卫 中 模块、向定 点运动 中低 [t5,t6) 追踪 UUV 追踪 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 中 逃逸、朝 UUV3发射 任务模块 高低 [t6,t7) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 中 逃逸、朝 UUV3发射 任务模块 中低 [t7,t8) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 逃逸 驱逐 中 逃逸 中低 [t8,t9) 辅助攻 击UUV 向定点 运动 辅助攻 击UUV 向定点 运动 核心攻 击UUV 发射任 务模块 攻击–防卫 低 逃逸 低 [t9,t10) 追踪 UUV 追踪 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 低 逃逸 中低 [t10,t11) 核心攻 击UUV 发射任 务模块 辅助攻 击UUV 向定点 运动 辅助攻 击UUV 向定点 运动 攻击–防卫 低 逃逸 低 [t11,t12) 追踪 UUV 追踪 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 中 逃逸 低 [t12,t13) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 低 逃逸 低 [t13,t14) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 低 朝UUV3发 射任务模 块、逃逸 高低 [t14,t15) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 逃逸 驱逐 低 逃逸 低 [t15,t16) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 逃逸 驱逐 低 向定点 运动 低 [t16,t17) 返航 UUV 向定点 运动 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 低 向定点 运动 低 [t17,t18) 核心攻 击UUV 向定点 运动 辅助攻 击UUV 向定点 运动 辅助攻 击UUV 向定点 运动 攻击–防卫 低 向定点 运动 低 [t18,−) 追踪 UUV 追踪 追踪 UUV 追踪 追踪 UUV 追踪 驱逐 低 逃逸 高 第 2 期 王宏健,等:非对称博弈下多 UUV 基地防卫协同对抗策略 ·355·
·356· 智能系统学报 第17卷 2 一UUVR,期望纵向速度 一UUVR,实际纵向速度 100 200 300 400 500 600 700 800 900 UUVR,期望纵向速度 UUVR2实际纵向速度 0 100 200 300 400 500 600 700 800 900 2 一UUVR,期望纵向速度 1 一UUVR,实际纵向速度 100 200 300 400 5t0 600 700 800 900 2 UUVB期望纵向速度 1 一UUVB实际纵向速度 100 200 300 40 500 600 700 300 900 200 UUVR,期望艏向角 UUVR,实际艏向角 200 100 200 300 40D 600 700 800 900 200 一UUVR2期望向角 0 一UUVR2实际艏向角 -200 100 200 300 40 500 600 700 800 900 200 UUVR,期望艏向角 0 一UUVR,实际艏向角 200 100 200 300 400 50 600 700 800 900 200 UUVB期望艏向角 0 一UUVB实际艏向角 200 100 200 300 400 5D0 600 700 800 900 321 红方威胁评估等级 100 200 300 400 600 700 800 900 4321 蓝方威胁评估等级 100 200 300 400 500400700800 900 仿真时间s 图14红蓝UUV纵向速度与艏向角变化及威胁评估等级 Fig.14 Longitudinal velocity and heading angle of red and blue UUV and threat assessment level 2)红方多UUV:由于经历上一次攻击后,红 胁,但蓝方凭借优于红方的机动能力逃脱。 方UUVs都在蓝方UUV附近,只需要通过调整艏 3)红方UUV:红方UUV采取追踪策略,调整 向即可到达阵位点。UUV,和UUV,在第二次有 艏向,追踪蓝方。由于UUV,进人蓝方探测范围, 效攻击过程中分别承担核心攻击UUV,从图13 被蓝方攻击,在t4时刻UUV,推力增大,纵向速度 中可以看出UUV,和UUV;调整艏向到达阵位 增加,执行逃逸行为。蓝方UUV:由于任务模块 点。从图14可以看出UUV2作为辅助攻击UUV 耗尽,态势评估自动评估为高,为保存实力撤退, 通过推力控制使得其运动始终平稳,承担追踪和 导致任务失败。 辅助攻击角色。蓝方UUV:从表5可以看出红方 6.2多UUV协同攻防算法优越性分析 UUV在此过程中两次向蓝方UUV发射任务模块, 本文的重点和创新点在于多UUV分层决策 导致在t、t时刻蓝方UUV调整艏向逃逸。可以 算法,该算法的核心是多UUV分布式合作,根据 看出红方多UUV策略选择成功,对蓝方产生威 整体的威胁态势切换策略,根据策略要求,按照
0 1 2 0 1 2 0 1 2 0 1 2 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 0 100 200 300 400 500 600 700 800 900 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 t14 t15 t16 t17 t18 UUVR1 期望纵向速度 UUVR1 实际纵向速度 UUVR1 纵向 速度 V/kn UUVR2 纵向 速度 V/kn UUVR3 纵向 速度 V/kn UUVB 纵向 速度 V/kn 艏向角 UUVR1 ω/(°) 艏向角 UUVR2 ω/(°) 艏向角 UUVR3 ω/(°) 艏向角 UUVB ω/(°) 仿真时间 t/s UUVR1 期望艏向角 UUVR1 实际艏向角 UUVR2 期望艏向角 UUVR2 实际艏向角 UUVR3 期望艏向角 UUVR3 实际艏向角 UUVB 期望艏向角 UUVB 实际艏向角 红方威胁评估等级 蓝方威胁评估等级 UUVR2 期望纵向速度 UUVR2 实际纵向速度 UUVR3 期望纵向速度 UUVR3 实际纵向速度 UUVB 期望纵向速度 UUVB 实际纵向速度 −200 0 200 −200 0 200 −200 0 200 −200 0 200 0 1 2 3 4 0 1 2 3 4 红方威胁 评估等级 蓝方威胁 评估等级 图 14 红蓝 UUV 纵向速度与艏向角变化及威胁评估等级 Fig. 14 Longitudinal velocity and heading angle of red and blue UUV and threat assessment level t9 t13 2)红方多 UUV:由于经历上一次攻击后,红 方 UUVs 都在蓝方 UUV 附近,只需要通过调整艏 向即可到达阵位点。UUV1 和 UUV3 在第二次有 效攻击过程中分别承担核心攻击 UUV,从图 13 中可以看出 UUV1 和 UUV3 调整艏向到达阵位 点。从图 14 可以看出 UUV2 作为辅助攻击 UUV 通过推力控制使得其运动始终平稳,承担追踪和 辅助攻击角色。蓝方 UUV:从表 5 可以看出红方 UUV 在此过程中两次向蓝方 UUV 发射任务模块, 导致在 、 时刻蓝方 UUV 调整艏向逃逸。可以 看出红方多 UUV 策略选择成功,对蓝方产生威 胁,但蓝方凭借优于红方的机动能力逃脱。 t14 3)红方 UUV:红方 UUV 采取追踪策略,调整 艏向,追踪蓝方。由于 UUV3 进入蓝方探测范围, 被蓝方攻击,在 时刻 UUV3 推力增大,纵向速度 增加,执行逃逸行为。蓝方 UUV:由于任务模块 耗尽,态势评估自动评估为高,为保存实力撤退, 导致任务失败。 6.2 多 UUV 协同攻防算法优越性分析 本文的重点和创新点在于多 UUV 分层决策 算法,该算法的核心是多 UUV 分布式合作,根据 整体的威胁态势切换策略,根据策略要求,按照 ·356· 智 能 系 统 学 报 第 17 卷
第2期 王宏健,等:非对称博弈下多UUV基地防卫协同对抗策略 ·357· 各自角色选择行为。针对多UUV的行为选择, 往的基于编队的多智能体协同,而是根据对抗环 为了避免冲突,设计基于任务优先级的行为选择 境提出蓝方对抗策略和红方多UUV动态角色分 算法。如图16所示为未设计优先级的多UUV攻 配方法,利用角色分工与任务优先级法对红方 防对抗仿真,由于红方多UUVs在事先未设计优 UUV群体进行协调。在研究中,考虑实际对抗情 先级,如左图UUV2和UUV,同时选择同一个策 形,基于蓝方UUV航向偏角的大小提出红方多 略点前进,导致距离过近来不及躲避,使得执行 UUV联合对抗策略,提高红方UUV作战效能。 任务时产生冲突,最终导致任务失败。 通过设计仿真实验验证了本文所提角色分配方法 10 和红蓝双方策略设计的合理性,完成“以弱胜强, 0 以多敌寡”的多UUV水下攻防对抗过程。 -1 0 100200300400500.600700800900 参考文献: 仿真时间s (a)UUVR推力F 10r []陈强.水下无人航行器[M.北京:国防工业出版社, 0 2014:1-2. CHEN Qiang.Unmanned underwater vehicle[M]. 0 100200300400500600700800900 仿真时间s Beijing:National Defense Industry Press,2014:1-2. (b)UUVR,推力F WILLCOX S,GOLDBERG D.VAGANAY J.et al. 20 [2] 0 Multi-vehicle cooperative navigation and autonomy with the bluefin CADRE system[Cl//Proceedings of IFAC (In- 0100200300400500600700800900 ternational Federation of Automatic Control)Conference 仿真时间s (c)UUVR,推力F [S.1],2006:20-22 [3]LI Ning,CURUKLU B,BASTOS J,et al.A probabilistic and highly efficient topology control algorithm for under- 0100200300400500600700800900 water cooperating AUV networks[J].Sensors,2017, 仿真时间s (d)UUVB推力F 17(5):1022 [4]GAO Zhenyu,GUO Ge.Fixed-time leader-follower 图15红蓝方UUV推力 Fig.15 UUV thrust formation control of autonomous underwater vehicles with event-triggered intermittent communications[J]. EEE access,,2018,6:27902-27911. [5]YAN Zheping,XU Da,CHEN Tao,et al.Leader-follow- er formation control of UUVs with model uncertainties, current disturbances,and unstable communication[J]. Sensors,2018,18(2):662. [6] 魏娜,刘明雍,张帅,等.基于协同对抗的水下博弈策略 优化.西北工业大学学报,2019,37:63-69. 图16多UUV对抗冲突 WEI Na,LIU Mingyong,ZHANG Shuai,et al.Optimiz- Fig.16 UUV conflict behavior ing underwater game strategy based on cooperative con- 7结束语 frontation[J].Journal of Northwestern Polytechnical Uni- versity,2019,37:63-69. 本文主要研究水下多UUV协同对抗策略选 [7]邓鹏,李伟,王新华.水下无人平台“蜂群”作战体系研 择问题,设计以保护基地为背景的水下UUV“多 究.兵器装备工程学报,2018,39(8):8-10, 对一”攻防对抗仿真实验。本研究与以往多 DENG Peng,LI Wei,WANG Xinhua.Research on battle UUV对抗问题研究的不同点在于,不是仅研究 system of "swarm"of underwater unmanned veicle UUV的机动围捕问题,而是研究集成具有打击能 (UUV)[J].Journal of ordnance equipment engineering, 力任务载荷的UUV的对抗问题;与以往研究具 2018.39(8):8-10. 有打击能力无人平台对抗的不同在于,设计了对 [8]冯卉,毛红保,吴天爱.侦察打击一体化无人机关键技 抗双方机动能力和打击能力的差异性。不同于以 术及其发展趋势分析.飞航导弹,2014(3:4246
各自角色选择行为。针对多 UUV 的行为选择, 为了避免冲突,设计基于任务优先级的行为选择 算法。如图 16 所示为未设计优先级的多 UUV 攻 防对抗仿真,由于红方多 UUVs 在事先未设计优 先级,如左图 UUV2 和 UUV3 同时选择同一个策 略点前进,导致距离过近来不及躲避,使得执行 任务时产生冲突,最终导致任务失败。 10 0 0 100 200 300 400 500 600 700 800 900 −10 仿真时间 t/s UUVR1 推力 F/N UUVR2 推力 F/N UUVR3 推力 F/N UUVB 推力 F/N 10 0 0 100 200 300 400 500 600 700 800 900 −10 仿真时间 t/s 20 0 0 100 200 300 400 500 600 700 800 900 −20 仿真时间 t/s 15 10 0 100 200 300 400 500 600 700 800 900 5 仿真时间 t/s (a) UUVR1 推力 F (b) UUVR2 推力 F (c) UUVR3 推力 F (d) UUVB 推力 F 图 15 红蓝方 UUV 推力 Fig. 15 UUV thrust Ⅰ Ⅰ Ⅱ Ⅱ Ⅲ Ⅲ 图 16 多 UUV 对抗冲突 Fig. 16 UUV conflict behavior 7 结束语 本文主要研究水下多 UUV 协同对抗策略选 择问题,设计以保护基地为背景的水下 UUV“多 对 一 ” 攻防对抗仿真实验。本研究与以往 多 UUV 对抗问题研究的不同点在于,不是仅研究 UUV 的机动围捕问题,而是研究集成具有打击能 力任务载荷的 UUV 的对抗问题;与以往研究具 有打击能力无人平台对抗的不同在于,设计了对 抗双方机动能力和打击能力的差异性。不同于以 往的基于编队的多智能体协同,而是根据对抗环 境提出蓝方对抗策略和红方多 UUV 动态角色分 配方法,利用角色分工与任务优先级法对红方 UUV 群体进行协调。在研究中,考虑实际对抗情 形,基于蓝方 UUV 航向偏角的大小提出红方多 UUV 联合对抗策略,提高红方 UUV 作战效能。 通过设计仿真实验验证了本文所提角色分配方法 和红蓝双方策略设计的合理性,完成“以弱胜强, 以多敌寡”的多 UUV 水下攻防对抗过程。 参考文献: 陈强. 水下无人航行器 [M]. 北京: 国防工业出版社, 2014: 1−2. CHEN Qiang. Unmanned underwater vehicle[M]. Beijing: National Defense Industry Press, 2014: 1−2. [1] WILLCOX S, GOLDBERG D, VAGANAY J, et al. Multi-vehicle cooperative navigation and autonomy with the bluefin CADRE system[C]//Proceedings of IFAC (International Federation of Automatic Control) Conference. [S.l.],2006: 20−22. [2] LI Ning, CÜRÜKLÜ B, BASTOS J, et al. A probabilistic and highly efficient topology control algorithm for underwater cooperating AUV networks[J]. Sensors, 2017, 17(5): 1022. [3] GAO Zhenyu, GUO Ge. Fixed-time leader-follower formation control of autonomous underwater vehicles with event-triggered intermittent communications[J]. IEEE access, 2018, 6: 27902–27911. [4] YAN Zheping, XU Da, CHEN Tao, et al. Leader-follower formation control of UUVs with model uncertainties, current disturbances, and unstable communication[J]. Sensors, 2018, 18(2): 662. [5] 魏娜, 刘明雍, 张帅, 等. 基于协同对抗的水下博弈策略 优化 [J]. 西北工业大学学报, 2019, 37: 63–69. WEI Na, LIU Mingyong, ZHANG Shuai, et al. Optimizing underwater game strategy based on cooperative confrontation[J]. Journal of Northwestern Polytechnical University, 2019, 37: 63–69. [6] 邓鹏, 李伟, 王新华. 水下无人平台“蜂群”作战体系研 究 [J]. 兵器装备工程学报, 2018, 39(8): 8–10. DENG Peng, LI Wei, WANG Xinhua. Research on battle system of “swarm” of underwater unmanned veicle (UUV)[J]. Journal of ordnance equipment engineering, 2018, 39(8): 8–10. [7] 冯卉, 毛红保, 吴天爱. 侦察打击一体化无人机关键技 术及其发展趋势分析 [J]. 飞航导弹, 2014(3): 42–46. [8] 第 2 期 王宏健,等:非对称博弈下多 UUV 基地防卫协同对抗策略 ·357·