第36卷第9期 北京科技大学学报 Vol.36 No.9 2014年9月 Journal of University of Science and Technology Beijing Sep.2014 多Agent联合灭火救援作战仿真 刘 静)四,程桦2) 1)中国人民武装警察部队学院消防指挥系,廊坊0650002)安徽大学资源与环境工程学院,合肥230039 ☒通信作者,E-mail:1jamy@163.com 摘要将多Agent理论和技术应用于联合灭火救援作战的研究,构建了多Agent联合灭火救授作战模型框架,实现了联合 灭火救援组织指挥相互之间的信息交换,显示了互相影响的行动过程.对系统中指挥Agent、.作战Agent和环境Agent进行描 述,定义Agent之间以及Agent-与环境之间的交互规则,来描述系统的相互关系,给出了多Agent的协同算法,并构建了联合灭 火救援仿真模型.最后用多Agnt软件工具集和通用软件平台(SWARM),采用JAVA语言编程,进行了模拟仿真,对文中构造 的模型及相应机制进行了功能验证. 关键词多Agent系统;灭火;救援作战;仿真方法 分类号X932 Simulation of multi-agent joint firefighting and rescue operation LIU Jing,CHENG Hua?) 1)College of Fire Command,Chinese Peoples Armed Police Force Academy,Langfang065000,China 2)School of Resources and Environmental Engineering,Anhui University,Hefei 230039,China Corresponding author,E-mail:1_j_amy@163.com ABSTRACT A framework of multi-agent joint firefighting and rescue operation was proposed by applying the multi-agent theory and technology to studies on joint firefighting and rescue operation.It can realize information exchange between the commanders and display the interacted course of operation.Based on the description of command agent,operation agent and environment agent in the system, interaction rules between the agents and between the agent and environment were defined to describe the system's interrelation,a multi-agent coordination algorithm was given,and a joint firefighting and rescue simulation model was built.At last,a simulation is made on SWARM software to validate the proposed model. KEY WORDS multi-agent systems;firefighting;rescue operation;simulation method Agent概念源于人们对于人工智能的认识,人 性智能[3].正是由于Agent和多Agent系统具有 工智能的最终目标就是要实现具有智能的、能够 对人类社会系统自然的描述能力,因此采用多 代替人来处理事务的“代理”?.对于所要研究的 Agent的方法进行联合灭火救援组织指挥的研究 系统和现象,多Agent系统建模首先定义单个 是可行的 Agent,赋予Agent一定的行为和参数.然后,为了 本文构造了一个联合灭火救援的多Agent系 模拟所要刻画的问题和现象,就要定义Agent之间 统.该系统由多个Agent组成,Agent间按照联合灭 以及Agent与环境之间的交互规则,来描述系统的 火救援组织指挥机制进行相互之间的信息交换与协 相互关系[2).由多个Agent组成的多Agent系统具 作,互相影响彼此的行动过程,即构建一个由多个 有其特有的灵活性和适应性,适合开放、动态的计 Agent组成的联合灭火救援模型,我们称之为联合 算环境,因此能够有效地体现类似于人类的社会 灭火救援多Agent系统的整体模型. 收稿日期:2013-04-28 基金项目:“十一五”国家科技支撑计划“典型社会公共场所突发事件应急处置关键技术研究”资助项目(2006BAK06B05-2) DOI:10.13374/j.issn1001-053x.2014.09.019;http://joumals.ustb.edu.cn
第 卷 第 期 北 京 科 技 大 学 学 报 丨 年 月 多 联合 灭火救 援 作 战 仿真 刘 静 , 程 桦 中 国 人 民武装 窨察部队 学 院 消 防指挥系 , 廊坊 安 徽大学资源与 环境工程学 院 , 合肥 通 信作者 , 摘 要 将 多 理论 和技术应用 于联合 灭火救援作 战 的 研究 , 构建 了 多 联 合灭火 救援作 战模 型框 架 实 现 了联合 灭 火救援组织 指挥相互 之间 的信 息交换 , 显示 了 互相影 响 的 行动过 程 对 系 统中 指挥 、 作 战 和 环 境 进行描 述 定义 之间 以及 与环境之间 的 交互规则 , 来描述系 统 的相互关系 给 出 了 多 的 协同算法 并 构建了 联合灭 火救援仿真模 型 最后用多 软件 工具集和通用 软件平 台 ( 采用 语言编程 进行 了 模拟仿真 对文 中 构造 的 模型及相应机制进 行了 功能验证 关键词 多 系统 ; 灭火 ; 救援作 战; 仿真方法 分类号 ’ 闻 : ’ , , ; ; 概念源 于人们 对 于人 工智 能 的认 识 人 性智 能 正是 由 于 和 多 系 统 具有 工 智 能 的 最 终 目 标 就是要 实 现具有 智 能 的 、 能 够 对人类 社 会 系 统 自 然 的 描 述 能 力 , 因 此 采 用 多 代 替人来处 理事务 的 “ 代 理” 对于 所要 研究 的 的 方法 进行联合灭 火救 援组织 指 挥 的 研究 系 统 和 现 象 , 多 系 统 建 模 首 先 定 义 单 个 是 可行的 , 赋予 —定 的 行为 和参 数 然后 , 为 了 本文 构造 了 一 个 联合灭 火救援 的 多 系 模 拟所要刻 画 的 问 题和 现象 , 就要定 义 之 间 统 该系 统 由 多个 组成 , 间 按 照联合灭 以 及 与 环境之 间 的 交互规则 , 来 描述系 统 的 火救援组织指 挥机制 进行相互之间 的 信息 交换与协 相互 关系 由 多个 组 成的 多 系统 具 作 互相影响 彼此 的 行动 过程 , 即 构 建 一个 由 多 个 有其 特有 的 灵活 性和 适应性 适合开放 、 动 态的 计 组成 的 联合灭 火救 援模型 我 们 称之为 联合 算环 境, 因 此 能 够有 效地 体 现类似 于 人类 的 社会 灭火救援多 系统的整体模型 收稿 日 期 : 基金项 目 : “ 十 一 五 ” 国家科技支撑计 划 “ 典型社会公共场所 突发 事件应 急处置关键技术 研究 ” 资助 项 目 ( : ;
第9期 刘静等:多Agent联合灭火救援作战仿真 ·1261· 1多Agent联合灭火救援作战模型框架 max(C)=C(E,R,A). (3) 2系统主要Agent模型 联合灭火救援系统由多个Agent组成,每个 Agent可以认为是一个虚拟指挥员或基本作战单 2.1指挥Agent 元,每个Agent被赋予一定的作战目标、相应的作战 指挥Agent中具有相应的指挥范围和指挥控制 规则和资源.将多Agent联合灭火救援作战模型用 规则,主要行为模式有接收上级下达的作战行动命 一个四元组来定义: 令和指示,向上级汇报作战行动进展情况和清求力 . 量增援,并与同级指挥Agent交流信息等.指挥 其中,REM为救援环境模型,RC为指挥Agent,RA Agent模型如图1所示. 为作战Agent,.INAC为Agent之间的交互关系.它 环境及其他 们共同组成了多Agent作战模型的基本结构. Agent 数据库 定义E、R和A为有限集合,E为联合灭火救援 环境空间集合,R为指挥Agent集合,A为作战Agent 通信模块 数据库接口 集合,INAC为Agent之间的交互关系.它们共同组 突发情况 信息感知 成了多Agent作战模型的基本结构.这样就建立了 行动 联合灭火救援作战的多Agent系统,E×R×A即为 决策模块 规划模块 联合灭火救援作战系统空间.将对应的问题定义为 指挥规则 Q,Q为E、R和A的函数,可表示为 控制模块 Q=(E,R,A). (1) 图1指挥Agent模型 式中, Fig.1 Model of a command agent E={E1,E2,…,E},R={R1,R2,…,Rg}, A={A1,A2,…,Ay}. 由图1可知:指挥Agent首先获取外部环境情 救援环境空间包含α个元素的子集,指挥 况,这一过程是通过信息感知模块经由信息模块完 Agent空间包含B个元素的子集,作战Agent空间包 成的,在非紧急情况下,经过决策模块,由决策模块 含y个元素的子集.在联合灭火救援多Agent系统 调用规划模块对感知到的获取的信息进行分析、判 中各空间集合在系统运行时都是一个信息处理函 断并做出决策,分析和决策结果传递到控制模块,由 数,E、R和A在作战指挥中相互影响,通过不断改 控制模块来做出响应,产生行动.其中,规划模块中 变自身的状态而生成动作执行结果.联合灭火救援 的推理分析模块进行救援力量调集,突发情况下,直 环境集合不断受到指挥机构和作战Agent信息处理 接根据规则做出反应. 函数的作用改变救援环境状态空间;同样,指挥机构 (I)通信模块.具有通信能力是Agent的基本 和作战Aget也会由于救援环境信息处理函数的不 特征之一[),只有具有可靠的通信,各种信息才能 断变化,调整内部的参数和状态,以适应动态的作战 够及时传达到指挥部,指挥者才能够迅速做出正确 态势.因此对于联合灭火救援多Agent问题我们将 的判断和决策[5-6];只有具有可靠的通信,指挥者的 做以重新描述: 命令才能准确迅速的传递到所属部队,使部队按照 Q=(E,R,A,C). (2) 上级命令实施战斗行动,保证联合灭火救援行动高 式中,C={C,C2,…,CE},Ck:E×R×A→P(k=1, 效和有序.Agent的智能型一个重要的指标就是通 2,…,) 信语言的完善度和灵活性[].指挥Agent模型中的 这里C定义为一个二阶函数,这里的E×R×A 通信模块主要包括各种语言辨识知识库(语法库、 为函数空间,P为实数空间,×表示笛卡儿乘积.C: 语义库等)、语言理解、语言生成、物理通信等多个 即为E×R×A到P的映射.这样Agent自身的行为 部分[8-】 处理结果用Q函数进行度量,从而实现了其形式化 指挥Agent通过语言辨识知识库对通信语言进 的描述。 行理解,通过对数据库中信息类别的对比,确定信息 因此,联合灭火救援作战系统中多Agent问题 所属类别,进而决定信息传送的位置,即应该到哪个 就转化为如下行为动作函数,即:当给定E、R和A, 单元,或者供哪个功能模块使用,最后抽取其中与相 采取何种作战方式和战术措施,使C满足下式: 应模块对应的有价值的信息进行传送
第 期 刘 静等 : 多 联合 灭 火救援作战仿真 多 联合灭火救援作 战模型框架 ■ 联合 灭 火 救援 系 统 由 多 个 组 成 , 每 个 可 以 认 为 是 一 个虚 拟指 挥 员 或 基本 作 战 单 指挥 元 每个 被赋予一定的 作 战 目 标 、 相 应 的 作 战 指挥 中 具有相应的 指挥范围 和指 挥控制 规则 和资源 将多 联合灭火救援 作战模 型 用 规则 主要行为模式有 接收 上 级下 达 的作战 行动命 一 个 四元组来定义 : 令和指示 , 向 上级汇报 作战行 动进展情况和 请求力 量增 援 , 并 与 同 级 指 挥 交 流 信息 等 指 挥 其中 为 救援环 境模 型 , 为 指 挥 , 模型如 图 所示 为作 战 , 为 之 间 的 交互 关系 它 矹播 巩 甘 讹 环境及 其他 们共同组成了 多 作战模型的 基本结构 数据库 定义 £ 、 和 为有 限集合 £; 为联合灭火救 援 丨 环境空 间 集合 为指 挥 集合 , 为作战 通 言 模块 库接 口 集合 为 之间 的 交互关系 它们共 同 组 士 丨 孪 发情况 “ ! 成 了 多 作战模型 的 基本结构 这样就建立 了 动 联合灭火救援作 战 的 多 系 统 £: 即 为 决策模块 联合灭火救援作战 系 统空间 将对应 的 问 题定义 为 规划模块 ! 化 为 £ 、 和 的 函数 , 可 表示为 控制模块 , 巾 图 指挥 模型 ‘ , 由 图 可知 : 指 挥 首 先获取外部 环境情 救援 环 境 空 间 包 含 个 元 素 的 子 集 , 指 挥 况 这一 过程是通过信息 感知 模块经 由 信 息模块完 空间 包含 ; 个元素 的 子集 作战 空间 包 成的 在非 紧急情况 下 经过决策模块 , 由 决策 模块 含 个元素 的 子集 在 联合灭 火救援多 系 统 调 用规划 模块对感 知到 的 获 取 的 信息 进行分析 、 判 中各空 间 集合在 系 统运行 时都是一 个信息 处 理函 断并做出 决策 , 分析和决策结果传递到控制模块 , 由 数 , £ 、 和 在作 战 指 挥 中 相互影 响 通过 不 断改 控制模块来做出 响 应 产生行动 其中 规划模块 中 变 自 身 的状态而生成动作 执行 结果 联合灭火 救援 的 推理分析模 块进行救援力量调集 , 突发情况下 直 环境集合不断受 到指挥机构和 作战 信息 处理 接根据规则做出 反应 函 数的 作用改变救援环境状态 空 间 ; 同 样 指挥机构 ( 通信模块 具有 通信能 力 是 的 基本 和作 战 也会由 于救援环境信息 处理 函数 的 不 特征之一 ⑷ 只有具有 可靠 的通 信 , 各种 信息 才能 断变化 调整 内 部 的参数和状态 , 以适应动态 的作 战 够及时传达到 指挥部 指 挥者 才能够迅 速做出 正确 态势 因此对于联合灭火救援 多 问 题我 们将 的判断和决策 — ; 只有具有可靠 的通信 , 指 挥者 的 做以 重新描述 : 命令才能准确 迅速 的 传递 到所 属部 队 使 部 队按照 上 级命令实施战斗 行动 保证联合灭火 救援行动 高 式中 ’ … ’ : , 效和有 序 的 智 能 型 一 个重要 的 指标就是通 信语言的 完善度和 灵活性 指 挥 模型 中 的 这里 定 义为一 个二阶 函 数 , 这 里的 通信模块 主要包括各种 语言 辨识 知 识库 ( 语 法库 、 为函 数空 间 , 为实数空 间 , 表示 笛卡 儿乘积 语义库等 ) 、 语言 理解 、 语言生 成 、 物 理通信等 多 个 即 为 到 尸 的 映射 这样 自 身的 行为 部分 “ 处理结果用 函 数进行度量 从 而实现 了 其形 式化 指挥 通过语言辨识知 识库对通 信语言进 的 描述 行理解 通过对数据 库 中信息类别 的 对 比 , 确 定信息 因此 , 联合灭 火 救援作 战 系统 中 多 问 题 所属 类别 进而决定信息传送的位置 即应该到 哪个 就转化为如下行为 动 作函 数, 即 : 当 给定 五 、 及 和 , 单元 , 或者供哪 个功 能模块使用 最后抽取其 中 与相 采取何种作战 方式和 战术 措施 , 使 满足 下式 : 应模块对应 的 有价值 的信息进行传送
·1262 北京科。技大学学报 第36卷 (2)指挥规则.指挥规则是在组织救援行动过 合同网协议.多Agent指挥关系链的开始形成前要 程中所遵循的具体的、基本的原则和规范!,对联 有一个发起Agent作为指挥关系链中最上端的 合灭火救援行动具有长期的、稳定的适用性.在联 Agent.当一个Agent发现自己不能或不适合完成某 合灭火救援中遵循如下原则:(I)时间距离最短; 个任务时,首先把任务进行分解,把分解后的子任务 (Ⅱ)同一行政区优先;(Ⅲ)类型适应;(V)战斗编 采用合同网协议进行招标;接到标书的各作战Agent 成等级优先;(V)力量调集比例限定. 根据自身的能力和意愿,进行投标;指挥Agent对投 (3)规划模块.规划模块是指挥Agent的核心 标的作战Agent的能力进行评估,选择适合的作战 模块,也是整个联合灭火救援系统的关键.此模块 Agent作为自己指挥链中的直接下级,同时中标的 主要职责是在灾害事故发生时,确定要调集哪个资 作战Agent把招标的Agent作为自己指挥链中的 源点的力量更为合理,各救援点在此次作战行动中 上级. 所处的优先级,在确定出的救援点中,应该调集哪些 在向作战Agent分配作战任务时应遵从以下原 人员,何种装备器材和资源参与作战,这些力量出动 则:(1)“火场主要方面”原则.首先应将兵力分配 的时间,集结的地点,选择的行车路径,以及进入现 给火场主要方面,且优先分配给作战能力最强的 场时的位置.这一系列的问题都是由规划模型来完 Agent..(2)“到达救援现场时间最少”原则.根据消 成,由于问题具有不可跨越,满足条件不唯一,因此 防部队执勤战斗条令要求,必须按照消防部队五个 是多阶段多目标的复合模型 “第一”,即“第一时间调集足够警力和有效装备,第 2.2作战Agent 一时间到场展开,第一时间实施救人,第一时间进行 作战Agent是信念(belief)、意图(desire)、目标 排烟降毒,第一时间控制灾情发展,最大限度地减少 (intention)即BDI解释模型.信念、愿望和意图被当 损失和危害”的要求,组织实施灭火与应急救援行 作Agent基本的思维属性,作战Agent中的BDI模 动.(3)“救援人员安全第一”原则.尽量避免灭火 型描述了思维属性及其各属性之间的相互关联,以 救援人员和装备受到高温、辐射、爆炸、倒塌和中毒 及各行为的关系 的伤害.(4)“多种因素兼顾”原则.在前三条原则 信念是对当前状况的认知,根据自身对周围环 无法同时满足的情况下,应兼顾各原则,这是个多目 境的了解和认识对所要达到的期望效果采取的行为 标优化问题.(5)“战勒人员决策优先”原则.无论 有一个大致的估计.愿望是对未来状况的偏好.愿 何时,保证战勤人员的决策比计算机优先级高,战勤 望表现的是对未来可能出现的状况和可能采取的行 人员可以随时干预与更改计算机给出的火力分配 为的喜好,所描述的愿望不一定是可实现的.愿望 方案. 中包括Agent的目标,目标是从愿望中选择的可实 2.4.1术语和约定 现的子集.但是由于受到资源和环境的限制,不可 A:包含m个作战Agent的集合.A={a1,a2, 能所有的目标都能够实现,选择某个目标或者目标 …,am,其中m为参加战斗的作战Agent个数. 集并采取具体行动的承诺就形成了意图.意图是对 A:符合任务t,要求的备选的作战Agent集合 未来的意向.意图是已经选定的目标集以及确定的 t∈T,ACA. 相对应的处理状态,是对Agent行为的引导和监督. Agent a,:长期任务组所对应的作战Agent.. 2.3救援环境Agent Agent c:上一级Agent 在实际作战仿真应用中,通常将环境建模纳入 c:Agent a,(a,∈A,1≤j≤m)完成任务t,所付 战术建模的范畴).环境建模中,应对地理环境、 出的代价. 气象环境、水源环境、特殊环境等进行定性定量描述 Ha:权重,表明Agent a完成任务子任务的权 和建模.一个完整的救援现场环境包括地理环境、 重,表明子任务组合效益,a∈A,1≤≤n. 气象条件、水源条件以及其他特殊环境等方面2] L:正式组. 本文在建立模型时把这些因素综合起来,用一个环 L:长期任务组列表 境系数来表示.环境系数越大,代表该救援环境的 N,:Agent a完成任务的能力,其中H1≤j≤m. 灾害程度越高,并且这个环境系数将直接影响到救 N,(t):Agent s,在t时刻所具有的作战能力,其 援活动的持续时间,即救援效率 中s,为前任任务和后续任务与当前任务t,共同占用 2.4多Agent协作算法 作战Agent,y∈S,S为前任任务和后续任务与当前 多Agent联合灭火救援指挥关系链的形成采用 任务共同占用作战Agent集合
? 1 2 6 2 ? 北 京 科 技 大 学 学 报 第 卷 指挥规则 指挥规则 是 在组织救援行动 过 合同 网协议 多 指 挥关系链 的 开始 形成前要 程 中 所遵循 的 具体的 、 基本 的 原则 和 规范 对 联 有一 个 发 起 作 为 指 挥 关 系 链 中 最 上 端 的 合灭火救援行动具 有 长期 的 、 稳 定 的 适 用性 在 联 当 一 个 发 现 自 己 不能 或不适合完成某 合灭火救援 中 遵循如 下原 则 : ( 时 间 距离 最短 ; 个任务时 , 首先把任务进行分解 把分解后 的 子任务 同 一 行政区优先 ; ( 类型适应 ; ( 战斗 编 采用 合同 网协议进 行招 标 ; 接到标书 的 各作 战 成等级优先 ( 力 量调集 比例 限定 根据 自 身 的能 力 和意愿 , 进行投标 ; 指挥 对投 规划模块 规划 模块是指挥 的 核心 标的作 战 的 能 力 进 行评估 , 选择适合 的 作 战 模块 , 也是 整个联合灭火救援 系 统 的 关键 此模块 作为 自 己 指 挥 链 中 的 直 接下 级, 同 时 中 标 的 主要职责是在 灾害事 故发生 时 , 确定 要调 集哪个资 作战 把 招 标 的 作 为 自 己 指 挥链 中 的 源点 的 力 量更为合理 各救援点 在此次作战 行动 中 上级 所处的 优先级 , 在确定 出 的 救援点 中 , 应该调集哪些 在向 作战 分配作战 任务时 应遵 从 以 下原 人员 , 何种装备器材和 资源参与作 战 , 这 些力量 出动 贝 “ 火 场主 要方 面” 原则 首 先应将 兵力 分配 的 时间 , 集结的 地点 , 选择的 行车路径 ’ 以 及进人现 给火场主 要方 面 且优先 分配 给 作 战 能力 最 强 的 场 时 的 位置 这 一 系 列 的 问题都是 由 规划模型 来完 “ 到达救援现场时 间 最少” 原则 根据消 成 , 由 于问 题具有不 可跨越 , 满足条件不 唯 一 ’ 因 此 防部 队执勤战 斗条令要 求 必须按照 消 防部 队 五个 是多阶段多 目 标的复合模型 “ 第 一 ” , 即 “ 第 一 时 间 调集 足够警力 和有效装 备 , 第 作战 — 时 间 到场展开 第 一 时间 实施救人 第一 时 间进行 作战 是信念 ( 、 意 图 ( 、 目 标 排烟 降毒 , 第 一 时 间 控制 灾情发 展 , 最 大限度地减少 即 解释模型 信念 、 愿 望和意 图被当 损失 和危害 ” 的 要 求 , 组织 实 施灭 火 与 应急 救援行 作 基 本 的 思 维 属 性 作 战 中 的 模 动 ( “ 救援人员 安 全第 一 ” 原则 尽量 避免灭火 型描述了 思维属性及 其各属 性之间 的 相 互关联 , 以 救援人员 和装备受 到 高温 、 辐射 、 爆炸 、 倒 塌 和 中 毒 及各行为 的 关系 的伤害 ( “ 多种 因 素 兼顾” 原则 在前 三 条原则 信念是 对 当 前状况 的认知 根 据 自 身 对周 围 环 无法 同 时满足 的情况下 , 应兼顾各原则 , 这是个多 目 境 的 了 解和认识对所要达到 的期 望效果采取 的行为 标优化问 题 ( “ 战 勤人 员 决策优先 ” 原 则 无论 有 一 个大致的 估计 愿 望是对未 来状况 的偏好 愿 何 时 保证战 勤人员 的 决策 比计算 机优先级高 战勤 望表现 的 是对未来可 能 出 现的状况 和可能采取的 行 人员 可 以 随时 干 预 与 更改 计算 机给 出 的 火 力 分配 为 的喜好 , 所描 述 的愿 望不 一 定 是 可实 现 的 愿 望 方案 中 包括 的 目 标 , 目 标是从愿望 中选择 的 可 实 术语和 约定 现的 子集 但是 由 于受 到 资 源 和环境 的 限制 , 不可 七 包含 个 作 战 的 集合 能所有的 目 标都能 够实现 选择某个 目 标或者 目 标 … , 其中 为参加 战斗 的作战 个数 集并采取具体行动 的 承诺就形成了 意 图 意 图 是对 符合任务 要求 的 备选的 作 战 集合 未来 的 意向 意 图 是已 经选定的 目 标集 以及确 定的 儿 相对应的处理状态 , 是对 行为 的 引 导 和监督 : 长期任 务组所对应的 作战 救援环境 : 上一 级 在实际作战仿真应用 中 , 通 常将环境建模纳入 忘 完 成任 务 所付 战 术建模的 范畴 环境 建模 中 , 应对 地理环 境 、 出 的 代 价 气象环境 、 水源环 境 、 特殊环境等 进行定性定 量描述 : 权重 , 表 明 完 成任 务子 任 务 的权 和 建模 一 个完整 的 救 援现场环 境 包括地理环境 、 重 , 表明 子任 务组合效益 , 气象条件 、 水源 条件 以 及其他特殊环境 等方 面 正式组 本文在建立模型 时把这 些 因 素 综合起来 , 用 一 个环 : 长期任务组列表 境 系 数来表示 环 境 系 数越 大 代表该救 援环境的 完 成任务的 能力 其 中 矣 矣 灾害 程度越高 并且这个环境 系数将直接影 响到 救 ⑴ : 在 时 刻所具有 的 作 战能力 , 其 援活 动 的 持续 时间 , 即 救援效率 中 为 任任务和后续 任务 与 当 前任务 共 同 占用 多 协作算法 作战 。 , 为 前任任务 和后 续 任务 与 当 前 多 联合灭火救援指 挥关系 链 的 形 成采 用 任务共 同 占 用 作战 集合
第9期 刘静等:多Agent联合灭火救援作战仿真 ·1263· P:Agent a,潜在任务组全部个数 作战能力和资源要大于等于该任务所要求的力量总 Q,:任务1,潜在任务分配组集合,k为潜在任务 数,否则任务将无法完成. 分配所对应的Agent.. 2.4.2任务优化分配算法 qa:Agent a完成任务g,的潜在任务组 上级Agent分配任务的原则是:在能够完成任 SC:作战付出的代价值表. 务的前提下,以最小的作战代价和消耗获取最大的 T:需要完成的子任务集合.T={t,2,…,tn}, 作战效果.算法如下. °=TU心.其中⑦表示一虚拟任务,代表任务队列 (1)作战Agent a,(a;∈A,1≤j≤m)向上一级 中的开始节点和终止节点,由于虚拟任务☑没有执 指挥Agent c公布所能完成的任务集T,T,ST. 行的过程,因此开始执行时间为0,占用时间也为0 (2)作战Agent将自身的完成任务的能力上报 W:权重最大的潜在任务组ga为Agent争取的 给上级指挥Agent c.完成任务的能力为N,= 利益 {k41,k,2,…,knn},1≤j≤m,如果子任务t,有 女h:当同时有两个任务,和,都要和作战 Agent a,进行合作,且两个任务的执行顺序相接,即 5=T并且立,≥1,k为任务所对应的序号, i=1 紧跟在,之后执行,则=1,否则2=0.其 转(3),否则退出算法 中t,,e7°.所有未定义的值都为0. (3)α,给出T中完成所有子任务所付出的代价 Hn:H。=∑er c(1≤k≤l,l=|Tl,t4∈T;),将结果返回给上一级 lt!6qja Agent c,这里cu就是Agent a;完成任务t需要的作战 min∑∑∑(ca名), 能力.此处的作战能力是任务t在T中某一位置,a 1≤i1≤a4中i2ljm 完成其所付出的代价.虽然作战任务相同,比如同 s.t.VtiET,Vii ETo,a EA. (4) 是火情侦察,但由于在不同的作战阶段或者即使在 max(Wg),1≤j≤lP,l, (5) 同一作战阶段但不同的侦察的范围不同,完成此项 st.∑,∑≤1,V,eT,t∈T,aeA, 侦察任务需要的力量和付出的代价也是不同,因此 1*21时写m (6) 作战任务在不同任务序列或同一任务序列不同位 置时,在时间环境等约束条件下,α,完成其付出的代 是≤1.4e7,4eA, (7) 价可能是不一样的. 月6昌=0,Ve,ge(8)) (4)在作战能力集T中,所能完成子任务共有 2-1种可能,α,对其进行完全组合,将组合的结 minc≤N,(t),Ht,tneT, 果记入Q中,得到的集合Q,即为a,的潜在任务组. s.t2∈{0,1},t1,t2eT,aeA. (9) (5)将潜在任务组集合表示为Q,={9n,92, 式(4)为目标函数,保证联合灭火救授任务分 …,9a,…},其中1≤α≤2-1,则作战付出的代价 配使得整个部队付出的代价最小 值表为SC,=sc1,sc2,…,sCa,…}.对ga中的任务 式(5)在能够完成上级Agent分配的任务的前 是按T,中任务执行时间顺序递增排列的. 提下,争取最大的收益,付出最小的代价 (6)各作战Agent给出的代价值c(a,∈A,1≤ 式(6)使得某一作战任务只能执行一次,即作 j≤m)发送给指挥Agent c,指挥Agent c得到每一子 战任务具有不可再现性,一旦任务分配给某个作战 任务的最小代价值e:(1≤k≤n),构成最小代价值 Agent或者一组作战Agent并执行,这个任务即宣告 表E={e1,e2,…,ek,…,en},并返回给T的回应者. 结束,无需进行再次分配.当任务执行结束后,后续 其中e4=min{Calte∈9a;l≤a≤2y-1;l≤j≤m; 任务只能有一个,该后续任务可以是虚拟任务⑦. k=1,2,…,n. 式(7)确保作战Agent的任务队列中的起始节 (7)a,接收到最小代价值表E之后,通过潜在 点唯一 任务组Q中所有完成任务所付代价的归一化处理 式(8)确保作战Agent的任务队列中任务的执 来比较最适合完成任务的Agent,.计算权重Ha/sca 行时间不会重叠,前任任务和后续任务与当前任务 t:共同占用作战Agent a~ 其中H。=∑ee 1e∈9ja 式(9)确保任务执行的能力和资源的需求,当 (8)经过计算得出潜在任务组完成任务的权重 作战Agent a,在t时刻开始执行任务时,可以提供的 集合,进行比较,找出权重最大的潜在任务组9,即
第 期 刘 静等 : 多 联合灭 火救 援作战仿真 潜在任务组全 部个数 作战 能力 和资 源要大于等于该任务所要求 的力量总 : 任 务 潜在任 务分配组集合 为 潜在任务 数 否则 任务将无法完成 分配所对应 的 任务 优化分配 算法 : 完成任务 的 潜在 任务组 上级 分配 任务 的 原 则是 : 在 能 够完成任 作 战付 出 的 代价值表 务 的 前提下, 以 最小 的 作战代 价和 消 耗 获取最 大的 需要完成 的子任 务集合 , … 人 作战效果 算 法如下 其中 表示一 虚 拟任 务 , 代表任 务 队 列 ( 作 战 句 矣 向 上 一 级 中 的 开始节点 和终止节点 由 于虚 拟 任务 没有执 指挥 公布所能完 成的任 务集 ” 行的过程 因此开始 执行时 间为 占用 时间 也为 作战 将 自 身的 完成任务 的能力 上报 : 权重最大的潜在任务 组 】 为 争取 的 给 上 级 指 挥 完 成 任 务 的 能 力 为 利 益 丨 人 , … , 巧 矣 如 果子任务 有 有 曰 么 并且 为任务 所对应 的 序号 , 。 进彳了合作 , 且两个任 务 的 执彳了 顺序 相接 , 卩 、 紧 跟在 、 之后执行 , 则 , 否 则 转 , 否则退 出 算法 中 《 £ 贿未定义的 值都为 ⑶ 给 出 ( 中 完成所有子任 务所付出 的 代价 ( 以 幻, 丨 ; 丨 , ; , 将结果返 回 给上 一 级 这里 就是 完成任务 “ 需 要 的作战 能九 此处 的作战能 力 是任 务 在 中 某 一 位置 , ‘ ‘ 完成其所付出 的 代价 虽 然 作 战任务 相 同 , 比 如 同 是火情侦察 , 但由 于在 不 同 的作 战 阶 段或 者 即 使在 同 一 作战 阶段 但不 同 的 侦察 的 范 围 不 同 , 完成此项 侦察任务需要 的 力 量 和 付出 的 代价 也是 不 同 , 因 此 丨 作 战 任 务 在不同 任务序列或 同 一 任 务序 列不 同 位 置时 , 在 时 间环境等 约束 条件下、 完 成其付 出 的代 价 可能 是不一 样 的 ⑷ 在作 战能 力 集 中 , 所能 完 成子任 务共有 ‘ — ‘ … ‘ ” “ ‘ 种 可 能 , 力 对其进 行完 全组 合 , 将组合 的 结 , ⑴ 果记入 仏 中 , 得到 的集 合 仏 即 为 的潜在任务组 将潜 在任 务 组 集 合 表示 为 式 ⑷ 为 目 标 函 数 ’ 保证联合灭 火 救援任务分 其 中 矣 则 作 战付出 的 代价 使 个部 队付 代价最小’ 值表为 , … , , … 对 知 中 的 任务 式 在 娜誠± 级 分睡任細目 碰 巾任錢行时 隱序綱删的 提下 ’ 争取最大的收益 ’ 付出最小的代价 」 各作战 给出 的代价值 式 使得某 作 战 任 务 只 能执 行 次 ’ 即 作 发送给指挥 , 指挥 翻每 子 战任务具有不可觀性 , 雕务分配 给某个絲 任細最 小代 价 。 ) , 贼最小代价值 或者一 组作战 并执行 , 这个任 务即 宣告 表 叫 , , … , , … 八 丨 , 并 返 回 给 的 回 应者 结束 无需进行再次分配 当 任务 执行结束后 , 后续 其中 任务只 能有 一 个 该后 续任 务可 以是虚拟任务 确 保作 战 的任 务 队 列 巾 的起始节 細最 小代 价值表 之后 , 通过潜在 点 唯 任务组 中 所有 完 成任务所付代价 的 归 一 化处理 ?? 来比较最适合完成任务的 , 计算权重 行时 间不会重叠 前 任任务 和 后续 任务与 当前任务 共同 占用作 战 其中 式 确 保任 务执行 的 能 力 和 资 源的 需求 , 当 ( 经过计算 得出 潜在任务组完 成任务 的权重 作 战 在 时刻开始 执行任务时 , 可 以 提供 的 集合 进行比 较, 找 出 权重 最 大 的 潜在任务 组 】 , 即
·1264· 北京科技大学学报 第36卷 9满足下面的条件:(H/sc)≥(Ha/sca),1≤a≤ 添加到其长期任务组列表L,对于其他的作战 1Q,l,H=∑e,并将g及对应的权重W,/sc反 Agent在收到g.为作战Agent a,的长期任务组的通 gleq成 告之后,将把该任务组9从Q中删除,即对j,a, 馈给Agent c.此时,有可能出现权重最大的任务组 9a∩g≠☑时,删除权重H。/sca,返回(8),进行循 可能有两个或者两个以上,表明具备完成此任务的 环计算,这时潜在任务组为删除q之后剩余的任务 作战Agent可能有多个,则进一步选择实际开始执 队列,同理找出最大权值,直到Q=0. 行时间最早的任务组,即选择能尽快到达指定救援 现场或者救援阵地的作战Agent..如假设得到权重 3联合灭火救援仿真 最大任务组有两个9a,和9m,9m={1,b},9脚,= {1,}.由于任务组中任务是按原T中任务执行时 多Agent仿真平台的SWARM是研究复杂自适 间顺序递增排列的(T={t,2,,…,},1=1T), 应系统的模拟工具集[3].由1994年圣塔菲研究所 因此确定由哪个任务组来最终完成作战任务,取决 (SFI)开发的,其主要目的是进行复杂适应系统的 于任务组中开始执行的时间.对两个任务组中的第 分析和研究1.该平台提供了一个面向对象的框 一个任务进行比较,此时都为1,实际开始执行时间 架,通过建立模型对相互作用的智能体及其行为进 一样,继而要对第二个任务进行比较,对应为2和 行仿真模拟s],实现了仿真模型中的Agent和 ·在T中k即任务所对应的序号,任务,的序号和 Agent交互的方法与过程,对本文构造的模型及相 任务2的序号有k,>k,故选择g,以此类推,直 应机制进行了功能验证,为该领域的研究者在模型 到找出权重最大并开始执行时间最早的任务组即为 的实现这一问题上提供了一定的参考和借鉴. 所选任务组,这个任务组既有较强的作战能力,同时 3.1仿真模型 又会以较快的速度到达救援现场,体现了消防部队 联合灭火救援作战中作战Agent具有多个种 “准确迅速”的作战原则. 类,可以是水编成Agent、泡沫编成Agent以及混合 (9)指挥Agent c计算得到权重最大的潜在任 编成Agent等.个体Agent建模包括对系统中实体 务组qk即g:满足下面的条件:(H/sCk)≥(H./ 类型的划分和各类实体的具体建模, sca),eS,1≤j≤m,将向所有作战Agent发出通告 3.1.1实体类型划分 9为作战Agent a,的长期任务组 表1给出了联合灭火救援作战中的各种作战、 (10)Agenta,同样也会受到该通告,之后将q 指挥实体类型及其与作战相关特性的描述, 表1 Agent实体描述 Table 1 Agent entity description Agent 实体类型 描述 水编成 灭火、冷却、稀释、洗消等功能 作战Agent 泡沫编成 灭火、冷却、防护与液体泄漏的覆盖等功能 混合编成 模式一般以救援对象类型来确定 总指挥部是跨地区救援现场的最高指挥机构,所有参与救授的力量都必须接受总指挥部的领导.总指 总指挥部 挥部在政府统一领导下工作,负责现场救援工作、后勤保障工作以及社会各教援力量的协调工作 指挥Agent 现场指挥部 现场作战指挥部根据总指挥部的命令和指示,组织现场救授行动并协调各作战指挥组的散授行动 前沿指挥所 作战指挥组在现场作战指挥部的领导下组织实施救援具体行动 环境Agent 现场环境 教援现场状况 3.1.2 Agent聚合模型 3.1.3协同建模 Agent聚合模型描述联合灭火救援作战中各类 联合灭火救援作战仿真中指控单元、作战单元 实体之间的交互机制,见图2.图中对联合灭火救援 和预警单元(本文未讨论)使用信息网络协同作战, 作战中各实体的关联与交互进行了描述. 为此必须对其协同进行详细建模 以上对联合灭火救援作战各类Agent及其交互 指挥控制建模中的交互类信息(协同组织中各 进行了概要描述.对于Agent内部建模所采用的各 种类别信息确定) 种模型已有相应的研究,此处不再展开阐述. 根据消防部队战斗条令和作战指挥实际,设置
? 1 2 6 4 ? 北 京 科 技 大 学 学 报 第 卷 办 满足 下面 的 条件 : ( , 忘 忘 添加 到 其 长 期 任 务 组 列 表 对 于 其 他 的 作 战 并将 %及对应的 权重 反 在收到 %为作 战 的 长期任务组 的通 ” 告之后 , 将把该任务 组 如 从 仏 中 删 除 , 即 对 人 , 此时 ’ 有可能出 现权重最大 的任 务 且 时 , ! 除权重 , 返回 ( 进行循 可能有两个或者两个 以 上 , 表 明 任 环计算 这 时潜在任务组为删 除 。之后剩余 的任务 作战 可 能有多 个 ’ 则 进 步 选择头 际开始 执 队列 , 同理找 出 最大权值 , 直到 行时 间最早 的任务组 , 即 选择能尽快 到达指定 救援 现场或者救援阵 地 的 作战 如 假设 得到 权重 联合灭火救援仿真 最大任务组 有 两个 啊 和 】 啊 由 于任务组 中任务是按原 ; 中 任务执行时 多 仿真平 台 的 是研究复杂 自 适 间 顺序递增排列 的 ( 彳 仏, … … ⑷ 应系 统的 模拟工具集 由 年圣塔菲研究所 因 此确 定由 哪个任务组来最终完 成作 战任务 , 取决 ( 开发的 , 其 主要 目 的 是进行复杂 适应 系统 的 于任务组中 开始执行的 时 间 对两个任务组中 的 帛 分析和研究 该平 台 提供 了 个面 向 对象 的框 个任务断赚 此喃为 , 麵开始执行咖 , , 舰數翻对淑細觸鮮及其行为进 一 样 继 而要 对第二个 任务进行 比较 , 对应 为 《 和 行仿 真 模 拟 , 实 现 了 仿 真 模 型 中 的 和 在 ; 中 即 任务 所对应的序号 , 任务 《 的 序号和 交互 的 方法与 过程 对本文构 造 的模 型及相 任务 的序号有 , 雌择 、 以 此类 推 , 直 应机制进行了 功能 验证 , 为该领域 的 研究者在模型 到找 出 权重 最大并开 始执行 时间 最早的 任务组 即 为 一 ±難了 — 所选任务组 , 这个任务组既有较强 的 作战能力 , 同 时 仿胃胃■ 又会以 较快 的速度到 达救援现场 体现了 消 防部 队 联合 灭火救援作 战 中 作战 具有 多个 种 “ 准确 迅速” 的 作战原 则 类 , 可以 是水编成 、 泡沫 编 成 以 及混合 指挥 计算得到权重最大的 潜在任 编 成 等 个体 建模包括对系 统 中 实 体 务组 切 即 满 足 下 面 的 条件 彡 类型 的划 分和各类实 体的具体建模 匀忘 , 将 向所有作 战 发 出 通告 实体类型划分 如为作 战 的 长期 任务组 表 给 出 了 联 合灭火救援作战 中 的 各种作 战 、 同 样也会 受到 该通告 之后将 办 指 挥实体类型及其与作战 相关特性 的描述 表 实体描述 实体类型 描述 水编成 灭火 、 冷却 、 稀释 、 洗消 等功能 作战 泡 沫编成 灭火、 冷却 、 防护与 液体泄漏的覆 盖等功能 混 合编成 模式一 般 以救援对象类型来确定 总 指挥部是跨地 区救援现场 的最 高指 挥机构 , 所有参 与 救援的 力 量都必须接受 总指 挥部的 领导 总指 挥部在政府统 一 领导下 工作 负责 现场救援工作 、 后 勤 保障工作以及社会各救援力 量的 协调工 作 指挥 现场指挥部 现场作 战指挥部根据总 指挥 部的命令和 指 示 , 组织 现场救援行动并协调 各作战指 挥组的 救援行 动 前沿指挥所 作 战 指挥组 在现场作战 指挥部的 领导下组织实施救援具体行动 环境 现场 环境 救援现场状 况 聚合模 型 协 同建模 聚 合模型描述联合灭火救援作战 中 各类 联合灭火救援作 战仿真 中 指 控单元、 作战单元 实 体之间 的交互机制 见 图 图 中 对联合灭火救援 和预警单元 本文未讨论 ) 使用 信息 网 络协同 作战 , 作战 中 各实体的关联与交互进行了 描述 为此必须对其协同进行详细建模 以 上对联合灭火救援作战各类 及其交互 指挥控制 建模中 的 交互类信息 ( 协同 组织 中各 进行 了 概要描述 对 于 内 部建模所采用 的 各 种类别信息确 定 ) 种模型 已有相应的 研究 此处不再展开阐 述 根据消 防部 队 战 斗条令和 作战指 挥实 际 设置
第9期 刘静等:多Agent联合灭火救援作战仿真 ·1265· 作战Agent 前沿指挥所 现场指挥部 总指挥部 了指挥控制建模过程中指挥Agent和作战Agent之 间可能涉及的交互信息,共有三类:命令类(com- 防护 mand)是指上级指挥机关下达给下级指挥机关或下 名中 灾情 力量 灾情 火情上报 分析 属部队的作战命令;上报类(report)是下级向上级报 协同 侦察 调巢 火情综合 作战 告救援现场信息以及作战效果的信息;请求类(re- 各战区态势 quest),是指挥Agent或者作战Agent向其他Agent 机动 态势 请求增援或协助的交互信息.这三类信息在联合灭 综合 跨地区 火救援仿真模型中使用最为标准的通信语言为指挥 作战 -战情上报 作战情况综合 作战 控制建模提供信息交互,表2给出了联合灭火救援 任务 任务分配完成 配 作战中与指挥控制建模有关的主要交互类信息. 作战组任务 协调 作战 通信是保障组织指挥跨地区救援行动正常运作 必要条件.它主要包括三个方面的内容:一是体现 图2联合灭火教授各Agent聚合模型 上级意图的各种指示和命令;二是供指挥者进行灭 Fig.2 Aggregation model of each agent in joint firefighting and res 火与应急救援决策的各种情报信息;三是救援行动 cue operation 中的各种请求信息,是上级部门和指挥人员协调控 表2指挥控制建模中的交互类信息 Table 2 Interplay information in the command and control model 命令(command) 上报(report) 请求(request) 使察命令,救人命令,进攻命令,撤退命上报火灾对象信息,上报作战环境信息,上报战斗力信息,上增援力量请求,物资补 令,转移命令,防护命令 报作战状态信息,上报伤亡信息,上报作战结果信息 给请求 制各救援队伍救援行动的依据. 组(engine group)协同完成. 在建立协作模型时,采用了基于合同网的协同 具体任务规划过程如下: 工作模型,根据作战阶段的划分,将现场指挥所视为 (1)Commander建立问题分解,首先询问下属 单个指挥Agent,将作战编成视为一个作战Agent,这 泡沫编成和水编成,选取最具能力的Agent.. 样整个仿真系统就构成了一个多Agent系统,根据 Goal (Commander,[attack (task)]). 联合灭火救援协作模型及其算法,模型的描述算法 Plan(Commander,[ask(Foam groupl,…, 如下: foam Groupi)],ask engine Groupl,...,Engine ①在作战Agent以及指挥Agent间建立目标任 groupj)]). 务规划; (2)假设Foam Group[i]与Engine Group[Uj]为 ②根据前面已给的协同算法来执行该算法; 可选Agent,分别赋予它们子目标. ③如果某一Agent的任务没有完成,那么它将 Goal(Engine Group[U],[attack(冷却)before 请求指挥Agent进行增援,这样指挥Agent就需要按 time(finish_time)]). 照战斗条令总队,支队及中队相协调的原则重新进 Goal (Foam Group[i],[attack (task)after En- 行任务分配.然后转②; gine Group[Uj门[attack(冷却)]]). ④任务执行完毕,继续进行下一作战阶段的 Engine Group[j]Leader根据上级目标为泡沫 作战. 编成和水编成制定规划,侦察单元首先进行侦察,作 目标任务分配算法如下: 战单元移动至Point1观察,然后开始进攻. 子任务生成过程可看作是目标明确化的过程, Goal(Engine Group[j],[attack(taskt)]) 它开始于总指挥采用一个抽象目标并形成一个抽象 Plan(Engine Group [j]_Leader,ask Scout_ 的规划.该规划由对其作战Agent的直接命令构 Units,scout(task)]). 成,这些命令被采纳为下属的目标.该过程继续直 Plan(Engine Group [j]_Leader,ask(Attack_ 至单元层,此层Agent将生成并执行详细的规划 Units,[attack(South WestPoint)]]). (operational plans)来实现这些目标.例如其内容是 Goal(Scout_Units,scout(task)]). 指挥官(commander)下令战斗组进行灭火总攻,任 Plan(Scout_Units,scout(SouthWestPoint)]). 务需要泡沫编成战斗组(foam group)与水编成战斗 scout(task)
第 期 刘 静等 : 多 联合灭 火救 援作战 仿真 作胸 前 沿指挥所 现场指挥部 总指 挥部 丨 丨 丨 间 可能涉及 的 交互 信 息 , 共有 三类 : 命 令类 ( : 是指 上级 指挥机关下 达给下级指 挥机关或下 力量 属部 队 的 作战命令 上报类 是下 级向 上级报 一 告救援现场信息 以 及作战 效果的 信息 ; 请求 类 、 各战 态 势丨 ! 是 指 挥 或 者作战 向 其他 丨 丨 请求增援或协助 的交互信息 这三类信息 在联 合灭 丨 丨 丨 火救援仿真模型 中使 用最为标准的通信语言为指挥 控糧觀供■、 交 表 给 出 了 联合灭火 救援 成 作 战‘壬务 ! 作 战 中与 指挥控制 建模有关的 主要交互类信息 — ; 通信是保障组织指 挥跨地区救援行动正常运作 丨 丨 丨 必要条件 它主要包括三个方面 的 内 容 : 一 是体现 图 联合灭火救援各 聚 合模型 上级 意图的 各种指示和 命令 ; 二是供指 挥者进行灭 火与应急救援决策 的 各种 情报信息 ; 三 是救援行动 “ 中 的各种请求信息 , 是上级部 门 和 指挥人员 协调 控 表 指 挥控制 建模中 的 交互类信息 命令 上报 请求 侦察命令 , 救 人命 令 , 进 攻命 令 , 撤退 命 上报火灾对象信息 , 上报作 战环 境信息 , 上 报 战 斗 力 信息 , 上 增援 力 量请 求 , 物 资 补 令 , 转移命令 , 防 护 命令 报作 战状态 信息 , 上 报伤亡 信息 , 上报 作战 结果信息 给请求 制各救援队伍救援行动的 依据 组 协 同完成 在 建立协作模 型 时 , 采 用 了基 于合 同 网 的 协 同 具体任务规划过程如 下 : 工作模型 , 根据作 战 阶段的划分 , 将现场指挥所视为 ( 建立 问 题分解 , 首 先询 问 下属 单个指挥 , 将作 战编成视 为 一 个作战 , 这 泡沫编 成和水编 成, 选 取最具能力 的 样整个仿真系 统就构 成 了 一 个多 系 统 , 根据 联合 灭火救援协作模 型及其算法 , 模型 的 描述 算法 , … , 如下 : , , … , ①在作战 以及指 挥 间 建立 目 标任 务规划 ; ( 假设 与 为 ②根据前 面已 给 的 协同算法来执行该算法 ; 可选 , 分别赋予它 们子 目 标 ③如果某一 的 任 务 没有 完成 , 那么 它将 , 冷却 ) 请求指挥 进行增援 , 这样指挥 就需要按 照 战斗条令总 队 , 支 队及中 队相 协调 的 原则 重 新进 行任务 分配 然后转② ; 冷却 ) ④任务执 行完 毕 , 继续 进行 下 一 作 战 阶 段 的 根据 上级 目 标为 泡 沫 作战 编成和水编成制定规划 , 侦察单元首先进行侦察, 作 目 标任务分配算法如 下 : 战单元移动 至 观察 , 然后 开始进攻 子任 务生 成过程可看作是 目 标 明 确化 的过程 , 它开始于总指 挥采用一 个抽象 目 标并形成一个抽象 的 规划 该规划 由 对其 作战 的 直接 命令 构 成 , 这些命令被采纳 为下 属 的 目 标 该过 程继续直 至单兀层, 此 层 将 生 成 并 执 行 详细 的 规 划 , 来实 现这些 目 标 例如 其 内 容是 指挥官 ( 下 令 战斗 组进 行灭火 总攻 , 任 , 务需 要泡 沫编成战 斗组 ( 与 水编成 战斗
·1266· 北京科技大学学报 第36卷 Goal(Attack_Units,attack(task)]). Other other;/其他Agent信念 Plan(Attack_Units,move(Pointl)]). /功能函数 move(Point1 ) void StartOff();/接警出动 Plan(Attack_Units,[attack(task)]). void Recon();/火情侦察; attack(task)]). void StateEstimate();/态势估计 Foam Group[i]Leader为下属单元制定规划, void ChoiceEquipment();/选择装备器材 移动至Point2观察,然后开始进攻. void Communication();/通信 Goal(Foam Group[i],[attack(task)after Engine void adaptability();/适应性 Group[Uj][attack(冷却)]). Plan(Foam Group[i]_Leader,ask Units,at- /规则,例如进攻规则 tack(task)]). Rule Goal(Units,[attack(task)]). Description:当接到进攻命令,使用本规则. Plan(Units,move(Point2)]). WHEN(当接到进攻命令时) move(Point2)). F(编成状态=待命) Plan(Units,attack(task)]). &&(资源满足进攻需要时) attack(task)). THEN执行进攻; 3.2仿真实验 执行到作战目标任务完成: 仿真实验在SWARM-2.1.1平台下采用JAVA …… 语言编程,建立了联合灭火救援仿真模型,并运行 指挥Agent是系统中最为重要的Agent.它提 SWARM. 供了系统的各种参数以及获取和设置参数的方法, 作战Agent调用环境的属性和方法,是整个仿 以便其他相关类进行调用. 真系统实现的载体 public class Command public classOperation public int commandRank;/指挥权限级别 public int,y; public Grid2 d world;/环境 public FireGround fireGround;作战Agent public FireGround fireGround://调用fire- public Command command;指挥Agent Ground类 public int kind;/编成类别 public int worldXSize,worldYSize; public int adscription;/归属 /信念 public int rank;/等级 Self self;/自身信念 public double carryingSupplement;/车载灭火 Envir envir;/环境信念 剂量 Other other;/上级Agent信念 public double timeDistance;/时间距离 /规则,例如时间距离最短和力量调集比例限 public double accesibilty;/消防站可达性 制规则 public int maxvelocity;/最大速度 Rule public int fireRange;/有效射程 Description:当需要调集编成时,使用本规则, public double satisfaction;/救援满意度 WHEN(需要调集编程时) public List operationList;/作战Agent列表 F(编成状态=待命) public int worldXSize,worldYSize; &&(集结时间距离+出动时间距离最小) public Grid2d world; THEN执行调集动作; public OperationModelSwarm operationMod- Rule elSwarm; Description:当需要调集编成时,使用本规则. WHEN(需要调集编程时) /信念 F(跨支队调集) Self self;/自身信念 THEN比例限定为40%; Envir envir;/环境信念 执行调集动作;
‘ 北 京 科 技 大 学 学 报 第 卷 , ; 其他 信念 , 功能函 数 ; 接警出 动 一 , ■ ; 火情侦察 ; ; 态势估计 为 下 属 单兀制 定规 划 , ; 选择装备器材 移动至 观察 , 然后开始进攻 ; 通信 ; 适应性 冷却 ) , 规贝丨 , 例如 进攻规则 进 攻规则 当接到进攻命令 , 使用本规则 , 当 接到进 攻命令时 ) 编 成状态 待命 ) 资源满足进攻需要 时 ) 执行进攻 ; 仿真 实验 执行到 作 战 目 标任 务完 成 ; 仿真实 验在 平 台 下采 用 … … 语言编程 建立 了 联合灭 火 救 援仿真模型 并运行 指 挥 是系 统中 最 为重要 的 它提 供 了系 统的 各种参数 以 及获取 和设置参数 的 方法 , 作战 调 用 环境 的 属 性 和方法 , 是整个仿 以 便其他相关类进行调用 真系统实现的载体 ; 指挥权 限级别 ; ; 环境 ; 作战 ; 调 用 ; 指挥 类 ; 编 成类别 ; ; 归属 百 念 ; 等级 ; 自 身丨目 念 ; 车 载 灭 火 环境 念 剂 量 ; 上级 信念 ; 时间距离 规则 , 例如 时 间 距离 最短和 力 量调集 比例 限 ; 消 防站可达性 制规则 ; 最大速度 时间 距离 最短规则 ; 有效射程 当需要调集编成时 , 使用 本规则 ; 救援满意度 需 要调集编程 时 ) ; 作战 列表 编成状态 待命 ) ; 集结时 间 距离 出 动 时间 距离 最小 ) ; 执彳了调 集动作 ; 〈 力 量调集 比例 限制规则 ; : 当 需要 调集编成时 , 使用本规则 需 要调集编程 时 ) 信念 跨支 队调集 ) ; 自 身信念 比例 限定为 ; ; 环境信念 执行调集动 作;
第9期 刘静等:多Agent联合灭火救援作战仿真 ·1267· ELSE比例限定为80% 随着时间的推进,到场力量逐渐增多,作战 Agent不断加入到灭火战斗中,这时成功率逐渐开 环境Agent主要包括坐标属性描述环境Agent 始增长,由于力量调集和部署需要一定的时间,同时 的“环境系数”属性,是为作战Agent和指挥Agent 在作战行动中需要阵地转移,所以在部分时间段可 提供判断依据 能出现负增长,因此在图4显示中呈现不稳定状态, public int sizeX,sizeY;/救援环境的长宽 这也是火场复杂性的一个充分表现, public int envParam;/环境系数 7Snt车faction of Fire里ighting Team ▣× public int minEnvParam=l;/最小环境系数, Satisfaction of Firefighting Team 暂定为1 /环境的信念: 400 weather((气温,风力风向,能见度,气象状况, …) w fireground(救援对象,类型,危险度,方位, 1000 3000 …) time /规则,环境系数变化规则 图4作战Agent增加的SWARM仿真图 Rule Fig.4 Simulation diagram in adding operation agents Description:当救援行动开展时,使用本规则. 随着时间的继续推移,如图5和图6所示救援 WHEN(救援行动展开时) 成功率不会呈现出大幅波动,会逐渐增长,直至最后 F(救援成功) 火灾扑灭,整个灭火战斗成功 THEN救援系数向好的方面转变: Satisfaction of Firefichting TeaX ELSE向坏的方面转变: Satisfaction of Firefighting Team 3.3仿真结果分析 SWARM仿真系统运行,如图3所示.当救援力 50 量没有到达现场时,救援成功率显示为负数,当初战 力量到场,一般指的是辖区中队到场之后开始进行 救援,救援成功率呈现出增长趋势,但是显然对于重 特大灾害事故,初战力量明显处于劣势,与火势的对 1000 000 比呈现出敌强我弱的态势,图中仍呈现出救援成功 图5 SWARM仿真推进图 率在0以下.15min之后,也就是我们常说的15min Fig.5 Simulation pushing diagram 消防的概念,救援成功率开始出现正增长,说明有增 援力量到场之后,力量对比态势发生改变,虽然到场 Satisfaction of Firefighting Tear区国回X☒ 力量仍处于劣势,但已经开始呈现增长趋势,这个时 Satisfaction of Firefighting Team 期是进行搜索和侦察的最佳时期. 000 Satisfaction of Firefighting Teas 酒回X 500 Satisfaction of Firefighting Team Mwn/ t000 2000 3000 time 图6 SWARM仿真继续推进图 Fig.6 Simulation continued pushing diagram 10 4结论 time (1)构造了联合灭火救援的多Agent系统.该 图3 SWARM仿真初期 系统由指挥Agent、作战Agent和救援环境Agent组 Fig.3 Simulation primary stage 成,并对指挥Agent和救援环境Agent进行了详细描
第 期 刘 静等 : 多 联 合 灭 火 救援作 战 仿真 比例 限定为 随着 时 间 的 推 进 , 到 场 力 量 逐 渐 增 多 , 作 战 … … 不断 加人 到 灭 火 战 斗 中 , 这时 成 功 率逐 渐开 环境 主要包 括 坐 标属 性描 述环 境 始增 长 , 由 于力 量调集 和部 署需 要一 定 的 时间 , 同 时 的 “ 环 境 系 数 ” 属 性 是为 作 战 和 指 挥 在作战行动 中需 要 阵 地转 移 所 以 在 部 分时 间 段 可 提供判 断依据 能 出 现负 增长 因 此在 图 显示中 呈现 不稳定 状态 , ; 救援环境 的长 宽 这也是火场夏 杂性 的 充分表现 ; 环 境系 数 棚 圓丨 冒 里丨 ; 最 小环 境 系 数 , 暂 定为 环境 的信念 : 气温 , 风力 风 向 , 能见 度 , 气象状况 , 、 救 援 对 象, 类 型 , 危 险 度 , 方位 , ‘ ■ — 规则 , 环境 系 数变化 规则 图 作 战 增 加 的 仿真 图 环境系 数变 化规则 〉 隨时间 的 继 续推 移 , 細 和 图 所示 救援 , 彳 成神不会《出 大 动 , 会藤± 长 , 直 至最后 火灾扑 灭 , 整个灭火 战 斗成功 救援系数 向 好 的 方面 转变 ; 向 坏 的方面转 变 ; 一 仿 真结 果分析 仿真 系 统运行 如 图 所示 当 救援力 挪 : 量没有 到 达现场 时 救援成功率显示为 负 数 , 当初 战 “ 力 量 到 场 , 一 般指 的 是辖 区 中 队 到 场之后 开 始进行 。 救援 救援 成功率呈 现出 增长趋 势 , 但是显然 对于重 特大灾害事故 , 初 战力 量明 显处 于劣 势 与 火 势 的对 。 側 : 比 呈现 出 敌强我 弱 的 态 势 ’ 图 丄 中仍呈 现 出 救援 成功 图 推 进 图 率在 以下 之后 , 也就是 我们 常说的 消 防 的概念 救援成功 率开始 出 现正增 长 说明 有增 援力 量 到 场 之后 , 力量 对 比态 势发生改 变 , 虽 然到 场 肌卿 請』 隐 嫩丨 力 量仍处 于劣 势 但已 经开始呈 现增 长 趋势 这个 时 — 雷 、 — 。 一 、 八 图 仿真 继续推进 图 晏 “ 结 论 构造 了 联 合灭 火 救援的 多 系 统 该 图 仿真初 期 系 统 由 指挥 、 作 战 和 救援 环境 组 成 , 并 对指 挥 和 救援环境 进 行了 详细描
·1268· 北京科技大学学报 第36卷 述.该系统使作战实体既能体现所有单元具有自治 [8]Cai H L,Tian L,Gao M.Simulation module on multi-Agent net 性,同时又能层次化的描述出救援现场上具有严格 combat system.J Sichuan Ordnance,2012,33(12):90 (蔡红柳,田磊,高豫.多Agent的网络对抗系统仿真建模.四 等级的指挥控制关系,与联合灭火救援作战的思想 川兵工学报,2012,33(12):90) 和作战模式相对应. [9]He J H,Gao X G,Yang L,et al.The concepts of network centric (2)采用多Agent理论中的合同网协议,提出 warfare and its application in air combat.Fire Control Command 了联合灭火救援的任务优化分配和协作算法. Control,2003,28(4):98 (3)利用多Agent软件工具集和通用软件平台 (何建华,高晓光,杨莉,等.网络中心战概念及其空战应用研 (SWARM),用JAVA语言编程,进行了模拟仿真,并 究.火力与指挥控制,2003,28(4):98) [10]Hu X F,Yang J Y,Si G Y,et al.War Complex System Simula- 开发了一个原型系统,对本文构造的模型及相应机 tion Analysis and Test.Beijing:National Defense University 制进行了功能验证. pres5,2008 (胡晓峰,杨靖宇,司光亚,等,战争复杂系统仿真分析与实 参考文献 验.北京:国防大学出版社,2008) [1]ShiZ Z.Intelligent Agent and Intelligent Agent and its Application. [11]llachinski A.Artificial War:Combat Simulation Based on Multi Beijing:Science Press,2000 agent.Zhang Z X,Gao C R,Transl.,Beijing:Electronic In- (史忠植.智能主体及其应用.北京:科学出版杜,2000) dustry Press,2010:15 [2]Yao L,Zhang W M.Intelligent and Cooperative Information Tech- (Andrew llachinski,.人工战争:基于多Agent的作战仿真.张 nology.Beijing:Electronic Industry Press,2002 志祥,高春容,译.北京:电子工业出版社,2010:15) (姚莉,张维明.智能协作信息技术,北京:电子工业出版社, [12]Chen Z H.IBM Rational Software Architect Module.Beijing: 2002) Electronic Industry Press.2008 [3]Weiss G.Multiagent Systems:A Modern Approach to Distributed (陈樟洪.IBM Rational Software Architect建模.北京:电子工 Artificial Intelligence.The MIT Press,2008 业出版杜,2008) [4] WeiB G.Adaptation and leaming in multi-agent systems:some re- [13]Hu X F,Si Y G.The War Simulation Principle and System.Bei- marks and a bibliography.Lecture Notes in Computer Science Vol- jing:National Defense University Press,2009 ume 1042,Springer,1996:1 (胡晓峰,司亚光.战争模拟原理与系统.北京:国防大学出版 [5]Chen WW.Intelligent decision Technology.Beijing:Electronic 社,2009) Industry Press,1998 [14]Yu B F,Zhang H.Simulation and analysis of contract net proto- (陈文伟.智能决策技术.北京:电子工业出版社,1998) col based on swarm multi-agent computer simulation platform. [6] Wang X F,Sandholm T.Reinforcement learing to play an optimal Comput Simul,2008(9):179 Nash equilibrium in team Markov games//Advances in Neural Infor- (余柏峰,张辉,基于Swam仿真平台的合同网协议的应用分 mation Processing Systems NIPS-2002).Vaneouver,2002:494 析.计算机仿真,2008(9):179) [7]Lu D W.Group events simulation research based on Swarm plat- [15]Liu Z,Cheng Y J.Swarm for Java Simulation and Procedure Im- form.Chin Emerg Rescue,2012(6):38 plementation.Beijing:Machinery Industry Press,2009 (路大为.基于Swam平台的群体性事件仿真研究.中国应急 (刘贞,程勇军.Swarm for Java仿真及编程实现.北京:机械工 救授,2012(6):38) 业出版社,2009)
‘ 北 京 科 技 大 学 学 报 第 卷 述 该系统使作 战实体既能体现所有 单元具有 自 治 , 性 同 时又 能层次化 的描述 出 救援现 场上具有严格 : — 八 丁 蔡红柳 , 田 幕 , 高朦■ 多 的 网 络对抗 系 统仿 真建 模 四 ■系 ’ 与 联合灭 火救 : 和作战模式相对应 采用 多 理论 中 的 合同 网 协议 , 提 出 了联合灭火救援 的任务优化分配和协作算法 ―’ : 利用 多 软件工具集 和通用 软件平 台 ( 何建华 ’ 高 晓光 ’ 杨莉 ’ 等 网络 中 心 战 概 念及其 空 战应用 研 、 其 士“ 泊 、 ■ 一 描七、 丨 士 古 并 究 火 力 与 指挥控制 , ’ 用 目 编程 , 进打了 觀仿真 ’ 并 , 开发了 一个原型 系统 , 对本文 构造 的 模型 及相 应机 — : 制 进行了 功 能验证 , 胡 晓 峰 , 杨靖 宇 , 司 光亚 , 等 战 争 复杂 系 统仿 真分析与 实 参 考 文 献 验 北京 : 国 防大学 出 版社 ; ’ ’ , ; 史忠 植 智 能主体及其应用 北京 : 科 学出 版社 : 人工战 争 基于多 的 作 战 仿真 张 : 志祥 高春容 , 译 北 : 电子工业 出 版社 , 姚莉 , 张维 明 智 能 协作 信息 技 术 北 京 : 电 子 工 业出 版社 , : : 陈樟洪 建模 北 京 : 电子 工 业 出 版社 , : ’ : ! : 胡 晓峰 , 司 亚光■ 战争 模拟■ 原理与 系 统 北京 : 国防 大 学出 版 : 社 ’ , 陈文伟 智 能决策 技术 北 京 : 电子工业出 版社 : 余柏 峰 , 张 辉 基于 仿真平 口 的 合同 网 协议■ 的 应用 分 : 析 计算机仿真 , : : : 路大为 基于 平 台 的群 体性事 件仿真 研究 中 国 应 急 ( 刘贞 , 程勇 军 仿真及编 程实现 北京 : 机械 工 救援 : 业出 版社