第6卷第1期 智能系统学报 Vol.6 No.1 2011年2月 CAAI Transactions on Intelligent Systems Feb.2011 doi:10.3969/i.i8sn.1673-4785.2011.01.005 基于模糊逻辑的多移动机器人自适应协作围捕 王斐,闻时光,吴成东,魏巍 (东北大学信息科学与工程学院,辽宁沈阳110819) 摘要:提出一种在未知动态环境下实现多移动机器人自适应协作围捕运动目标的整体方案,为成功实现围捕,设 计了基于模糊逻辑的钳型夹击策略,模糊规则通过遗传算法学习获得.同时为躲避围捕过程中遇到的动态随机障 碍,提出了基于碰撞风险的随机避障策略.围捕机器人的综合行为通过融合避障行为、合围行为和抓捕行为获得.在 MRS仿真环境下进行了摸拟实验,获得的不同条件下的围捕结果证明了围捕策略的有效性和鲁棒性, 关键词:多移动机器人;自适应协作围捕;钳型夹击策略;模糊逻辑;遗传算法;碰撞风险 中图分类号:TP391.9文献标识码:A文章编号:16734785(2011)01004407 Adaptive cooperative hunting for multiple mobile robots based on fuzzy logic WANG Fei,WEN Shiguang,WU Chengdong,WEI Wei (College of Information Science and Engineering,Northeaster University,Shenyang 110819,China) Abstract:A general scheme of adaptive cooperative hunting for a moving target by multiple mobile robots in un- known dynamic environments was presented.To realize successful hunting,pincer attack strategy was proposed and its behavior module was described by fuzzy logic,which was learned by a genetic algorithm.Simultaneously,obsta- cle avoidance scheme based on collision risk was used to avoid random obstacles during hunting.The synthesized behavior was obtained by combining avoidance behavior,formation behavior,and approach behavior.Simulated hunting experiments were conducted under different conditions in the Microsoft robotics studio and simulation results demonstrate the effectiveness and robustness of the proposed scheme. Keywords:multiple mobile robots system;adaptive cooperative hunting;pincer attack strategy;fuzzy logics;ge- netic algorithm:collision risk 随着科技的飞速发展,作为多前沿学科交叉的机 近年新兴的研究热点.研究主要集中在以下几个方 器人学在理论和应用上都取得了巨大进展.近年来,机 面:群体结构、学习、资源冲突解决、协作的起源、几 器人在工业、航天、军事和民用服务业等各领域的应用何问题等.在研究中,为了使研究成果具有普遍意 越来越普及,集成化、自动化和智能化程度也在不断提 义,人们主要集中对一些基本的标准问题进行研究, 高.作为一个新兴的研究热点,多机器人系统因具有空 比如搬运、编队、搜索、分类、围捕和跟踪等.其中,协 间上的分布性、功能上的多样性、执行任务时的并行 作围捕可以说是非常典型的一类问题.文献[2]探 性、较强的容错能力和更低的经济成本等单机器人无 讨了以势场栅格法为基础的协作围捕策略,在引入 法比拟的优越性近年来广受关注。 “虚拟范围”后减少了围捕机器人的路径规划次数, 多机器人协作与协调是多机器人系统控制中的 然而“虚拟范围”与机器人速度的对应关系问题并 基本问题,主要涉及高层的组织与运行机制问题,即 没有得到很好的解决.文献[3-4]则提出不同的编队 可以实现系统快速组织与重构的柔性控制机制,是 方法,使移动机器人在围捕前首先形成一定队形 (如圆形),然后对目标进行合围.该类方法优点是 收稿日期:201008-13. 编队行进扩大了搜索目标的范围,缺点也很明显,编 基金项目:国家自然科学基金资助项目(60705031):机器人技术与系 统国家重点实验室(哈尔滨工业大学)开放基金资助项目 队易受到环境因素的影响,队形不容易保持.文献 (SKLRS-2010-ZD-03);中央高校基本科研业务费专项资金 [5]提出一种强化学习算法,利用Q-学习算法得出 资助项目(N090404007). 通信作者:王斐.E-mail:wangfei(@ise.neu.edu.cm. 各种行为的输出并进行加权求和获得综合行为来实
第1期 王斐,等:基于模糊逻辑的多移动机器人自适应协作围捕 ·45 现多移动机器人围捕.这种方法适用于连续环境中 图1为2个围捕机器人合围1个动态目标过程 有障碍物以及围捕移动目标的情况,缺点是当围捕 中的位置关系图.当合围区域(以两围捕机器人重 机器人接近目标时,对状态聚类的分类较粗,包围效 心连线为直径形成的圆形区域)半径小于3m时,围 果较差.文献[6]提出一种针对已知环境下的多移 捕机器人则各自采用圆弧运动来完成对抓捕目标的 动机器人路径规划问题,采用遗传算法,通过设计合 夹击.抓捕目标可以实时地感知到围捕机器人的运 理的适应度函数,能够引导有碰撞危险的多个机器 动信息,当围捕机器人在逃避区域外(以目标重心 人选择最优的运动路径,避免死锁的问题.文献[7] 为圆心,半径为2.5m的圆)运动时,抓捕目标保持 则使用遗传算法解决了组合拍卖中的胜者决定问 静止,一旦感知到围捕机器人侵入逃避区域时,它则 题,实现了多移动机器人协调中对动态、复杂任务的 根据势场法计算出逃逸矢量来进行躲避.仿真中将 最优分配, 围捕机器人与抓捕目标的最高速度设定为相同,这 由于环境的不确定性、系统的高度非线性和强 样就可以保证1个围捕机器人无法单独完成对动态 偶合性使得未知动态环境下的多机器人协作围捕极 目标的抓捕 具挑战.传统的至上而下的设计方法无法满足系统 机器人# 在实时性、自适应性和鲁棒性等方面的要求.包容式 逃避区域 体系结构可保证多机器人系统对未知环境具有快速 7 的反应性和适应性,而行为分解则降低了任务求解 的复杂度,简化了控制器设计过程.在包容式框架 下,系统中的每个围捕机器人都被设计成具有3个 基本行为的智能个体,综合行为分别是与其他机器 机器人#2 人协作夹击目标的合围行为,形成合围后攻击目标 的抓捕行为以及躲避环境中动、静障碍的随机避障 图1双移动机器人协作围捕动态目标 行为.合围行为的获取通过机器学习技术实现,即采 Fig.1 Cooperative hunting dynamic target by dual mo- bile robots 用模糊逻辑建立合围行为模型,模糊规则通过机器 人与环境交互采用遗传算法进化获得.避障行为的 1.3动态目标的运动模式 获取则是通过对碰撞风险进行量化评估间接实现. 动态目标采用势场法来决定自身的运动模式, 抓捕行为可提高围捕效率,本文采用圆弧运动的末 其逃逸速度的大小由式(1)计算得出,逃逸方向为 端处理算法⑧]加以实现.围捕机器人的各种基本行 周捕机器人与动态目标质心连线的反向延长线方 为则通过包容式结构进行融合 向,即: 1.5, 02.5m. 本文以微软公司2006年推出的通用机器人仿真 (1) 软件MRS(Microsoft robotics studio)作为研究多移动 式中:d为动态目标与第k(1,2)个围捕机器人之 机器人协作围捕的实验平台9),选用其中带有激光测 间的相对距离.当围捕机器人侵入其逃避区域内时, 距仪的Pioneer3DX两轮差速移动机器人来模拟围捕 抓捕目标即按照式(1)计算得出的速度矢量控制移 系统中的围捕机器人和动态抓捕目标.激光雷达可同 动机构进行逃逸.当有多个围捕机器人同时进入逃 时考虑精度要求和速度要求,且对工作环境要求低, 避区域时,抓捕目标的逃逸矢量由相对于多个围捕 这些特别适用于移动机器人实时导航领域。 机器人的逃逸矢量叠加而成。 1.2协作围捕问题设定 2合围行为获取 在MRS仿真环境中,围捕机器人可根据自身安 装的激光测距仪感知环境中随机障碍的相对距离和 所谓合围是指多个机器人通过某种协调机制或 方位,并根据避障策略进行躲避.同时根据仿真环境 控制策略相互配合来对目标进行有效的包围和夹 反馈的抓捕目标的位置信息,依据钳型夹击策略规 击.在以往的合围研究中,围捕机器人的数量一般固 划自己的运动轨迹,并根据彼此的状态,不断调整自 定,且环境大多为静态或准静态.因此,当系统中机 身的速度以达到最佳的夹击位置 器人数量发生增减或环境统计特性发生剧烈变化甚
.46 智能系统学报 第6卷 至完全未知时,原有的合围策略往往会失效,控制系 不需计算重心,因此计算速度快,并且只涉及简单的 统需要重新进行设计,即系统不具备自适应能力.针 四则运算,解析也非常容易: 对这一问题,本文提出了双机器人钳形夹击策略,即 本文采用简化推论法建立双机器人钳形夹击行 为了获取整个系统的合围行为,首先对多机器人系 为模型,将围捕过程中机器人间的相对位姿L、L 统进行分解,个体机器人通过两两组合形成多个双 0、0G,k=1,2,j≠)(见图2)作为模型输入,则 机子系统,并以此为单位采用钳形夹击策略产生个 第k个围捕机器人在第n+1个采样时刻的速度 体机器人的合围矢量,分属于不同子系统的同一机 和方向由如下规则产生: 器人的合围矢量由各子系统生成的合围矢量叠加形 if 0n(n)is A,and Ln (n)is B and 0 (n)is C. 成.钳形夹击策略保证了多机器人系统在未知环境 and La(n)is D,then (n+1)is Wi (n); 下的反应性和鲁棒性,同时也使系统具备了较强的 if n (n)is A,and Ln (n)is B and 0 (n)is C. 容错能力和自适应能力. and La (n)is D,then p (n+1)is Wo (n). 多移动机器人系统是一类典型的动态系统,其 式中:A2、B,、C,、D,(P,9,T,s∈[0,1])分别是0、 中包含了机器人个体及个体与环境之间复杂的相互 L、日、L所对应的模糊集合,即隶属度函数的标 关联和交互作用.复杂的动力学特性使得系统在建 签;后件部变量Wn(n)和W,(n)为速度和运动 模、分析、规划和控制等方面面临着诸多的困难,机 方向相关的规则,为单值变量 器学习为解决这一系列难题提供了一条简洁的思 采用如图2所示的三角形隶属度函数对输入的 路.由L.A.Zadeh提出的模糊集合理论为处理客观 环境信息进行模糊化.距离的隶属度函数有2个模 世界中存在的模糊性问题提供了有力的工具.在此 糊子集,分别为近和远,输入为激光测距仪的读数, 基础发展起来的模糊逻辑(fuzzy logics,FL)具有符 有效范围为0~12m.方位隶属度函数具有3个模 合人类思维的习惯,不需要建立精确的数学模型,具 糊子集,分别为左、中和右,输入为机器人间的相对 备易于将专家知识直接转换为控制信号等优点.此 角度,范围设定为[-180°,180°]. 外,与神经网络等控制方法相比,L计算量小,能满 近 远 左 足实时性要求,非常适合时变未知环境下的路径规 划.本文选择用模糊逻辑建立未知环境下多机器人 合围行为模型,以此为基础规划各围捕机器人的运 动速度,实现协作围捕。 2m-180° LL0,k=1,2,j≠k) 遗传算法是一种借鉴生物界自然选择和进化机 0.0.k=1.2/≠k1809 制发展起来的高度并行、随机、自适应的搜索算法。 图2距离与方位的隶属度函数 它使用群体搜索技术,将种群代表一组问题解,通过 Fig.2 Membership functions for distance and orientation 对当前种群施加选择、交叉和变异等一系列遗传操 作,产生新一代的种群,并逐步使种群进化到包含近 由于距离和方位的隶属度函数分别由2个和3 似最优解的状态.遗传算法提供了一种求解复杂系 个模糊集合构成,对于双机器人钳形夹击,第k个围 统优化问题的通用框架,它不依赖于问题的具体领 捕机器人行为模型的输入分别为其与目标的相对距 域,对问题的种类具有很强的鲁棒性.本文将应用遗 离和角度及与第j个围捕机器人的相对距离和角 传算法对合围行为模型进行修正,通过将模糊规则 度,因此为了得到该机器人的速度或方位,需要2× 编码成基因个体并设定相应的适应度函数,使得合 3×2×3=36个模糊规则用以计算,如果4个输人 围规则在不断的进化中逐渐适应环境,最终获得动 变量经模糊化得到的隶属度分别为,(n)g(n)、 态环境下的多机器人系统的近最优合围行为 4,(n)和4,(n),则模糊规则的隶属度由式(2)给出. 2.1合围行为模糊规则 ugn(n)=h,(n)×ug(n)×4,(n)×u,(n).(2) FL中常用的模糊推论包括min-max重心法 进而,在第n+1个采样时刻的第k个围捕机器人的 product--sum法和简化推论法等.min-max重心法由 速度和运动方向更可由式(3)计算得出. 于原理简单,在模糊控制领域应用最为广泛.而 (n)Wis (n) Maeda等人提出的简化推论法以快速和简单为目 y(n+1)=9=0 的,控制规则后件部的变量不再是模糊子集而是常 数,同时使用加权平均取代重心法.由于简化推论法 (
第1期 王斐,等:基于模糊逻辑的多移动机器人自适应协作围捕 ·47… (n)W(n) 高了遗传算法的效率和精度 Φ(n+1) 9=0 (3 种群 评价 排列 选择 交叉 突变 ∑(n) P9,,d=0 2 式中:后件部变量W(n)和W(n)将被编码成基 3+ 因个体,并在后续的遗传进化中得到调整, 2.2基于遗传算法的模糊规则进化 2.2.1模糊规则的遗传编码 第代 第W+1代 在遗传算法中用编码描述问题的可行解,即把 图3遗传进化计算 一个问题的可行解从其解空间转换到遗传算法所能 Fig.3 Evolutionary computing 处理的搜索空间.编码是应用遗传算法时要解决的 2.2.3评价函数 首要问题,也是设计遗传算法时的一个关键步骤,因 评价函数是影响遗传算法学习速度和精度的重 为它在很大程度上决定了如何进行群体的遗传进化 要因素.本文采用遗传算法调整多机器人系统合围 运算以及运算的效率编码方法主要分2类:二进制 行为模糊逻辑控制器(fuz四logic controls,FLC)参 编码和实数编码,后者是连续参数优化问题的直接 数,因此,评价标准应该是在LC作用下的对目标 描述,适合在遗传算法中表示范围较大的数,具有运 的围捕效果.具体到双机器人钳形夹击中,评价指标 算精度高、搜索空间大、计算复杂性低和运算效率高 应该包括动态目标与合围区域中心的距离,以及围 等优点.本文即采用实数编码方式生成遗传进化计 捕机器人间的相对距离等信息.本文设计的遗传算 算所需的基因个体.如上节所述,合围规则中速度和 法评价函数如下: 方位相关的后件部变量Wm(n)和W(n)各有36 个,以这72个变量为元素构成的一维数组定义为 f=∑(△Lg(n)WLm(n)+f 基因个体原型,其排列如下, 式中:N=Tma/△t为最大采样数;Tma为最大围捕时 Genotype b+l Woooo I Wooor I... 间设定为20s;△t为采样间隔设定为0.1s;△Lm(n) I Wi22 I Wooo I Wooor I...I Wi22 1. 为个相邻采样时刻两围捕机器人间相对距离的变化 种群的规模反映了工作空间内随机产生的路径条 量;Lo(n)为合围区域中心与动态目标重心的距 数规模越大,产生的路径越精确,而且容易找到全局 离;权重系数W。在一定程度上决定了遗传算法的 最优解,但搜索时间也会相应越长经过反复比较,本 搜索方向,通过试错法最终选定Wc=10:f。为惩罚 文设定的种群包含有51个基因个体,依一定概率随机 值,其值由下列关系决定: 产生满足下列约束条件的基因个体初始值, r1000. LTo >R; r0≤W≤1, f,= lWa∑(Ln-Ln),Lw<R. T ≤院≤石 三0 6 式中,Wm为权重系数,设定为50. 上述对速度和角度的约束来源于围捕机器人自 为了获得与机器人初始位姿及目标位置无关的 身的驱动能力. 合围行为规则,设计了7种典型的围捕环境用于 2.2.2遗传进化运算 LC的离线学习.则在这7种环境下合围的综合性 对随机生成的51个基因个体,依照图3所示的 能最好的规则即可以被看作多机器人系统近最优合 顺序进行遗传进化运算,为防止寻优过程中在最优 围行为控制器参数.相应地,由控制器参数编码形成 解附近产生震荡而导致不收敛,采用如下策略改进 的基因个体适应度函数定义如下: 传统遗传算法: 1)在排列环节,淘汰适应度值最低的个体,取 而代之是最优个体的1个复制,这个新个体将参与 式中,f为第i个环境下围捕实验获得的评价值.图 后续的交叉操作.这样在保持种群规模不变的前提 4为适应度随迭代次数变化的曲线,上方为种群平 下,提高了种群的平均适应度, 均适应度,下方为种群中最优个体适应度.可见随着 2)在变异环节,对由适应度高的父代交叉生成 遗传操作迭代次数的增加,种群适应度和最优个体 的子代设定较小的变异概率,反之设定较大的变异 适应度值均呈下降趋势. 概率.这种随机搜索机制既可以防止产生震荡又提
48 智能系统学报 第6卷 39*10 相对距离,虽然使算法简单易行,但避障效果差.碰 种群平均适应度 撞风险除与距离有关外,还和机器人与障碍间的相 31 wwwoy 对速度和相对方位等运动学信息密切相关.在MRS 仿真环境中,任意时刻的移动机器人速度和位置为 23 种群最优适应度 已知,障碍物的位置则由激光测距仪来测定,动态障 碍物的速度虽然未知,但当采样间隔较小时,可根据 迭代次数 激光测距仪量度变化量近似求得其运动速度.在得 图4模糊规则进化学习过程的适应度变化 到了上述运动信息后即可以通过CRE进行碰撞风 Fig.4 Fitness changes during learning process of fuzzy rules 险的计算,过程如图6~7所示.图6(a)、图7(a)分 为验证提出策略的有效性,在MRS平台上进行 别是静、动碰撞风险的模糊化隶属度函数.前者的输 了仿真实验.图5为采用FL的双机器人围捕1个动 入为夹角0和相对距离d;后者的输人则为速度矢 态目标的运动轨迹图.由图可知,尽管围捕机器人和 量间的夹角Φ和相对速度S.图6(b)、图7(b)分别 动态目标的初始位姿均不相同,采用同一策略的2 对应着静、动碰撞风险的模糊规则.图6(c)、 个仿真实验均实现了较好的围捕效果 图7(©)为反模糊化隶属度函数,采用加权平均计算 23 机器人1 22 静、动碰撞风险,即: 机器人#」 19 18 Q= 动态 动 P90 P,9■0 目标 5 5 15 14 日标机器人2 B=∑unw/∑ 机寤人#2 T,5=0 70 左大 左小右小石大 近 中 远 29 32 35 38 32 35 38 x/m x/m (a)实验1 (b)实验2 图5双机器人合围动态目标 90 a”) 90 0.6 左 …右 Fig.5 Cooperative hunting of dynamic target by dual robots 近远 (a)模糊求属度数 3避障行为获取 避障问题是机器人运动规划中最为复杂的基本 右小 左小 问题.常用方法包括边缘检测法(edge detection method,EDM)、向量场直方图(vector field histogram method,VFHM)和虚拟势场法(virtual force field 位 method,VFFM)等.EDM的缺点是需要停在障碍物 左大 原为 名大 花不 前获得足够的传感器信息,对硬件要求较高,实时性 系效系数 发 差.VFHM和VFFM的缺点则是不能利用局部的传 条数低 感器信息来逃离陷阱状态,容易陷入死锁.传统的避 交 近 机器人近 中 远 障策略也无法应付环境中存在动态随机障碍的导航 (h)模糊规则 任务. 左危险左危险左安全左交全右安全石安全右危险名危险 系数高系数低系数低系数高系数高系数低系数低系数高 针对上述问题,本文提出一种基于模糊逻辑的 碰撞风险评估(collision risk evaluation,CRE)方法. 在未知动态环境下,机器人首先通过激光测距仪感 知周围障碍物的信息,环境信息经模糊化后,被输入 -0.75-0.45-0.100.10.450.75 到规则库里进行模糊推论,最后通过反模糊计算得 到量化的碰撞风险.本文将碰撞风险与机器人的规 危险+…一安全一一危险 避角度进行了一一映射,并以此为参考对机器人避 (c)反模糊隶屈度函数 障进行控制。 图6静态碰撞风险模糊推理 传统的避障算法一般只考虑机器人与障碍间的 Fig.6 Fuzzy reference of static collision risk
第1期 王斐,等:基于模糊逻辑的多移动机器人自适应协作围捕 ·49… 左小 左中左小右小右中右大慢 快 算得到的碰撞风险与机器人避障角度进行了一一映 射,其映射关系如表1所示. 表1碰撞风险与避障角度映射关系 Φ/ 180 SMm·s) Table 1 Mapping between collision risk and avoidance angle 左 石 慢 …一快 B 危险一 ·安全 +危险 (a模糊求属度函数 -1.0-0.9-0.7-0.5-03-0.10010.30.50.70.91.0 -1. -180-90-60-45-30-151530456090180 -0.9 左小 石小 险0.7 -90 -60-45-30-1500153045-60-90 -60 -45-30-150 000153045-60 -0.5 -0.3 -45-30-15000000153045 -30-15 0000000015 30 -0.1 安0 -15 0 00000000015 全0.1 -15 0 00000 000015 -30-15 0 0 00000015 0.3 30 0.5 45 -30 -15 0 000001530 60 45-30-1 ,0000153045 左中 石中 0.7 数不 90 6045-30-15001530456090 险 0.9 180 1.0 906045-30-151530456090180 为了验证CRE策略的可行性,在MRS环境下 进行了仿真实验,机器人导航环境动态且未知.如图 左大 右大 8所示结果表明了提出策略的正确性和有效性 4仿真实验 (凸)模糊规则 在包容式结构下,机器人根据当前环境状态进 左危险左危险左安全左安全石交全石安全右危险石危险 行3种基本行为的切换.避障行为具有最高的优先 系数高系数低系数低系数高系数高系数低系数低系数高 级,因此围捕机器人在每一采样时刻均需要通过激 光测距仪感知是否有障碍进入避障区域(r= 2.5m),如果有,则切换至避障行为进行躲避,否 则,切换至合围行为来夹击目标;当围捕区域半径小 -0.75-0.45-0.100.10.450.7 于3m时,切换至抓捕行为来捕获目标。 危险… 安全 …危险 (c)反模糊隶属度函数 机器人种】 20 静念膜阁 图7动态碰撞风险模糊推理 动态 三16H标 Fig.7 Fuzzy reference of dynamic collision risk 12 态麻供物 机器人2 29 机器人 34 机2器人#1 29 34 39 28 38 x/m 24 费】 29 ● (a)2抓1 (b)3抓1 器人2 22 23 19 24 静态侯得物 机器人 卧态侨碍物 机海人#1 静态 障碍物 标点。 18 1410 160 13 16 19 142 14 16 18 x/m x/m 三13- 0 0 机器人#3 10 (a)静态障碍物 (b)动态障碍物 。机器人好 马杭程人#1 图8未知障碍环境下的随机避障 Fig.8 Random avoidance under environment with 27 32 3> 22 27 3237 x/m x/m unknown obstacles (c)4抓1 (d带行故辟的4抓1 本文中,无论是模糊规则还是反模糊隶属度函 图9未知动态环境多机器人协作围捕 数,自变量W均为根据专家知识和经验事先确定 Fig.9 Cooperative hunting of multi-robots under un- 的.为获得有效的实时避障策略,将基于模糊逻辑计 known dynamical environment
.50 智能系统学报 第6卷 本文设计了如下实验来验证提出策略的有效 [5]KAYA M,ALHAJJ R.Modular fuzzy-reinforcement learn- 性.图9(a)为2抓1,即2个机器人采用钳形夹击策 ing approach with internal model capabilities for multi-agent 略协作围捕1个动态目标,环境中既有静态随机障 systems[J].IEEE Transactions on System,Man,and Cy- 碍物,也有动态随机障碍物;图9(b)为3抓1,3个 bernetics,2004,34(2):1210-1223. [6]BURGARD W,MOORS M,SCHNEIDER F.Collaborative 围捕机器人组成3个双机子系统,各采用钳形夹击 exploration of unknown environments with teams of mobile 策略围捕动态目标;图9(c)为4抓1,4个围捕机器 robots[J].Lecture Notes in Computer Science,2002, 人组成6个双机子系统;图9(d)仍然是4抓1,不同 2466:187-215. 的是,其中1个机器人在围捕过程中出现故障,任务 [7]GONG Jianwei,QI Jianyong,XIONG Guangming,et al.A 变成了3抓1.实验结果表明,提出的策略对于围捕 GA based combinatorial auction algorithm for multi-robot co- 机器人数量的增减以及环境的变化具有自适应性和 operative hunting [C]//2007 International Conference on 鲁棒性,且具有大型多机器人系统必须具备的容错 Computational Intelligence and Security.Harbin,China, 能力. 2007:137-141. [8]曹洋.非完整足球机器人运动控制策略的研究与实现 5结束语 [D].沈阳:东北大学信息科学与工程学院,2004:92- 93. 本文提出一种在未知动态环境下实现多移动机 CAO Yang.Study and implementation of motion control 器人自适应协作围捕运动目标的整体方案.首先在 strategy for nonholonomic constraint soccer robot[D].Shen- 包容式体系结构下将机器人行为分解为避障、合围 yang:College of Information Science and Engineering, 和抓捕3个基本行为.合围属于协调行为,为保证其 Northeastern University,2004:92-93. 良好的反应性、自适应性和容错性,提出双机器人钳 [9]WANG Fei,WEI Wei,WU Chengdong.Cooperative hun- 形夹击策略,并通过L方法实现.在围捕过程中, ting of multiple mobile robots under unknown dynamic envi- 多机器人系统被分解为若干个双机子系统,子系统 ronment[C]//The 21st Chinese Control and Decision Con- 采用钳形夹击策略计算个体机器人的合围矢量,并 ference.Guilin,China,2009:3039-3044. 通过矢量叠加获得整个系统的合围行为.同时,设计 作者简介: 了基于碰撞风险的随机避障策略以躲避动态环境中 王斐,男,1974年生,副教授,中国 的障碍.最后,采用圆弧运动末端处理算法对动态目 自动化学会机器人专业委员会委员,主 要研究方向为智能机器人、多机器人系 标实现抓捕以提高围捕效率.在MRS仿真环境下进 统,主持参与国家级、省部级基金等项 行了各种初始条件下的围捕实验,结果证明了新方 目10余项,发表学术论文40余篇: 法的正确性和有效性, 参考文献: 闻时光,男,1981年生,助教,主要 [1]SUGAR T G,KUMAR V.Control of cooperating mobile 研究方向为智能控制、摸式识别: manipulators[J].IEEE Transactions on Robotics and Auto- mation,2002,18(1):94-103. [2]WANG Wei,QI Jinghao,ZHANG Houxiang,et al.A rapid hunting algorithm for multi-mobile robots system[C]//The 2nd IEEE Conference on Industrial Electronics and Applica- tions.Harbin,China,2007:1203-1207. 吴成东,男,1960年生,教授、博士 [3]毛小锋,曹志强,谭民,等,多移动机器人圆形队列形成 生导师,教育部自动化专业教学指导委 算法[J].系统仿真学报,2004,16(4):628629, 员会委员、中国自动化学会教育工作委 MAO Xiaofeng,CAO Zhiqiang,TAN Min,et al.Distribu- 员会副主任,主要研究方向为智能控 ted circle formation algorithm for multiple mobile robots[J]. 制、移动机器人智能导航.主持完成国 Journal of System Simulation,2004,16(4):628-629. 家级、省部级等项目20余项,荣获国家 [4]MIYAMAE T,ICHIKAWA S,HARA F.Effects of popula- 级教学成果二等奖1项、省部级科技进步奖和教学研究成果 tion density on the emergence of circle formation in multiple 奖一等奖、二等奖14项.发表学术论文200余篇,被SCI、I robots system with a local vision[C]//Proceedings of IEEE 检索160余篇,出版学术著作和教材9部. RSJ International Conference on Robots and Systems.Lau- sanne,Switzerland,2002,3:2789-2794