【学术论文】异质多移动机器人协同技术研究的进展（蔡自兴、陈白帆、王璐、刘丽珏、段琢华）

团购合买资源类别：文库，文档格式：PDF，文档页数：7，文件大小：209.59KB

第2卷第3期智能系统学报 Vol.2 N23 2007年6月 CAAI Transactions on Intelligent Systems Jun.2007 异质多移动机器人协同技术研究的进展蔡自兴，陈白帆，王璐，刘丽珏，段琢华 (中南大学信息科学与工程学院，湖南长沙410083) 摘要：随着移动机器人应用的领域和范围的不断扩展，多移动机器人由于其单个机器人无法比拟的优越性己经越来越受到重视从体系结构、协作与协调、协作环境感知与定位、重构及机器学习几个重要课题对多移动机器人协同技术进行了综述，尤其侧重于各种技术如何处理和包容团队中的异质性，并分析了本领域中的研究难点问题，最后展望了异质多移动机器人研究的前景与发展趋势. 关键词：多移动机器人；协同；异质中图分类号：TP242文献标识码：A文章编号：1673-4785(2007)030001-07 The progress of cooperative technology for heterogeneous multiple mobile robots CAI Zi-xing,CHEN Bai-fan,WANG Lu ,LIU Li-jue,DUAN Zhuo-hua (School of Information Science and Engineering,Central South University,Changsha 410083,China) Abstract:With continuing growth in the use of mobile robots,multiple mobile robots get more and more attention because of their superiority in performance over an individual robot.This paper makes a compre- hensive introduction to cooperative technology for multiple mobile robots.Some important subjects are in- cluded such as architecture,collaboration and coordination,sensing and localization,reconfiguration,and machine learning.It particularly emphasizes how all technologies must deal with the heterogeneity of the team.It concludes by examining challenges in the field,research prospects,and development trends for heterogeneous multiple mo bile robots. Keywords:multiple mobile robots;cooperation;heterogeneous 多移动机器人领域研究始于20世纪80年代，有限任务的机器人可以设计得更完善；可以通过成最初的研究集中在体系结构运动规划、可重构几个员间的相互协作增加冗余度，消除失效点，增加解决方面四.随着应用领域的不断拓展，尤其是水下、空方案的鲁棒性：可以提供更多的解决方案，降低系统间、危险环境探索、服务及教育领域等场合的应用需造价与复杂度等.由于这样一些优势，多机器人协同求，促使多移动机器人领域的研究课题逐渐深入和技术研究吸引了国内外学术界越来越多的兴趣与关广泛. 注. 与单机器人相比，多机器人系统具有许多优点：异质性研究是多移动机器人领域的重要热点之可以通过对某些任务进行适当分解，使多个机器人一).严格地说，实践中由于制造、磨损等原因不可分别并行地完成不同的子任务，从而加快任务执行能得到真正同质的机器人团队.因此，为了有效设计速度，提高工作效率；可以将系统中的成员设计成完多移动机器人团队，必须理解团队中个体间的差异成某项任务的“专家”，而不是设计成完成所有任务性以及对性能的影响，关注异质性为多机器人协同的“通才”，使得机器人的设计有更大的灵活性，完成领域带来的新的研究课题，如差异检测、异质个体间的通信、个体对其他成员的适应性、不同传感能力的收稿日期：200608-28. 个体间如何协作定位等。基金项目：因家基础科学研究基金资助项目(A1420060159):国家自然科学基金重点资助项目(60234030). 文中对多移动机器人协同技术的几个重要研究 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

第 2 卷第 3 期智能系统学报 Vol. 2 №. 3 2007 年 6 月 CAA I Transactions on Intelligent Systems J un. 2007 异质多移动机器人协同技术研究的进展蔡自兴 ,陈白帆 ,王璐 ,刘丽珏 ,段琢华 (中南大学信息科学与工程学院 ,湖南长沙 410083) 摘要 :随着移动机器人应用的领域和范围的不断扩展 ,多移动机器人由于其单个机器人无法比拟的优越性已经越来越受到重视. 从体系结构、协作与协调、协作环境感知与定位、重构及机器学习几个重要课题对多移动机器人协同技术进行了综述 ,尤其侧重于各种技术如何处理和包容团队中的异质性 ,并分析了本领域中的研究难点问题 ,最后展望了异质多移动机器人研究的前景与发展趋势. 关键词 :多移动机器人 ;协同 ;异质中图分类号 : TP242 文献标识码 :A 文章编号 :167324785 (2007) 0320001207 The progress of cooperative technology for heterogeneous multiple mobile robots CAI Zi2xing ,CH EN Bai2fan ,WAN G Lu ,L IU Li2jue ,DUAN Zhuo2hua (School of Information Science and Engineering , Central South University , Changsha 410083 , China) Abstract :Wit h continuing growt h in t he use of mobile robots , multiple mobile robots get more and more attention because of t heir superiority in performance over an individual robot. This paper makes a compre2 hensive introduction to cooperative technology for multiple mobile robots. Some important subjects are in2 cluded such as architect ure , collaboration and coordination , sensing and localization , reconfiguration , and machine learning. It particularly emp hasizes how all technologies must deal wit h t he heterogeneity of t he team. It concludes by examining challenges in t he field , research prospects , and development trends for heterogeneous multiple mobile robots. Keywords :multiple mobile robots ; cooperation ; heterogeneous 收稿日期 :2006208228. 基金项目 :国家基础科学研究基金资助项目(A1420060159) ;国家自然科学基金重点资助项目(60234030) . 多移动机器人领域研究始于 20 世纪 80 年代 , 最初的研究集中在体系结构、运动规划、可重构几个方面[ 1 ] . 随着应用领域的不断拓展 ,尤其是水下、空间、危险环境探索、服务及教育领域等场合的应用需求 ,促使多移动机器人领域的研究课题逐渐深入和广泛. 与单机器人相比 ,多机器人系统具有许多优点 : 可以通过对某些任务进行适当分解 ,使多个机器人分别并行地完成不同的子任务 ,从而加快任务执行速度 ,提高工作效率 ;可以将系统中的成员设计成完成某项任务的“专家”,而不是设计成完成所有任务的“通才”,使得机器人的设计有更大的灵活性 ,完成有限任务的机器人可以设计得更完善 ;可以通过成员间的相互协作增加冗余度 ,消除失效点 ,增加解决方案的鲁棒性 ;可以提供更多的解决方案 ,降低系统造价与复杂度等. 由于这样一些优势 ,多机器人协同技术研究吸引了国内外学术界越来越多的兴趣与关注. 异质性研究是多移动机器人领域的重要热点之一[2 ] . 严格地说 ,实践中由于制造、磨损等原因不可能得到真正同质的机器人团队. 因此 ,为了有效设计多移动机器人团队 ,必须理解团队中个体间的差异性以及对性能的影响 ,关注异质性为多机器人协同领域带来的新的研究课题 ,如差异检测、异质个体间的通信、个体对其他成员的适应性、不同传感能力的个体间如何协作定位等. 文中对多移动机器人协同技术的几个重要研究 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

·2 智能系统学报第2卷课题进行了综述，尤其侧重于各种技术如何处理和他专用设备构成，采用合同网(Contract Net)进行包容团队中的异质性.随后对本领域的研究难点进任务分配和协商.L.E.Parker提出的ALL 行了一定的剖析，并指出未来的研究趋势，希望能够 ANCE山与ACTRESS相比，可以在某个机器人任对本领域的进一步深入研究有所帮助务失败后由其他机器人来接替.其缺点在于它只能 1异质多移动机器人协同技术的研究处理可以被分解成独立的子任务的情况，并且没有明显的协商机制，每个机器人通过广播把自身的状概况态和行为通知其他机器人.针对异质多移动机器人多移动机器人协同技术的主要研究课题包括：协作问题，Vidal等提出一种混合层次体系结构2] 体系结构以及通信，任务分配、运动协调及控制；定将异质Agent置于不同的抽象层次，通过层次间通位、建模与探索；可重构机器人等).文中从上述几信实现异质机器人的互操作.该方法在无人地面/空个研究课题出发，着重指出各种技术对异质性的包中移动体的追击逃避游戏中取得了较好的应用效容与处理.另外，还对多移动机器人协同领域的学习果理论与方法进行了总结通信方面，统一的语言或符号理解是显式通信 1.1异质多移动机器人协作的体系结构中异质机器人间通信的基础.国际上比较广泛使用多移动机器人软件体系结构研究的主要内容包的Aget通信语言有KQML、KIF等.除此之外括：组织结构与通信机制、同质与异质成员等 Jung和Zelinsky3提出一种面向工程的符号通信目前多移动机器人协作的组织结构主要有3 机制以支持异质机器人间的协作，并在完成清洁任种务的多机器人团队中进行了成功的部署 1)集中式，其代表是基于黑板的多Agent系 1.2异质多移动机器人的协同机制统)以及SRI的OAA软件体系).OAA设计一个协同包括2项内容：协作与协调.异质移动体的代理助手(facilitator)作为控制与协作的中心与各存在为多移动机器人协作研究带来新的挑战，其关种功能Agent组成C/S系统结构，其功能远远超过键问题是异质团队中能力不同的各成员间如何彼此黑板.代理助手负责管理通信、数据、任务分配等，并适应，即如何展开有效合作且将用户当作具有特权的Agent,即支持异质A- 异质多Agent团队中由于各自能力不同，对协 gent的集成.但该结构灵活性不足，过分依赖协调作提出了特殊要求.尤其是当多个成员都能完成某中心将可能使系统在失去该中心时完全瘫痪任务，只是效果不同的重叠(overlap)情况下，如何 2)分布式，其代表是UPenn提出的ROC1以合理有效地进行任务分配和调度是一个挑战性的问及层次化和对象可重构1、多模式交互I以及Ad 题.Parker提出一种L~ALL IANCE机制使多机器 Hoc网络劉等软件框架.ROCI基于己封装的功能人团队能够适应成员能力差异环境状态变化等，保模块组成特定任务的Agent,进而组成团队.软件体证团队能够长期工作).Murphy等提出利用情感系的核心称为ROCI核，每个Agent上都存在一个计算模型在传感马达级（反应式）修改主动行为 ROCI核的副本，负责管理网络和维护网络上A- 从而无需集中规划即可产生团队的社会行为，并极 get组成的数据库，以实现分布式控制.分布式结大降低了通信需求s].基于市场机制(market- 构具有结构灵活等优点，但在协调机制上，如任务分 based)的任务分配策略有利于包容异质成员.各机配运动规划等方面开销很大. 器人根据自己的局部环境信息对某任务的执行效果 3)混合式，是集中式与分布式的折中1.系统中做出估计，并将估计值向团队中的成员通报，同时所多Agent组成层次结构，上层的监控Agent对下层有得到该通报信息的成员根据各自的局部信息也对的受控Aget有部分控制能力.该结构既灵活又能该任务做出估计且在团队中通报.如果估计的结果够有效协调，其思想与一些应用的实际情况较接近. 是以效用值表示，则团队中对该任务的效用估计值近年来，国外对异质多机器人协作问题的研究大者获得该任务的执行权.此外，Matchell A.Pot 逐渐增多，但国内还很少见.异质机器人在处理信息 tr等提出的基于自然界中物种协作进化机制的协的形式和处理信息的能力等方面存在很大差异，因作协进化方法有可能获得优化的任务分配性能6 此对软件体系结构的设计提出了新的要求对于协调问题，近年来该领域研究逐渐从多机早期的异质多机器人系统的研究中成员间差异器人路径规划编队等传统研究课题转向目标搜索、并不明显，如ACTRESS!1由计算机、机器人和其多机器人停驻等问题.Saptharishi等提出通过检查 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

课题进行了综述 ,尤其侧重于各种技术如何处理和包容团队中的异质性. 随后对本领域的研究难点进行了一定的剖析 ,并指出未来的研究趋势 ,希望能够对本领域的进一步深入研究有所帮助. 1 异质多移动机器人协同技术的研究概况多移动机器人协同技术的主要研究课题包括 : 体系结构以及通信 ;任务分配、运动协调及控制 ;定位、建模与探索 ;可重构机器人等[1 ] . 文中从上述几个研究课题出发 ,着重指出各种技术对异质性的包容与处理. 另外 ,还对多移动机器人协同领域的学习理论与方法进行了总结. 1. 1 异质多移动机器人协作的体系结构多移动机器人软件体系结构研究的主要内容包括 :组织结构与通信机制、同质与异质成员等. 目前多移动机器人协作的组织结构主要有 3 种 : 1) 集中式 ,其代表是基于黑板的多 Agent 系统[3 ]以及 SRI 的 OAA 软件体系[ 4 ] . OAA 设计一个代理助手 (facilitator) 作为控制与协作的中心与各种功能 Agent 组成 C/ S 系统结构 ,其功能远远超过黑板. 代理助手负责管理通信、数据、任务分配等 ,并且将用户当作具有特权的 Agent ,即支持异质 A2 gent 的集成. 但该结构灵活性不足 ,过分依赖协调中心将可能使系统在失去该中心时完全瘫痪. 2) 分布式 ,其代表是 U Penn 提出的 ROCI [5 ] 以及层次化和对象可重构[6 ] 、多模式交互[7 ] 以及 Ad Hoc 网络[8 ] 等软件框架. ROCI 基于已封装的功能模块组成特定任务的 Agent ,进而组成团队. 软件体系的核心称为 ROCI 核 ,每个 Agent 上都存在一个 ROCI 核的副本 ,负责管理网络和维护网络上 A2 gent 组成的数据库 ,以实现分布式控制. 分布式结构具有结构灵活等优点 ,但在协调机制上 ,如任务分配、运动规划等方面开销很大. 3) 混合式 ,是集中式与分布式的折中[9 ] . 系统中多 Agent 组成层次结构 ,上层的监控 Agent 对下层的受控 Agent 有部分控制能力. 该结构既灵活又能够有效协调 ,其思想与一些应用的实际情况较接近. 近年来 ,国外对异质多机器人协作问题的研究逐渐增多 ,但国内还很少见. 异质机器人在处理信息的形式和处理信息的能力等方面存在很大差异 ,因此对软件体系结构的设计提出了新的要求. 早期的异质多机器人系统的研究中成员间差异并不明显 ,如 ACTRESS [10 ] 由计算机、机器人和其他专用设备构成 ,采用合同网 (Contract Net) 进行任务分配和协商. L. E. Parker 提出的 ALL I2 ANCE [11 ]与 ACTRESS 相比 ,可以在某个机器人任务失败后由其他机器人来接替. 其缺点在于它只能处理可以被分解成独立的子任务的情况 ,并且没有明显的协商机制 ,每个机器人通过广播把自身的状态和行为通知其他机器人. 针对异质多移动机器人协作问题 ,Vidal 等提出一种混合层次体系结构[12 ] , 将异质 Agent 置于不同的抽象层次 ,通过层次间通信实现异质机器人的互操作. 该方法在无人地面/ 空中移动体的追击 —逃避游戏中取得了较好的应用效果. 通信方面 ,统一的语言或符号理解是显式通信中异质机器人间通信的基础. 国际上比较广泛使用的 Agent 通信语言有 KQML 、KIF 等. 除此之外 , J ung 和 Zelinsky [13 ]提出一种面向工程的符号通信机制以支持异质机器人间的协作 ,并在完成清洁任务的多机器人团队中进行了成功的部署. 1. 2 异质多移动机器人的协同机制协同包括 2 项内容 :协作与协调. 异质移动体的存在为多移动机器人协作研究带来新的挑战 ,其关键问题是异质团队中能力不同的各成员间如何彼此适应 ,即如何展开有效合作. 异质多 Agent 团队中由于各自能力不同 ,对协作提出了特殊要求. 尤其是当多个成员都能完成某任务 ,只是效果不同的重叠 (overlap) 情况下 ,如何合理有效地进行任务分配和调度是一个挑战性的问题. Parker 提出一种 L2ALL IANCE 机制使多机器人团队能够适应成员能力差异、环境状态变化等 ,保证团队能够长期工作[14 ] . Murp hy 等提出利用情感计算模型在传感 —马达级 (反应式) 修改主动行为 , 从而无需集中规划即可产生团队的社会行为 ,并极大降低了通信需求[15 ] . 基于市场机制 ( market2 based) 的任务分配策略有利于包容异质成员. 各机器人根据自己的局部环境信息对某任务的执行效果做出估计 ,并将估计值向团队中的成员通报 ,同时所有得到该通报信息的成员根据各自的局部信息也对该任务做出估计且在团队中通报. 如果估计的结果是以效用值表示 ,则团队中对该任务的效用估计值大者获得该任务的执行权. 此外 ,Matchell A. Pot2 ter 等提出的基于自然界中物种协作进化机制的协作协进化方法有可能获得优化的任务分配性能[16 ] . 对于协调问题 ,近年来该领域研究逐渐从多机器人路径规划、编队等传统研究课题转向目标搜索、多机器人停驻等问题. Sapt harishi 等提出通过检查 ·2 · 智能系统学报第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

第3期蔡自兴，等：异质多移动机器人协同技术研究的进展站和基于统计运动状态估计的动态权限分配策略进间必须保持视觉或距离传感方面的“接触” 行路径规划，并开发出基于视觉的监视及复杂环境在环境建模与定位算法方面，将单机器人的算中跟踪多运动目标的实验系统).异质多机器人团法扩展到多机器人领域，取得了较高的定位精度，但队中由于个体具有不同的运动、规划等能力，使得协算法在适应性等方面仍存在很大的问题.文献[23- 调问题更加复杂.ALLIANCE基于行为集合(be 24]将Kalman滤波算法扩展到多机器人协作建模 havior set))支持异质移动体的集成，但构造基本行领域，将一个Kalman滤波估计器分解为多个具有为本身就比较困难，而且没有明显的协商机制.此通信能力的小滤波器，存在于每个机器人上，相互之外，还需要关注动态环境的多机器人协调路径规划间共享内部传感器信息.多机器人团队行动中，各滤问题.目前解决这个问题的基本方法有2种：一种是波器根据各自外部传感器信息进行位置估计和修基于“空间时间”的规划方法，它通过给各个机器正，并相互交流位置信息.实践表明，协作定位精度人设置优先级的思想或交通规则的思想而把问题简明显高于单个机器人使用Kalman滤波的定位结化为单个机器人的路径规划问题，另一种是人工势果.但该方法在估计与更新阶段都忽略了方向不确场法它基于各个机器人的局部信息而确定其当前定性的影响，因而简化了实际环境的噪声分布运动路线但当机器人的工作空间比较复杂或者障 Monte Carlo定位是近年来单机器人建模与定位领碍物的形状比较复杂时，上述2种方法都无法保证》域非常流行的热门技术，文献[25·26]将其扩展到一定能够产生出无碰撞的运动路线，也保证不了各多机器人领域，具体应用于2个机器人协作探索环个机器人一定能够达到各自相应的目的地.此外，也境的场合.当2个机器人互相探测到对方时，各自对有不少人提出了采用遗传算法来解决这一问题，但定位位置估计的信念由于互相印证而得到加强，从遗传算法包括复杂的交叉运算，并采用无记忆的进而可以比单机器人更快地收敛到相对精确的估计位化模式，收敛速度较慢，计算复杂置.但目前该方法还只能应用于室内环境，且由于彼关于多Agent协作领域的任务分配、运动规划此探测时忽略了探测信息的相互依赖，有可能导致及控制等问题，文献[1]进行了比较全面的综述.需过分乐观的位置估计2列要指出的是，关于异质多Aget团队研究国内很少目前，大多数多机器人团队协作时只能针对同涉及，特别是有人参与的多Agent协作始终是一个种传感器以方便融合2】，有效利用异质传感器融合具有挑战性的开放问题.Nakamura等提出一个比的多机器人协作环境识别与目标定位还很少见.事较灵活的命令与监督机制8】，使人能够作为操作者实上，各种传感器具有各自的优点.声呐能够较精确与移动机器人团队协调工作探测机器人间的距离，但杂波较多.立体视觉既能探 1.3多移动机器人的环境感知与定位测距离也能探测方向21，近年来激光雷达逐渐取代多机器人协作的环境感知与定位需要考虑选择声纳成为测距传感器的主流，文献[30]融合视觉传何种控制结构、如何实现协作、相互间的定位等单机感器与激光雷达数据进行协作建模，是异质传感信器人不需要考虑的问题.文献[19]采用一种完全分息融合的有益尝试.但目前，这些融合还只是严格约布式的控制结构，多机器人间通过无线网络进行通束条件下的像素级融合讯，每个机器人通过广播方式把自己的局部地图信 1.4多移动机器人团队的重构技术息发送到所有机器人.文献[20]采用了另外一种控重构(reconfiguration)是针对多移动体的故障制结构：分散探索，集中环境建模，即各机器人使用或任务要求重新配置或重新组织的方法，其日的在相同的算法处理自己的感知数据并创建局部地图，于屏蔽发生故障的移动体或部件对其他移动体和部存在一个中央模块将所有的局部环境模型集成为全件的影响，以尽可能最大程度地完成预定任务：或者局环境模型.而对于多机器人间相互定位问题，文献通过重构满足不同任务要求」 [21]中多移动机器人在待探索的环境中行动时，某对于多机器人系统，重构研究主要集中在可重个时刻至少有一个机器人是静止的.其他机器人将构机器人，即通过独立模块重新组织或连接而形成该静止机器人作为路标，相对其进行自身定位.文献不同形状以满足不同功能要求，甚至可实现自修 [22]中某时刻只有一个机器人可以行动，其他机器复3).文献[32]研究了基于动机行为(motivational 人则组成等边三角形的信标供移动机器人进行定 behaviors)的异质多机器人容错机制，为机器人赋位.这2种方法具有共同的局限性，即某时刻只能有予“急躁”(impatience)与“默许”(acquiescence)2种部分机器人可以移动；机器人与作为信标的机器人内部动机.“急躁”导致机器人对某一行为的动机增 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.nei

站和基于统计运动状态估计的动态权限分配策略进行路径规划 ,并开发出基于视觉的监视及复杂环境中跟踪多运动目标的实验系统[17 ] . 异质多机器人团队中由于个体具有不同的运动、规划等能力 ,使得协调问题更加复杂. ALL IANCE 基于行为集合 ( be2 havior set) 支持异质移动体的集成 ,但构造基本行为本身就比较困难 ,而且没有明显的协商机制. 此外 ,还需要关注动态环境的多机器人协调路径规划问题. 目前解决这个问题的基本方法有 2 种 :一种是基于“空间 —时间”的规划方法 ,它通过给各个机器人设置优先级的思想或交通规则的思想而把问题简化为单个机器人的路径规划问题 ;另一种是人工势场法 ,它基于各个机器人的局部信息而确定其当前运动路线. 但当机器人的工作空间比较复杂 ,或者障碍物的形状比较复杂时 ,上述 2 种方法都无法保证一定能够产生出无碰撞的运动路线 ,也保证不了各个机器人一定能够达到各自相应的目的地. 此外 ,也有不少人提出了采用遗传算法来解决这一问题 ,但遗传算法包括复杂的交叉运算 ,并采用无记忆的进化模式 ,收敛速度较慢 ,计算复杂. 关于多 Agent 协作领域的任务分配、运动规划及控制等问题 ,文献[ 1 ]进行了比较全面的综述. 需要指出的是 ,关于异质多 Agent 团队研究国内很少涉及 ,特别是有人参与的多 Agent 协作始终是一个具有挑战性的开放问题. Nakamura 等提出一个比较灵活的命令与监督机制[18 ] ,使人能够作为操作者与移动机器人团队协调工作. 1. 3 多移动机器人的环境感知与定位多机器人协作的环境感知与定位需要考虑选择何种控制结构、如何实现协作、相互间的定位等单机器人不需要考虑的问题. 文献[ 19 ]采用一种完全分布式的控制结构 ,多机器人间通过无线网络进行通讯 ,每个机器人通过广播方式把自己的局部地图信息发送到所有机器人. 文献[ 20 ]采用了另外一种控制结构 :分散探索 ,集中环境建模 ,即各机器人使用相同的算法处理自己的感知数据并创建局部地图 , 存在一个中央模块将所有的局部环境模型集成为全局环境模型. 而对于多机器人间相互定位问题 ,文献 [21 ]中多移动机器人在待探索的环境中行动时 ,某个时刻至少有一个机器人是静止的. 其他机器人将该静止机器人作为路标 ,相对其进行自身定位. 文献 [22 ]中某时刻只有一个机器人可以行动 ,其他机器人则组成等边三角形的信标供移动机器人进行定位. 这 2 种方法具有共同的局限性 ,即某时刻只能有部分机器人可以移动 ;机器人与作为信标的机器人间必须保持视觉或距离传感方面的“接触”. 在环境建模与定位算法方面 ,将单机器人的算法扩展到多机器人领域 ,取得了较高的定位精度 ,但算法在适应性等方面仍存在很大的问题. 文献[ 23 - 24 ]将 Kalman 滤波算法扩展到多机器人协作建模领域 ,将一个 Kalman 滤波估计器分解为多个具有通信能力的小滤波器 ,存在于每个机器人上 ,相互之间共享内部传感器信息. 多机器人团队行动中 ,各滤波器根据各自外部传感器信息进行位置估计和修正 ,并相互交流位置信息. 实践表明 ,协作定位精度明显高于单个机器人使用 Kalman 滤波的定位结果. 但该方法在估计与更新阶段都忽略了方向不确定性的影响 ,因而简化了实际环境的噪声分布. Monte Carlo 定位是近年来单机器人建模与定位领域非常流行的热门技术 ,文献[ 25 - 26 ]将其扩展到多机器人领域 ,具体应用于 2 个机器人协作探索环境的场合. 当 2 个机器人互相探测到对方时 ,各自对定位位置估计的信念由于互相印证而得到加强 ,从而可以比单机器人更快地收敛到相对精确的估计位置. 但目前该方法还只能应用于室内环境 ,且由于彼此探测时忽略了探测信息的相互依赖 ,有可能导致过分乐观的位置估计[27 ] . 目前 ,大多数多机器人团队协作时只能针对同种传感器以方便融合[28 ] ,有效利用异质传感器融合的多机器人协作环境识别与目标定位还很少见. 事实上 ,各种传感器具有各自的优点. 声呐能够较精确探测机器人间的距离 ,但杂波较多. 立体视觉既能探测距离也能探测方向[29 ] ;近年来激光雷达逐渐取代声纳成为测距传感器的主流 ,文献[ 30 ]融合视觉传感器与激光雷达数据进行协作建模 ,是异质传感信息融合的有益尝试. 但目前 ,这些融合还只是严格约束条件下的像素级融合. 1. 4 多移动机器人团队的重构技术重构(reconfiguration) 是针对多移动体的故障或任务要求重新配置或重新组织的方法 ,其目的在于屏蔽发生故障的移动体或部件对其他移动体和部件的影响 ,以尽可能最大程度地完成预定任务 ;或者通过重构满足不同任务要求. 对于多机器人系统 ,重构研究主要集中在可重构机器人 ,即通过独立模块重新组织或连接而形成不同形状以满足不同功能要求 ,甚至可实现自修复[31 ] . 文献[32 ]研究了基于动机行为 (motivational behaviors) 的异质多机器人容错机制 ,为机器人赋予“急躁”(impatience) 与“默许”(acquiescence) 2 种内部动机.“急躁”导致机器人对某一行为的动机增第 3 期蔡自兴 ,等 :异质多移动机器人协同技术研究的进展 ·3 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

●4 智能系统学报第2卷强而取代其他可能不能顺利完成任务（例如出现故协同进化适合用于能自然分解成相互作用或相互合障)的机器人，从而实现对机器人团队内其他成员失作的问题，每一个子模块用单独的种群进化，通过问效的容错，“默许”导致机器人放弃某一未能完成的题分解使搜索空间变小，并更容易维持多样性.竞争任务以实现对自身的容错.文献[33]研究了受生物协同进化适合于求解比较容易获得测试例子的问启发的激素通讯机制，在此基础上提出了自适应通题，通过问题的解和测试例子一起进化，相互驱使提讯协议.单个“激素”信号可以在整个模块网络间传高各自性能和复杂性，使得参与竞争的种群不断提递，但导致不同的模块根据其局部接收器、传感器、高复杂度4 拓扑连接以及状态信息等不同而做出不同的反应. 但是协进化学习还面临着一些问题，体现在：1) 1.5增强多机器人团队环境和任务适应能力的机目前建立的协同进化模型没有充分考虑生态系统的器学习理论与方法特性，如时滞性、关键性等；2)研究在新环境和动态由于实时环境瞬息万变，不可能在研制期间完变化环境MAS中协同算法的应用也是很多工作指全预知未来的环境变化情况并做出完善的对策，因出的进一步研究方向；3)问题如何自动分解，以自动此必须研究相应的机器学习理论与方法以提高移动构造协同种群也值得研究21.因此，进化学习是否体个体及团队的灵活自治性和适应性能持续有效进化结果是否可以进一步扩展到有人近年来，机器学习已取得了一些突破性进展，其参与的团队协同等复杂行为等问题都值得深入探中包括增强学习(reinforcement learning)理论和算讨法研究、进化学习算法和应用研究等.上述机器学习理论和方法为复杂和未知环境中的多机器人协 2 研究难点作信息提取、环境理解、任务规划与行为决策等提供 2.1异质成员间的通信问题了有效的解决途径异质多移动机器人间的通信问题是一个比较关经典的增强学习仅适用于解决单机器人的马尔键和急需解决的问题.由于团队中不同机器人具有科夫决策问题(MDP),而多机器人系统中由于机器不同的结构通信能力和信息表达方式，所执行的任人间的相互影响，不是一个完全的MDP过程.因此务也五花八门，因此设计一种通用的描述语言是非提出并证明一个多Agent系统(MAS,又称多智能常困难的体系统)的强化学习理论系统的任务就迫在眉睫此外，还需要考虑通信的开销问题.最理想情况 Junlung Hu在1998年证明了应用在线Q-学习实是能够达到按需通信，即在需要的时候某2个机器现的动态环境下的多Agent协作最终会收敛到人才进行通信，在不需要的时候就不通信，这样可以 Nash平衡点，为MAS中使用增强学习提供了理论减少整个团队的消耗」基础3].在此基础上，增强学习在多机器人协作领 2.2异质成员间的任务分配优化问题域得到越来越多的应用6·)，分布式增强学习异质团队的优势在于能够根据具体的任务分配 (DL)逐渐成为新的研究热点38.391.目前，国内外不同能力的机器人去完成，达到“人尽其材，物尽其针对DL的研究较少，尤其是在真实环境中受传感用”.真正做到任务分配优化，就要了解不同机器人能力等制约，环境最多只可能模型化为部分可观测的能力，在具体情况下根据机器人所处的状态，将任马氏决策过程(POMDP),在此情况下，如何最大化务分解成多个子任务分配给机器人.其难点主要体奖励总和（增强信号），正是本项目中需要解决的问现在2个方面：题 1)任务的分解.任务分解是否合理直接影响到移动机器人进化学习包括群体进化学习和个体任务分配是否达到优化.目前对任务的分解主要根发展学习，协进化策略是近年该领域研究的热据距离、时间场合等，很多实际任务是比较难分解点01，为解决机器学习、复杂系统动态自适应等问的题提供了一种重要的途径.传统遗传算法(GA)在处 2)子任务的分配.在将任务分解成多个子任务理复杂的、多目标、多变量优化问题时往往存在早后，应该根据机器人的能力和当前状态来分配子任熟或收敛慢等问题，并且只适用于单个个体的进化. 务.这是一个优化问题，需要考虑众多因素，如所携而协进化算法借鉴生态学的种群协同理论，通过构带的传感器，机器人的速度和灵活程度，机器人的计造多个种群，建立它们之间的竞争或共生关系，多个算能力和通信能力，以及当前机器人是否空闲，机器种群相互驱使来提高各自性能和复杂性.其中共生人以前做类似任务时的完成情况等 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved htp://www.cnki.net

强而取代其他可能不能顺利完成任务 (例如出现故障) 的机器人 ,从而实现对机器人团队内其他成员失效的容错“; 默许”导致机器人放弃某一未能完成的任务以实现对自身的容错. 文献[ 33 ]研究了受生物启发的激素通讯机制 ,在此基础上提出了自适应通讯协议. 单个“激素”信号可以在整个模块网络间传递 ,但导致不同的模块根据其局部接收器、传感器、拓扑连接以及状态信息等不同而做出不同的反应. 1. 5 增强多机器人团队环境和任务适应能力的机器学习理论与方法由于实时环境瞬息万变 ,不可能在研制期间完全预知未来的环境变化情况并做出完善的对策 ,因此必须研究相应的机器学习理论与方法以提高移动体个体及团队的灵活自治性和适应性. 近年来 ,机器学习已取得了一些突破性进展 ,其中包括增强学习 (reinforcement learning) 理论和算法研究、进化学习算法和应用研究[34 ] 等. 上述机器学习理论和方法为复杂和未知环境中的多机器人协作信息提取、环境理解、任务规划与行为决策等提供了有效的解决途径. 经典的增强学习仅适用于解决单机器人的马尔科夫决策问题(MDP) ,而多机器人系统中由于机器人间的相互影响 ,不是一个完全的 MDP 过程. 因此提出并证明一个多 Agent 系统 (MAS ,又称多智能体系统) 的强化学习理论系统的任务就迫在眉睫. J unlung Hu 在 1998 年证明了应用在线 Q2学习实现的动态环境下的多 Agent 协作最终会收敛到 Nash 平衡点 ,为 MAS 中使用增强学习提供了理论基础[ 35 ] . 在此基础上 ,增强学习在多机器人协作领域得到越来越多的应用[36 - 37 ] ,分布式增强学习 (DRL) 逐渐成为新的研究热点[38 - 39 ] . 目前 ,国内外针对 DRL 的研究较少 ,尤其是在真实环境中受传感能力等制约 ,环境最多只可能模型化为部分可观测马氏决策过程(POMDP) ,在此情况下 ,如何最大化奖励总和(增强信号) ,正是本项目中需要解决的问题. 移动机器人进化学习包括群体进化学习和个体发展学习 , 协进化策略是近年该领域研究的热点[40 ] ,为解决机器学习、复杂系统动态自适应等问题提供了一种重要的途径. 传统遗传算法( GA) 在处理复杂的、多目标、多变量优化问题时 ,往往存在早熟或收敛慢等问题 ,并且只适用于单个个体的进化. 而协进化算法借鉴生态学的种群协同理论 ,通过构造多个种群 ,建立它们之间的竞争或共生关系 ,多个种群相互驱使来提高各自性能和复杂性. 其中共生协同进化适合用于能自然分解成相互作用或相互合作的问题 ,每一个子模块用单独的种群进化 ,通过问题分解使搜索空间变小 ,并更容易维持多样性. 竞争协同进化适合于求解比较容易获得测试例子的问题 ,通过问题的解和测试例子一起进化 ,相互驱使提高各自性能和复杂性 ,使得参与竞争的种群不断提高复杂度[41 ] . 但是协进化学习还面临着一些问题 ,体现在 :1) 目前建立的协同进化模型没有充分考虑生态系统的特性 ,如时滞性、关键性等 ;2) 研究在新环境和动态变化环境 MAS 中协同算法的应用也是很多工作指出的进一步研究方向 ;3) 问题如何自动分解 ,以自动构造协同种群也值得研究[42 ] . 因此 ,进化学习是否能持续有效、进化结果是否可以进一步扩展到有人参与的团队协同等复杂行为等问题都值得深入探讨. 2 研究难点 2. 1 异质成员间的通信问题异质多移动机器人间的通信问题是一个比较关键和急需解决的问题. 由于团队中不同机器人具有不同的结构、通信能力和信息表达方式 ,所执行的任务也五花八门 ,因此设计一种通用的描述语言是非常困难的. 此外 ,还需要考虑通信的开销问题. 最理想情况是能够达到按需通信 ,即在需要的时候某 2 个机器人才进行通信 ,在不需要的时候就不通信 ,这样可以减少整个团队的消耗. 2. 2 异质成员间的任务分配优化问题异质团队的优势在于能够根据具体的任务分配不同能力的机器人去完成 ,达到“人尽其材 ,物尽其用”. 真正做到任务分配优化 ,就要了解不同机器人的能力 ,在具体情况下根据机器人所处的状态 ,将任务分解成多个子任务分配给机器人. 其难点主要体现在 2 个方面 : 1) 任务的分解. 任务分解是否合理直接影响到任务分配是否达到优化. 目前对任务的分解主要根据距离、时间、场合等 ,很多实际任务是比较难分解的. 2) 子任务的分配. 在将任务分解成多个子任务后 ,应该根据机器人的能力和当前状态来分配子任务. 这是一个优化问题 ,需要考虑众多因素 ,如所携带的传感器 ,机器人的速度和灵活程度 ,机器人的计算能力和通信能力 ,以及当前机器人是否空闲 ,机器人以前做类似任务时的完成情况等. ·4 · 智能系统学报第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

第3期蔡自兴，等：异质多移动机器人协同技术研究的进展 5 2.3异质成员间的信息融合问题 cooperation method based on the ant algorithm [J ]Ro- 异质多移动机器人团队可以携带更多不同种类 bot,2003,25(5):207-283. 的传感器，从而具有不同的功能以完成不同的任务 [4]CHEYER,ADAM,MARTIN,et al.The open agent 这样一个异质团队共同合作时，为了完成最终的目 architecture [J ]Journal of Autonomous Agents and 标，必不可少需要信息融合.异质间的信息融合就包 Multi-Agent Systems,2001,4 (1):143-148. [5]CHAIMOWICZ L,COWL EY A,SABELLA V,et al 括了单个机器人上不同传感器的信息融合和机器人 ROCI:a distributed framework for multi-robot percep- 与机器人间的信息融合.例如，当异质团队共同完成 tion and control[A].Proceedings of the 2003 IEEE/RJS 环境探测时，将视觉信息与激光雷动或声纳信息融 International Conference on Intelligent Robots and Sys- 合生成单个机器人的局部地图，然后将多个机器人 tems[C].Las Vegas,USA,2003. 的局部地图信息融合成一个全局地图.因此，异质多 [6]ALUR R,DAS A et al.A framework and architecture 机器人间的信息融合涉及到信息表示匹配、相关及 for multi-robot coordination [A].Experimental Robotics 如何处理不确定性和如何提高处理速度等难点问 VII,LNCIS 271[C].Springer Verlag,2001. 题 [7]陈卫东，顾冬雷，席裕庚，基于多模式交互的多移动机器人分布式合作系统U],自动化学报，2004,30(5)：671- 3结束语 678. CHEN Weidong,GU Donglei,XI Yugeng.Distributed 多机器人协同研究己经逐渐成为机器人学的一 cooperation for multiple mobile robots based on multi- 个重要分支经过20多年的不懈积累，该领域已经 modal interactions[J ]Acta Automatica Sinica,2004,30 在体系结构、通信、运动协调等子课题研究中取得了 (5):671-678. 长足的进步，并且越来越显现出学科交叉性更强、应 [8]DAS A,SPL ETZERJ,KUMAR V,et al.Ad Hoc net- 用前景广阔的特点.展望未来，IEEE Transaction works for localization and control[A ]In Proceedings of on Robotics and Automation在2002年关于多机器 the IEEE Conference on Decision and Control C].Las 人系统的专刊中指出了本领域研究中一些具有挑战 Vegas,USA,2002. 性的开放课题.此外，还应注意几个方面的研究动 [9]周三元.一种MAS开发的构架[J].导弹与航天运载技向.首先异质性越来越成为考察与设计多移动机器术，2003,4：41-44 ZHOU Sanyuan.A kingd of framework for MAS devel- 人团队的一项重要特征.正如Balch&Parker所说， opment[J].Missiles and Space Vehicles,2003,4:41- 应该把异质性作为多机器人团队的基本出发点.在 44. 此思想指导下，进行体系结构、通信、协同机制等的 [10]ASAMA H,ARAI T,ISHIDA Y.Design of an auton 设计与研究；其次，在考虑人能够有效控制机器人团 omous and distributed robot system:ACTRESS [A]. 队的基础上，如何使人能够更有效地参与团队；最 In Proc of IEEE/RSJ Int Conf on Intelligence Robots 后，应用需求仍然对多机器人协作理论的研究方向 and Systems[C].Tsukuba,Japan,1989. 起决定作用.家庭服务、广域环境协作清扫、工件搬 [11]PARKER L E.ALL IANCE:An architecture for fault- 运等任务依然是本领域研究的热点，但这些任务主 tolerant multi-robot cooperation[J].IEEE Transactions 要面向结构化环境.针对非结构化环境甚至未知环 on Robotics and Automation,1998,14(2):220-240. 12]VIDAL,SHA KERNIA,KIM,et al.Multi-agent prob- 境的建模、定位与探索任务也将逐渐成为研究的热 abilistic pursuit-evasion games with unmanned ground 门话题 and aerial vehicles [J ]IEEE Transactions on Robotics 参考文献 and Automation,2002,18(5):662-669. [13 JUN GD,ZEL INSKY A.Grounded symbolic communi- [1]ARAI T,PA GELLO E,PARKER L E.Editorial ad- cation between heterogeneous cooperating robots [J ] vances in multi-bobot systems [J ]IEEE Transactions Autonomous Robots,2000,8(3):269-292. on Robotics and Automation,2002,18(5):655-661. [14 PARKER L E.Lifelong adaptation in heterogeneous [2]BALCH T,PARKER L E.Special issue on heterogene- multi-robot teams:response to continual variation inin- ous multi-robot systems[J ]Autonomous Robots,2000, dividual robot performance [J].Autonomous Robots, 8(3):207-383. 2000,8(3):239-267. [3]丁滢颖，何衍，蒋静坪，基于蚁群算法的多机器人协 [15 MURPHY,LISETTI,IRISH,et al.Emotiorr based 作策略].机器人，2003,25()414-418 control of cooperating heterogeneous mobile robots[J]. DIN G Yingying,HE Yan,JIAN GJingping.Multi-robot IEEE Transactions on Robotics and Automation,2002, 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

2. 3 异质成员间的信息融合问题异质多移动机器人团队可以携带更多不同种类的传感器 ,从而具有不同的功能以完成不同的任务. 这样一个异质团队共同合作时 ,为了完成最终的目标 ,必不可少需要信息融合. 异质间的信息融合就包括了单个机器人上不同传感器的信息融合和机器人与机器人间的信息融合. 例如 ,当异质团队共同完成环境探测时 ,将视觉信息与激光雷动或声纳信息融合生成单个机器人的局部地图 ,然后将多个机器人的局部地图信息融合成一个全局地图. 因此 ,异质多机器人间的信息融合涉及到信息表示、匹配、相关及如何处理不确定性和如何提高处理速度等难点问题. 3 结束语多机器人协同研究已经逐渐成为机器人学的一个重要分支. 经过 20 多年的不懈积累 ,该领域已经在体系结构、通信、运动协调等子课题研究中取得了长足的进步 ,并且越来越显现出学科交叉性更强、应用前景广阔的特点. 展望未来 , IEEE Transaction on Robotics and Automation 在 2002 年关于多机器人系统的专刊中指出了本领域研究中一些具有挑战性的开放课题. 此外 ,还应注意几个方面的研究动向. 首先异质性越来越成为考察与设计多移动机器人团队的一项重要特征. 正如 Balch & Parker 所说 , 应该把异质性作为多机器人团队的基本出发点. 在此思想指导下 ,进行体系结构、通信、协同机制等的设计与研究 ;其次 ,在考虑人能够有效控制机器人团队的基础上 ,如何使人能够更有效地参与团队 ;最后 ,应用需求仍然对多机器人协作理论的研究方向起决定作用. 家庭服务、广域环境协作清扫、工件搬运等任务依然是本领域研究的热点 ,但这些任务主要面向结构化环境. 针对非结构化环境甚至未知环境的建模、定位与探索任务也将逐渐成为研究的热门话题. 参考文献 : [1 ]ARAI T , PA GELLO E , PAR KER L E. Editorial : ad2 vances in multi2bobot systems [J ]. IEEE Transactions on Robotics and Automation , 2002 , 18 (5) : 655 - 661. [2 ]BALCH T , PAR KER L E. Special issue on heterogene2 ous multi2robot systems[J ]. Autonomous Robots , 2000 , 8 (3) : 207 - 383. [3 ]丁滢颍 , 何衍 , 蒋静坪. 基于蚁群算法的多机器人协作策略[J ]. 机器人 , 2003 , 25 (5) :414 - 418. DIN G Yingying , HE Yan , J IAN GJingping. Multi2robot cooperation method based on the ant algorithm [J ]. Ro2 bot , 2003 , 25 (5) :207 - 283. [4 ] CHEYER , ADAM , MARTIN , et al. The open agent architecture [J ]. Journal of Autonomous Agents and Multi2Agent Systems , 2001 , 4 (1) : 143 - 148. [5 ]CHAIMOWICZ L , COWL EY A , SABELLA V , et al. ROCI: a distributed framework for multi2robot percep2 tion and control[ A ]. Proceedings of the 2003 IEEE/ RJ S International Conference on Intelligent Robots and Sys2 tems[C]. Las Vegas , USA , 2003. [6 ] ALUR R , DAS A et al. A framework and architecture for multi2robot coordination [A ]. Experimental Robotics VII , LNCIS 271[C]. Springer Verlag , 2001. [7 ]陈卫东 ,顾冬雷 ,席裕庚. 基于多模式交互的多移动机器人分布式合作系统[J ]. 自动化学报 ,2004 ,30 (5) : 671 - 678. CHEN Weidong , GU Donglei , XI Yugeng. Distributed cooperation for multiple mobile robots based on multi2 modal interactions[J ]. Acta Automatica Sinica , 2004 , 30 (5) :671 - 678. [8 ]DAS A , SPL ETZER J , KUMAR V , et al. Ad Hoc net2 works for localization and control[ A ]. In Proceedings of the IEEE Conference on Decision and Control [ C]. Las Vegas , USA , 2002. [9 ]周三元. 一种 MAS 开发的构架[J ]. 导弹与航天运载技术 , 2003 ,4 : 41 - 44. ZHOU Sanyuan. A kingd of framework for MAS devel2 opment[J ]. Missiles and Space Vehicles , 2003 , 4 :41 - 44. [10 ]ASAMA H , ARAI T , ISHIDA Y. Design of an auton2 omous and distributed robot system : ACTRESS [ A ]. In Proc of IEEE/ RSJ Int Conf on Intelligence Robots and Systems[C]. Tsukuba , J apan , 1989. [11 ]PAR KER L E. ALL IANCE: An architecture for fault2 tolerant multi2robot cooperation[J ]. IEEE Transactions on Robotics and Automation , 1998 , 14 (2) : 220 - 240. [ 12 ]VIDAL , SHA KERNIA , KIM , et al. Multi2agent prob2 abilistic pursuit2evasion games with unmanned ground and aerial vehicles [J ]. IEEE Transactions on Robotics and Automation , 2002 , 18 (5) : 662 - 669. [ 13 ]J UN G D , ZEL INSKY A. Grounded symbolic communi2 cation between heterogeneous cooperating robots [J ]. Autonomous Robots , 2000 , 8 (3) : 269 - 292. [ 14 ] PAR KER L E. Lifelong adaptation in heterogeneous multi2robot teams: response to continual variation in in2 dividual robot performance [J ]. Autonomous Robots , 2000 , 8 (3) : 239 - 267. [15 ] MURPH Y , L ISETTI , IRISH , et al. Emotion2based control of cooperating heterogeneous mobile robots[J ]. IEEE Transactions on Robotics and Automation , 2002 , 第 3 期蔡自兴 ,等 :异质多移动机器人协同技术研究的进展 ·5 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

6年智能系统学报第2卷 18(5):744-757. 162. [16]MITCHELL A P.A cooperative coevolutionary ap- ZHANG Hongfeng,WANG Shuo,TAN Min,et al.A proach to function optimization [A ]Parallel Problem dynamic region decomposition approach to cooperative Solving from Nature [C].Jerusalem:Springer-Verlag, multirobot map-building[J ]Robot,2003,25(2):156 1994. .162. [17]SAPTHARISHI,OHYER,DIEHL,et al.Distributed [29]DAVISON A J.KITA N.Active visual localization for surveillance and reconnaissance using multiple autono- cooperating inspection robots[A ]In Proceedings of the mous ATVs:cyberscout[J ]IEEE Transactions on Ro- IEEE/RSJ International Conference on Intelligent Ro- botics and Automation,2002,18(5):826-836. bots and Systems[C].Takamatsu,Japan,2000. [18]NA KAMURA A,OTA J,ARAI T.Humamrsuper- [30]BURGARD W,FOX D,MOORS M,et al.Collabora- vised multiple mobile robot system[A].In Proc of the tive multi-robot exploration[A ]In Proceedings of the 5th Int.Symposium on Distributed Autonomous Robot- IEEE International Conference on Robotics and Auto- ic Systems[C].Knoxville,USA,2000. mation[C].San Francisco,CA,2000. [19]SIMMONS R,APFELBAUM D,BURGARD W.Co- [31]李斌，董慧颖，白雪.可重构机器人研究和发展现 ordination for multi-robot exploration and mapping[A]. 状U].沈阳工业学院学报，2000,19(4)：68.72. In Proceedings of the AAAI National Conference on Ar- LI Bin,DONG Huiying,BAI Xue.The recent situation tificial Intelligence[C].Austin,USA,2000. of developing for reconfigurable robot [J].Journal of [20]KIM YJ,KIM J H.Online map building evolutionary Shenyang Institute of Technology,2000,19(4):68- algorithm for multi-agent mobile robots with odometric 1 uncertainty [A].IEEE Conf Evolutionary Computation [32]PARKER L E.Adaptive heterogeneous multi-robot teams [C].San Diego,USA,2000. [U].Neurocomputing,1999,28(1.3):75-92. [21]REKL EITIS I M,DUDEK G,MILIOS E.Multi-robot [33]SHEN W,SAL EMI B,WILL P.Hormone-inspired a- collaboration for robust exploration [J].Annals of daptive communication and distributed control for CON- Mathematics and Artificial Intelligence,2001,31 (1- RO self-reconfigurable robots[J ]IEEE Tansaction on 4):7.40 Robotics and Automation,2002,18(5):700-712. [22]GRABOWSKI R,NAVARRO L E,PAREDIS C J,et [34]刘娟，蔡自兴，涂春鸣.进化机器人学研究进展U] al.Heterogenouse teams of modular robots for mapping 控制理论与应用，2002,19(4)：493.499 and exploration[J ]Autonomous Robots,2000,8(3): LIU Juan,CAI Zixing,TU Chunming.Survey on evo- 293-308. lutionary robotics[J].Control Theory Applications, [23]ROUMEL IOTIS S I,BEKEY GA.Collective localiza- 2002,19(4):493-499. tion:a distributed kalman filter approach to localization [35]HU Junling.Learning in Markov game with incomplete of groups of mobile robots[A].In Proceeding of the information[A].Proceedings of the 15th National Con IEEE International Conference on Robotics and Auto- ference on Artificial Intelligence C].Madison,USA, mation[C].San Francisco,CA,2000. 1998. [24]ROUMELIOTIS S I,BEKEY G A.Distributed multi- [36]ABUL O,PLOAT F,AL HAJJ R.MultiAgent reinforce- robot localization [J ]IEEE Transactions on Robotics ment learning using function approximation [J].IEEE Trans and Automation,2002,18(5):781,795. action on Systems,Man,and Cybernetics (Part C:Applica- [25]REKL EITIS I M,DUDEK G,MILIOS E.Probabilistic tion and Reviews),2000.,30(4):485.497. cooperative localization in rractice [A ]In Proceedings [37]MARTINSON E,ARKIN R.Learning to role-switch of the IEEE International Conference on Robotics and in multi-robot systems[A].In Proceeding of the IEEE Automation[C].Taipei,China,2003. International Conference on Robotics and Automation [26]FOX D,BURGARD W,KRUPPA H,et al.A probabilis [C].Taipei,China,2003. tic approach to collaborative multi-robot localization [J ] [38]LAUER M,RIEDMILL ER M.An algorithm for dis- Autonomous Robots.2000.8(3):325-344. tributed reinforcement learning in cooperative multra- [27]ROUMEL IOTIS S I,REKL EITIS I M.Propagation of gent systems[A ]In Proceedings of International Con uncertainty in cooperative multirobot localization:anal- ference on Machine Learning[C].Stanford,CA,2000. ysis and experimental results[J ]Autonomous Robots, [39]王醒策，张汝波，顾国昌.多机器人动态编队的强化学 2004,17(1):41-54. 习算法研究U].计算机研究与发展，2003,40(10)： [28]张洪峰，王硕，谭民，等.基于动态分区方法的多 1444.1450. 机器人协作地图构建U].机器人，2003,25(2)：156- WANG Xingce,ZHANG Rubo,GU Guochang.Re- 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net

18 (5) : 744 - 757. [ 16 ] MITCHELL A P. A cooperative coevolutionary ap2 proach to function optimization [ A ]. Parallel Problem Solving from Nature [ C]. J erusalem : Springer2Verlag , 1994. [17 ]SAPTHARISHI , O H YER , DIEHL , et al. Distributed surveillance and reconnaissance using multiple autono2 mous A TVs: cyberscout[J ]. IEEE Transactions on Ro2 botics and Automation , 2002 , 18 (5) : 826 - 836. [18 ] NA KAMURA A , O TA J , ARAI T. Human2super2 vised multiple mobile robot system[ A ]. In Proc of the 5th Int. Symposium on Distributed Autonomous Robot2 ic Systems[C]. Knoxville , USA , 2000. [19 ]SIMMONS R , APFELBAUM D , BURGARD W. Co2 ordination for multi2robot exploration and mapping[ A ]. In Proceedings of the AAAI National Conference on Ar2 tificial Intelligence[C]. Austin , USA ,2000. [20 ] KIM Y J , KIM J H. Online map building evolutionary algorithm for multi2agent mobile robots with odometric uncertainty [ A ]. IEEE Conf Evolutionary Computation [C]. San Diego , USA , 2000. [21 ]REKL EITIS I M , DUDEK G, MIL IOS E. Multi2robot collaboration for robust exploration [ J ]. Annals of Mathematics and Artificial Intelligence , 2001 , 31 (1 - 4) : 7 - 40. [22 ] GRABOWSKI R , NAVARRO L E , PAREDIS C J ,et al. Heterogenouse teams of modular robots for mapping and exploration[J ]. Autonomous Robots , 2000 , 8 (3) : 293 - 308. [23 ]ROUMEL IO TIS S I , BEKEY G A. Collective localiza2 tion : a distributed kalman filter approach to localization of groups of mobile robots [ A ]. In Proceeding of the IEEE International Conference on Robotics and Auto2 mation[C]. San Francisco , CA , 2000. [24 ]ROUMEL IO TIS S I , BEKEY G A. Distributed multi2 robot localization [J ]. IEEE Transactions on Robotics and Automation , 2002 , 18 (5) :781 - 795. [ 25 ]REKL EITIS I M , DUDEK G, MIL IOS E. Probabilistic cooperative localization in rractice [ A ]. In Proceedings of the IEEE International Conference on Robotics and Automation[C]. Taipei , China , 2003. [ 26 ] FOX D , BURGARD W , KRUPPA H , et al. A probabilis2 tic approach to collaborative multi2robot localization [J ]. Autonomous Robots , 2000 , 8 (3) : 325 - 344. [27 ]ROUMEL IO TIS S I , REKL EITIS I M. Propagation of uncertainty in cooperative multirobot localization : anal2 ysis and experimental results[J ]. Autonomous Robots , 2004 , 17 (1) : 41 - 54. [28 ]张洪峰 , 王硕 , 谭民 ,等. 基于动态分区方法的多机器人协作地图构建[J ]. 机器人 , 2003 , 25 (2) : 156 - 162. ZHAN G Hongfeng , WAN G Shuo , TAN Min , et al. A dynamic region decomposition approach to cooperative multi2robot map2building[J ]. Robot , 2003 , 25 (2) :156 - 162. [29 ]DAVISON A J , KITA N. Active visual localization for cooperating inspection robots[ A ]. In Proceedings of the IEEE/ RSJ International Conference on Intelligent Ro2 bots and Systems[C]. Takamatsu , J apan , 2000. [30 ]BURGARD W , FOX D , MOORS M , et al. Collabora2 tive multi2robot exploration [ A ]. In Proceedings of the IEEE International Conference on Robotics and Auto2 mation[C]. San Francisco , CA , 2000. [31 ]李斌 , 董慧颖 , 白雪. 可重构机器人研究和发展现状[J ]. 沈阳工业学院学报 , 2000 , 19 (4) : 68 - 72. L I Bin , DON G Huiying , BAI Xue. The recent situation of developing for reconfigurable robot [J ]. Journal of Shenyang Institute of Technology , 2000 , 19 (4) : 68 - 72. [32 ] PARKER L E. Adaptive heterogeneous multi2robot teams [J ]. Neurocomputing , 1999 , 28 (1 - 3) : 75 - 92. [33 ]SHEN W , SAL EMI B , WILL P. Hormone2inspired a2 daptive communication and distributed control for CON2 RO self2reconfigurable robots[J ]. IEEE Tansaction on Robotics and Automation , 2002 , 18 (5) : 700 - 712. [34 ]刘娟 ,蔡自兴 ,涂春鸣. 进化机器人学研究进展[J ]. 控制理论与应用 ,2002 ,19 (4) :493 - 499. L IU J uan , CAI Zixing , TU Chunming. Survey on evo2 lutionary robotics[J ]. Control Theory & Applications , 2002 , 19 (4) :493 - 499. [35 ] HU J unling. Learning in Markov game with incomplete information[ A ]. Proceedings of the 15th National Con2 ference on Artificial Intelligence [ C]. Madison , USA , 1998. [36 ]ABUL O , PLOAT F , AL HAJJ R. Multi2Agent reinforce2 ment learning using function approximation [J ]. IEEE Trans2 action on Systems , Man , and Cybernetics (Part C: Applica2 tion and Reviews) , 2000 , 30(4) :485 - 497. [ 37 ] MARTINSON E , AR KIN R. Learning to role2switch in multi2robot systems[ A ]. In Proceeding of the IEEE International Conference on Robotics and Automation [C]. Taipei , China , 2003. [38 ]LAU ER M , RIEDMILL ER M. An algorithm for dis2 tributed reinforcement learning in cooperative multi2a2 gent systems[ A ]. In Proceedings of International Con2 ference on Machine Learning[C]. Stanford , CA , 2000. [39 ]王醒策 , 张汝波 , 顾国昌. 多机器人动态编队的强化学习算法研究[J ]. 计算机研究与发展 , 2003 , 40 (10) : 1444 - 1450. WAN G Xingce , ZHAN G Rubo , GU Guochang. Re2 ·6 · 智能系统学报第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

第3期蔡自兴，等：异质多移动机器人协同技术研究的进展。7 search on dynamic team formation of multi-robots rein- 作者简介： forcement learning [J ]Journal of Computer Research 蔡自兴，男，1938年生，教授，博士 and Development,2003,40(10):1444-1450 生导师.主要研究方向为人工智能、机器 [40]薛宏涛，沈林成，叶媛媛，等.基于协进化方法的多智人等.获科技奖励30多项，其中国家级能体协作系统体系结构及其仿真框架[卩].系统仿真学奖励2项，省部级奖励20多项，已在国报，2002,14(3)：297.303. 内外发表论文550多篇，出版专著和材 XUE Hongtao,SHEN Lincheng,YE Yuanyuan,et al. 料26部. Multi-agent collaboration system architecture and simu- Email zxcai @csu.edu.cn lation framework based on co-evolution method [J ] Journal of System Simulation,2002,14(3):297-303. 陈白帆，女，1979年生，博士研究 [41]NOL FI S,FLOREANO D.How co-evolution can enhance 生.主要研究方向为移动机器人定位、 the adaptive power of artificial evolution:implications for 环境建模机器视觉等 evolutionary robotics [A].In Proceedings of Evolutionary Email chenbaifan @csu.edu.cn. Robot[C].Springer Verlag,1998. [42]阮怀忠，徐精明.MAS中基于协同进化的学习[J].安徽技术师范学院学报，2004,18(1)：58.59 RUAN Huaizhong,XU Jingming.Co-operative co-evo- 王璐，男，1972年生，博士研究 lution based learning in multi-agent system[J ]Journal 生.主要研究方向为人工智能、移动机 of Anhui Technical Teachers College,2004,18(1):58 器人导航、计算机视觉等。 -59. E mail dqxwl @21cn.com. [43]蔡自兴.机器人学[M.北京：清华大学出版社，2000. 第七届全球智能控制与自动化大会(WCIC08) The 7th World Congress on Intelligent Control and Automation 全球智能控制与自动化大会(WCICA)是每两年一次在中国召开的重要国际会议。第七届大会(WC CA08)将于2008年6月25-27日在美丽的山城重庆召开。本次会议由重庆大学主办，由IEEE国家自然科学基金委员会、中国自动化学会、中国人工智能学会协办。会议为全球从事智能控制和自动化的专家、学者和工程技术人员提供一个交流、研讨和报告他们最新研究成果的平台。大会热忱欢迎广大同行踊跃投稿，录用的论文将由正式出版社出版论文集（附带光盘），版权属EEE。论文同时被国际重要检索机构EI收录。会议征文包括与智能控制和自动化有关的理论、方法和应用方面的论文。会议网站：http://wcica08. cqu.edu.cn,联系电话：8623-65112857. 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net

search on dynamic team formation of multi2robots rein2 forcement learning [J ]. Journal of Computer Research and Development , 2003 , 40 (10) :1444 - 1450. [40 ]薛宏涛 , 沈林成 , 叶媛媛 ,等. 基于协进化方法的多智能体协作系统体系结构及其仿真框架[J ]. 系统仿真学报 ,2002 ,14 (3) :297 - 303. XU E Hongtao , SHEN Lincheng , YE Yuanyuan , et al. Multi2agent collaboration system architecture and simu2 lation framework based on co2evolution method [J ]. Journal of System Simulation , 2002 , 14 (3) :297 - 303. [41 ]NOLFI S , FLOREANO D. How co2evolution can enhance the adaptive power of artificial evolution : implications for evolutionary robotics [ A ]. In Proceedings of Evolutionary Robot[C]. Springer Verlag , 1998. [42 ]阮怀忠 , 徐精明. MAS 中基于协同进化的学习[J ]. 安徽技术师范学院学报 , 2004 , 18 (1) : 58 - 59. RUAN Huaizhong , XU Jingming. Co2operative co2evo2 lution based learning in multi2agent system[J ]. Journal of Anhui Technical Teachers College , 2004 , 18 (1) :58 - 59. [43 ]蔡自兴. 机器人学[ M ]. 北京 :清华大学出版社 ,2000. 作者简介 : 蔡自兴 ,男 ,1938 年生 ,教授 ,博士生导师. 主要研究方向为人工智能、机器人等. 获科技奖励 30 多项 ,其中国家级奖励 2 项 ,省部级奖励 20 多项 ,已在国内外发表论文 550 多篇 ,出版专著和材料 26 部. E2mail : zxcai @csu. edu. cn. 陈白帆 ,女 , 1979 年生 ,博士研究生. 主要研究方向为移动机器人定位、环境建模、机器视觉等. E2mail : chenbaifan @csu. edu. cn. 王璐 ,男 , 1972 年生 ,博士研究生. 主要研究方向为人工智能、移动机器人导航、计算机视觉等. E2mail : dqx2wl @21cn. com. 第七届全球智能控制与自动化大会( WCICA’08) The 7th World Congress on Intelligent Control and Automation 全球智能控制与自动化大会 (WCICA) 是每两年一次在中国召开的重要国际会议。第七届大会(WCI2 CA’08) 将于 2008 年 6 月 25 - 27 日在美丽的山城重庆召开。本次会议由重庆大学主办 ,由 IEEE 国家自然科学基金委员会、中国自动化学会、中国人工智能学会协办。会议为全球从事智能控制和自动化的专家、学者和工程技术人员提供一个交流、研讨和报告他们最新研究成果的平台。大会热忱欢迎广大同行踊跃投稿 , 录用的论文将由正式出版社出版论文集 (附带光盘) ,版权属 IEEE。论文同时被国际重要检索机构 EI 收录。会议征文包括与智能控制和自动化有关的理论、方法和应用方面的论文。会议网站 : http :/ / wcica08. cqu. edu. cn ,联系电话 :86223265112857. 第 3 期蔡自兴 ,等 :异质多移动机器人协同技术研究的进展 ·7 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录