第2卷第3期 智能系统学报 Vol.2 N23 2007年6月 CAAI Transactions on Intelligent Systems Jun.2007 异质多移动机器人协同技术研究的进展 蔡自兴,陈白帆,王璐,刘丽珏,段琢华 (中南大学信息科学与工程学院,湖南长沙410083) 摘要:随着移动机器人应用的领域和范围的不断扩展,多移动机器人由于其单个机器人无法比拟的优越性己经越 来越受到重视从体系结构、协作与协调、协作环境感知与定位、重构及机器学习几个重要课题对多移动机器人协同 技术进行了综述,尤其侧重于各种技术如何处理和包容团队中的异质性,并分析了本领域中的研究难点问题,最后 展望了异质多移动机器人研究的前景与发展趋势. 关键词:多移动机器人;协同;异质 中图分类号:TP242文献标识码:A文章编号:1673-4785(2007)030001-07 The progress of cooperative technology for heterogeneous multiple mobile robots CAI Zi-xing,CHEN Bai-fan,WANG Lu ,LIU Li-jue,DUAN Zhuo-hua (School of Information Science and Engineering,Central South University,Changsha 410083,China) Abstract:With continuing growth in the use of mobile robots,multiple mobile robots get more and more attention because of their superiority in performance over an individual robot.This paper makes a compre- hensive introduction to cooperative technology for multiple mobile robots.Some important subjects are in- cluded such as architecture,collaboration and coordination,sensing and localization,reconfiguration,and machine learning.It particularly emphasizes how all technologies must deal with the heterogeneity of the team.It concludes by examining challenges in the field,research prospects,and development trends for heterogeneous multiple mo bile robots. Keywords:multiple mobile robots;cooperation;heterogeneous 多移动机器人领域研究始于20世纪80年代,有限任务的机器人可以设计得更完善;可以通过成 最初的研究集中在体系结构运动规划、可重构几个 员间的相互协作增加冗余度,消除失效点,增加解决 方面四.随着应用领域的不断拓展,尤其是水下、空 方案的鲁棒性:可以提供更多的解决方案,降低系统 间、危险环境探索、服务及教育领域等场合的应用需 造价与复杂度等.由于这样一些优势,多机器人协同 求,促使多移动机器人领域的研究课题逐渐深入和 技术研究吸引了国内外学术界越来越多的兴趣与关 广泛. 注. 与单机器人相比,多机器人系统具有许多优点: 异质性研究是多移动机器人领域的重要热点之 可以通过对某些任务进行适当分解,使多个机器人 一).严格地说,实践中由于制造、磨损等原因不可 分别并行地完成不同的子任务,从而加快任务执行 能得到真正同质的机器人团队.因此,为了有效设计 速度,提高工作效率;可以将系统中的成员设计成完 多移动机器人团队,必须理解团队中个体间的差异 成某项任务的“专家”,而不是设计成完成所有任务 性以及对性能的影响,关注异质性为多机器人协同 的“通才”,使得机器人的设计有更大的灵活性,完成 领域带来的新的研究课题,如差异检测、异质个体间 的通信、个体对其他成员的适应性、不同传感能力的 收稿日期:200608-28. 个体间如何协作定位等。 基金项目:因家基础科学研究基金资助项目(A1420060159):国家自 然科学基金重点资助项目(60234030). 文中对多移动机器人协同技术的几个重要研究 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 2 卷第 3 期 智 能 系 统 学 报 Vol. 2 №. 3 2007 年 6 月 CAA I Transactions on Intelligent Systems J un. 2007 异质多移动机器人协同技术研究的进展 蔡自兴 ,陈白帆 ,王 璐 ,刘丽珏 ,段琢华 (中南大学 信息科学与工程学院 ,湖南 长沙 410083) 摘 要 :随着移动机器人应用的领域和范围的不断扩展 ,多移动机器人由于其单个机器人无法比拟的优越性已经越 来越受到重视. 从体系结构、协作与协调、协作环境感知与定位、重构及机器学习几个重要课题对多移动机器人协同 技术进行了综述 ,尤其侧重于各种技术如何处理和包容团队中的异质性 ,并分析了本领域中的研究难点问题 ,最后 展望了异质多移动机器人研究的前景与发展趋势. 关键词 :多移动机器人 ;协同 ;异质 中图分类号 : TP242 文献标识码 :A 文章编号 :167324785 (2007) 0320001207 The progress of cooperative technology for heterogeneous multiple mobile robots CAI Zi2xing ,CH EN Bai2fan ,WAN G Lu ,L IU Li2jue ,DUAN Zhuo2hua (School of Information Science and Engineering , Central South University , Changsha 410083 , China) Abstract :Wit h continuing growt h in t he use of mobile robots , multiple mobile robots get more and more attention because of t heir superiority in performance over an individual robot. This paper makes a compre2 hensive introduction to cooperative technology for multiple mobile robots. Some important subjects are in2 cluded such as architect ure , collaboration and coordination , sensing and localization , reconfiguration , and machine learning. It particularly emp hasizes how all technologies must deal wit h t he heterogeneity of t he team. It concludes by examining challenges in t he field , research prospects , and development trends for heterogeneous multiple mobile robots. Keywords :multiple mobile robots ; cooperation ; heterogeneous 收稿日期 :2006208228. 基金项目 :国家基础科学研究基金资助项目(A1420060159) ;国家自 然科学基金重点资助项目(60234030) . 多移动机器人领域研究始于 20 世纪 80 年代 , 最初的研究集中在体系结构、运动规划、可重构几个 方面[ 1 ] . 随着应用领域的不断拓展 ,尤其是水下、空 间、危险环境探索、服务及教育领域等场合的应用需 求 ,促使多移动机器人领域的研究课题逐渐深入和 广泛. 与单机器人相比 ,多机器人系统具有许多优点 : 可以通过对某些任务进行适当分解 ,使多个机器人 分别并行地完成不同的子任务 ,从而加快任务执行 速度 ,提高工作效率 ;可以将系统中的成员设计成完 成某项任务的“专家”,而不是设计成完成所有任务 的“通才”,使得机器人的设计有更大的灵活性 ,完成 有限任务的机器人可以设计得更完善 ;可以通过成 员间的相互协作增加冗余度 ,消除失效点 ,增加解决 方案的鲁棒性 ;可以提供更多的解决方案 ,降低系统 造价与复杂度等. 由于这样一些优势 ,多机器人协同 技术研究吸引了国内外学术界越来越多的兴趣与关 注. 异质性研究是多移动机器人领域的重要热点之 一[2 ] . 严格地说 ,实践中由于制造、磨损等原因不可 能得到真正同质的机器人团队. 因此 ,为了有效设计 多移动机器人团队 ,必须理解团队中个体间的差异 性以及对性能的影响 ,关注异质性为多机器人协同 领域带来的新的研究课题 ,如差异检测、异质个体间 的通信、个体对其他成员的适应性、不同传感能力的 个体间如何协作定位等. 文中对多移动机器人协同技术的几个重要研究 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
·2 智能系统学报 第2卷 课题进行了综述,尤其侧重于各种技术如何处理和 他专用设备构成,采用合同网(Contract Net)进行 包容团队中的异质性.随后对本领域的研究难点进 任务分配和协商.L.E.Parker提出的ALL 行了一定的剖析,并指出未来的研究趋势,希望能够 ANCE山与ACTRESS相比,可以在某个机器人任 对本领域的进一步深入研究有所帮助 务失败后由其他机器人来接替.其缺点在于它只能 1异质多移动机器人协同技术的研究 处理可以被分解成独立的子任务的情况,并且没有 明显的协商机制,每个机器人通过广播把自身的状 概况 态和行为通知其他机器人.针对异质多移动机器人 多移动机器人协同技术的主要研究课题包括: 协作问题,Vidal等提出一种混合层次体系结构2] 体系结构以及通信,任务分配、运动协调及控制;定 将异质Agent置于不同的抽象层次,通过层次间通 位、建模与探索;可重构机器人等).文中从上述几 信实现异质机器人的互操作.该方法在无人地面/空 个研究课题出发,着重指出各种技术对异质性的包 中移动体的追击逃避游戏中取得了较好的应用效 容与处理.另外,还对多移动机器人协同领域的学习 果 理论与方法进行了总结 通信方面,统一的语言或符号理解是显式通信 1.1异质多移动机器人协作的体系结构 中异质机器人间通信的基础.国际上比较广泛使用 多移动机器人软件体系结构研究的主要内容包的Aget通信语言有KQML、KIF等.除此之外 括:组织结构与通信机制、同质与异质成员等 Jung和Zelinsky3提出一种面向工程的符号通信 目前多移动机器人协作的组织结构主要有3 机制以支持异质机器人间的协作,并在完成清洁任 种 务的多机器人团队中进行了成功的部署 1)集中式,其代表是基于黑板的多Agent系 1.2异质多移动机器人的协同机制 统)以及SRI的OAA软件体系).OAA设计一个 协同包括2项内容:协作与协调.异质移动体的 代理助手(facilitator)作为控制与协作的中心与各 存在为多移动机器人协作研究带来新的挑战,其关 种功能Agent组成C/S系统结构,其功能远远超过 键问题是异质团队中能力不同的各成员间如何彼此 黑板.代理助手负责管理通信、数据、任务分配等,并 适应,即如何展开有效合作 且将用户当作具有特权的Agent,即支持异质A- 异质多Agent团队中由于各自能力不同,对协 gent的集成.但该结构灵活性不足,过分依赖协调 作提出了特殊要求.尤其是当多个成员都能完成某 中心将可能使系统在失去该中心时完全瘫痪 任务,只是效果不同的重叠(overlap)情况下,如何 2)分布式,其代表是UPenn提出的ROC1以 合理有效地进行任务分配和调度是一个挑战性的问 及层次化和对象可重构1、多模式交互I以及Ad 题.Parker提出一种L~ALL IANCE机制使多机器 Hoc网络劉等软件框架.ROCI基于己封装的功能 人团队能够适应成员能力差异环境状态变化等,保 模块组成特定任务的Agent,进而组成团队.软件体 证团队能够长期工作).Murphy等提出利用情感 系的核心称为ROCI核,每个Agent上都存在一个 计算模型在传感马达级(反应式)修改主动行为 ROCI核的副本,负责管理网络和维护网络上A- 从而无需集中规划即可产生团队的社会行为,并极 get组成的数据库,以实现分布式控制.分布式结 大降低了通信需求s].基于市场机制(market- 构具有结构灵活等优点,但在协调机制上,如任务分 based)的任务分配策略有利于包容异质成员.各机 配运动规划等方面开销很大. 器人根据自己的局部环境信息对某任务的执行效果 3)混合式,是集中式与分布式的折中1.系统中 做出估计,并将估计值向团队中的成员通报,同时所 多Agent组成层次结构,上层的监控Agent对下层 有得到该通报信息的成员根据各自的局部信息也对 的受控Aget有部分控制能力.该结构既灵活又能 该任务做出估计且在团队中通报.如果估计的结果 够有效协调,其思想与一些应用的实际情况较接近. 是以效用值表示,则团队中对该任务的效用估计值 近年来,国外对异质多机器人协作问题的研究 大者获得该任务的执行权.此外,Matchell A.Pot 逐渐增多,但国内还很少见.异质机器人在处理信息 tr等提出的基于自然界中物种协作进化机制的协 的形式和处理信息的能力等方面存在很大差异,因 作协进化方法有可能获得优化的任务分配性能6 此对软件体系结构的设计提出了新的要求 对于协调问题,近年来该领域研究逐渐从多机 早期的异质多机器人系统的研究中成员间差异 器人路径规划编队等传统研究课题转向目标搜索、 并不明显,如ACTRESS!1由计算机、机器人和其 多机器人停驻等问题.Saptharishi等提出通过检查 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
课题进行了综述 ,尤其侧重于各种技术如何处理和 包容团队中的异质性. 随后对本领域的研究难点进 行了一定的剖析 ,并指出未来的研究趋势 ,希望能够 对本领域的进一步深入研究有所帮助. 1 异质多移动机器人协同技术的研究 概况 多移动机器人协同技术的主要研究课题包括 : 体系结构以及通信 ;任务分配、运动协调及控制 ;定 位、建模与探索 ;可重构机器人等[1 ] . 文中从上述几 个研究课题出发 ,着重指出各种技术对异质性的包 容与处理. 另外 ,还对多移动机器人协同领域的学习 理论与方法进行了总结. 1. 1 异质多移动机器人协作的体系结构 多移动机器人软件体系结构研究的主要内容包 括 :组织结构与通信机制、同质与异质成员等. 目前多移动机器人协作的组织结构主要有 3 种 : 1) 集中式 ,其代表是基于黑板的多 Agent 系 统[3 ]以及 SRI 的 OAA 软件体系[ 4 ] . OAA 设计一个 代理助手 (facilitator) 作为控制与协作的中心与各 种功能 Agent 组成 C/ S 系统结构 ,其功能远远超过 黑板. 代理助手负责管理通信、数据、任务分配等 ,并 且将用户当作具有特权的 Agent ,即支持异质 A2 gent 的集成. 但该结构灵活性不足 ,过分依赖协调 中心将可能使系统在失去该中心时完全瘫痪. 2) 分布式 ,其代表是 U Penn 提出的 ROCI [5 ] 以 及层次化和对象可重构[6 ] 、多模式交互[7 ] 以及 Ad Hoc 网络[8 ] 等软件框架. ROCI 基于已封装的功能 模块组成特定任务的 Agent ,进而组成团队. 软件体 系的核心称为 ROCI 核 ,每个 Agent 上都存在一个 ROCI 核的副本 ,负责管理网络和维护网络上 A2 gent 组成的数据库 ,以实现分布式控制. 分布式结 构具有结构灵活等优点 ,但在协调机制上 ,如任务分 配、运动规划等方面开销很大. 3) 混合式 ,是集中式与分布式的折中[9 ] . 系统中 多 Agent 组成层次结构 ,上层的监控 Agent 对下层 的受控 Agent 有部分控制能力. 该结构既灵活又能 够有效协调 ,其思想与一些应用的实际情况较接近. 近年来 ,国外对异质多机器人协作问题的研究 逐渐增多 ,但国内还很少见. 异质机器人在处理信息 的形式和处理信息的能力等方面存在很大差异 ,因 此对软件体系结构的设计提出了新的要求. 早期的异质多机器人系统的研究中成员间差异 并不明显 ,如 ACTRESS [10 ] 由计算机、机器人和其 他专用设备构成 ,采用合同网 (Contract Net) 进行 任务分配 和协商. L. E. Parker 提 出 的 ALL I2 ANCE [11 ]与 ACTRESS 相比 ,可以在某个机器人任 务失败后由其他机器人来接替. 其缺点在于它只能 处理可以被分解成独立的子任务的情况 ,并且没有 明显的协商机制 ,每个机器人通过广播把自身的状 态和行为通知其他机器人. 针对异质多移动机器人 协作问题 ,Vidal 等提出一种混合层次体系结构[12 ] , 将异质 Agent 置于不同的抽象层次 ,通过层次间通 信实现异质机器人的互操作. 该方法在无人地面/ 空 中移动体的追击 —逃避游戏中取得了较好的应用效 果. 通信方面 ,统一的语言或符号理解是显式通信 中异质机器人间通信的基础. 国际上比较广泛使用 的 Agent 通信语言有 KQML 、KIF 等. 除此之外 , J ung 和 Zelinsky [13 ]提出一种面向工程的符号通信 机制以支持异质机器人间的协作 ,并在完成清洁任 务的多机器人团队中进行了成功的部署. 1. 2 异质多移动机器人的协同机制 协同包括 2 项内容 :协作与协调. 异质移动体的 存在为多移动机器人协作研究带来新的挑战 ,其关 键问题是异质团队中能力不同的各成员间如何彼此 适应 ,即如何展开有效合作. 异质多 Agent 团队中由于各自能力不同 ,对协 作提出了特殊要求. 尤其是当多个成员都能完成某 任务 ,只是效果不同的重叠 (overlap) 情况下 ,如何 合理有效地进行任务分配和调度是一个挑战性的问 题. Parker 提出一种 L2ALL IANCE 机制使多机器 人团队能够适应成员能力差异、环境状态变化等 ,保 证团队能够长期工作[14 ] . Murp hy 等提出利用情感 计算模型在传感 —马达级 (反应式) 修改主动行为 , 从而无需集中规划即可产生团队的社会行为 ,并极 大降低了 通信需求[15 ] . 基于市 场 机 制 ( market2 based) 的任务分配策略有利于包容异质成员. 各机 器人根据自己的局部环境信息对某任务的执行效果 做出估计 ,并将估计值向团队中的成员通报 ,同时所 有得到该通报信息的成员根据各自的局部信息也对 该任务做出估计且在团队中通报. 如果估计的结果 是以效用值表示 ,则团队中对该任务的效用估计值 大者获得该任务的执行权. 此外 ,Matchell A. Pot2 ter 等提出的基于自然界中物种协作进化机制的协 作协进化方法有可能获得优化的任务分配性能[16 ] . 对于协调问题 ,近年来该领域研究逐渐从多机 器人路径规划、编队等传统研究课题转向目标搜索、 多机器人停驻等问题. Sapt harishi 等提出通过检查 ·2 · 智 能 系 统 学 报 第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第3期 蔡自兴,等:异质多移动机器人协同技术研究的进展 站和基于统计运动状态估计的动态权限分配策略进 间必须保持视觉或距离传感方面的“接触” 行路径规划,并开发出基于视觉的监视及复杂环境 在环境建模与定位算法方面,将单机器人的算 中跟踪多运动目标的实验系统).异质多机器人团 法扩展到多机器人领域,取得了较高的定位精度,但 队中由于个体具有不同的运动、规划等能力,使得协 算法在适应性等方面仍存在很大的问题.文献[23- 调问题更加复杂.ALLIANCE基于行为集合(be 24]将Kalman滤波算法扩展到多机器人协作建模 havior set))支持异质移动体的集成,但构造基本行 领域,将一个Kalman滤波估计器分解为多个具有 为本身就比较困难,而且没有明显的协商机制.此 通信能力的小滤波器,存在于每个机器人上,相互之 外,还需要关注动态环境的多机器人协调路径规划 间共享内部传感器信息.多机器人团队行动中,各滤 问题.目前解决这个问题的基本方法有2种:一种是 波器根据各自外部传感器信息进行位置估计和修 基于“空间时间”的规划方法,它通过给各个机器 正,并相互交流位置信息.实践表明,协作定位精度 人设置优先级的思想或交通规则的思想而把问题简 明显高于单个机器人使用Kalman滤波的定位结 化为单个机器人的路径规划问题,另一种是人工势 果.但该方法在估计与更新阶段都忽略了方向不确 场法它基于各个机器人的局部信息而确定其当前 定性的影响,因而简化了实际环境的噪声分布 运动路线但当机器人的工作空间比较复杂或者障 Monte Carlo定位是近年来单机器人建模与定位领 碍物的形状比较复杂时,上述2种方法都无法保证》域非常流行的热门技术,文献[25·26]将其扩展到 一定能够产生出无碰撞的运动路线,也保证不了各 多机器人领域,具体应用于2个机器人协作探索环 个机器人一定能够达到各自相应的目的地.此外,也 境的场合.当2个机器人互相探测到对方时,各自对 有不少人提出了采用遗传算法来解决这一问题,但 定位位置估计的信念由于互相印证而得到加强,从 遗传算法包括复杂的交叉运算,并采用无记忆的进 而可以比单机器人更快地收敛到相对精确的估计位 化模式,收敛速度较慢,计算复杂 置.但目前该方法还只能应用于室内环境,且由于彼 关于多Agent协作领域的任务分配、运动规划 此探测时忽略了探测信息的相互依赖,有可能导致 及控制等问题,文献[1]进行了比较全面的综述.需 过分乐观的位置估计2列 要指出的是,关于异质多Aget团队研究国内很少 目前,大多数多机器人团队协作时只能针对同 涉及,特别是有人参与的多Agent协作始终是一个 种传感器以方便融合2】,有效利用异质传感器融合 具有挑战性的开放问题.Nakamura等提出一个比 的多机器人协作环境识别与目标定位还很少见.事 较灵活的命令与监督机制8】,使人能够作为操作者 实上,各种传感器具有各自的优点.声呐能够较精确 与移动机器人团队协调工作 探测机器人间的距离,但杂波较多.立体视觉既能探 1.3多移动机器人的环境感知与定位 测距离也能探测方向21,近年来激光雷达逐渐取代 多机器人协作的环境感知与定位需要考虑选择 声纳成为测距传感器的主流,文献[30]融合视觉传 何种控制结构、如何实现协作、相互间的定位等单机 感器与激光雷达数据进行协作建模,是异质传感信 器人不需要考虑的问题.文献[19]采用一种完全分 息融合的有益尝试.但目前,这些融合还只是严格约 布式的控制结构,多机器人间通过无线网络进行通 束条件下的像素级融合 讯,每个机器人通过广播方式把自己的局部地图信 1.4多移动机器人团队的重构技术 息发送到所有机器人.文献[20]采用了另外一种控 重构(reconfiguration)是针对多移动体的故障 制结构:分散探索,集中环境建模,即各机器人使用 或任务要求重新配置或重新组织的方法,其日的在 相同的算法处理自己的感知数据并创建局部地图, 于屏蔽发生故障的移动体或部件对其他移动体和部 存在一个中央模块将所有的局部环境模型集成为全 件的影响,以尽可能最大程度地完成预定任务:或者 局环境模型.而对于多机器人间相互定位问题,文献 通过重构满足不同任务要求」 [21]中多移动机器人在待探索的环境中行动时,某 对于多机器人系统,重构研究主要集中在可重 个时刻至少有一个机器人是静止的.其他机器人将 构机器人,即通过独立模块重新组织或连接而形成 该静止机器人作为路标,相对其进行自身定位.文献 不同形状以满足不同功能要求,甚至可实现自修 [22]中某时刻只有一个机器人可以行动,其他机器 复3).文献[32]研究了基于动机行为(motivational 人则组成等边三角形的信标供移动机器人进行定 behaviors)的异质多机器人容错机制,为机器人赋 位.这2种方法具有共同的局限性,即某时刻只能有 予“急躁”(impatience)与“默许”(acquiescence)2种 部分机器人可以移动;机器人与作为信标的机器人 内部动机.“急躁”导致机器人对某一行为的动机增 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.nei
站和基于统计运动状态估计的动态权限分配策略进 行路径规划 ,并开发出基于视觉的监视及复杂环境 中跟踪多运动目标的实验系统[17 ] . 异质多机器人团 队中由于个体具有不同的运动、规划等能力 ,使得协 调问题更加复杂. ALL IANCE 基于行为集合 ( be2 havior set) 支持异质移动体的集成 ,但构造基本行 为本身就比较困难 ,而且没有明显的协商机制. 此 外 ,还需要关注动态环境的多机器人协调路径规划 问题. 目前解决这个问题的基本方法有 2 种 :一种是 基于“空间 —时间”的规划方法 ,它通过给各个机器 人设置优先级的思想或交通规则的思想而把问题简 化为单个机器人的路径规划问题 ;另一种是人工势 场法 ,它基于各个机器人的局部信息而确定其当前 运动路线. 但当机器人的工作空间比较复杂 ,或者障 碍物的形状比较复杂时 ,上述 2 种方法都无法保证 一定能够产生出无碰撞的运动路线 ,也保证不了各 个机器人一定能够达到各自相应的目的地. 此外 ,也 有不少人提出了采用遗传算法来解决这一问题 ,但 遗传算法包括复杂的交叉运算 ,并采用无记忆的进 化模式 ,收敛速度较慢 ,计算复杂. 关于多 Agent 协作领域的任务分配、运动规划 及控制等问题 ,文献[ 1 ]进行了比较全面的综述. 需 要指出的是 ,关于异质多 Agent 团队研究国内很少 涉及 ,特别是有人参与的多 Agent 协作始终是一个 具有挑战性的开放问题. Nakamura 等提出一个比 较灵活的命令与监督机制[18 ] ,使人能够作为操作者 与移动机器人团队协调工作. 1. 3 多移动机器人的环境感知与定位 多机器人协作的环境感知与定位需要考虑选择 何种控制结构、如何实现协作、相互间的定位等单机 器人不需要考虑的问题. 文献[ 19 ]采用一种完全分 布式的控制结构 ,多机器人间通过无线网络进行通 讯 ,每个机器人通过广播方式把自己的局部地图信 息发送到所有机器人. 文献[ 20 ]采用了另外一种控 制结构 :分散探索 ,集中环境建模 ,即各机器人使用 相同的算法处理自己的感知数据并创建局部地图 , 存在一个中央模块将所有的局部环境模型集成为全 局环境模型. 而对于多机器人间相互定位问题 ,文献 [21 ]中多移动机器人在待探索的环境中行动时 ,某 个时刻至少有一个机器人是静止的. 其他机器人将 该静止机器人作为路标 ,相对其进行自身定位. 文献 [22 ]中某时刻只有一个机器人可以行动 ,其他机器 人则组成等边三角形的信标供移动机器人进行定 位. 这 2 种方法具有共同的局限性 ,即某时刻只能有 部分机器人可以移动 ;机器人与作为信标的机器人 间必须保持视觉或距离传感方面的“接触”. 在环境建模与定位算法方面 ,将单机器人的算 法扩展到多机器人领域 ,取得了较高的定位精度 ,但 算法在适应性等方面仍存在很大的问题. 文献[ 23 - 24 ]将 Kalman 滤波算法扩展到多机器人协作建模 领域 ,将一个 Kalman 滤波估计器分解为多个具有 通信能力的小滤波器 ,存在于每个机器人上 ,相互之 间共享内部传感器信息. 多机器人团队行动中 ,各滤 波器根据各自外部传感器信息进行位置估计和修 正 ,并相互交流位置信息. 实践表明 ,协作定位精度 明显高于单个机器人使用 Kalman 滤波的定位结 果. 但该方法在估计与更新阶段都忽略了方向不确 定性的影响 ,因而简化了实际环境的噪声分布. Monte Carlo 定位是近年来单机器人建模与定位领 域非常流行的热门技术 ,文献[ 25 - 26 ]将其扩展到 多机器人领域 ,具体应用于 2 个机器人协作探索环 境的场合. 当 2 个机器人互相探测到对方时 ,各自对 定位位置估计的信念由于互相印证而得到加强 ,从 而可以比单机器人更快地收敛到相对精确的估计位 置. 但目前该方法还只能应用于室内环境 ,且由于彼 此探测时忽略了探测信息的相互依赖 ,有可能导致 过分乐观的位置估计[27 ] . 目前 ,大多数多机器人团队协作时只能针对同 种传感器以方便融合[28 ] ,有效利用异质传感器融合 的多机器人协作环境识别与目标定位还很少见. 事 实上 ,各种传感器具有各自的优点. 声呐能够较精确 探测机器人间的距离 ,但杂波较多. 立体视觉既能探 测距离也能探测方向[29 ] ;近年来激光雷达逐渐取代 声纳成为测距传感器的主流 ,文献[ 30 ]融合视觉传 感器与激光雷达数据进行协作建模 ,是异质传感信 息融合的有益尝试. 但目前 ,这些融合还只是严格约 束条件下的像素级融合. 1. 4 多移动机器人团队的重构技术 重构(reconfiguration) 是针对多移动体的故障 或任务要求重新配置或重新组织的方法 ,其目的在 于屏蔽发生故障的移动体或部件对其他移动体和部 件的影响 ,以尽可能最大程度地完成预定任务 ;或者 通过重构满足不同任务要求. 对于多机器人系统 ,重构研究主要集中在可重 构机器人 ,即通过独立模块重新组织或连接而形成 不同形状以满足不同功能要求 ,甚至可实现自修 复[31 ] . 文献[32 ]研究了基于动机行为 (motivational behaviors) 的异质多机器人容错机制 ,为机器人赋 予“急躁”(impatience) 与“默许”(acquiescence) 2 种 内部动机.“急躁”导致机器人对某一行为的动机增 第 3 期 蔡自兴 ,等 :异质多移动机器人协同技术研究的进展 ·3 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
●4 智能系统学报 第2卷 强而取代其他可能不能顺利完成任务(例如出现故 协同进化适合用于能自然分解成相互作用或相互合 障)的机器人,从而实现对机器人团队内其他成员失 作的问题,每一个子模块用单独的种群进化,通过问 效的容错,“默许”导致机器人放弃某一未能完成的 题分解使搜索空间变小,并更容易维持多样性.竞争 任务以实现对自身的容错.文献[33]研究了受生物 协同进化适合于求解比较容易获得测试例子的问 启发的激素通讯机制,在此基础上提出了自适应通 题,通过问题的解和测试例子一起进化,相互驱使提 讯协议.单个“激素”信号可以在整个模块网络间传 高各自性能和复杂性,使得参与竞争的种群不断提 递,但导致不同的模块根据其局部接收器、传感器、 高复杂度4 拓扑连接以及状态信息等不同而做出不同的反应. 但是协进化学习还面临着一些问题,体现在:1) 1.5增强多机器人团队环境和任务适应能力的机 目前建立的协同进化模型没有充分考虑生态系统的 器学习理论与方法 特性,如时滞性、关键性等;2)研究在新环境和动态 由于实时环境瞬息万变,不可能在研制期间完 变化环境MAS中协同算法的应用也是很多工作指 全预知未来的环境变化情况并做出完善的对策,因 出的进一步研究方向;3)问题如何自动分解,以自动 此必须研究相应的机器学习理论与方法以提高移动 构造协同种群也值得研究21.因此,进化学习是否 体个体及团队的灵活自治性和适应性 能持续有效进化结果是否可以进一步扩展到有人 近年来,机器学习已取得了一些突破性进展,其 参与的团队协同等复杂行为等问题都值得深入探 中包括增强学习(reinforcement learning)理论和算 讨 法研究、进化学习算法和应用研究等.上述机器 学习理论和方法为复杂和未知环境中的多机器人协 2 研究难点 作信息提取、环境理解、任务规划与行为决策等提供 2.1异质成员间的通信问题 了有效的解决途径 异质多移动机器人间的通信问题是一个比较关 经典的增强学习仅适用于解决单机器人的马尔 键和急需解决的问题.由于团队中不同机器人具有 科夫决策问题(MDP),而多机器人系统中由于机器 不同的结构通信能力和信息表达方式,所执行的任 人间的相互影响,不是一个完全的MDP过程.因此 务也五花八门,因此设计一种通用的描述语言是非 提出并证明一个多Agent系统(MAS,又称多智能 常困难的 体系统)的强化学习理论系统的任务就迫在眉睫 此外,还需要考虑通信的开销问题.最理想情况 Junlung Hu在1998年证明了应用在线Q-学习实 是能够达到按需通信,即在需要的时候某2个机器 现的动态环境下的多Agent协作最终会收敛到 人才进行通信,在不需要的时候就不通信,这样可以 Nash平衡点,为MAS中使用增强学习提供了理论 减少整个团队的消耗」 基础3].在此基础上,增强学习在多机器人协作领 2.2异质成员间的任务分配优化问题 域得到越来越多的应用6·),分布式增强学习 异质团队的优势在于能够根据具体的任务分配 (DL)逐渐成为新的研究热点38.391.目前,国内外 不同能力的机器人去完成,达到“人尽其材,物尽其 针对DL的研究较少,尤其是在真实环境中受传感 用”.真正做到任务分配优化,就要了解不同机器人 能力等制约,环境最多只可能模型化为部分可观测 的能力,在具体情况下根据机器人所处的状态,将任 马氏决策过程(POMDP),在此情况下,如何最大化 务分解成多个子任务分配给机器人.其难点主要体 奖励总和(增强信号),正是本项目中需要解决的问 现在2个方面: 题 1)任务的分解.任务分解是否合理直接影响到 移动机器人进化学习包括群体进化学习和个体 任务分配是否达到优化.目前对任务的分解主要根 发展学习,协进化策略是近年该领域研究的热 据距离、时间场合等,很多实际任务是比较难分解 点01,为解决机器学习、复杂系统动态自适应等问 的 题提供了一种重要的途径.传统遗传算法(GA)在处 2)子任务的分配.在将任务分解成多个子任务 理复杂的、多目标、多变量优化问题时往往存在早 后,应该根据机器人的能力和当前状态来分配子任 熟或收敛慢等问题,并且只适用于单个个体的进化. 务.这是一个优化问题,需要考虑众多因素,如所携 而协进化算法借鉴生态学的种群协同理论,通过构 带的传感器,机器人的速度和灵活程度,机器人的计 造多个种群,建立它们之间的竞争或共生关系,多个 算能力和通信能力,以及当前机器人是否空闲,机器 种群相互驱使来提高各自性能和复杂性.其中共生 人以前做类似任务时的完成情况等 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved htp://www.cnki.net
强而取代其他可能不能顺利完成任务 (例如出现故 障) 的机器人 ,从而实现对机器人团队内其他成员失 效的容错“; 默许”导致机器人放弃某一未能完成的 任务以实现对自身的容错. 文献[ 33 ]研究了受生物 启发的激素通讯机制 ,在此基础上提出了自适应通 讯协议. 单个“激素”信号可以在整个模块网络间传 递 ,但导致不同的模块根据其局部接收器、传感器、 拓扑连接以及状态信息等不同而做出不同的反应. 1. 5 增强多机器人团队环境和任务适应能力的机 器学习理论与方法 由于实时环境瞬息万变 ,不可能在研制期间完 全预知未来的环境变化情况并做出完善的对策 ,因 此必须研究相应的机器学习理论与方法以提高移动 体个体及团队的灵活自治性和适应性. 近年来 ,机器学习已取得了一些突破性进展 ,其 中包括增强学习 (reinforcement learning) 理论和算 法研究、进化学习算法和应用研究[34 ] 等. 上述机器 学习理论和方法为复杂和未知环境中的多机器人协 作信息提取、环境理解、任务规划与行为决策等提供 了有效的解决途径. 经典的增强学习仅适用于解决单机器人的马尔 科夫决策问题(MDP) ,而多机器人系统中由于机器 人间的相互影响 ,不是一个完全的 MDP 过程. 因此 提出并证明一个多 Agent 系统 (MAS ,又称多智能 体系统) 的强化学习理论系统的任务就迫在眉睫. J unlung Hu 在 1998 年证明了应用在线 Q2学习实 现的动态环境下的多 Agent 协作最终会收敛到 Nash 平衡点 ,为 MAS 中使用增强学习提供了理论 基础[ 35 ] . 在此基础上 ,增强学习在多机器人协作领 域得到越来越多的应用[36 - 37 ] ,分布式增强学习 (DRL) 逐渐成为新的研究热点[38 - 39 ] . 目前 ,国内外 针对 DRL 的研究较少 ,尤其是在真实环境中受传感 能力等制约 ,环境最多只可能模型化为部分可观测 马氏决策过程(POMDP) ,在此情况下 ,如何最大化 奖励总和(增强信号) ,正是本项目中需要解决的问 题. 移动机器人进化学习包括群体进化学习和个体 发展学习 , 协进化策略是近年该领域研究的热 点[40 ] ,为解决机器学习、复杂系统动态自适应等问 题提供了一种重要的途径. 传统遗传算法( GA) 在处 理复杂的、多目标、多变量优化问题时 ,往往存在早 熟或收敛慢等问题 ,并且只适用于单个个体的进化. 而协进化算法借鉴生态学的种群协同理论 ,通过构 造多个种群 ,建立它们之间的竞争或共生关系 ,多个 种群相互驱使来提高各自性能和复杂性. 其中共生 协同进化适合用于能自然分解成相互作用或相互合 作的问题 ,每一个子模块用单独的种群进化 ,通过问 题分解使搜索空间变小 ,并更容易维持多样性. 竞争 协同进化适合于求解比较容易获得测试例子的问 题 ,通过问题的解和测试例子一起进化 ,相互驱使提 高各自性能和复杂性 ,使得参与竞争的种群不断提 高复杂度[41 ] . 但是协进化学习还面临着一些问题 ,体现在 :1) 目前建立的协同进化模型没有充分考虑生态系统的 特性 ,如时滞性、关键性等 ;2) 研究在新环境和动态 变化环境 MAS 中协同算法的应用也是很多工作指 出的进一步研究方向 ;3) 问题如何自动分解 ,以自动 构造协同种群也值得研究[42 ] . 因此 ,进化学习是否 能持续有效、进化结果是否可以进一步扩展到有人 参与的团队协同等复杂行为等问题都值得深入探 讨. 2 研究难点 2. 1 异质成员间的通信问题 异质多移动机器人间的通信问题是一个比较关 键和急需解决的问题. 由于团队中不同机器人具有 不同的结构、通信能力和信息表达方式 ,所执行的任 务也五花八门 ,因此设计一种通用的描述语言是非 常困难的. 此外 ,还需要考虑通信的开销问题. 最理想情况 是能够达到按需通信 ,即在需要的时候某 2 个机器 人才进行通信 ,在不需要的时候就不通信 ,这样可以 减少整个团队的消耗. 2. 2 异质成员间的任务分配优化问题 异质团队的优势在于能够根据具体的任务分配 不同能力的机器人去完成 ,达到“人尽其材 ,物尽其 用”. 真正做到任务分配优化 ,就要了解不同机器人 的能力 ,在具体情况下根据机器人所处的状态 ,将任 务分解成多个子任务分配给机器人. 其难点主要体 现在 2 个方面 : 1) 任务的分解. 任务分解是否合理直接影响到 任务分配是否达到优化. 目前对任务的分解主要根 据距离、时间、场合等 ,很多实际任务是比较难分解 的. 2) 子任务的分配. 在将任务分解成多个子任务 后 ,应该根据机器人的能力和当前状态来分配子任 务. 这是一个优化问题 ,需要考虑众多因素 ,如所携 带的传感器 ,机器人的速度和灵活程度 ,机器人的计 算能力和通信能力 ,以及当前机器人是否空闲 ,机器 人以前做类似任务时的完成情况等. ·4 · 智 能 系 统 学 报 第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第3期 蔡自兴,等:异质多移动机器人协同技术研究的进展 5 2.3异质成员间的信息融合问题 cooperation method based on the ant algorithm [J ]Ro- 异质多移动机器人团队可以携带更多不同种类 bot,2003,25(5):207-283. 的传感器,从而具有不同的功能以完成不同的任务 [4]CHEYER,ADAM,MARTIN,et al.The open agent 这样一个异质团队共同合作时,为了完成最终的目 architecture [J ]Journal of Autonomous Agents and 标,必不可少需要信息融合.异质间的信息融合就包 Multi-Agent Systems,2001,4 (1):143-148. [5]CHAIMOWICZ L,COWL EY A,SABELLA V,et al 括了单个机器人上不同传感器的信息融合和机器人 ROCI:a distributed framework for multi-robot percep- 与机器人间的信息融合.例如,当异质团队共同完成 tion and control[A].Proceedings of the 2003 IEEE/RJS 环境探测时,将视觉信息与激光雷动或声纳信息融 International Conference on Intelligent Robots and Sys- 合生成单个机器人的局部地图,然后将多个机器人 tems[C].Las Vegas,USA,2003. 的局部地图信息融合成一个全局地图.因此,异质多 [6]ALUR R,DAS A et al.A framework and architecture 机器人间的信息融合涉及到信息表示匹配、相关及 for multi-robot coordination [A].Experimental Robotics 如何处理不确定性和如何提高处理速度等难点问 VII,LNCIS 271[C].Springer Verlag,2001. 题 [7]陈卫东,顾冬雷,席裕庚,基于多模式交互的多移动机器 人分布式合作系统U],自动化学报,2004,30(5):671- 3结束语 678. CHEN Weidong,GU Donglei,XI Yugeng.Distributed 多机器人协同研究己经逐渐成为机器人学的一 cooperation for multiple mobile robots based on multi- 个重要分支经过20多年的不懈积累,该领域已经 modal interactions[J ]Acta Automatica Sinica,2004,30 在体系结构、通信、运动协调等子课题研究中取得了 (5):671-678. 长足的进步,并且越来越显现出学科交叉性更强、应 [8]DAS A,SPL ETZERJ,KUMAR V,et al.Ad Hoc net- 用前景广阔的特点.展望未来,IEEE Transaction works for localization and control[A ]In Proceedings of on Robotics and Automation在2002年关于多机器 the IEEE Conference on Decision and Control C].Las 人系统的专刊中指出了本领域研究中一些具有挑战 Vegas,USA,2002. 性的开放课题.此外,还应注意几个方面的研究动 [9]周三元.一种MAS开发的构架[J].导弹与航天运载技 向.首先异质性越来越成为考察与设计多移动机器 术,2003,4:41-44 ZHOU Sanyuan.A kingd of framework for MAS devel- 人团队的一项重要特征.正如Balch&Parker所说, opment[J].Missiles and Space Vehicles,2003,4:41- 应该把异质性作为多机器人团队的基本出发点.在 44. 此思想指导下,进行体系结构、通信、协同机制等的 [10]ASAMA H,ARAI T,ISHIDA Y.Design of an auton 设计与研究;其次,在考虑人能够有效控制机器人团 omous and distributed robot system:ACTRESS [A]. 队的基础上,如何使人能够更有效地参与团队;最 In Proc of IEEE/RSJ Int Conf on Intelligence Robots 后,应用需求仍然对多机器人协作理论的研究方向 and Systems[C].Tsukuba,Japan,1989. 起决定作用.家庭服务、广域环境协作清扫、工件搬 [11]PARKER L E.ALL IANCE:An architecture for fault- 运等任务依然是本领域研究的热点,但这些任务主 tolerant multi-robot cooperation[J].IEEE Transactions 要面向结构化环境.针对非结构化环境甚至未知环 on Robotics and Automation,1998,14(2):220-240. 12]VIDAL,SHA KERNIA,KIM,et al.Multi-agent prob- 境的建模、定位与探索任务也将逐渐成为研究的热 abilistic pursuit-evasion games with unmanned ground 门话题 and aerial vehicles [J ]IEEE Transactions on Robotics 参考文献 and Automation,2002,18(5):662-669. [13 JUN GD,ZEL INSKY A.Grounded symbolic communi- [1]ARAI T,PA GELLO E,PARKER L E.Editorial ad- cation between heterogeneous cooperating robots [J ] vances in multi-bobot systems [J ]IEEE Transactions Autonomous Robots,2000,8(3):269-292. on Robotics and Automation,2002,18(5):655-661. [14 PARKER L E.Lifelong adaptation in heterogeneous [2]BALCH T,PARKER L E.Special issue on heterogene- multi-robot teams:response to continual variation inin- ous multi-robot systems[J ]Autonomous Robots,2000, dividual robot performance [J].Autonomous Robots, 8(3):207-383. 2000,8(3):239-267. [3]丁滢颖,何衍,蒋静坪,基于蚁群算法的多机器人协 [15 MURPHY,LISETTI,IRISH,et al.Emotiorr based 作策略].机器人,2003,25()414-418 control of cooperating heterogeneous mobile robots[J]. DIN G Yingying,HE Yan,JIAN GJingping.Multi-robot IEEE Transactions on Robotics and Automation,2002, 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
2. 3 异质成员间的信息融合问题 异质多移动机器人团队可以携带更多不同种类 的传感器 ,从而具有不同的功能以完成不同的任务. 这样一个异质团队共同合作时 ,为了完成最终的目 标 ,必不可少需要信息融合. 异质间的信息融合就包 括了单个机器人上不同传感器的信息融合和机器人 与机器人间的信息融合. 例如 ,当异质团队共同完成 环境探测时 ,将视觉信息与激光雷动或声纳信息融 合生成单个机器人的局部地图 ,然后将多个机器人 的局部地图信息融合成一个全局地图. 因此 ,异质多 机器人间的信息融合涉及到信息表示、匹配、相关及 如何处理不确定性和如何提高处理速度等难点问 题. 3 结束语 多机器人协同研究已经逐渐成为机器人学的一 个重要分支. 经过 20 多年的不懈积累 ,该领域已经 在体系结构、通信、运动协调等子课题研究中取得了 长足的进步 ,并且越来越显现出学科交叉性更强、应 用前景广阔的特点. 展望未来 , IEEE Transaction on Robotics and Automation 在 2002 年关于多机器 人系统的专刊中指出了本领域研究中一些具有挑战 性的开放课题. 此外 ,还应注意几个方面的研究动 向. 首先异质性越来越成为考察与设计多移动机器 人团队的一项重要特征. 正如 Balch & Parker 所说 , 应该把异质性作为多机器人团队的基本出发点. 在 此思想指导下 ,进行体系结构、通信、协同机制等的 设计与研究 ;其次 ,在考虑人能够有效控制机器人团 队的基础上 ,如何使人能够更有效地参与团队 ;最 后 ,应用需求仍然对多机器人协作理论的研究方向 起决定作用. 家庭服务、广域环境协作清扫、工件搬 运等任务依然是本领域研究的热点 ,但这些任务主 要面向结构化环境. 针对非结构化环境甚至未知环 境的建模、定位与探索任务也将逐渐成为研究的热 门话题. 参考文献 : [1 ]ARAI T , PA GELLO E , PAR KER L E. Editorial : ad2 vances in multi2bobot systems [J ]. IEEE Transactions on Robotics and Automation , 2002 , 18 (5) : 655 - 661. [2 ]BALCH T , PAR KER L E. Special issue on heterogene2 ous multi2robot systems[J ]. Autonomous Robots , 2000 , 8 (3) : 207 - 383. [3 ]丁滢颍 , 何 衍 , 蒋静坪. 基于蚁群算法的多机器人协 作策略[J ]. 机器人 , 2003 , 25 (5) :414 - 418. DIN G Yingying , HE Yan , J IAN GJingping. Multi2robot cooperation method based on the ant algorithm [J ]. Ro2 bot , 2003 , 25 (5) :207 - 283. [4 ] CHEYER , ADAM , MARTIN , et al. The open agent architecture [J ]. Journal of Autonomous Agents and Multi2Agent Systems , 2001 , 4 (1) : 143 - 148. [5 ]CHAIMOWICZ L , COWL EY A , SABELLA V , et al. ROCI: a distributed framework for multi2robot percep2 tion and control[ A ]. Proceedings of the 2003 IEEE/ RJ S International Conference on Intelligent Robots and Sys2 tems[C]. Las Vegas , USA , 2003. [6 ] ALUR R , DAS A et al. A framework and architecture for multi2robot coordination [A ]. Experimental Robotics VII , LNCIS 271[C]. Springer Verlag , 2001. [7 ]陈卫东 ,顾冬雷 ,席裕庚. 基于多模式交互的多移动机器 人分布式合作系统[J ]. 自动化学报 ,2004 ,30 (5) : 671 - 678. CHEN Weidong , GU Donglei , XI Yugeng. Distributed cooperation for multiple mobile robots based on multi2 modal interactions[J ]. Acta Automatica Sinica , 2004 , 30 (5) :671 - 678. [8 ]DAS A , SPL ETZER J , KUMAR V , et al. Ad Hoc net2 works for localization and control[ A ]. In Proceedings of the IEEE Conference on Decision and Control [ C]. Las Vegas , USA , 2002. [9 ]周三元. 一种 MAS 开发的构架[J ]. 导弹与航天运载技 术 , 2003 ,4 : 41 - 44. ZHOU Sanyuan. A kingd of framework for MAS devel2 opment[J ]. Missiles and Space Vehicles , 2003 , 4 :41 - 44. [10 ]ASAMA H , ARAI T , ISHIDA Y. Design of an auton2 omous and distributed robot system : ACTRESS [ A ]. In Proc of IEEE/ RSJ Int Conf on Intelligence Robots and Systems[C]. Tsukuba , J apan , 1989. [11 ]PAR KER L E. ALL IANCE: An architecture for fault2 tolerant multi2robot cooperation[J ]. IEEE Transactions on Robotics and Automation , 1998 , 14 (2) : 220 - 240. [ 12 ]VIDAL , SHA KERNIA , KIM , et al. Multi2agent prob2 abilistic pursuit2evasion games with unmanned ground and aerial vehicles [J ]. IEEE Transactions on Robotics and Automation , 2002 , 18 (5) : 662 - 669. [ 13 ]J UN G D , ZEL INSKY A. Grounded symbolic communi2 cation between heterogeneous cooperating robots [J ]. Autonomous Robots , 2000 , 8 (3) : 269 - 292. [ 14 ] PAR KER L E. Lifelong adaptation in heterogeneous multi2robot teams: response to continual variation in in2 dividual robot performance [J ]. Autonomous Robots , 2000 , 8 (3) : 239 - 267. [15 ] MURPH Y , L ISETTI , IRISH , et al. Emotion2based control of cooperating heterogeneous mobile robots[J ]. IEEE Transactions on Robotics and Automation , 2002 , 第 3 期 蔡自兴 ,等 :异质多移动机器人协同技术研究的进展 ·5 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
6年 智能系统学报 第2卷 18(5):744-757. 162. [16]MITCHELL A P.A cooperative coevolutionary ap- ZHANG Hongfeng,WANG Shuo,TAN Min,et al.A proach to function optimization [A ]Parallel Problem dynamic region decomposition approach to cooperative Solving from Nature [C].Jerusalem:Springer-Verlag, multirobot map-building[J ]Robot,2003,25(2):156 1994. .162. [17]SAPTHARISHI,OHYER,DIEHL,et al.Distributed [29]DAVISON A J.KITA N.Active visual localization for surveillance and reconnaissance using multiple autono- cooperating inspection robots[A ]In Proceedings of the mous ATVs:cyberscout[J ]IEEE Transactions on Ro- IEEE/RSJ International Conference on Intelligent Ro- botics and Automation,2002,18(5):826-836. bots and Systems[C].Takamatsu,Japan,2000. [18]NA KAMURA A,OTA J,ARAI T.Humamrsuper- [30]BURGARD W,FOX D,MOORS M,et al.Collabora- vised multiple mobile robot system[A].In Proc of the tive multi-robot exploration[A ]In Proceedings of the 5th Int.Symposium on Distributed Autonomous Robot- IEEE International Conference on Robotics and Auto- ic Systems[C].Knoxville,USA,2000. mation[C].San Francisco,CA,2000. [19]SIMMONS R,APFELBAUM D,BURGARD W.Co- [31]李斌,董慧颖,白雪.可重构机器人研究和发展现 ordination for multi-robot exploration and mapping[A]. 状U].沈阳工业学院学报,2000,19(4):68.72. In Proceedings of the AAAI National Conference on Ar- LI Bin,DONG Huiying,BAI Xue.The recent situation tificial Intelligence[C].Austin,USA,2000. of developing for reconfigurable robot [J].Journal of [20]KIM YJ,KIM J H.Online map building evolutionary Shenyang Institute of Technology,2000,19(4):68- algorithm for multi-agent mobile robots with odometric 1 uncertainty [A].IEEE Conf Evolutionary Computation [32]PARKER L E.Adaptive heterogeneous multi-robot teams [C].San Diego,USA,2000. [U].Neurocomputing,1999,28(1.3):75-92. [21]REKL EITIS I M,DUDEK G,MILIOS E.Multi-robot [33]SHEN W,SAL EMI B,WILL P.Hormone-inspired a- collaboration for robust exploration [J].Annals of daptive communication and distributed control for CON- Mathematics and Artificial Intelligence,2001,31 (1- RO self-reconfigurable robots[J ]IEEE Tansaction on 4):7.40 Robotics and Automation,2002,18(5):700-712. [22]GRABOWSKI R,NAVARRO L E,PAREDIS C J,et [34]刘娟,蔡自兴,涂春鸣.进化机器人学研究进展U] al.Heterogenouse teams of modular robots for mapping 控制理论与应用,2002,19(4):493.499 and exploration[J ]Autonomous Robots,2000,8(3): LIU Juan,CAI Zixing,TU Chunming.Survey on evo- 293-308. lutionary robotics[J].Control Theory Applications, [23]ROUMEL IOTIS S I,BEKEY GA.Collective localiza- 2002,19(4):493-499. tion:a distributed kalman filter approach to localization [35]HU Junling.Learning in Markov game with incomplete of groups of mobile robots[A].In Proceeding of the information[A].Proceedings of the 15th National Con IEEE International Conference on Robotics and Auto- ference on Artificial Intelligence C].Madison,USA, mation[C].San Francisco,CA,2000. 1998. [24]ROUMELIOTIS S I,BEKEY G A.Distributed multi- [36]ABUL O,PLOAT F,AL HAJJ R.MultiAgent reinforce- robot localization [J ]IEEE Transactions on Robotics ment learning using function approximation [J].IEEE Trans and Automation,2002,18(5):781,795. action on Systems,Man,and Cybernetics (Part C:Applica- [25]REKL EITIS I M,DUDEK G,MILIOS E.Probabilistic tion and Reviews),2000.,30(4):485.497. cooperative localization in rractice [A ]In Proceedings [37]MARTINSON E,ARKIN R.Learning to role-switch of the IEEE International Conference on Robotics and in multi-robot systems[A].In Proceeding of the IEEE Automation[C].Taipei,China,2003. International Conference on Robotics and Automation [26]FOX D,BURGARD W,KRUPPA H,et al.A probabilis [C].Taipei,China,2003. tic approach to collaborative multi-robot localization [J ] [38]LAUER M,RIEDMILL ER M.An algorithm for dis- Autonomous Robots.2000.8(3):325-344. tributed reinforcement learning in cooperative multra- [27]ROUMEL IOTIS S I,REKL EITIS I M.Propagation of gent systems[A ]In Proceedings of International Con uncertainty in cooperative multirobot localization:anal- ference on Machine Learning[C].Stanford,CA,2000. ysis and experimental results[J ]Autonomous Robots, [39]王醒策,张汝波,顾国昌.多机器人动态编队的强化学 2004,17(1):41-54. 习算法研究U].计算机研究与发展,2003,40(10): [28]张洪峰,王硕,谭民,等.基于动态分区方法的多 1444.1450. 机器人协作地图构建U].机器人,2003,25(2):156- WANG Xingce,ZHANG Rubo,GU Guochang.Re- 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
18 (5) : 744 - 757. [ 16 ] MITCHELL A P. A cooperative coevolutionary ap2 proach to function optimization [ A ]. Parallel Problem Solving from Nature [ C]. J erusalem : Springer2Verlag , 1994. [17 ]SAPTHARISHI , O H YER , DIEHL , et al. Distributed surveillance and reconnaissance using multiple autono2 mous A TVs: cyberscout[J ]. IEEE Transactions on Ro2 botics and Automation , 2002 , 18 (5) : 826 - 836. [18 ] NA KAMURA A , O TA J , ARAI T. Human2super2 vised multiple mobile robot system[ A ]. In Proc of the 5th Int. Symposium on Distributed Autonomous Robot2 ic Systems[C]. Knoxville , USA , 2000. [19 ]SIMMONS R , APFELBAUM D , BURGARD W. Co2 ordination for multi2robot exploration and mapping[ A ]. In Proceedings of the AAAI National Conference on Ar2 tificial Intelligence[C]. Austin , USA ,2000. [20 ] KIM Y J , KIM J H. Online map building evolutionary algorithm for multi2agent mobile robots with odometric uncertainty [ A ]. IEEE Conf Evolutionary Computation [C]. San Diego , USA , 2000. [21 ]REKL EITIS I M , DUDEK G, MIL IOS E. Multi2robot collaboration for robust exploration [ J ]. Annals of Mathematics and Artificial Intelligence , 2001 , 31 (1 - 4) : 7 - 40. [22 ] GRABOWSKI R , NAVARRO L E , PAREDIS C J ,et al. Heterogenouse teams of modular robots for mapping and exploration[J ]. Autonomous Robots , 2000 , 8 (3) : 293 - 308. [23 ]ROUMEL IO TIS S I , BEKEY G A. Collective localiza2 tion : a distributed kalman filter approach to localization of groups of mobile robots [ A ]. In Proceeding of the IEEE International Conference on Robotics and Auto2 mation[C]. San Francisco , CA , 2000. [24 ]ROUMEL IO TIS S I , BEKEY G A. Distributed multi2 robot localization [J ]. IEEE Transactions on Robotics and Automation , 2002 , 18 (5) :781 - 795. [ 25 ]REKL EITIS I M , DUDEK G, MIL IOS E. Probabilistic cooperative localization in rractice [ A ]. In Proceedings of the IEEE International Conference on Robotics and Automation[C]. Taipei , China , 2003. [ 26 ] FOX D , BURGARD W , KRUPPA H , et al. A probabilis2 tic approach to collaborative multi2robot localization [J ]. Autonomous Robots , 2000 , 8 (3) : 325 - 344. [27 ]ROUMEL IO TIS S I , REKL EITIS I M. Propagation of uncertainty in cooperative multirobot localization : anal2 ysis and experimental results[J ]. Autonomous Robots , 2004 , 17 (1) : 41 - 54. [28 ]张洪峰 , 王 硕 , 谭 民 ,等. 基于动态分区方法的多 机器人协作地图构建[J ]. 机器人 , 2003 , 25 (2) : 156 - 162. ZHAN G Hongfeng , WAN G Shuo , TAN Min , et al. A dynamic region decomposition approach to cooperative multi2robot map2building[J ]. Robot , 2003 , 25 (2) :156 - 162. [29 ]DAVISON A J , KITA N. Active visual localization for cooperating inspection robots[ A ]. In Proceedings of the IEEE/ RSJ International Conference on Intelligent Ro2 bots and Systems[C]. Takamatsu , J apan , 2000. [30 ]BURGARD W , FOX D , MOORS M , et al. Collabora2 tive multi2robot exploration [ A ]. In Proceedings of the IEEE International Conference on Robotics and Auto2 mation[C]. San Francisco , CA , 2000. [31 ]李 斌 , 董慧颖 , 白 雪. 可重构机器人研究和发展现 状[J ]. 沈阳工业学院学报 , 2000 , 19 (4) : 68 - 72. L I Bin , DON G Huiying , BAI Xue. The recent situation of developing for reconfigurable robot [J ]. Journal of Shenyang Institute of Technology , 2000 , 19 (4) : 68 - 72. [32 ] PARKER L E. Adaptive heterogeneous multi2robot teams [J ]. Neurocomputing , 1999 , 28 (1 - 3) : 75 - 92. [33 ]SHEN W , SAL EMI B , WILL P. Hormone2inspired a2 daptive communication and distributed control for CON2 RO self2reconfigurable robots[J ]. IEEE Tansaction on Robotics and Automation , 2002 , 18 (5) : 700 - 712. [34 ]刘 娟 ,蔡自兴 ,涂春鸣. 进化机器人学研究进展[J ]. 控制理论与应用 ,2002 ,19 (4) :493 - 499. L IU J uan , CAI Zixing , TU Chunming. Survey on evo2 lutionary robotics[J ]. Control Theory & Applications , 2002 , 19 (4) :493 - 499. [35 ] HU J unling. Learning in Markov game with incomplete information[ A ]. Proceedings of the 15th National Con2 ference on Artificial Intelligence [ C]. Madison , USA , 1998. [36 ]ABUL O , PLOAT F , AL HAJJ R. Multi2Agent reinforce2 ment learning using function approximation [J ]. IEEE Trans2 action on Systems , Man , and Cybernetics (Part C: Applica2 tion and Reviews) , 2000 , 30(4) :485 - 497. [ 37 ] MARTINSON E , AR KIN R. Learning to role2switch in multi2robot systems[ A ]. In Proceeding of the IEEE International Conference on Robotics and Automation [C]. Taipei , China , 2003. [38 ]LAU ER M , RIEDMILL ER M. An algorithm for dis2 tributed reinforcement learning in cooperative multi2a2 gent systems[ A ]. In Proceedings of International Con2 ference on Machine Learning[C]. Stanford , CA , 2000. [39 ]王醒策 , 张汝波 , 顾国昌. 多机器人动态编队的强化学 习算法研究[J ]. 计算机研究与发展 , 2003 , 40 (10) : 1444 - 1450. WAN G Xingce , ZHAN G Rubo , GU Guochang. Re2 ·6 · 智 能 系 统 学 报 第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第3期 蔡自兴,等:异质多移动机器人协同技术研究的进展 。7 search on dynamic team formation of multi-robots rein- 作者简介: forcement learning [J ]Journal of Computer Research 蔡自兴,男,1938年生,教授,博士 and Development,2003,40(10):1444-1450 生导师.主要研究方向为人工智能、机器 [40]薛宏涛,沈林成,叶媛媛,等.基于协进化方法的多智 人等.获科技奖励30多项,其中国家级 能体协作系统体系结构及其仿真框架[卩].系统仿真学 奖励2项,省部级奖励20多项,已在国 报,2002,14(3):297.303. 内外发表论文550多篇,出版专著和材 XUE Hongtao,SHEN Lincheng,YE Yuanyuan,et al. 料26部. Multi-agent collaboration system architecture and simu- Email zxcai @csu.edu.cn lation framework based on co-evolution method [J ] Journal of System Simulation,2002,14(3):297-303. 陈白帆,女,1979年生,博士研究 [41]NOL FI S,FLOREANO D.How co-evolution can enhance 生.主要研究方向为移动机器人定位、 the adaptive power of artificial evolution:implications for 环境建模机器视觉等 evolutionary robotics [A].In Proceedings of Evolutionary Email chenbaifan @csu.edu.cn. Robot[C].Springer Verlag,1998. [42]阮怀忠,徐精明.MAS中基于协同进化的学习[J].安 徽技术师范学院学报,2004,18(1):58.59 RUAN Huaizhong,XU Jingming.Co-operative co-evo- 王璐,男,1972年生,博士研究 lution based learning in multi-agent system[J ]Journal 生.主要研究方向为人工智能、移动机 of Anhui Technical Teachers College,2004,18(1):58 器人导航、计算机视觉等。 -59. E mail dqxwl @21cn.com. [43]蔡自兴.机器人学[M.北京:清华大学出版社,2000. 第七届全球智能控制与自动化大会(WCIC08) The 7th World Congress on Intelligent Control and Automation 全球智能控制与自动化大会(WCICA)是每两年一次在中国召开的重要国际会议。第七届大会(WC CA08)将于2008年6月25-27日在美丽的山城重庆召开。本次会议由重庆大学主办,由IEEE国家自然 科学基金委员会、中国自动化学会、中国人工智能学会协办。会议为全球从事智能控制和自动化的专家、学 者和工程技术人员提供一个交流、研讨和报告他们最新研究成果的平台。大会热忱欢迎广大同行踊跃投稿, 录用的论文将由正式出版社出版论文集(附带光盘),版权属EEE。论文同时被国际重要检索机构EI收 录。会议征文包括与智能控制和自动化有关的理论、方法和应用方面的论文。会议网站:http://wcica08. cqu.edu.cn,联系电话:8623-65112857. 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net
search on dynamic team formation of multi2robots rein2 forcement learning [J ]. Journal of Computer Research and Development , 2003 , 40 (10) :1444 - 1450. [40 ]薛宏涛 , 沈林成 , 叶媛媛 ,等. 基于协进化方法的多智 能体协作系统体系结构及其仿真框架[J ]. 系统仿真学 报 ,2002 ,14 (3) :297 - 303. XU E Hongtao , SHEN Lincheng , YE Yuanyuan , et al. Multi2agent collaboration system architecture and simu2 lation framework based on co2evolution method [J ]. Journal of System Simulation , 2002 , 14 (3) :297 - 303. [41 ]NOLFI S , FLOREANO D. How co2evolution can enhance the adaptive power of artificial evolution : implications for evolutionary robotics [ A ]. In Proceedings of Evolutionary Robot[C]. Springer Verlag , 1998. [42 ]阮怀忠 , 徐精明. MAS 中基于协同进化的学习[J ]. 安 徽技术师范学院学报 , 2004 , 18 (1) : 58 - 59. RUAN Huaizhong , XU Jingming. Co2operative co2evo2 lution based learning in multi2agent system[J ]. Journal of Anhui Technical Teachers College , 2004 , 18 (1) :58 - 59. [43 ]蔡自兴. 机器人学[ M ]. 北京 :清华大学出版社 ,2000. 作者简介 : 蔡自兴 ,男 ,1938 年生 ,教授 ,博士 生导师. 主要研究方向为人工智能、机器 人等. 获科技奖励 30 多项 ,其中国家级 奖励 2 项 ,省部级奖励 20 多项 ,已在国 内外发表论文 550 多篇 ,出版专著和材 料 26 部. E2mail : zxcai @csu. edu. cn. 陈白帆 ,女 , 1979 年生 ,博士研究 生. 主要研究方向为移动机器人定位、 环境建模、机器视觉等. E2mail : chenbaifan @csu. edu. cn. 王 璐 ,男 , 1972 年生 ,博士研究 生. 主要研究方向为人工智能、移动机 器人导航、计算机视觉等. E2mail : dqx2wl @21cn. com. 第七届全球智能控制与自动化大会( WCICA’08) The 7th World Congress on Intelligent Control and Automation 全球智能控制与自动化大会 (WCICA) 是每两年一次在中国召开的重要国际会议。第七届大会(WCI2 CA’08) 将于 2008 年 6 月 25 - 27 日在美丽的山城重庆召开。本次会议由重庆大学主办 ,由 IEEE 国家自然 科学基金委员会、中国自动化学会、中国人工智能学会协办。会议为全球从事智能控制和自动化的专家、学 者和工程技术人员提供一个交流、研讨和报告他们最新研究成果的平台。大会热忱欢迎广大同行踊跃投稿 , 录用的论文将由正式出版社出版论文集 (附带光盘) ,版权属 IEEE。论文同时被国际重要检索机构 EI 收 录。会议征文包括与智能控制和自动化有关的理论、方法和应用方面的论文。会议网站 : http :/ / wcica08. cqu. edu. cn ,联系电话 :86223265112857. 第 3 期 蔡自兴 ,等 :异质多移动机器人协同技术研究的进展 ·7 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net