第16卷第2期 智能系统学报 Vol.16 No.2 2021年3月 CAAI Transactions on Intelligent Systems Mar.2021 D0:10.11992/tis.202006019 网络出版地址:https:/ns.cnki.net/kcms/detail/23.1538.TP.20201104.1430.004html 面向观测融合和吸引因子的多机器人主动SLAM 王贺彬,葛泉波2,刘华平3,袁小虎 (1.杭州电子科技大学自动化学院,浙江杭州310018,2.同济大学电子与信息工程学院,上海201804,3.清华 大学计算机科学与技术系,北京100084,4.清华大学自动化系,北京100084) 摘要:针对未知环境下多机器人主动SLAM(simultaneous localization and mapping)存在不能完全遍历环境、定 位精度不理想等问题,本文基于EKF-SLAM(extended Kalman filter-simultaneous localization and mapping)算法提出 一种多机器人主动SLAM算法。通过引入吸引因子,增强多机器人系统之间的交流,提升机器人自身定位精度 与环境建图精度,同时又引导多机器人团队进行探索环境。当同一地标被多个机器人观测到,采用凸组合融合 方法融合各个机器人对地标的估计,从而降低被估计地标的不确定度。仿真结果表明,所提算法能够对环境进 行覆盖遍历,提升对地标估计的定位精度。 关键词:主动同时定位与建图;多机器人协作;吸引因子;凸组合融合;扩展卡尔曼滤波器;最优控制;互信息: 多目标优化 中图分类号:TP510.80文献标志码:A 文章编号:1673-4785(2021)02-0371-07 中文引用格式:王贺彬,葛泉波,刘华平,等.面向观测融合和吸引因子的多机器人主动SLAM[J.智能系统学报,2021, 16(2):371-377. 英文引用格式:WANG Hebin,.GE Quanbo,LIU Huaping,etal.Multi--robot active SLAM for observation fusion and attractorJ. CAAI transactions on intelligent systems,2021,16(2):371-377. Multi-robot active SLAM for observation fusion and attractor WANG Hebin',GE Quanbo',LIU Huaping,YUAN Xiaohu' (1.School of Automation,Hangzhou Dianzi University,Hangzhou 310018,China;2.School of Electronics and Information Engin- eering,Tongji University,Shanghai 201804,China;3.Department of Computer Science and Technology,Tsinghua University, Beijing 100084.China:4.Department of Automation,Tsinghua University,Beijing 100084.China) Abstract:Because multi-robot active SLAM cannot fully traverse an environment,and the localization accuracy is not ideal in an unknown environment,a new multi-robot active SLAM algorithm is proposed in this paper.By introducing attractors to enhance communication between multi-robot systems,the accuracy of robot localization and mapping is en- hanced,and multi-robot teams are guided to explore the environment.When the same landmark is observed by multiple robots,convex combination fusion is used to fuse the estimate of the landmark by each robot,thereby reducing the un- certainty of the landmark.The simulation results show that the proposed algorithm can cover and traverse the environ- ment and improve the localization accuracy of landmark estimation. Keywords:active simultaneous location and mapping;multi-robot cooperation;attractor;convex combination fusion; extended Kalman filter;optimal control;mutual information;multi-objective optimization 同步定位与地图构建(simultaneous localiza- 器人在未知环境中运动时,逐步构建其周围环境 tion and mapping,.SLAM)问题可以描述为:移动机的地图,同时运用此地图对机器人位置和姿态进 收稿日期:2020-06-12.网络出版日期:2020-11-05 行估计山。SLAM技术广泛应用于移动机器人、 基金项目:国家自然科学基金项目(61773147,U1509203):浙江 无人驾驶汽车、无人机、增强现实、导航或水下无 省自然科学基金项目(LR17F030005). 通信作者:刘华平.E-mail:hpliu(@tsinghua.edu.cn 人潜航器等领域。但是目前已有的SLAM算
DOI: 10.11992/tis.202006019 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20201104.1430.004.html 面向观测融合和吸引因子的多机器人主动 SLAM 王贺彬1 ,葛泉波2 ,刘华平3 ,袁小虎4 (1. 杭州电子科技大学 自动化学院,浙江 杭州 310018; 2. 同济大学 电子与信息工程学院,上海 201804; 3. 清华 大学 计算机科学与技术系,北京 100084; 4. 清华大学 自动化系,北京 100084) 摘 要:针对未知环境下多机器人主动 SLAM(simultaneous localization and mapping) 存在不能完全遍历环境、定 位精度不理想等问题,本文基于 EKF-SLAM(extended Kalman filter-simultaneous localization and mapping) 算法提出 一种多机器人主动 SLAM 算法。通过引入吸引因子,增强多机器人系统之间的交流,提升机器人自身定位精度 与环境建图精度,同时又引导多机器人团队进行探索环境。当同一地标被多个机器人观测到,采用凸组合融合 方法融合各个机器人对地标的估计,从而降低被估计地标的不确定度。仿真结果表明,所提算法能够对环境进 行覆盖遍历,提升对地标估计的定位精度。 关键词:主动同时定位与建图;多机器人协作;吸引因子;凸组合融合;扩展卡尔曼滤波器;最优控制;互信息; 多目标优化 中图分类号:TP510.80 文献标志码:A 文章编号:1673−4785(2021)02−0371−07 中文引用格式:王贺彬, 葛泉波, 刘华平, 等. 面向观测融合和吸引因子的多机器人主动 SLAM[J]. 智能系统学报, 2021, 16(2): 371–377. 英文引用格式:WANG Hebin, GE Quanbo, LIU Huaping, et al. Multi-robot active SLAM for observation fusion and attractor[J]. CAAI transactions on intelligent systems, 2021, 16(2): 371–377. Multi-robot active SLAM for observation fusion and attractor WANG Hebin1 ,GE Quanbo2 ,LIU Huaping3 ,YUAN Xiaohu4 (1. School of Automation, Hangzhou Dianzi University, Hangzhou 310018, China; 2. School of Electronics and Information Engineering, Tongji University, Shanghai 201804, China; 3. Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China; 4. Department of Automation, Tsinghua University, Beijing 100084, China) Abstract: Because multi-robot active SLAM cannot fully traverse an environment, and the localization accuracy is not ideal in an unknown environment, a new multi-robot active SLAM algorithm is proposed in this paper. By introducing attractors to enhance communication between multi-robot systems, the accuracy of robot localization and mapping is enhanced, and multi-robot teams are guided to explore the environment. When the same landmark is observed by multiple robots, convex combination fusion is used to fuse the estimate of the landmark by each robot, thereby reducing the uncertainty of the landmark. The simulation results show that the proposed algorithm can cover and traverse the environment and improve the localization accuracy of landmark estimation. Keywords: active simultaneous location and mapping; multi-robot cooperation; attractor; convex combination fusion; extended Kalman filter; optimal control; mutual information; multi-objective optimization 同步定位与地图构建 (simultaneous localization and mapping, SLAM) 问题可以描述为:移动机 器人在未知环境中运动时,逐步构建其周围环境 的地图,同时运用此地图对机器人位置和姿态进 行估计[1]。SLAM 技术广泛应用于移动机器人、 无人驾驶汽车、无人机、增强现实、导航或水下无 人潜航器等领域[2-4]。但是目前已有的 SLAM 算 收稿日期:2020−06−12. 网络出版日期:2020−11−05. 基金项目:国家自然科学基金项目(61773147,U1509203);浙江 省自然科学基金项目(LR17F030005). 通信作者:刘华平. E-mail:hpliu@tsinghua.edu.cn. 第 16 卷第 2 期 智 能 系 统 学 报 Vol.16 No.2 2021 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2021
·372· 智能系统学报 第16卷 法,大多是单机器人系统且假设运动轨迹已知, 互,使其能够快速协同完成定位建图任务。多机 这种被动式SLAM与SLAM问题中的环境未知 器人主动SLAM中的误差主要来自于两个方面: 相矛盾。 一是机器人自身位置误差,二是传感器观测误 多机器人系统在探索能力、鲁棒性、容错性 差。当机器人自身定位精准时,其估计的视野范 等方面比单机器人更具优势,各个机器人通过 围内的地标精度也比较高。当多个机器人观测到 通信网络进行信息传递与共享,相互协调工作, 同一地标时,通过凸组合融合)利用多个机器人 共享环境信息,极大扩展了机器人系统对环境 对地标的估计值修正当前地标的状态值,可以大 的感知范围与定位的精度。因此,自20世纪90 大降低该地标的不确定度,减少多机器人系统定 年代以来,在研究单机器人SLAM的基础上,多 位与建图的误差。 机器人SLAM逐步成为移动机器人领域研究的 针对上述问题,本文基于EKF-SLAM算法I6 热门 提出一种多机器人主动SLAM算法,其主要创新 由Feder提出的基于信息论的自适应导航 性工作包含改进吸引因子作用范围和建立信息 与建图方法为主动SLAM奠定了基础。文献[10], 融合技术为基础的地标估计融合方法,将主动 基于EKF提出局部子地图的SLAM方法,证明局 SLAM问题转化为最优控制选取问题,并通过引 部子地图与全局地图相互独立,机器人只维护自 入吸引因子促进了多机器人间的信息交流,一方 己所建立的子图,然后周期性地将子图融合到全 面用于提升机器人自身位置估计准确性,另一方 局地图中,但是其机器人的路径事先指定,建图 面用于指引多机器人进行环境的探索。当多个机 过程中仅按规定路线进行环境探索,因此缺乏多 器人观测到同一地标时,采用凸组合融合,进行 机协同。文献[11]扩展了基于局部子图的多机器 地标的估计,降低被估计地标的不确定度,提升 人主动SLAM方法,将主动SLAM问题转为多目 建图与定位的精度。 标优化问题,并通过EKF对子地图进行融合得到 1问题描述 全局地图。文献[12]通过引人吸引因子,实现主 动SLAM,但是只适用于单机器人。文献[13] 考虑一个拥有n个机器人的系统,符合以下 将主动信息收集任务应用于多机器人主动SLAM 运动模型: 中,并引入虚拟地标与吸引因子引导多机器人探 x41=fx,ua+w,i∈(l,2,…m (1) 索,但是没有进行估计的数据融合。 式中:1是第i个机器人在时间t时刻的n.维状 多机器人主动SLAM是指机器人在未知环境 态向量;f)是非线性状态转移函数;u∈U,是在 下多机器人协同主动感知环境,并通过目标函数 1时刻第i个在机器人的控制量;U,是有限的控制 选择一系列的控制输入使得机器人能够高效地完 输入;w∈Rm:是n.维高斯过程噪声。 成探索与建图的任务,其目标函数的优化的目标 在主动SLAM任务中要求机器人感知环境主 一般包括定位与建图的准确、新增探索区域、导 动选择控制量去定位未知环境下的所有地标,地 航代价等因素。但以上优化目标之间往往是相互 标的状态y,是静态的: 制约、相互对立的,例如机器人为了提高自身定 y+1=y (2) 位与建图的准确性,常局限于一定的范围内徘 其中y=E…JT,包含了m个地标的位置, 徊,而向外探索时,定位与建图的不确定性又会 [,]代表其中第i个地标的坐标。 增大。即使进行多目标优化,对常见的优化函 令x=[x;y小则x+1可以表示为 数进行线性叠加,在实际中还是会出现不能遍历 xi+1= f(xiui)+wis 完整个环境、定位与建图精度不理想的情况,因 ,ie{1,2,…,nl y 3 为,定位所有地标不等于遍历整个环境,不遍历 机器人运动时在每个时刻进行观测,其传感 完整个环境,是不知道地标的具体数目位置的。 器观测模型如下: 因此,本文扩展了文献[13]的吸引因子,将吸引 zu=h(x,y)+y,i∈{1,2,…,n (4) 因子作用域放大,不仅仅用来纠正自身定位不好 式中:z∈R为在1时刻第i个机器人的观测向 的机器人,还用于去指导多机器人团队进行环境 量;h(是非线性量测函数;∈R是n维量测 的探索,使其能够遍历完整个环境,定位环境中 噪声。为了简化符号,令=[z…,“=4 所有的未知地标,吸引因子作为媒介促进多机器 2…4nJ,U=Ui×U2×…XUn。 人系统的交流,增强多机器人系统与环境的交 如图1所示为EKF-SLAM简图Im,其中椭圆
法,大多是单机器人系统且假设运动轨迹已知, 这种被动式 SLAM 与 SLAM 问题中的环境未知 相矛盾[5]。 多机器人系统在探索能力、鲁棒性、容错性 等方面比单机器人更具优势[6] ,各个机器人通过 通信网络进行信息传递与共享,相互协调工作, 共享环境信息,极大扩展了机器人系统对环境 的感知范围与定位的精度。因此,自 20 世纪 90 年代以来,在研究单机器人 SLAM 的基础上,多 机器人 SLAM 逐步成为移动机器人领域研究的 热门[5,7-8]。 由 Feder[9] 提出的基于信息论的自适应导航 与建图方法为主动 SLAM 奠定了基础。文献 [10], 基于 EKF 提出局部子地图的 SLAM 方法,证明局 部子地图与全局地图相互独立,机器人只维护自 己所建立的子图,然后周期性地将子图融合到全 局地图中,但是其机器人的路径事先指定,建图 过程中仅按规定路线进行环境探索,因此缺乏多 机协同。文献 [11] 扩展了基于局部子图的多机器 人主动 SLAM 方法,将主动 SLAM 问题转为多目 标优化问题,并通过 EKF 对子地图进行融合得到 全局地图。文献 [12] 通过引入吸引因子,实现主 动 SLAM,但是只适用于单机器人。文献 [13] 将主动信息收集任务应用于多机器人主动 SLAM 中,并引入虚拟地标与吸引因子引导多机器人探 索,但是没有进行估计的数据融合。 多机器人主动 SLAM 是指机器人在未知环境 下多机器人协同主动感知环境,并通过目标函数 选择一系列的控制输入使得机器人能够高效地完 成探索与建图的任务,其目标函数的优化的目标 一般包括定位与建图的准确、新增探索区域、导 航代价等因素。但以上优化目标之间往往是相互 制约、相互对立的,例如机器人为了提高自身定 位与建图的准确性,常局限于一定的范围内徘 徊,而向外探索时,定位与建图的不确定性又会 增大[14]。即使进行多目标优化,对常见的优化函 数进行线性叠加,在实际中还是会出现不能遍历 完整个环境、定位与建图精度不理想的情况,因 为,定位所有地标不等于遍历整个环境,不遍历 完整个环境,是不知道地标的具体数目位置的。 因此,本文扩展了文献 [13] 的吸引因子,将吸引 因子作用域放大,不仅仅用来纠正自身定位不好 的机器人,还用于去指导多机器人团队进行环境 的探索,使其能够遍历完整个环境,定位环境中 所有的未知地标,吸引因子作为媒介促进多机器 人系统的交流,增强多机器人系统与环境的交 互,使其能够快速协同完成定位建图任务。多机 器人主动 SLAM 中的误差主要来自于两个方面: 一是机器人自身位置误差,二是传感器观测误 差。当机器人自身定位精准时,其估计的视野范 围内的地标精度也比较高。当多个机器人观测到 同一地标时,通过凸组合融合[15] 利用多个机器人 对地标的估计值修正当前地标的状态值,可以大 大降低该地标的不确定度,减少多机器人系统定 位与建图的误差。 针对上述问题,本文基于 EKF-SLAM 算法[16] 提出一种多机器人主动 SLAM 算法,其主要创新 性工作包含改进吸引因子作用范围和建立信息 融合技术为基础的地标估计融合方法,将主动 SLAM 问题转化为最优控制选取问题,并通过引 入吸引因子促进了多机器人间的信息交流,一方 面用于提升机器人自身位置估计准确性,另一方 面用于指引多机器人进行环境的探索。当多个机 器人观测到同一地标时,采用凸组合融合[15] ,进行 地标的估计,降低被估计地标的不确定度,提升 建图与定位的精度。 1 问题描述 考虑一个拥有 n 个机器人的系统,符合以下 运动模型: x r i,t+1 = f ( x r i,t ,ui,t ) +wi,t ,i ∈ {1,2,···n} (1) x r i,t+1 nx f(·) ui,t ∈ Ui Ui wi,t ∈ R nx nx 式中: 是第 i 个机器人在时间 t 时刻的 维状 态向量; 是非线性状态转移函数; 是在 t 时刻第 i 个在机器人的控制量; 是有限的控制 输入; 是 维高斯过程噪声。 yt 在主动 SLAM 任务中要求机器人感知环境主 动选择控制量去定位未知环境下的所有地标,地 标的状态 是静态的: yt+1 = yt (2) y = [l x 1 l y 1 · · · l x m l y m] T [l x i ,l y i ] 其中 ,包含了 m 个地标的位置, 代表其中第 i 个地标的坐标。 xi,t = [x r i,t ; yt] x 令 则 i,t+1 可以表示为 xi,t+1 = [ f ( x r i,t ,ui,t ) +wi,t yt ] ,i ∈ {1,2,··· ,n} (3) 机器人运动时在每个时刻进行观测,其传感 器观测模型如下: zi,t = h ( xi,t , yt ) +vi,t ,i ∈ {1,2,··· ,n} (4) zi,t ∈ R nzi h(·) vi,t ∈ R nzi nzi zt = [z T 1,t z T 2,t · · · z T n,t ] u = [u1,t u2,t · · · un,t ] U = U1 ×U2 × · · · ×Un 式中: 为在 t 时刻第 i 个机器人的观测向 量; 是非线性量测函数; 是 维量测 噪声。为了简化符号,令 , , 。 如图 1 所示为 EKF-SLAM 简图[17] ,其中椭圆 ·372· 智 能 系 统 学 报 第 16 卷
第2期 王贺彬,等:面向观测融合和吸引因子的多机器人主动SLAM ·373· 代表机器人位置估计的不确定度,当机器人沿如 其中F:和G.分别为运动模型f()对机器人状 图1所示直线运动时,可以看出当机器人一直观 态向量:与运动噪声向量w的雅可比矩阵。 测不到地标时,位置估计不确定度会越来越大, af 在完全未知环境中无法预测机器人定位误差的上 fu二ax-u afl (8) 限8),直到观测到新的地标时其不确定度会下 Gu= ow lw=o 降。这也是现有大多数算法不能遍历完环境的原 量测更新: 因,因为在完全未知环境下,当没有地标作用时, 无+1=41+K+1(z+1-h(t4i》 机器人自身定位误差越来越大,其会倾向于去探 K1=P+1H41(H1P41H+1+R4) (9) 索过的地方降低自身不确定度,而不是选择继续 其中H41是观测模型h()对状态向量1的雅 探索环境。 可比矩阵: 地标 A-微 (10) 主动SLAM问题式(6)指多机器人系统在 0 1时刻,主动选取最优控制序列“使得其在1+1时 刻目标函数J最小。本文利用贪婪算法凶可以用 机器人初始位置 观测 于解决第i个机器人的主动SLAM问题,在1时刻 已地标 分析控制空间U,中可用的控制量u,对机器人的 图1使用EKF-SLAM进行地标定位简图 运动产生的影响,找到能使机器人估计误差协方 Fig.1 Landmark localization using extended Kalman 差trace(P+i)最小的控制量4uo Filter 但是在EKF-SLAM建图中,机器人为了提升 多机器人主动SLAM问题可以描述为最大化 自身的估计精度,常会在一定范围局部运动,在 目标y,与z,之间的互信息1心yz)。 探测过的区域进行徘徊。当机器人与两个陆标的 max J(u):=I(y,lz) 距离相等,且到两个陆标的向量正交时,系统更 s.t.xim=f(xinui)+winiE(1.2.....n (5) 新是最稳定的。因此需要对式(6)进行优化,不 zu=h(xy)+yu,ie{l,2,…,nl 仅仅考虑机器人估计误差协方差还要考虑新增探 互信息可以衡量观测与目标的关联程度,互 索面积△S,优化后的目标函数为 信息越大说明,目标与观测之前的关联越大,则 更有可能从观测中获取更多信息。 min Ju):=alogdet(P)+BAS (11) 其中山为归一化符号。 2基于观测融合的主动SLAM 新增探索面积为相对于已探索区域,机器人 主动SLAM可以用式(5)描述为随机最优控 视野扫过新增加的面积。 制问题,通常,对于此类问题,自适应闭环控制策 观测阶段中,每个机器人在不同位置对环境 略比非自适应开环策略具有显著优势。但是,由 中的地标进行观测,如图2所示。 于观测模型式(4)在目标状态下的线性和高斯噪 声假设,可以证明式(⑤)简化为确定性的最优控 制问题,对于该问题,开环策略是最优的。在目 标状态是高斯分布的情况下,存在最优控制序列 地标 u使得式(⑤)最优,与此同时式(5)等价于以下最 优控制问题: min J(u):=logdet(P) 机器人 机器人可视范围 s.t.x+1=f(x,)+w,ie{1,2,…,nl (6) Pu41=P+1-KsiH+1Pa+1,i∈1,2,…, 图2地标估计融合示意 式中P+1为第i个机器人的卡尔曼估计误差协方 Fig.2 Landmark estimation fusion schematic 差。时间更新: 当多个机器人观测到同一地标时,多机器人 im=firui) (7) 系统可以分先后观测到同一地标,每个机器人都 Pint FuPuFI+GLQGL 会对地标位置产生一个估计,同一地标的估计位
代表机器人位置估计的不确定度,当机器人沿如 图 1 所示直线运动时,可以看出当机器人一直观 测不到地标时,位置估计不确定度会越来越大, 在完全未知环境中无法预测机器人定位误差的上 限 [ 1 8 ] ,直到观测到新的地标时其不确定度会下 降。这也是现有大多数算法不能遍历完环境的原 因,因为在完全未知环境下,当没有地标作用时, 机器人自身定位误差越来越大,其会倾向于去探 索过的地方降低自身不确定度,而不是选择继续 探索环境。 观测 地标 观测 地标 机器人初始位置 图 1 使用 EKF-SLAM 进行地标定位简图 Fig. 1 Landmark localization using extended Kalman Filter yt zt I(yt |zt) 多机器人主动 SLAM 问题可以描述为最大化 目标 与 之间的互信息 。 max u∈U J(u) := I(yt |zt) s.t. xi,t+1 = f ( xi,t ,ui,t ) +wi,t ,i ∈ {1,2,··· ,n} zi,t = h ( xi,t , yt ) +vi,t ,i ∈ {1,2,··· ,n} (5) 互信息可以衡量观测与目标的关联程度,互 信息越大说明,目标与观测之前的关联越大,则 更有可能从观测中获取更多信息。 2 基于观测融合的主动 SLAM u 主动 SLAM 可以用式 (5) 描述为随机最优控 制问题,通常,对于此类问题,自适应闭环控制策 略比非自适应开环策略具有显著优势。但是,由 于观测模型式 (4) 在目标状态下的线性和高斯噪 声假设,可以证明式 (5) 简化为确定性的最优控 制问题,对于该问题,开环策略是最优的[19]。在目 标状态是高斯分布的情况下,存在最优控制序列 使得式 (5) 最优,与此同时式 (5) 等价于以下最 优控制问题: min u∈U J(u) := log det( Pi,t+1 ) s.t. xi,t+1 = f ( xi,t ,ui,t ) +wi,t ,i ∈ {1,2,··· ,n} Pi,t+1 = P − i,t+1 − Ki,t+1Hi,t+1P − i,t+1 ,i ∈ {1,2,··· ,n} (6) 式中 Pi,t+1 为第 i 个机器人的卡尔曼估计误差协方 差。时间更新: xˆ − i,t+1 = f(xˆ i,t ,ui,t) P − i,t+1 = Fi,tPi,tF T i,t +Gi,tQi,tG T i,t (7) Fi,t Gi,t f(·) xˆi,t wi,t 其中 和 分别为运动模型 对机器人状 态向量 与运动噪声向量 的雅可比矩阵。 Fi,t = ∂ f ∂x x=xˆ i,t Gi,t = ∂ f ∂w w=0 (8) 量测更新: xˆi,t+1 = xˆ − i,t+1 + Ki,t+1(zt+1 − h(xˆ − i,t+1 )) Ki,t+1 = Pi,t+1HT i,t+1 (Hi,t+1P − i,t+1HT i,t+1 + Ri,t+1) −1 (9) Hi,t+1 h(·) xˆ − 其中 是观测模型 对状态向量 i,t+1 的雅 可比矩阵: Hi,t+1 = ∂h ∂x x=xˆ − i,t+1 (10) u Ui ui,t trace(Pi,t+1 ) ui,t 主动 SLAM 问题式 (6) 指多机器人系统在 t 时刻,主动选取最优控制序列 使得其在 t+1 时 刻目标函数 J 最小。本文利用贪婪算法[12] 可以用 于解决第 i 个机器人的主动 SLAM 问题,在 t 时刻 分析控制空间 中可用的控制量 对机器人的 运动产生的影响,找到能使机器人估计误差协方 差 最小的控制量 。 ∆S i t+1|t 但是在 EKF-SLAM 建图中,机器人为了提升 自身的估计精度,常会在一定范围局部运动,在 探测过的区域进行徘徊。当机器人与两个陆标的 距离相等,且到两个陆标的向量正交时,系统更 新是最稳定的[14]。因此需要对式 (6) 进行优化,不 仅仅考虑机器人估计误差协方差还要考虑新增探 索面积 ,优化后的目标函数为 min µ∈U J(u) := α∏log det( Pi,t+1 ) +β∏∆S i t+1|t (11) 其中 ∏ 为归一化符号。 新增探索面积为相对于已探索区域,机器人 视野扫过新增加的面积。 观测阶段中,每个机器人在不同位置对环境 中的地标进行观测,如图 2 所示。 机器人 机器人可视范围 地标 图 2 地标估计融合示意 Fig. 2 Landmark estimation fusion schematic 当多个机器人观测到同一地标时,多机器人 系统可以分先后观测到同一地标,每个机器人都 会对地标位置产生一个估计,同一地标的估计位 第 2 期 王贺彬,等:面向观测融合和吸引因子的多机器人主动 SLAM ·373·
·374· 智能系统学报 第16卷 置可能有多个,这样会带来更多的不确定性,造 人探索环境。吸引因子促进了多机器人团队进行 成错误的数据关联。因此,在多个机器人观测到 交流与通信。在完全未知的环境下,吸引因子的 同一地标时,采用凸组合融合对各个机器人对地 必要性是保证多机器人团队能够遍历完整个环 标的估计值融合,从而降低地标的不确定度。地 境,不加吸引因子的主动SLAM算法,会出现局 标的不确定度越小其地标估计误差协方差的迹越 部环境遍历不完全的情况。 小,凸组合融合可以表示为 机器人: △ P4=(P)+(P4)) 地标: (12) 机器人位置估计: 1=P=(Pai)41+(Pu广i) (13) 地标位置估计: · 吸引因子:☆☆☆☆☆ 其中41∈x+1小+1∈x+、P41∈P+小P+1∈P+Io 同 在多个机器人进行探索建图的过程中,每个机器 人只维护自己所建立的地图,即使其中一个机器 人出现故障,依然可以继续建图,系统鲁棒性 ☆ 强。当出现同一地标被不同机器人观测到后,则 会融合各个机器人对该地标的估计,降低该地标 的不确定度。根据凸组合融合可知,对地标估 计进行融合所得到的估计值,会比原来估计要 图3用于位姿修正的吸引因子 小。由于只针对地标估计进行融合,其算法的复 Fig.3 Attractors for pose correction 杂度也会有所降低。机器人构建的局部的子图组 如图4所示,吸引因子的应用范围是位姿修 成了所构建的全局地图,多机器人系统所构建的 正与探索环境,虚线代表满足一定的条件所采 地图包括被多个机器人观测到的融合地标与非融 取的控制策略。在机器人位置估计偏差较大 合地标。 时,会触发吸引因子,此时不采用贪婪算法,而 吸引因子会去引导机器人修正其位姿,而不会 3吸引因子 进行环境探索。当机器人在1步内无新增扩展 由于多机器人系统不知道环境中地标的数目 面积时,则会触发吸引因子,引导多机器人团队 和位置,基于式(11)的目标函数在机器人视野范 去探索环境。 围内无新增探索面积时,其会采用估计误差协方 贪梦 机器人 算法 差作为主动控制选取的原则,这样会导致机器人 探索 当前状态 环境 最优控制→预测 在已经探索过的区域徘徊。因此有必要让多机器 修正 观测 人团队去探索环境,故增加虚拟探索地标,在机 位姿 器人所建图的边界上,当机器人扩展环境时虚拟 状态 通信网络 地标会建立,并移除旧的虚拟探索地标,当虚拟 更新 探索地标集合为空时证明环境已经遍历完毕。 图4多机器人主动SLAM算法流程 吸引因子是用于指引机器人进行控制策略选 Fig.4 Multi-robot active SLAM algorithm 择的一个向量,当其出现时机器人会去选择朝着 4仿真分析 吸引因子的方向进行运动规划。其发挥作用从出 现到消失为3步,满足一定条件后会重新出现。 为验证多机器人主动SLAM算法有效性,设 当机器人在1步内无新增探索面积时,吸引因子 计仿真进行验证。机器人运动模型如下 会出现,其朝向为最近的虚拟探索地标,去引导 sin+sin(0+) 多机器人团队进行环境探索,如图3所示,当机器 (14) 人自身的位置估计协方差的迹trace(P,)大于一定 COs0-v cos(0+w△f) 阈值ε时,ε阈值根据实验设定,吸引因子会出 w△t 现,其朝向为定位最精确的地标,修正自身位姿 机器人的状态向量为x=[xy,其中x、y为机 估计。 器人在环境内的位置,0为其方位角。离散控制 吸引因子的作用有两个,一是提升机器人自 入U={(w,wp=10m/s,ω∈{0,±π/6,±π/12(°)/s。采 身的定位精度修正自身位姿估计,二是引导机器 样周期△t=0.5,无论机器人选择哪个控制量,其一
置可能有多个,这样会带来更多的不确定性,造 成错误的数据关联。因此,在多个机器人观测到 同一地标时,采用凸组合融合对各个机器人对地 标的估计值融合,从而降低地标的不确定度。地 标的不确定度越小其地标估计误差协方差的迹越 小,凸组合融合可以表示为 P ′ f,t+1 = ( (P ′ i,t+1 ) −1 +(P ′ j,t+1 ) −1 )−1 (12) xˆ ′ f,t+1 = P ′ f,t+1 ( (P ′ i,t+1 ) −1 xˆ ′ j,t+1 +(P ′ j,t+1 ) −1 xˆ ′ i,t+1 ) (13) xˆ ′ i,t+1 ∈ xi,t+1 xˆ ′ j,t+1 ∈ xj,t+1 P ′ i,t+1 ∈ Pi,t+1 P ′ 其中 、 、 、 j,t+1 ∈ Pj,t+1。 在多个机器人进行探索建图的过程中,每个机器 人只维护自己所建立的地图,即使其中一个机器 人出现故障,依然可以继续建图,系统鲁棒性 强。当出现同一地标被不同机器人观测到后,则 会融合各个机器人对该地标的估计,降低该地标 的不确定度。根据凸组合融合可知[9] ,对地标估 计进行融合所得到的估计值,会比原来估计要 小。由于只针对地标估计进行融合,其算法的复 杂度也会有所降低。机器人构建的局部的子图组 成了所构建的全局地图,多机器人系统所构建的 地图包括被多个机器人观测到的融合地标与非融 合地标。 3 吸引因子 由于多机器人系统不知道环境中地标的数目 和位置,基于式 (11) 的目标函数在机器人视野范 围内无新增探索面积时,其会采用估计误差协方 差作为主动控制选取的原则,这样会导致机器人 在已经探索过的区域徘徊。因此有必要让多机器 人团队去探索环境,故增加虚拟探索地标,在机 器人所建图的边界上,当机器人扩展环境时虚拟 地标会建立,并移除旧的虚拟探索地标,当虚拟 探索地标集合为空时证明环境已经遍历完毕。 trace (Pr) ε ε 吸引因子是用于指引机器人进行控制策略选 择的一个向量,当其出现时机器人会去选择朝着 吸引因子的方向进行运动规划。其发挥作用从出 现到消失为 3 步,满足一定条件后会重新出现。 当机器人在 t 步内无新增探索面积时,吸引因子 会出现,其朝向为最近的虚拟探索地标,去引导 多机器人团队进行环境探索,如图 3 所示,当机器 人自身的位置估计协方差的迹 大于一定 阈值 时 , 阈值根据实验设定,吸引因子会出 现,其朝向为定位最精确的地标,修正自身位姿 估计。 吸引因子的作用有两个,一是提升机器人自 身的定位精度修正自身位姿估计,二是引导机器 人探索环境。吸引因子促进了多机器人团队进行 交流与通信。在完全未知的环境下,吸引因子的 必要性是保证多机器人团队能够遍历完整个环 境,不加吸引因子的主动 SLAM 算法,会出现局 部环境遍历不完全的情况。 地标位置估计: 机器人: 地标: 机器人位置估计: 吸引因子: 图 3 用于位姿修正的吸引因子 Fig. 3 Attractors for pose correction 如图 4 所示,吸引因子的应用范围是位姿修 正与探索环境,虚线代表满足一定的条件所采 取的控制策略。在机器人位置估计偏差较大 时,会触发吸引因子,此时不采用贪婪算法,而 吸引因子会去引导机器人修正其位姿,而不会 进行环境探索。当机器人在 t 步内无新增扩展 面积时,则会触发吸引因子,引导多机器人团队 去探索环境。 机器人 当前状态 吸引 因子 贪婪 算法 探索 环境 修正 位姿 通信网络 预测 观测 状态 更新 最优控制 图 4 多机器人主动 SLAM 算法流程 Fig. 4 Multi-robot active SLAM algorithm 4 仿真分析 为验证多机器人主动 SLAM 算法有效性,设 计仿真进行验证。机器人运动模型如下[18] : x ′ y ′ θ ′ = x y θ + − v ω sinθ+ v ω sin(θ+ω∆t) v ω cos θ− v ω cos(θ+ω∆t) ω∆t (14) x r = [x y θ] T θ U = {(v,ω)|v = 10 m/s,ω ∈ {0,±π/6,±π/12}(°)/s} ∆t= 0.5 机器人的状态向量为 ,其中 x、y 为机 器人在环境内的位置, 为其方位角。离散控制 入 。采 样周期 ,无论机器人选择哪个控制量,其一 ·374· 智 能 系 统 学 报 第 16 卷
第2期 王贺彬,等:面向观测融合和吸引因子的多机器人主动SLAM ·375· 步可以移动的最大距离为d=10m/s×0.5s=5m。 其中图5、图7、图9为建图的中间过程对比, 目标为静态地标,在(0,200],[0,200])环境中 从图6和图8中可以看出这两种方式的主动 随机分布200个地标,传感器观测模型包含机器 SLAM可以遍历大部分的环境,但是不能遍历完 人与目标y距离和角度,观测模型如下: 全部环境。 zis=h(xiny:)+v 200 V0-x)2+y-y2 (15) 180 h(x,y)= arctan((y;-y)/(y;-x))-0 160 机器人所携带的传感器能探测的最大范围 140 为25m,机器人可视角度为中=π/3,具有前向视 野(-/2<a(x,y)</2),超过最大范围和视野的地 80 标,仅对其进行预测而不更新,设定吸引因子的 6 触发条件8=10,t=3。 % 考虑拥有5台机器人的多机器人团队,初始 020406080100120140160180200 位置为随机分布于环境中,系统噪声观测噪声设 x/m 置为 图6 基于EKF融合的多机器主动SLAM建图167步 0=diag0.3,0.3,0.03]) Fig.6 167 steps of multi-robot active SLAM based on EKF R=diag(0.015,0.015]) fusion 为探究本文算法有效性,本文分别对比单机 200 器人主动SLAM、随机SLAM、无吸引因子的多机 180 器人主动SLAM、基于EKF融合的多机器人主动 160 140 SLAM和带吸引因子的多机器人主动SLAM,这 120 5种方式的SLAM算法以验证本文算法有效性。 图5、6为基于EKF融合的多机器人主动 SLAM,图7、8为无吸引因子的多机器人主动 60 SLAM,图9、10带吸引因子的多机器人主动 0 含 SLAM。其中,绿色三角代表机器人,红色椭圆代 020406080100120140160180200 表机器人的位置协方差,青色圆圈代表真实的地 x/m 标位置,蓝色点和椭圆分别代表估计的地标位置 图7无吸引因子的多机器人主动SLAM建图80步 与协方差,红色虚线代表机器人可视范围,洋红 Fig.7 80 steps of multi-robot active SLAM without at- tractor 色的五角星代表吸引因子,黄色方块代表虚拟探 200 索地标。深红色的点和椭圆代表融合估计的地标 180 位置和协方差,初始的地标不确定度为:tr(Pm)/m= 160 2000. 140 120 200 100 180 140 120 100 020406080100120140160180200 80 x/m 60 图8无吸引因子的多机器人主动SLAM建图167步 Fig.8 167 steps of multi-robot active SLAM without at- 20 tractors 020406080100120140160180200 x/m 对于无吸引因子的主动SLAM来说,即使目 图5基于EKF融合的多机器主动SLAM建图80步 标函数式(11)中含有对新增面积的权重,仍然难 Fig.5 80 steps of multi-robot active SLAM based on EKF 以对环境进行完全覆盖。因为多机器人团队,在 fusion 建图过程中,当机器人在已经建图的环境中走动
步可以移动的最大距离为 d = 10 m/s×0.5 s = 5 m。 ([0,200],[0,200]) yt 目标为静态地标,在 环境中 随机分布 200 个地标,传感器观测模型包含机器 人与目标 距离和角度,观测模型如下: zi,t = h ( xi,t , yt ) +vt h ( x, yt ) = √ (y x t − x) 2 +(y y t −y) 2 arctan((y y t −y)/(y x t − x))−θ (15) ϕ = π/3 −ϕ/2 < α(x, y) < ϕ/2 ε = 10 t = 3 机器人所携带的传感器能探测的最大范围 为 25 m,机器人可视角度为 ,具有前向视 野 ( ),超过最大范围和视野的地 标,仅对其进行预测而不更新,设定吸引因子的 触发条件 , 。 考虑拥有 5 台机器人的多机器人团队,初始 位置为随机分布于环境中,系统噪声观测噪声设 置为 Q = diag([0.3,0.3,0.03]) R = diag([0.015,0.015]) 为探究本文算法有效性,本文分别对比单机 器人主动 SLAM、随机 SLAM、无吸引因子的多机 器人主动 SLAM、基于 EKF 融合的多机器人主动 SLAM 和带吸引因子的多机器人主动 SLAM,这 5 种方式的 SLAM 算法以验证本文算法有效性。 tr(Plm)/m = 2 000 图 5、6 为基于 EKF 融合的多机器人主动 SLAM,图 7、8 为无吸引因子的多机器人主动 SLAM,图 9、 10 带吸引因子的多机器人主动 SLAM。其中,绿色三角代表机器人,红色椭圆代 表机器人的位置协方差,青色圆圈代表真实的地 标位置,蓝色点和椭圆分别代表估计的地标位置 与协方差,红色虚线代表机器人可视范围,洋红 色的五角星代表吸引因子,黄色方块代表虚拟探 索地标。深红色的点和椭圆代表融合估计的地标 位置和协方差,初始的地标不确定度为: 。 200 180 160 140 120 100 80 60 40 20 0 20 40 60 80 100 120 140 160 180 200 y/m x/m 图 5 基于 EKF 融合的多机器主动 SLAM 建图 80 步 Fig. 5 80 steps of multi-robot active SLAM based on EKF fusion 其中图 5、图 7、图 9 为建图的中间过程对比, 从 图 6 和 图 8 中可以看出这两种方式的主 动 SLAM 可以遍历大部分的环境,但是不能遍历完 全部环境。 200 180 160 140 120 100 80 60 40 20 0 20 40 60 80 100 120 140 160 180 200 y/m x/m 图 6 基于 EKF 融合的多机器主动 SLAM 建图 167 步 Fig. 6 167 steps of multi-robot active SLAM based on EKF fusion 200 180 160 140 120 100 80 60 40 20 0 20 40 60 80 100 120 140 160 180 200 y/m x/m 图 7 无吸引因子的多机器人主动 SLAM 建图 80 步 Fig. 7 80 steps of multi-robot active SLAM without attractor 200 180 160 140 120 100 80 60 40 20 0 20 40 60 80 100 120 140 160 180 200 y/m x/m 图 8 无吸引因子的多机器人主动 SLAM 建图 167 步 Fig. 8 167 steps of multi-robot active SLAM without attractors 对于无吸引因子的主动 SLAM 来说,即使目 标函数式 (11) 中含有对新增面积的权重,仍然难 以对环境进行完全覆盖。因为多机器人团队,在 建图过程中,当机器人在已经建图的环境中走动 第 2 期 王贺彬,等:面向观测融合和吸引因子的多机器人主动 SLAM ·375·
·376· 智能系统学报 第16卷 的时候,无新增覆盖面积。因此目标函数式(11) 表15种SLAM方法对比 退化成了式(6),这样会导致机器人在已经建图区 Table 1 Comparison of five SLAM methods 域徘徊,不能遍历整个环境。 SLAM方法 环境覆盖率% 平均地标估计 200 单机器人 48.51 5.06 180 随机SLAM 73.31 9.34 160 140 EKF融合 80.86 3.95 120 无吸引因子 83.11 3.24 100 80 本文改进方法 100.00 1.50 60 从表1中可以看出,本文改进方法即带吸引 40 因子的多机器人主动SLAM不仅可以覆盖全部 020406080100120140160180200 环境而且平均地标估计均低于其他方法。通过与 x/m 单机器人的对比可以看出多机器人系统的优越 图9带吸引因子的多机器主动SLAM建图80步 性,多机器人团队可以同时不同地作业,协作完 Fig.9 80 steps of multi-robot active SLAM with attractors 成任务。通过与无吸引因子的方法对比,说明吸 200 引因子的有效性,带吸引因子的多机器人团队, 180 可以在机器人位置估计大于一定阈值下,通过吸 160 140 引因子,让机器人先去定位精度较高的地标,修 120 正自己的位姿,然后去扩展环境,自身定位精度 100 提升有利于提升估计地标的精度。无吸引因子的 80 主动SLAM方法和本文改进方法的平均地标估 60 计均低于基于EKF融合的方法,说明凸组合融合 40 可以很好地降低地标估计的不确定度。综上所 20 020406080100120140160180200 诉,本文改进方法可以很好地遍历完环境,而且 x/m 对地标的估计精度有所提升。 图10带吸引因子的多机器主动SLAM建图完成 Fig.10 Multi-robot active SLAM with attractors com- 5结束语 pleted 如图11所示,为带吸引因子的多机器主动 本文研究基于EKF-SLAM的多机器人主动 SLAM仿真中凸组合融合前后地标估计误差协方 SLAM问题,将主动SLAM问题转化为最优控制 差迹的对比,其中共有184个地标是融合地标,纵 选择问题,通过引入吸引因子,既提升了机器人 坐标为该地标融合前后估计误差协方差的迹的大 自身定位建图准确性,又引导多机器人团队机器 小,可以看出凸组合融合可以有效地提升地标估 人探索环境。对于多个机器人观测到的同一地 计的精度,降低估计的不确定度。 标,采用凸组合融合,降低该地标的不确定度。 并通过仿真验证算法有效性,实现多机器人主动 40 凸组合融合前 凸组合融合后 SLAM,其鲁棒性、定位建图精度都大大提升。但 0 是本文算法依赖于多机器人之间通信良好,对多 25 机器人在通信受限的情况下的主动SLAM研究 还需要进一步完善。 15 参考文献: - 0 [1]张恒,樊晓平.移动机器人同步定位与地图构建过程中 地标标号 的轨迹规划研究).机器人,2006,28(3):285-290 图11凸组合融合前后地标估计误差协方差迹的对比 ZHANG Heng,FAN Xiaoping.Mobile robot trajectory Fig.11 Comparison of landmark estimation error covari- planning in simultaneous localization and mapping prob- ance trace before and after convex combination 1em].Robot,.2006,28(3:285-290 表1所示为当仿真步数为167步时5种SLAM [2]HASHEMIFAR Z S,ADHIVARAHAN C,BALAKRISH- 方法平均地标估计与环境覆盖率的对比。 NAN A,et al.Augmenting visual SLAM with Wi-Fi sens-
的时候,无新增覆盖面积。因此目标函数式 (11) 退化成了式 (6),这样会导致机器人在已经建图区 域徘徊,不能遍历整个环境。 200 180 160 140 120 100 80 60 40 20 0 20 40 60 80 100 120 140 160 180 200 y/m x/m 图 9 带吸引因子的多机器主动 SLAM 建图 80 步 Fig. 9 80 steps of multi-robot active SLAM with attractors 200 180 160 140 120 100 80 60 40 20 0 20 40 60 80 100 120 140 160 180 200 y/m x/m 图 10 带吸引因子的多机器主动 SLAM 建图完成 Fig. 10 Multi-robot active SLAM with attractors completed 如图 11 所示,为带吸引因子的多机器主动 SLAM 仿真中凸组合融合前后地标估计误差协方 差迹的对比,其中共有 184 个地标是融合地标,纵 坐标为该地标融合前后估计误差协方差的迹的大 小,可以看出凸组合融合可以有效地提升地标估 计的精度,降低估计的不确定度。 40 35 30 25 20 15 10 5 0 地标估计误差协方差的迹 地标标号 凸组合融合前 凸组合融合后 图 11 凸组合融合前后地标估计误差协方差迹的对比 Fig. 11 Comparison of landmark estimation error covariance trace before and after convex combination 表 1 所示为当仿真步数为 167 步时 5 种 SLAM 方法平均地标估计与环境覆盖率的对比。 表 1 5 种 SLAM 方法对比 Table 1 Comparison of five SLAM methods SLAM方法 环境覆盖率/% 平均地标估计 单机器人 48.51 5.06 随机SLAM 73.31 9.34 EKF融合 80.86 3.95 无吸引因子 83.11 3.24 本文改进方法 100.00 1.50 从表 1 中可以看出,本文改进方法即带吸引 因子的多机器人主动 SLAM 不仅可以覆盖全部 环境而且平均地标估计均低于其他方法。通过与 单机器人的对比可以看出多机器人系统的优越 性,多机器人团队可以同时不同地作业,协作完 成任务。通过与无吸引因子的方法对比,说明吸 引因子的有效性,带吸引因子的多机器人团队, 可以在机器人位置估计大于一定阈值下,通过吸 引因子,让机器人先去定位精度较高的地标,修 正自己的位姿,然后去扩展环境,自身定位精度 提升有利于提升估计地标的精度。无吸引因子的 主动 SLAM 方法和本文改进方法的平均地标估 计均低于基于 EKF 融合的方法,说明凸组合融合 可以很好地降低地标估计的不确定度。综上所 诉,本文改进方法可以很好地遍历完环境,而且 对地标的估计精度有所提升。 5 结束语 本文研究基于 EKF-SLAM 的多机器人主动 SLAM 问题,将主动 SLAM 问题转化为最优控制 选择问题,通过引入吸引因子,既提升了机器人 自身定位建图准确性,又引导多机器人团队机器 人探索环境。对于多个机器人观测到的同一地 标,采用凸组合融合,降低该地标的不确定度。 并通过仿真验证算法有效性,实现多机器人主动 SLAM,其鲁棒性、定位建图精度都大大提升。但 是本文算法依赖于多机器人之间通信良好,对多 机器人在通信受限的情况下的主动 SLAM 研究 还需要进一步完善。 参考文献: 张恒, 樊晓平. 移动机器人同步定位与地图构建过程中 的轨迹规划研究 [J]. 机器人, 2006, 28(3): 285–290. ZHANG Heng, FAN Xiaoping. Mobile robot trajectory planning in simultaneous localization and mapping problem[J]. Robot, 2006, 28(3): 285–290. [1] HASHEMIFAR Z S, ADHIVARAHAN C, BALAKRISHNAN A, et al. Augmenting visual SLAM with Wi-Fi sens- [2] ·376· 智 能 系 统 学 报 第 16 卷
第2期 王贺彬,等:面向观测融合和吸引因子的多机器人主动SLAM ·377· ing for indoor applications[J].Autonomous robots,2019. [13]ATANASOV N,LE NY J,DANIILIDIS K,et al.Decent- 43(8):2245-2260. ralized active information acquisition:theory and applica- [3]张毅,陈起,罗元.室内环境下移动机器人三维视觉 tion to multi-robot SLAM[Cl//Proceedings of 2015 IEEE SLAM[J.智能系统学报,2015,10(4):615-619. International Conference on Robotics and Automation. ZHANG Yi,CHEN Qi,LUO Yuan.Three dimensional Seattle,USA,2015:4775-4782 visual SLAM for mobile robots in indoor environments[J]. [14]刘杨.基于激光传感器的移动机器人主动SLAM[D].. CAAI transactions on intelligent systems,2015,10(4): 天津:南开大学,2009:24-29. 615-619. LIU Yang.Mobile robot based on laser sensor active [4]权美香,朴松吴,李国.视觉SLAM综述).智能系统学 SLAM[D].Tianjin:Nankai University,2009:24-29. 报,2016,11(6:768-776. [15]ZHU Hongyan,CHEN Shuo,HAN Chongzhao.Fusion of QUAN Meixiang,PIAO Songhao,LI Guo.An overview of Gaussian mixture models for possible mismatches of visual SLAM[J].CAAI transactions on intelligent systems, sensor model[J].Information fusion,2014,20:203-212. 2016,11(6):768-776. [16]THRUN S,BURGARD W.FOX D.Probabilistic robot- [S]沈永福,王希彬.基于边界的无人机主动SLAM算法. ics[M].Cambridge,MA:MIT Press,2005. 海军航空工程学院学报,2014,29(5):461-464. [17]MASINJILA R,PAYEUR P.Consistent multirobot local- SHEN Yongfu,WANG Xibin.UAV active SLAM al- ization using heuristically tuned extended Kalman gorithm based on boundary[J.Journal of naval aeronautic- filter[Cl//Proceedings of 2017 IEEE International Sym- al and astronautical university,2014,29(5):461-464. posium on Robotics and Intelligent Sensors.Ottawa, [6]DONG Siyan,XU Kai,ZHOU Qiang,et al.Multi-robot Canada.2017:297-303. collaborative dense scene reconstruction[J].ACM transac- [18]季秀才,郑志强,张辉.SLAM问题中机器人定位误差 tions on graphics,2019,38(4):84. 分析与控制[U.自动化学报,2008,34(3323-330. [7]陶通,黄亚楼,苑晶,等.基于协助校正方法的多机器人 JI Xiucai,ZHENG Zhiqiang,ZHANG Hui.Analysis and 主动同时定位与建图).模式识别与人工智能,2012, control of robot position error in SLAM[J].Acta automat- 25(3):534543. ica sinica,2008,34(3):323-330. TAO Tong,HUANG Yalou,YUAN Jing,et al.Multi-ro- [19]ATANASOV N,LE NY J,DANIILIDIS K,et al.Inform- bot active simultaneous localization and mapping based on ation acquisition with sensing robots:algorithms and er- cooperative correction approach[J].Pattern recognition and ror bounds[C]//Proceedings of 2014 IEEE International artificial intelligence,2012,25(3):534-543. Conference on Robotics and Automation.Hong Kong [8]张国良,汤文俊,曾静,等.考虑通信状况的多机器人 China,2014:6447-6454. CSLAM问题综述[J].自动化学报,2014,40(10) 作者简介: 2073-2088 王贺彬,硕士研究生,主要研究方 ZHANG Guoliang,TANG Wenjun,ZENG Jing,et al.An 向为多智能体控制、非线性非高斯状 overview on the cooperative SLAM problem of multi-ro- 态估计。 bot systems considering communication conditions[J]. Acta automatica sinica,2014,40(10):2073-2088. [9]FEDER HJS,LEONARD J J,SMITH C M.Adaptive mo- bile robot navigation and mapping[J].The International journal of robotics research,1999,18(7):650-668 [10]WILLIAMS S B.Efficient solutions to autonomous map- 葛泉波,研究员,博士生导师,主 ping and navigation problems[D].Sydney,Australia:Uni- 要研究方向为自适应Kalman滤波、工 versity of Sydney,2001. 程化智能Kalman滤波方法、目标跟踪 [11]苑晶,黄亚楼,陶通,等.基于局部子地图方法的多机器 融合理论和能源互联网大数据分析。 人主动同时定位与地图创建[).机器人,2009,31(2): 发表学术论文80余篇。 97-103. YUAN Jing,HUANG Yalou,TAO Tong,et al.Multi-ro- bot active simultaneous localization and mapping based 刘华平,副教授,博士生导师,主 on local submap approach[J].Robot,2009,31(2):97-103. 要研究方向为机器人感知、学习与控 [12]LEUNG C,HUANG Shoudong,DISSANAYAKE G. 制、多模态信息融合。国家杰出青年 Active SLAM using model predictive control and attract- 基金获得者,发表学术论文340余篇。 or based exploration[C]//Proceedings of 2006 IEEE/RSJ International Conference on Intelligent Robots and Sys- tems.Beijing,China,2006:5026-5031
ing for indoor applications[J]. Autonomous robots, 2019, 43(8): 2245–2260. 张毅, 陈起, 罗元. 室内环境下移动机器人三维视觉 SLAM[J]. 智能系统学报, 2015, 10(4): 615–619. ZHANG Yi, CHEN Qi, LUO Yuan. Three dimensional visual SLAM for mobile robots in indoor environments[J]. CAAI transactions on intelligent systems, 2015, 10(4): 615–619. [3] 权美香, 朴松昊, 李国. 视觉 SLAM 综述 [J]. 智能系统学 报, 2016, 11(6): 768–776. QUAN Meixiang, PIAO Songhao, LI Guo. An overview of visual SLAM[J]. CAAI transactions on intelligent systems, 2016, 11(6): 768–776. [4] 沈永福, 王希彬. 基于边界的无人机主动 SLAM 算法 [J]. 海军航空工程学院学报, 2014, 29(5): 461–464. SHEN Yongfu, WANG Xibin. UAV active SLAM algorithm based on boundary[J]. Journal of naval aeronautical and astronautical university, 2014, 29(5): 461–464. [5] DONG Siyan, XU Kai, ZHOU Qiang, et al. Multi-robot collaborative dense scene reconstruction[J]. ACM transactions on graphics, 2019, 38(4): 84. [6] 陶通, 黄亚楼, 苑晶, 等. 基于协助校正方法的多机器人 主动同时定位与建图 [J]. 模式识别与人工智能, 2012, 25(3): 534–543. TAO Tong, HUANG Yalou, YUAN Jing, et al. Multi-robot active simultaneous localization and mapping based on cooperative correction approach[J]. Pattern recognition and artificial intelligence, 2012, 25(3): 534–543. [7] 张国良, 汤文俊, 曾静, 等. 考虑通信状况的多机器人 CSLAM 问题综述 [J]. 自动化学报, 2014, 40(10): 2073–2088. ZHANG Guoliang, TANG Wenjun, ZENG Jing, et al. An overview on the cooperative SLAM problem of multi-robot systems considering communication conditions[J]. Acta automatica sinica, 2014, 40(10): 2073–2088. [8] FEDER H J S, LEONARD J J, SMITH C M. Adaptive mobile robot navigation and mapping[J]. The International journal of robotics research, 1999, 18(7): 650–668. [9] WILLIAMS S B. Efficient solutions to autonomous mapping and navigation problems[D]. Sydney, Australia: University of Sydney, 2001. [10] 苑晶, 黄亚楼, 陶通, 等. 基于局部子地图方法的多机器 人主动同时定位与地图创建 [J]. 机器人, 2009, 31(2): 97–103. YUAN Jing, HUANG Yalou, TAO Tong, et al. Multi-robot active simultaneous localization and mapping based on local submap approach[J]. Robot, 2009, 31(2): 97–103. [11] LEUNG C, HUANG Shoudong, DISSANAYAKE G. Active SLAM using model predictive control and attractor based exploration[C]//Proceedings of 2006 IEEE/RSJ International Conference on Intelligent Robots and Systems. Beijing, China, 2006: 5026−5031. [12] ATANASOV N, LE NY J, DANIILIDIS K, et al. Decentralized active information acquisition: theory and application to multi-robot SLAM[C]//Proceedings of 2015 IEEE International Conference on Robotics and Automation. Seattle, USA, 2015: 4775−4782. [13] 刘杨. 基于激光传感器的移动机器人主动 SLAM[D]. 天津: 南开大学, 2009: 24−29. LIU Yang. Mobile robot based on laser sensor active SLAM[D]. Tianjin: Nankai University, 2009: 24−29. [14] ZHU Hongyan, CHEN Shuo, HAN Chongzhao. Fusion of Gaussian mixture models for possible mismatches of sensor model[J]. Information fusion, 2014, 20: 203–212. [15] THRUN S, BURGARD W, FOX D. Probabilistic robotics[M]. Cambridge, MA: MIT Press, 2005. [16] MASINJILA R, PAYEUR P. Consistent multirobot localization using heuristically tuned extended Kalman filter[C]//Proceedings of 2017 IEEE International Symposium on Robotics and Intelligent Sensors. Ottawa, Canada, 2017: 297−303. [17] 季秀才, 郑志强, 张辉. SLAM 问题中机器人定位误差 分析与控制 [J]. 自动化学报, 2008, 34(3): 323–330. JI Xiucai, ZHENG Zhiqiang, ZHANG Hui. Analysis and control of robot position error in SLAM[J]. Acta automatica sinica, 2008, 34(3): 323–330. [18] ATANASOV N, LE NY J, DANIILIDIS K, et al. Information acquisition with sensing robots: algorithms and error bounds[C]//Proceedings of 2014 IEEE International Conference on Robotics and Automation. Hong Kong, China, 2014: 6447−6454. [19] 作者简介: 王贺彬,硕士研究生,主要研究方 向为多智能体控制、非线性非高斯状 态估计。 葛泉波,研究员,博士生导师,主 要研究方向为自适应 Kalman 滤波、工 程化智能 Kalman 滤波方法、目标跟踪 融合理论和能源互联网大数据分析。 发表学术论文 80 余篇。 刘华平,副教授,博士生导师,主 要研究方向为机器人感知、学习与控 制、多模态信息融合。国家杰出青年 基金获得者,发表学术论文 340 余篇。 第 2 期 王贺彬,等:面向观测融合和吸引因子的多机器人主动 SLAM ·377·