第8卷第4期 智能系统学报 Vol.8 No.4 2013年8月 CAAI Transactions on Intelligent Systems Aug.2013 D0I:10.3969/i.issn.1673-4785.201303030 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20130603.1601.002.html 基于大脑情感学习的四轮驱动机器人速度补偿控制 陈建平1,王建彬2,杨宜民2 (1.肇庆学院计算机学院,广东肇庆526061:2.广东工业大学自动化学院,广东广州510090) 摘要:由于4轮驱动机器人的轮间耦合特性及系统非线性的存在,即使单个驱动电机的控制精度达到最优,机器 人整体的运动控制效果也未必理想针对这一问题,提出一种基于大脑情感学习的机器人速度补偿控制方法基于大 脑情感学习计算模型,设计了融合机器人整体速度跟踪误差及其积分、微分信息的补偿控制器,通过计算模型内部 各节点权值的在线学习,及时地调整控制器的参数,实现对4个轮子速度的自适应补偿.仿真实验表明,该方法有效 减小了非线性干扰对系统的影响,具有较高的稳态控制精度和较快的响应速度,大大提高了机器人整体的速度和轨 迹跟踪精度. 关键词:全向移动机器人:大脑情感学习:速度补偿:轨迹跟踪:运动控制 中图分类号:TP242.6文献标志码:A文章编号:1673-4785(2013)04-0361-06 中文引用格式:陈建平,王建彬,杨宜民.基于大脑情感学习的4轮驱动机器人速度补偿控制[J].智能系统学报,2013,8(4):361 366. 英文引用格式:CHEN Jianping,WANG Jianbin,YANG Yimin.Velocity compensation control for a four-wheel drive robot based on brain emotional learning[J].CAAI Transactions on Intelligent Systems,2013,8(4):361-366. Velocity compensation control for a four-wheel drive robot based on brain emotional learning CHEN Jianping',WANG Jianbin2,YANG Yimin2 (1.School of Computer Science,Zhaoqing University,Zhaoqing 526061,China;2.School of Automation,Guangdong University of Technology,Guangzhou 510090,China) Abstract:Since there are system nonlinearity and couple relationships in four wheels,even each motor has the opti- mal parameters,and the whole robot may not be precisely controlled.A velocity compensation controller based on brain emotional learning was applied to the motion control of a four-wheel drive omni-directional mobile robot (FDOMR)in this paper,which contains differential and integral information of robot speed tracking errors.By means of the parameters adjusted through online learning of weight of every node inside the computing model,adap- tive compensation of four wheels'speed was achieved.The simulation results show that the influence produced by non-linear disturbance is effectively decreased;as a result,the system has higher steady-state control precision and faster response speed,greatly increasing the whole velocity and trajectory control precision of the robot. Keywords:omni-directional mobile robots;brain emotional learning;velocity compensation;trajectory tracking; motion control 全向移动机器人具有全方位移动的功能,可以 大力的推广和发展,但其复杂的轮系分布给机器人 在不改变位姿的情况下向任意方向运动,凭借独特 的控制带来了难度.机器人受到堵转、摩擦、打滑 的运动优势,在国内外中型组机器人大赛中,得到了 及各种扰动因素的影响,导致机器人的运动能力变 差而偏离目标点,控制精度不高].因此,大多数研 收稿日期:2013-03-18.网络出版日期:2013-06-03. 基金项目:广东省自然科学基金资助项目(S2011010004006):广东省 究是从如何改善各个轮的驱动控制环的动态性能出 教育部产学研结合资助项目(2012B091100423):肇庆市科 发,通过各种先进的控制与补偿技术提高对每个轮 技计划资助项目(2010F006):肇庆学院科研启动基金资助 项目(2012KQ01). 驱动电机的控制精度,然而这种方法没有考虑机器 通信作者:陈建平.E-mail:jpchent@zu.ce.cn. 人整体的速度跟踪误差[]」
第 8 卷第 4 期 智 能 系 统 学 报 Vol.8 №.4 2013 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2013 DOI:10.3969 / j.issn.1673⁃4785.201303030 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20130603.1601.002.html 基于大脑情感学习的四轮驱动机器人速度补偿控制 陈建平1 ,王建彬2 ,杨宜民2 (1. 肇庆学院 计算机学院,广东 肇庆 526061; 2. 广东工业大学 自动化学院,广东 广州 510090) 摘 要:由于 4 轮驱动机器人的轮间耦合特性及系统非线性的存在,即使单个驱动电机的控制精度达到最优,机器 人整体的运动控制效果也未必理想.针对这一问题,提出一种基于大脑情感学习的机器人速度补偿控制方法.基于大 脑情感学习计算模型,设计了融合机器人整体速度跟踪误差及其积分、微分信息的补偿控制器,通过计算模型内部 各节点权值的在线学习,及时地调整控制器的参数,实现对 4 个轮子速度的自适应补偿.仿真实验表明,该方法有效 减小了非线性干扰对系统的影响,具有较高的稳态控制精度和较快的响应速度,大大提高了机器人整体的速度和轨 迹跟踪精度. 关键词:全向移动机器人;大脑情感学习;速度补偿;轨迹跟踪;运动控制 中图分类号:TP242.6 文献标志码:A 文章编号:1673⁃4785(2013)04⁃0361⁃06 中文引用格式:陈建平,王建彬,杨宜民. 基于大脑情感学习的 4 轮驱动机器人速度补偿控制[J]. 智能系统学报, 2013, 8(4): 361⁃ 366. 英文引用格式:CHEN Jianping, WANG Jianbin, YANG Yimin. Velocity compensation control for a four⁃wheel drive robot based on brain emotional learning[J]. CAAI Transactions on Intelligent Systems, 2013, 8(4): 361⁃366. Velocity compensation control for a four⁃wheel drive robot based on brain emotional learning CHEN Jianping 1 , WANG Jianbin 2 , YANG Yimin 2 (1. School of Computer Science, Zhaoqing University, Zhaoqing 526061, China; 2. School of Automation, Guangdong University of Technology, Guangzhou 510090, China) Abstract:Since there are system nonlinearity and couple relationships in four wheels, even each motor has the opti⁃ mal parameters, and the whole robot may not be precisely controlled. A velocity compensation controller based on brain emotional learning was applied to the motion control of a four⁃wheel drive omni⁃directional mobile robot (FDOMR) in this paper, which contains differential and integral information of robot speed tracking errors. By means of the parameters adjusted through online learning of weight of every node inside the computing model, adap⁃ tive compensation of four wheels’ speed was achieved. The simulation results show that the influence produced by non⁃linear disturbance is effectively decreased; as a result, the system has higher steady⁃state control precision and faster response speed, greatly increasing the whole velocity and trajectory control precision of the robot. Keywords:omni⁃directional mobile robots; brain emotional learning; velocity compensation; trajectory tracking; motion control 收稿日期:2013⁃03⁃18. 网络出版日期:2013⁃06⁃03. 基金项目:广东省自然科学基金资助项目( S2011010004006);广东省 教育部产学研结合资助项目(2012B091100423);肇庆市科 技计划资助项目(2010F006);肇庆学院科研启动基金资助 项目(2012KQ01). 通信作者:陈建平. E⁃mail: jpchen@ zqu.edu.cn. 全向移动机器人具有全方位移动的功能,可以 在不改变位姿的情况下向任意方向运动,凭借独特 的运动优势,在国内外中型组机器人大赛中,得到了 大力的推广和发展,但其复杂的轮系分布给机器人 的控制带来了难度[1] .机器人受到堵转、摩擦、打滑 及各种扰动因素的影响,导致机器人的运动能力变 差而偏离目标点,控制精度不高[2] .因此,大多数研 究是从如何改善各个轮的驱动控制环的动态性能出 发,通过各种先进的控制与补偿技术提高对每个轮 驱动电机的控制精度,然而这种方法没有考虑机器 人整体的速度跟踪误差[3⁃7] .
·362· 智能系统学报 第8卷 文献[8]依据交叉耦合思想设计了2轮差动机 /-sin(⑧,+0) c0s(8,+0) < 器人的速度补偿控制器,但是难以应用到相对复杂 2 -sin(8,-0) -c0s(⑧2-8) 的全向移动机器人运动控制中.文献[9]为提高机器 (1) sin(⑧,+0) -c0s(82+0) L 人灵巧手基关节的轨迹跟踪精度,提出了包含同步 Va) sin(δ1-0) cos(5-0)L 误差和位置误差反馈项及平滑鲁棒非线性反馈补偿 式中:0为机器人的运动方向;”。为机器人的角速 项的交叉耦合同步控制策略,由于该方法需要复杂 度,逆时针方向为正;1、23,分别为4个车轮的 的计算求解,导致很难满足全向移动机器人运动控 线速度:δ,和δ2为各轮与x轴的夹角;L为车体中心 制的实时性要求.文献[10]基于模糊控制与PD控 到轮子中心的距离, 制理论设计了一种速度补偿控制器,对机器人4个 车轮的线速度和角速度之间的关系如式(2): 轮子的速度进行补偿,由于控制规则要靠经验确定, 参数变化缺乏自适应和自学习能力,控制过程中存 ( 01 在死区,导致机器人在速度较大时控制偏差变大而 0 02 =R· (2) 得不到及时调整,甚至出现失控现象 03 针对上述方法的不足,本文提出了一种基于大 va 04 脑情感学习的4轮驱动机器人速度补偿控制方法」 式中:R为轮子半径;w1、w2、w、w4为轮子角速度, 利用大脑情感学习能力强、计算简单的特点[) 逆时针方向为正 对机器人整体的速度误差设计合理的误差补偿器, 2 四轮驱动机器人的速度补偿控制系统 在不改变机器人内部控制结构的情况下,为机器人 4个轮子提供附加的补偿控制量,进而提高机器人 根据机器人足球比赛的实际需要,设计4轮驱 整体的运动控制精度, 动足球机器人的速度补偿控制系统,其结构框图如 图2所示. 1全方位移动机器人运动学模型 建立4轮全方位移动机器人的轮系分布系统, 电机控 如图1所示].由于所用比赛足球机器人的射门机 制系统1 参 轮 电机控 构的增加,导致4个全向轮不是对称分布,而是前2 速 制系统2 机 e 速度补偿 轮夹角为120°,后2轮夹角为90°. 度 控制器 配 电机控 制系统3 电机控 加速度计 制系统4 和陀螺仪 图2机器人的速度补偿控制系统结构 Fig.2 Structure of velocity compensation controller for 60 45 the robot 459 60 由图2可知,将实际测得的机器人整体的实际 速度与其参考速度进行比较,经过速度补偿控制器 处理后得到4个轮子关于机器人整体速度误差的额 外补偿量.从而在不改变各轮子内环控制结构的前 提下,实现了对机器人整体速度的有效补偿,提高了 系统运动控制的精度, 图1机器人运动学模型 3基于大脑情感学习的速度补偿控制 Fig.I Kinetic model of the robot 3.1大脑情感学习计算模型 根据图1所示,建立机器人运动坐标系,XOY Moren等于20O0年提出了基于神经生理学的 为世界坐标系,xy为以机器人中心为原点的局部 坐标系,得到机器人运动学方程为 大脑情感学习(brain emotional learning,BEL)计算 模型),该模型在不完全模仿杏仁核、眶额皮质等
文献[8]依据交叉耦合思想设计了 2 轮差动机 器人的速度补偿控制器,但是难以应用到相对复杂 的全向移动机器人运动控制中.文献[9]为提高机器 人灵巧手基关节的轨迹跟踪精度,提出了包含同步 误差和位置误差反馈项及平滑鲁棒非线性反馈补偿 项的交叉耦合同步控制策略,由于该方法需要复杂 的计算求解,导致很难满足全向移动机器人运动控 制的实时性要求.文献[10]基于模糊控制与 PD 控 制理论设计了一种速度补偿控制器,对机器人 4 个 轮子的速度进行补偿,由于控制规则要靠经验确定, 参数变化缺乏自适应和自学习能力,控制过程中存 在死区,导致机器人在速度较大时控制偏差变大而 得不到及时调整,甚至出现失控现象. 针对上述方法的不足,本文提出了一种基于大 脑情感学习的 4 轮驱动机器人速度补偿控制方法. 利用大脑情感学习能力强、计算简单的特点[11⁃12] , 对机器人整体的速度误差设计合理的误差补偿器, 在不改变机器人内部控制结构的情况下,为机器人 4 个轮子提供附加的补偿控制量,进而提高机器人 整体的运动控制精度. 1 全方位移动机器人运动学模型 建立 4 轮全方位移动机器人的轮系分布系统, 如图 1 所示[13] .由于所用比赛足球机器人的射门机 构的增加,导致 4 个全向轮不是对称分布,而是前 2 轮夹角为 120°,后 2 轮夹角为 90°. 图 1 机器人运动学模型 Fig.1 Kinetic model of the robot 根据图 1 所示,建立机器人运动坐标系, XOY 为世界坐标系, xoy 为以机器人中心为原点的局部 坐标系,得到机器人运动学方程为 v1 v2 v3 v4 æ è ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ = - sin(δ1 + θ) cos(δ1 + θ) L - sin(δ2 - θ) - cos(δ2 - θ) L sin(δ2 + θ) - cos(δ2 + θ) L sin(δ1 - θ) cos(δ1 - θ) L æ è ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ vx vy vθ æ è ç ç ç ö ø ÷ ÷ ÷ . (1) 式中: θ 为机器人的运动方向;vθ 为机器人的角速 度,逆时针方向为正;v1 、v2 、v3 、v4 分别为 4 个车轮的 线速度;δ1 和 δ2 为各轮与 x 轴的夹角;L 为车体中心 到轮子中心的距离. 车轮的线速度和角速度之间的关系如式(2): v1 v2 v3 v4 æ è ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ = R· ω1 ω2 ω3 ω4 æ è ç ç ç ç ç ö ø ÷ ÷ ÷ ÷ ÷ . (2) 式中:R 为轮子半径;ω1 、ω2 、ω3 、ω4 为轮子角速度, 逆时针方向为正. 2 四轮驱动机器人的速度补偿控制系统 根据机器人足球比赛的实际需要,设计 4 轮驱 动足球机器人的速度补偿控制系统,其结构框图如 图 2 所示. 图 2 机器人的速度补偿控制系统结构 Fig.2 Structure of velocity compensation controller for the robot 由图 2 可知,将实际测得的机器人整体的实际 速度与其参考速度进行比较,经过速度补偿控制器 处理后得到 4 个轮子关于机器人整体速度误差的额 外补偿量.从而在不改变各轮子内环控制结构的前 提下,实现了对机器人整体速度的有效补偿,提高了 系统运动控制的精度. 3 基于大脑情感学习的速度补偿控制 3.1 大脑情感学习计算模型 Moren 等于 2000 年提出了基于神经生理学的 大脑情感学习( brain emotional learning, BEL) 计算 模型[11] ,该模型在不完全模仿杏仁核、眶额皮质等 ·362· 智 能 系 统 学 报 第 8 卷
第4期 陈建平,等:基于大脑情感学习的四轮驱动机器人速度补偿控制 ·363. 生理结构的基础上,将大脑情感学习模型划分为两 输入与输出、控制量以及跟踪误差等因素的函数.因 大组成部分,即分别对应杏仁核和眶额皮质.大脑情 为A-0组织中的可调权值较多,其节点个数通常设 感学习模型的基本工作原理及结构如图3所示 置为多个,因此,感官输入函数通常为向量形式 感官 由于全向移动机器人的角速度可以单独进行规 输人S丘脑 感官 皮质 眶额 划,此处只讨论机器人的线速度补偿控制器.又由于 皮质 机器人在局部坐标系的x和y方向上有相似的运动 特性,因此本文以x方向上的线速度为例设计补偿 奖励信号R 香仁体 输出E 控制器.基于大脑情感学习的速度补偿控制器结构 图3大脑情感学习模型的基本结构 如图4所示. Fig.3 Structure of brain emotional learning model 感官输人 由图3可知,感官输入信号S,的最大值通过丘 函数S, BEL 情感暗示 模型E 受控 脑传递给杏仁体,则有A.=max(S,)· 函数Rw 系统 1)对于每一个刺激信号,杏仁体内均有一个对 BEL控制器 应节点A:来接收,该刺激信号包括感官输入信号 S,、奖励信号Rx以及丘脑信号A,则杏仁体的输出 为 图4基于大脑情感学习的速度补偿控制器 Fig.4 Velocity compensation controller based on brain A:=V:·S,Am+1=Vm+1·Ah,i=0,1,…,m emotional learning (3) 设x方向机器人的线速度误差为e,为了便于 式中:m为刺激信号的数目,V为各节点的权值,其 与文献[10]中的方法进行比较,选取感官输入函数 调节律为: 为PD控制器的形式,则有感官输入函数为 △y:=a[S4·max(0,Rw-】 A,)门,(4) s=e小地6 △Vn+1=a[Ah·max(0,Rw-】 41.(5 以刺激学习的奖励信号R为目标函数的情感 式中:α为学习率,它影响杏仁体的学习速度:△V 暗示函数为 的单调性与S,的符号保持一致. de Rpw =re raedt +rsdi 2)对于刺激信号,眶额皮质内也有节点接收, 则有BEL模型的输出为 它的刺激信号为感官皮质信号(即感官输入信号) 和来自杏仁体的信号,而对丘脑的信号不产生刺激 u=E= W·S,= 它的输出为 0,=W·S (6) kre+kedt+ks d de 式中:W,为各节点的权值,它的调节律为 式中:k、k2、k、k4、T1、r2、T3分别为权重调节系 AW:=B[S,·(E'-Rw)] (7) 数,1、2r3为对象误差减小的期望.k~ka的调节 式中:B为学习率,且B>0,E为不含丘脑信号刺激 律为: 下的杏仁体的输出,可表示为 S, △k:=S,[a·max(0,Rew-V· (8) i=1 i=1 由式(3)~(8)可以看出,△W,可取正值也可取 S B(V. -W·S,-Rw)],i=1,2,3: 负值,即眶额皮质能抑制或增强杏仁体的学习过程, A 通过消除奖励信号Rw与杏仁体输出E'之间的差 ,=aAm(0.R-A)], 值,使杏仁体向着期望值学习. 32基于大脑情感学习的速度补偿控制器 式中:S,表示S,中的各个向量元素。 BEL模型与实际系统相结合,必须事先确定感 通常,神经网络学习需要利用系统的导数信息, 官输入信号S,和奖励信号R的函数形式,分别称 按照梯度下降的思想进行权值的更新迭代,易受到 之为感官输入函数和情感暗示函数,它们为系统的 初始取值的影响,计算效率低:而由权值调节式
生理结构的基础上,将大脑情感学习模型划分为两 大组成部分,即分别对应杏仁核和眶额皮质.大脑情 感学习模型的基本工作原理及结构如图 3 所示. 图 3 大脑情感学习模型的基本结构 Fig.3 Structure of brain emotional learning model 由图 3 可知,感官输入信号 SI 的最大值通过丘 脑传递给杏仁体,则有 Ath =max(SI). 1)对于每一个刺激信号,杏仁体内均有一个对 应节点 Ai 来接收,该刺激信号包括感官输入信号 SI、奖励信号 REW以及丘脑信号 Ath ,则杏仁体的输出 为 Ai = Vi·SI i ,Am+1 = Vm+1·Ath , i = 0,1,…,m. (3) 式中:m 为刺激信号的数目,Vi 为各节点的权值,其 调节律为: ΔVi = α [SI i ·max(0,REW - ∑ m+1 i = 1 Ai)], (4) ΔVm+1 = α [Ath·max(0,REW - ∑ m+1 i = 1 Ai)]. (5) 式中:α 为学习率,它影响杏仁体的学习速度;ΔVi 的单调性与 SI i 的符号保持一致. 2)对于刺激信号,眶额皮质内也有节点接收, 它的刺激信号为感官皮质信号(即感官输入信号) 和来自杏仁体的信号,而对丘脑的信号不产生刺激. 它的输出为 Oi = Wi·SI i . (6) 式中:Wi 为各节点的权值,它的调节律为 ΔWi = β [SI i ·(E′ - REW )]. (7) 式中:β 为学习率,且 β>0,E′为不含丘脑信号刺激 下的杏仁体的输出,可表示为 E′ = ∑ m i = 1 Ai - ∑ m i = 1 Oi . (8) 由式(3) ~ (8)可以看出,ΔWi 可取正值也可取 负值,即眶额皮质能抑制或增强杏仁体的学习过程, 通过消除奖励信号 REW与杏仁体输出 E′之间的差 值,使杏仁体向着期望值学习. 3.2 基于大脑情感学习的速度补偿控制器 BEL 模型与实际系统相结合,必须事先确定感 官输入信号 SI 和奖励信号 REW的函数形式,分别称 之为感官输入函数和情感暗示函数,它们为系统的 输入与输出、控制量以及跟踪误差等因素的函数.因 为 A⁃O 组织中的可调权值较多,其节点个数通常设 置为多个,因此,感官输入函数通常为向量形式. 由于全向移动机器人的角速度可以单独进行规 划,此处只讨论机器人的线速度补偿控制器.又由于 机器人在局部坐标系的 x 和 y 方向上有相似的运动 特性,因此本文以 x 方向上的线速度为例设计补偿 控制器.基于大脑情感学习的速度补偿控制器结构 如图 4 所示. 图 4 基于大脑情感学习的速度补偿控制器 Fig.4 Velocity compensation controller based on brain emotional learning 设 x 方向机器人的线速度误差为 e,为了便于 与文献[10]中的方法进行比较,选取感官输入函数 为 PID 控制器的形式,则有感官输入函数为 SI = (k1 e k2 ∫edt k3 de dt ) T . 以刺激学习的奖励信号 REW为目标函数的情感 暗示函数为 REW = r1 e + r2 ∫edt + r3 de dt . 则有 BEL 模型的输出为 u = E = V· SI Ath é ë ê ê ù û ú ú - W·SI = k1 e + k2 ∫edt + k3 de dt + k4Ath . 式中: k1 、 k2 、 k3 、 k4 、 r1 、 r2 、 r3 分别为权重调节系 数, r1 、r2 、r3 为对象误差减小的期望. k1 ~ k4 的调节 律为: Δki = SI i [α·max (0,REW - V· SI Ath é ë ê ê ù û ú ú ) - β(V· SI Ath é ë ê ê ù û ú ú - W·SI - REW )], i = 1,2,3; Δk4 = α[Ath·max(0,REW - ∑ m+1 i = 1 Ai)]. 式中:SI i 表示 SI 中的各个向量元素. 通常,神经网络学习需要利用系统的导数信息, 按照梯度下降的思想进行权值的更新迭代,易受到 初始取值的影响, 计算效率低; 而由权值调节式 第 4 期 陈建平,等:基于大脑情感学习的四轮驱动机器人速度补偿控制 ·363·
·364. 智能系统学报 第8卷 (4)、(5)和(7)可知,本文设计的控制器在运行时, 扰动,所得到的机器人1号轮子(由于本实验室所 不需要具体的导数信息就能够实现各个权值系数的 用4轮机器人的4个电机参数相同,因此在进行仿 迭代更新,对初始值的选取不敏感,计算效率高,这 真时仅给出了1号轮子的仿真曲线,其他3个轮子 也是该方法与神经网络学习的本质区别同时,该控 与之相似,故作省略)的速度跟踪曲线以及机器人 制器直接以误差的PD控制函数形式作为奖励信 整体的轨迹跟踪结果分别如图6~8所示. 号函数,从而保证了控制系统的稳定性。 .........Ref -----.NVCC FUPD 4仿真实验及结果分析 BELVC 为验证本文所提方法的有效性,进行了机器人 路径跟踪仿真实验,令机器人跟踪x方向的直线路 径.实验过程中,分别采用无速度补偿控制(NVCC)、 0.5 1.01.52.02.53.0 模糊PD速度补偿控制(FUPD)[o以及本文方法 s (BELVC)进行仿真 图61号电机无扰动时的速度跟踪曲线 以实验室的“太极队”中型组足球机器人作为 Fig.6 Velocity tracking curve of the No.I motor with- 研究对象进行仿真实验研究,机器人轮子直流电机 out interference 的具体性能参数设置情况详见文献[13].BEL控制 器的基本参数初始值设定为k,=10、k2=0.5、k3= 15r …Ref 10f ------NVCC 0.011=1300、r2=25000、r3=10. ·----FUPD 4.1学习率对系统的影响 ·Peyn 以 BELVC 当学习率αB取不同的数值情况时(分别为方 -5 案1:a=0.001,B=0.02;方案2:a=0.001,B=0.035; -105 方案3:a=0.005,B=0.015:方案4:=0.0005,B= -15 1.5 2.0 2.5 3.0 0.001),系统的阶跃响应如图5所示. t/s 2.01 -方案1 图71号电机有扰动时的速度跟踪曲线 *…方案2 Fig.7 Velocity tracking curve of the No.I motor with +……方案3 ----方案4 interference …Ref ------NVCC 1.0 -,-·--FUPD -BELVC 0.s 0.5 1.0 1.5 s 图5不同学习率情况下的系统响应 Fig.5 System response in different learning rate situa- 2 3 tions x/m 由图5可知,当BEL控制器的基本参数不变 图8机器人整体的轨迹跟踪曲线 时,权值学习率α、B的选取对控制器响应结果的影 Fig.8 Trajectory tracking curve of the robot 响非常明显.当α的值恒定时,B的值越大,系统响 表1所示为采用不同控制方法时,机器人轨迹 应越快,但是系统的振荡幅度越大,系统达到稳定状 跟踪的最大偏差与平均偏差的对比统计情况, 态的时间越长;当α、B的取值同时减小时,系统的 表1机器人轨迹跟踪偏差比较 振荡幅度也减小,当α、B的取值继续减小时,则系 Table 1 Comparison of trajectory tracking error m 统达到稳定状态需要更长的时间. 控制方法 最大偏差 平均偏差 4.2机器人速度与轨迹跟踪 NVCC 0.71 0.46 实验中,选取第1组学习率参数方案进行控制, FUPD 0.32 0.15 即取=0.001、B=0.02.为了更好地研究BEL控制 BELVC 0.09 0.02 器的优越性,当t=2s时,在给定的输入信号中加入 由图6~8可以看出,在机器人未采用速度交叉
(4)、(5)和(7)可知,本文设计的控制器在运行时, 不需要具体的导数信息就能够实现各个权值系数的 迭代更新,对初始值的选取不敏感,计算效率高,这 也是该方法与神经网络学习的本质区别.同时,该控 制器直接以误差的 PID 控制函数形式作为奖励信 号函数,从而保证了控制系统的稳定性. 4 仿真实验及结果分析 为验证本文所提方法的有效性,进行了机器人 路径跟踪仿真实验,令机器人跟踪 x 方向的直线路 径.实验过程中,分别采用无速度补偿控制(NVCC)、 模糊 PD 速度补偿控制( FUPD) [10] 以及本文方法 (BELVC)进行仿真. 以实验室的“太极队” 中型组足球机器人作为 研究对象进行仿真实验研究,机器人轮子直流电机 的具体性能参数设置情况详见文献[13].BEL 控制 器的基本参数初始值设定为 k1 = 10、k2 = 0. 5、k3 = 0.01、r1 = 1 300、r2 = 25 000、r3 = 10. 4.1 学习率对系统的影响 当学习率 α、β 取不同的数值情况时(分别为方 案 1:α= 0.001,β = 0.02;方案 2:α = 0.001,β = 0.035; 方案 3:α = 0.005,β = 0.015;方案 4:α= 0.000 5,β = 0.001),系统的阶跃响应如图 5 所示. 图 5 不同学习率情况下的系统响应 Fig.5 System response in different learning rate situa⁃ tions 由图 5 可知,当 BEL 控制器的基本参数不变 时,权值学习率 α、β 的选取对控制器响应结果的影 响非常明显.当 α 的值恒定时,β 的值越大,系统响 应越快,但是系统的振荡幅度越大,系统达到稳定状 态的时间越长;当 α、β 的取值同时减小时,系统的 振荡幅度也减小,当 α、β 的取值继续减小时,则系 统达到稳定状态需要更长的时间. 4.2 机器人速度与轨迹跟踪 实验中,选取第 1 组学习率参数方案进行控制, 即取 α= 0.001、β = 0.02.为了更好地研究 BEL 控制 器的优越性,当t = 2 s时,在给定的输入信号中加入 扰动,所得到的机器人 1 号轮子(由于本实验室所 用 4 轮机器人的 4 个电机参数相同,因此在进行仿 真时仅给出了 1 号轮子的仿真曲线,其他 3 个轮子 与之相似,故作省略) 的速度跟踪曲线以及机器人 整体的轨迹跟踪结果分别如图 6~8 所示. 图 6 1 号电机无扰动时的速度跟踪曲线 Fig.6 Velocity tracking curve of the No.1 motor with⁃ out interference 图 7 1 号电机有扰动时的速度跟踪曲线 Fig.7 Velocity tracking curve of the No.1 motor with interference 图 8 机器人整体的轨迹跟踪曲线 Fig.8 Trajectory tracking curve of the robot 表 1 所示为采用不同控制方法时,机器人轨迹 跟踪的最大偏差与平均偏差的对比统计情况. 表 1 机器人轨迹跟踪偏差比较 Table 1 Comparison of trajectory tracking error m 控制方法 最大偏差 平均偏差 NVCC 0.71 0.46 FUPD 0.32 0.15 BELVC 0.09 0.02 由图 6 ~ 8 可以看出,在机器人未采用速度交叉 ·364· 智 能 系 统 学 报 第 8 卷
第4期 陈建平,等:基于大脑情感学习的四轮驱动机器人速度补偿控制 ·365. 耦合补偿时,由于场地材料不同、4个轮子装配上存 参考文献: 在误差、轮子与场地之间摩擦力不一致、4个驱动电 机存在机械差异等原因,使得机器人在加速过程中 [1]EFENDI M S,MOHAMED R,SAZALI Y.Designing omni- 4个轮子的加速程度不一致,同时也使得4个轮子 directional mobile robot with mecanum wheel[]].American Journal of Applied Sciences,2006,3(5):1831-1835. 的转速与其期望值之间存在较大偏差,机器人很难 [2]BAHAA I K,ALI HH,MUSTAFA MM.Modified vector 跟踪预先期望的运行轨迹:当采用模糊PD控制方 field histogram with a neural network learning model for mo- 法时,由于模糊规则建立的主观性,参数变化缺乏自 bile robot path planning and obstacle avoidance[J].Interna- 适应和自学习能力,控制过程中容易出现控制死区 tional Jouranl of Advancements in Computing Technology, 2010,2(5):166-173. 的现象,导致机器人在速度较大时控制偏差变大而 [3]ALI HH,FATIMA B I.Path lanning of mobile robot based 得不到及时调整,机器人4个轮子的转速出现较大 on modification of vector field histogram using neuro-fuzzy 幅度的波动,跟踪轨迹的精度变差,并且当机器人的 algorithm[J].International Journal of Advancements in 速度越大时,轨迹跟踪的偏差也越大,甚至会出现失 Computing Technology,2010,2(3):129-138. 控的现象:当采用本文所设计的方法BELVC进行控 [4]MARYAM R,MOHAMMAD H K.MOHAMMAD A N,et al.Designing the fuzzy controller in mobile robot navigation 制时,4个轮子速度跟踪的波动明显减小,从而使得 with the presence of unknown obstacles[J].International 机器人的运行轨迹更加接近期望轨迹, Journal of Intelligent Information Processing,2012,3(1): 由图7可知,当系统出现外界扰动的情况下, 45-62. BEL控制器的反应比模糊PD控制器的反应更快, [5]ALBERTO V,CARL T,BENGT L,et al.Modeling and op- 输出响应曲线更平滑,系统更稳定,减小了外界扰动 timization of energy consumption in cooperative multi-robot systems[J].IEEE Transactions on Automation Science and 对系统的影响,从而使控制系统呈现出良好的鲁棒 Engineering,2012,9(2):423-428. 性同时,由表1可知,在进行轨迹跟踪时,采用本文 [6]ELEFTHERIA SS,GEORGE SS,ANASTASIOS D P.Op- 设计方法BELVC的情况下,机器人轨迹跟踪的最大 timal robot speed trajectory by minimization of the actuator 偏差和平均偏差均小于其他2种方法.由此,进一步 motor electromechanical losses[J].Journal of Intelligent and Robotic Systems,2002,33:187-207. 验证了本文设计方法BELVC确实提高了机器人轨 [7]熊蓉,张翻,褚健,等.四轮全方位移动机器人的建模 迹跟踪的精度 和最优控制[J].控制理论与应用,2006,23(1):96-98. 5结束语 XIONG Rong,ZHANG He,CHU Jian,et al.Modeling and optimal control of omni-directional mobile robots[J].Con- 由于全向移动机器人复杂的机械结构,其4个 trol Theory and Applications,2006,23(1):96-98 [8]曹洋,徐心和.一种基于交叉耦合的速度控制器[J]东 轮子之间存在着耦合关系,即使单个电机的控制参 北大学学报,2003,24(5):420-423. 数达到最优,整个机器人的控制效果也未必理想同 CAO Yang,XU Xinhe.Cross-coupling speed controller[J]. 时,由于4个驱动电机的参数不一致、负载的扰动 Journal of Northeastern University,2003,24(5):420-423. 各个轮子安装时的机械差异等种种因素的影响,不 「9]兰天,刘伊威,陈养彬,等.机器人灵巧手基关节交叉 耦合同步控制[J].机器人,2010,32(2):150-156. 可避免地将会导致机器人在运动过程中,其实际位 LAN Tian,LIU Yiwei,CHEN Yangbin,et al.Synchronized 姿和期望位姿之间存在偏差.引入本文的基于大脑 cross-coupled control for base joint of dexterous robot hand 情感学习的4轮驱动机器人速度补偿控制器以后, [J].Robot.2010,32(2):150-156. 将机器人整体的速度误差转换为4个轮子转速的额 「101匡建辉,杨宜民.基于模糊PD控制的四轮驱动全向移 外补偿量,在不改变机器人内环电机转速控制结构 动机器人速度补偿控制器研究[J].计算技术与自动 化,2011,30(1):21-25. 的情况下,通过大脑情感学习模型内部各节点权值 KUANG Jianhui,YANG Yimin.Velocity compensate con- 的在线学习,及时地调整4个轮子的转速,有效地减 troller of four-wheel drive omni-directional mobile robots 小了机器人整体的速度误差,进一步提高了其轨迹 based on fuzzy-PD control method[]]Computing Technol- 跟踪的精度,从而改善了机器人的运动性能.然而, ogy and Automation,2011,30(1)21-25. [11]LUCAS C,SHAHMIRZADI D,SHEIKHOLESLAMI N. 本文中BEL控制器各相关参数的选取主要是在仿 Introducing BELBIC:brain emotional learning based intel- 真环境下采用试凑法获得的,有关算法的收敛性以 ligent controller[J].Intemational Journal of Intelligent 及学习率取值的定量分析等问题将在今后工作中做 Automation and Soft Computing,2004,10(1):11-22. 进一步研究 [12]MEHRABIAN A R,LUCAS C.Emotional learning based intelligent robust adaptive controller for stable uncertain nonlinear systems[J].International Journal of Computa-
耦合补偿时,由于场地材料不同、4 个轮子装配上存 在误差、轮子与场地之间摩擦力不一致、4 个驱动电 机存在机械差异等原因,使得机器人在加速过程中 4 个轮子的加速程度不一致,同时也使得 4 个轮子 的转速与其期望值之间存在较大偏差,机器人很难 跟踪预先期望的运行轨迹;当采用模糊 PD 控制方 法时,由于模糊规则建立的主观性,参数变化缺乏自 适应和自学习能力,控制过程中容易出现控制死区 的现象,导致机器人在速度较大时控制偏差变大而 得不到及时调整,机器人 4 个轮子的转速出现较大 幅度的波动,跟踪轨迹的精度变差,并且当机器人的 速度越大时,轨迹跟踪的偏差也越大,甚至会出现失 控的现象;当采用本文所设计的方法 BELVC 进行控 制时,4 个轮子速度跟踪的波动明显减小,从而使得 机器人的运行轨迹更加接近期望轨迹. 由图 7 可知,当系统出现外界扰动的情况下, BEL 控制器的反应比模糊 PD 控制器的反应更快, 输出响应曲线更平滑,系统更稳定,减小了外界扰动 对系统的影响,从而使控制系统呈现出良好的鲁棒 性.同时,由表 1 可知,在进行轨迹跟踪时,采用本文 设计方法 BELVC 的情况下,机器人轨迹跟踪的最大 偏差和平均偏差均小于其他 2 种方法.由此,进一步 验证了本文设计方法 BELVC 确实提高了机器人轨 迹跟踪的精度. 5 结束语 由于全向移动机器人复杂的机械结构,其 4 个 轮子之间存在着耦合关系,即使单个电机的控制参 数达到最优,整个机器人的控制效果也未必理想.同 时,由于 4 个驱动电机的参数不一致、负载的扰动、 各个轮子安装时的机械差异等种种因素的影响,不 可避免地将会导致机器人在运动过程中,其实际位 姿和期望位姿之间存在偏差.引入本文的基于大脑 情感学习的 4 轮驱动机器人速度补偿控制器以后, 将机器人整体的速度误差转换为 4 个轮子转速的额 外补偿量,在不改变机器人内环电机转速控制结构 的情况下,通过大脑情感学习模型内部各节点权值 的在线学习,及时地调整 4 个轮子的转速,有效地减 小了机器人整体的速度误差,进一步提高了其轨迹 跟踪的精度,从而改善了机器人的运动性能.然而, 本文中 BEL 控制器各相关参数的选取主要是在仿 真环境下采用试凑法获得的,有关算法的收敛性以 及学习率取值的定量分析等问题将在今后工作中做 进一步研究. 参考文献: [1]EFENDI M S, MOHAMED R, SAZALI Y. Designing omni⁃ directional mobile robot with mecanum wheel[ J]. American Journal of Applied Sciences, 2006, 3(5): 1831⁃1835. [2]BAHAA I K, ALI H H, MUSTAFA M M. Modified vector field histogram with a neural network learning model for mo⁃ bile robot path planning and obstacle avoidance[J]. Interna⁃ tional Jouranl of Advancements in Computing Technology, 2010, 2(5): 166⁃173. [3]ALI H H, FATIMA B I. Path lanning of mobile robot based on modification of vector field histogram using neuro⁃fuzzy algorithm [ J ]. International Journal of Advancements in Computing Technology, 2010, 2(3): 129⁃138. [4]MARYAM R, MOHAMMAD H K, MOHAMMAD A N, et al. Designing the fuzzy controller in mobile robot navigation with the presence of unknown obstacles [ J]. International Journal of Intelligent Information Processing, 2012, 3(1): 45⁃62. [5]ALBERTO V, CARL T, BENGT L, et al. Modeling and op⁃ timization of energy consumption in cooperative multi⁃robot systems[J]. IEEE Transactions on Automation Science and Engineering, 2012, 9(2): 423⁃428. [6]ELEFTHERIA S S, GEORGE S S, ANASTASIOS D P. Op⁃ timal robot speed trajectory by minimization of the actuator motor electromechanical losses [ J ]. Journal of Intelligent and Robotic Systems, 2002, 33: 187⁃207. [7]熊蓉, 张翮, 褚健, 等. 四轮全方位移动机器人的建模 和最优控制[J].控制理论与应用, 2006, 23(1): 96⁃98. XIONG Rong, ZHANG He, CHU Jian, et al. Modeling and optimal control of omni⁃directional mobile robots[ J]. Con⁃ trol Theory and Applications, 2006, 23(1): 96⁃98. [8]曹洋, 徐心和. 一种基于交叉耦合的速度控制器[ J].东 北大学学报, 2003, 24(5): 420⁃423. CAO Yang, XU Xinhe. Cross⁃coupling speed controller[J]. Journal of Northeastern University, 2003, 24(5): 420⁃423. [9]兰天, 刘伊威, 陈养彬, 等. 机器人灵巧手基关节交叉 耦合同步控制[J]. 机器人, 2010, 32(2): 150⁃156. LAN Tian, LIU Yiwei, CHEN Yangbin, et al. Synchronized cross⁃coupled control for base joint of dexterous robot hand [J]. Robot, 2010, 32(2): 150⁃156. [10]匡建辉, 杨宜民. 基于模糊 PD 控制的四轮驱动全向移 动机器人速度补偿控制器研究[ J]. 计算技术与自动 化, 2011, 30(1): 21⁃25. KUANG Jianhui, YANG Yimin. Velocity compensate con⁃ troller of four⁃wheel drive omni⁃directional mobile robots based on fuzzy⁃PD control method[J]. Computing Technol⁃ ogy and Automation, 2011, 30(1): 21⁃25. [11] LUCAS C, SHAHMIRZADI D, SHEIKHOLESLAMI N. Introducing BELBIC: brain emotional learning based intel⁃ ligent controller [ J]. International Journal of Intelligent Automation and Soft Computing, 2004, 10(1): 11⁃22. [12] MEHRABIAN A R, LUCAS C. Emotional learning based intelligent robust adaptive controller for stable uncertain nonlinear systems [ J]. International Journal of Computa⁃ 第 4 期 陈建平,等:基于大脑情感学习的四轮驱动机器人速度补偿控制 ·365·
·366. 智能系统学报 第8卷 tional Intelligence,2005,2(4):1304-4508. 王建彬,男,1982年生,博士研究 [13]CHEN J P,WANG J B,YANG Y M.A motion control 生,主要研究方向为智能机器人与智能 method of four-wheel drive omni-directional mobile robots 控制,发表学术论文8篇 based on multi points preview control[J].Journal of Theo- retical and Applied Information Technology,2012.45 (1):278-284. 作者简介: 陈建平,男,1975年生,副教授,博 杨宜民,男,1945年生,教授,博士 士,主要研究方向为人工智能与智能机 生导师,主要研究方向为智能机器人、 器人,获国家实用新型专利1项,发表 自动控制、机器视觉等,发表学术论文 学术论文20余篇,出版著作1部. 100余篇,出版著作6部 第6届图像和信号处理,生物医学工程和信息国际会议 The 2013 6th International Congress on Image and Signal Processing CISP 2013)and the 2013 6th International Conference on BioMedical Engineering and Informatics BMEI 2013) The 2013 6th International Congress on Image and Signal Processing (CISP 2013)and the 2013 6th International Confer- ence on BioMedical Engineering and Informatics (BMEI 2013)will be jointly held in Hangzhou,China.CISP-BMEI 2013 is a premier international forum for scientists and researchers to present the state-of-the-art of multimedia,signal process- ing,biomedical engineering and informatics and to discuss future research challenges.Co-locating two conferences we aim to promote collaboration among multiple areas,especially the interactions of engineering,computing,and medicine. CISP'13-BMEI 13 is technically co-sponsored by the IEEE Engineering in Medicine and Biology Society. As with past CISP-BMEI conferences,all papers in conference proceedings will be submitted to both EI Compendex and ISTP,as well as IEEE Xplore IEEE Conference Record Number for CISP13:32698;IEEE Conference Record Number for BMEI13:32697;All CISP 2008-2012 and BMEI 2008-2011 papers have already been indexed by EI Compendex and included in IEEE Xplore.BMEI 2012 papers have been included in IEEE Xplore and submitted to EI Compendex).Sub- stantially extended versions of best papers will be considered for publication in a CISP-BMEI special issue of a SCI-in- dexed journal. An old Chinese saying goes,"There is heaven above,Suzhou and Hangzhou below."(Suzhou is about 100 kilometers north of Hangzhou).Famous for its scenic splendor,Hangzhou attracts more than 20 million tourists from home and abroad every year.West Lake is completely man-made in the imperial garden style."Impressions of the West Lake"is an evening spectacle of light and dance staged outdoors at West Lake,created by award-winning director Zhang Yimou and musician Kitaro.Peak Flown in from Afar and Lingyin Temple are well-known for Buddhist carvings.Hangzhou is among the six ol- dest cities in China and is the southern end of the Beijing-Hangzhou Grand Canal,the longest canal ever built in the world.Boating on the old Canal is one of the best ways to get a panoramic view of river towns,with ancient dwellings,tra- ditional stone bridges,and historical relics.Explore Chinese culture at the museums of tea,silk and Chinese medicine. Prospective authors are invited to submit manuscripts written in English.All submissions will be peer-reviewed by experts in the field based on originality,significance,quality and clarity.Authors should use the Latex style files or MS-Word templates provided by the conference site to format their papers.Authors should submit PDF files of their manuscripts via the online submission system.Submissions imply that the papers have not been submitted elsewhere and will not be submit- ted elsewhere for publications before the review decisions of this conference
tional Intelligence, 2005, 2(4): 1304⁃4508. [13] CHEN J P, WANG J B, YANG Y M. A motion control method of four⁃wheel drive omni⁃directional mobile robots based on multi points preview control[J]. Journal of Theo⁃ retical and Applied Information Technology, 2012, 45 (1): 278⁃284. 作者简介: 陈建平,男,1975 年生,副教授,博 士,主要研究方向为人工智能与智能机 器人,获国家实用新型专利 1 项,发表 学术论文 20 余篇,出版著作 1 部. 王建彬,男,1982 年生,博士研究 生,主要研究方向为智能机器人与智能 控制,发表学术论文 8 篇. 杨宜民,男,1945 年生,教授,博士 生导师,主要研究方向为智能机器人、 自动控制、机器视觉等,发表学术论文 100 余篇,出版著作 6 部. 第 6 届图像和信号处理,生物医学工程和信息国际会议 The 2013 6th International Congress on Image and Signal Processing (CISP 2013) and the 2013 6th International Conference on BioMedical Engineering and Informatics (BMEI 2013) The 2013 6th International Congress on Image and Signal Processing (CISP 2013) and the 2013 6th International Confer⁃ ence on BioMedical Engineering and Informatics (BMEI 2013) will be jointly held in Hangzhou, China. CISP⁃BMEI 2013 is a premier international forum for scientists and researchers to present the state⁃of⁃the⁃art of multimedia, signal process⁃ ing, biomedical engineering and informatics and to discuss future research challenges. Co⁃locating two conferences we aim to promote collaboration among multiple areas, especially the interactions of engineering, computing, and medicine. CISP’13⁃BMEI'13 is technically co⁃sponsored by the IEEE Engineering in Medicine and Biology Society. As with past CISP⁃BMEI conferences, all papers in conference proceedings will be submitted to both EI Compendex and ISTP, as well as IEEE Xplore (IEEE Conference Record Number for CISP'13: 32698;IEEE Conference Record Number for BMEI'13: 32697; All CISP 2008⁃2012 and BMEI 2008⁃2011 papers have already been indexed by EI Compendex and included in IEEE Xplore. BMEI 2012 papers have been included in IEEE Xplore and submitted to EI Compendex). Sub⁃ stantially extended versions of best papers will be considered for publication in a CISP⁃BMEI special issue of a SCI⁃in⁃ dexed journal. An old Chinese saying goes, " There is heaven above, Suzhou and Hangzhou below." ( Suzhou is about 100 kilometers north of Hangzhou). Famous for its scenic splendor, Hangzhou attracts more than 20 million tourists from home and abroad every year. West Lake is completely man⁃made in the imperial garden style. " Impressions of the West Lake" is an evening spectacle of light and dance staged outdoors at West Lake, created by award⁃winning director Zhang Yimou and musician Kitaro. Peak Flown in from Afar and Lingyin Temple are well⁃known for Buddhist carvings. Hangzhou is among the six ol⁃ dest cities in China and is the southern end of the Beijing⁃Hangzhou Grand Canal, the longest canal ever built in the world. Boating on the old Canal is one of the best ways to get a panoramic view of river towns, with ancient dwellings, tra⁃ ditional stone bridges, and historical relics. Explore Chinese culture at the museums of tea, silk and Chinese medicine. Prospective authors are invited to submit manuscripts written in English. All submissions will be peer⁃reviewed by experts in the field based on originality, significance, quality and clarity. Authors should use the Latex style files or MS⁃Word templates provided by the conference site to format their papers. Authors should submit PDF files of their manuscripts via the online submission system. Submissions imply that the papers have not been submitted elsewhere and will not be submit⁃ ted elsewhere for publications before the review decisions of this conference. ·366· 智 能 系 统 学 报 第 8 卷