正在加载图片...
·364. 智能系统学报 第8卷 (4)、(5)和(7)可知,本文设计的控制器在运行时, 扰动,所得到的机器人1号轮子(由于本实验室所 不需要具体的导数信息就能够实现各个权值系数的 用4轮机器人的4个电机参数相同,因此在进行仿 迭代更新,对初始值的选取不敏感,计算效率高,这 真时仅给出了1号轮子的仿真曲线,其他3个轮子 也是该方法与神经网络学习的本质区别同时,该控 与之相似,故作省略)的速度跟踪曲线以及机器人 制器直接以误差的PD控制函数形式作为奖励信 整体的轨迹跟踪结果分别如图6~8所示. 号函数,从而保证了控制系统的稳定性。 .........Ref -----.NVCC FUPD 4仿真实验及结果分析 BELVC 为验证本文所提方法的有效性,进行了机器人 路径跟踪仿真实验,令机器人跟踪x方向的直线路 径.实验过程中,分别采用无速度补偿控制(NVCC)、 0.5 1.01.52.02.53.0 模糊PD速度补偿控制(FUPD)[o以及本文方法 s (BELVC)进行仿真 图61号电机无扰动时的速度跟踪曲线 以实验室的“太极队”中型组足球机器人作为 Fig.6 Velocity tracking curve of the No.I motor with- 研究对象进行仿真实验研究,机器人轮子直流电机 out interference 的具体性能参数设置情况详见文献[13].BEL控制 器的基本参数初始值设定为k,=10、k2=0.5、k3= 15r …Ref 10f ------NVCC 0.011=1300、r2=25000、r3=10. ·----FUPD 4.1学习率对系统的影响 ·Peyn 以 BELVC 当学习率αB取不同的数值情况时(分别为方 -5 案1:a=0.001,B=0.02;方案2:a=0.001,B=0.035; -105 方案3:a=0.005,B=0.015:方案4:=0.0005,B= -15 1.5 2.0 2.5 3.0 0.001),系统的阶跃响应如图5所示. t/s 2.01 -方案1 图71号电机有扰动时的速度跟踪曲线 *…方案2 Fig.7 Velocity tracking curve of the No.I motor with +……方案3 ----方案4 interference …Ref ------NVCC 1.0 -,-·--FUPD -BELVC 0.s 0.5 1.0 1.5 s 图5不同学习率情况下的系统响应 Fig.5 System response in different learning rate situa- 2 3 tions x/m 由图5可知,当BEL控制器的基本参数不变 图8机器人整体的轨迹跟踪曲线 时,权值学习率α、B的选取对控制器响应结果的影 Fig.8 Trajectory tracking curve of the robot 响非常明显.当α的值恒定时,B的值越大,系统响 表1所示为采用不同控制方法时,机器人轨迹 应越快,但是系统的振荡幅度越大,系统达到稳定状 跟踪的最大偏差与平均偏差的对比统计情况, 态的时间越长;当α、B的取值同时减小时,系统的 表1机器人轨迹跟踪偏差比较 振荡幅度也减小,当α、B的取值继续减小时,则系 Table 1 Comparison of trajectory tracking error m 统达到稳定状态需要更长的时间. 控制方法 最大偏差 平均偏差 4.2机器人速度与轨迹跟踪 NVCC 0.71 0.46 实验中,选取第1组学习率参数方案进行控制, FUPD 0.32 0.15 即取=0.001、B=0.02.为了更好地研究BEL控制 BELVC 0.09 0.02 器的优越性,当t=2s时,在给定的输入信号中加入 由图6~8可以看出,在机器人未采用速度交叉(4)、(5)和(7)可知,本文设计的控制器在运行时, 不需要具体的导数信息就能够实现各个权值系数的 迭代更新,对初始值的选取不敏感,计算效率高,这 也是该方法与神经网络学习的本质区别.同时,该控 制器直接以误差的 PID 控制函数形式作为奖励信 号函数,从而保证了控制系统的稳定性. 4 仿真实验及结果分析 为验证本文所提方法的有效性,进行了机器人 路径跟踪仿真实验,令机器人跟踪 x 方向的直线路 径.实验过程中,分别采用无速度补偿控制(NVCC)、 模糊 PD 速度补偿控制( FUPD) [10] 以及本文方法 (BELVC)进行仿真. 以实验室的“太极队” 中型组足球机器人作为 研究对象进行仿真实验研究,机器人轮子直流电机 的具体性能参数设置情况详见文献[13].BEL 控制 器的基本参数初始值设定为 k1 = 10、k2 = 0. 5、k3 = 0.01、r1 = 1 300、r2 = 25 000、r3 = 10. 4.1 学习率对系统的影响 当学习率 α、β 取不同的数值情况时(分别为方 案 1:α= 0.001,β = 0.02;方案 2:α = 0.001,β = 0.035; 方案 3:α = 0.005,β = 0.015;方案 4:α= 0.000 5,β = 0.001),系统的阶跃响应如图 5 所示. 图 5 不同学习率情况下的系统响应 Fig.5 System response in different learning rate situa⁃ tions 由图 5 可知,当 BEL 控制器的基本参数不变 时,权值学习率 α、β 的选取对控制器响应结果的影 响非常明显.当 α 的值恒定时,β 的值越大,系统响 应越快,但是系统的振荡幅度越大,系统达到稳定状 态的时间越长;当 α、β 的取值同时减小时,系统的 振荡幅度也减小,当 α、β 的取值继续减小时,则系 统达到稳定状态需要更长的时间. 4.2 机器人速度与轨迹跟踪 实验中,选取第 1 组学习率参数方案进行控制, 即取 α= 0.001、β = 0.02.为了更好地研究 BEL 控制 器的优越性,当t = 2 s时,在给定的输入信号中加入 扰动,所得到的机器人 1 号轮子(由于本实验室所 用 4 轮机器人的 4 个电机参数相同,因此在进行仿 真时仅给出了 1 号轮子的仿真曲线,其他 3 个轮子 与之相似,故作省略) 的速度跟踪曲线以及机器人 整体的轨迹跟踪结果分别如图 6~8 所示. 图 6 1 号电机无扰动时的速度跟踪曲线 Fig.6 Velocity tracking curve of the No.1 motor with⁃ out interference 图 7 1 号电机有扰动时的速度跟踪曲线 Fig.7 Velocity tracking curve of the No.1 motor with interference 图 8 机器人整体的轨迹跟踪曲线 Fig.8 Trajectory tracking curve of the robot 表 1 所示为采用不同控制方法时,机器人轨迹 跟踪的最大偏差与平均偏差的对比统计情况. 表 1 机器人轨迹跟踪偏差比较 Table 1 Comparison of trajectory tracking error m 控制方法 最大偏差 平均偏差 NVCC 0.71 0.46 FUPD 0.32 0.15 BELVC 0.09 0.02 由图 6 ~ 8 可以看出,在机器人未采用速度交叉 ·364· 智 能 系 统 学 报 第 8 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有