工程科学学报 Chinese Journal of Engineering 基于深度循环神经网络的协作机器人动力学误差补偿 徐征张弓汪火明侯至丞杨文林梁济民王建顾星 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng,ZHANG Gong.WANG Huo-ming.HOU Zhi-cheng,YANG Wen-lin,LIANG Ji-min.WANG Jian.GU Xing 引用本文: 徐征,张弓,汪火明,侯至丞,杨文林,梁济民,王建,顾星.基于深度循环神经网络的协作机器人动力学误差补偿工程科 学学报,2021,43(7):995-1002.doi:10.13374.issn2095-9389.2020.04.30.003 XU Zheng.ZHANG Gong,WANG Huo-ming.HOU Zhi-cheng.YANG Wen-lin,LIANG Ji-min,WANG Jian,GU Xing.Error compensation of collaborative robot dynamics based on deep recurrent neural network [J].Chinese Journal of Engineering,2021, 43(7):995-1002.doi:10.13374.issn2095-9389.2020.04.30.003 在线阅读View online:https::/oi.org10.13374.issn2095-9389.2020.04.30.003 您可能感兴趣的其他文章 Articles you may be interested in 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报.2019,41(8):1085 https:/1doi.org/10.13374.issn2095-9389.2019.08.014 机器人负载的动力学参数辨识 Identification methods for robot payload dynamical parameters 工程科学学报.2017,3912:1907htps:1doi.org10.13374.issn2095-9389.2017.12.018 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019,41(10):1229 https:/1doi.org/10.13374.issn2095-9389.2019.03.27.002 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报.2019,41(3:401 https:/1doi.org10.13374j.issn2095-9389.2019.03.014 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报.2020,42(10:1372 https:/oi.org/10.13374.issn2095-9389.2019.10.10.005 BP神经网络F钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报.2017,394:511 https::/1doi.org10.13374.issn2095-9389.2017.04.005
基于深度循环神经网络的协作机器人动力学误差补偿 徐征 张弓 汪火明 侯至丞 杨文林 梁济民 王建 顾星 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng, ZHANG Gong, WANG Huo-ming, HOU Zhi-cheng, YANG Wen-lin, LIANG Ji-min, WANG Jian, GU Xing 引用本文: 徐征, 张弓, 汪火明, 侯至丞, 杨文林, 梁济民, 王建, 顾星. 基于深度循环神经网络的协作机器人动力学误差补偿[J]. 工程科 学学报, 2021, 43(7): 995-1002. doi: 10.13374/j.issn2095-9389.2020.04.30.003 XU Zheng, ZHANG Gong, WANG Huo-ming, HOU Zhi-cheng, YANG Wen-lin, LIANG Ji-min, WANG Jian, GU Xing. Error compensation of collaborative robot dynamics based on deep recurrent neural network [J]. Chinese Journal of Engineering, 2021, 43(7): 995-1002. doi: 10.13374/j.issn2095-9389.2020.04.30.003 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003 您可能感兴趣的其他文章 Articles you may be interested in 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报. 2019, 41(8): 1085 https://doi.org/10.13374/j.issn2095-9389.2019.08.014 机器人负载的动力学参数辨识 Identification methods for robot payload dynamical parameters 工程科学学报. 2017, 39(12): 1907 https://doi.org/10.13374/j.issn2095-9389.2017.12.018 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 基于机器学习的北京市PM2.5浓度预测模型及模拟分析 Machine-learning-based model and simulation analysis of PM2.5 concentration prediction in Beijing 工程科学学报. 2019, 41(3): 401 https://doi.org/10.13374/j.issn2095-9389.2019.03.014 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报. 2020, 42(10): 1372 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.005 BP神经网络IF钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报. 2017, 39(4): 511 https://doi.org/10.13374/j.issn2095-9389.2017.04.005
工程科学学报.第43卷,第7期:995-1002.2021年7月 Chinese Journal of Engineering,Vol.43,No.7:995-1002,July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003;http://cje.ustb.edu.cn 基于深度循环神经网络的协作机器人动力学误差补偿 徐 征,张弓)区,汪火明2,侯至丞,杨文林,梁济民”, 王 建),顾 星) 1)广州中国科学院先进技术研究所机器人与智能装备中心,广州5114582)中国地质大学机械与电子信息学院,武汉430074 区通信作者,E-mail:gong2hang@gat.ac.cn 摘要由于协作机器人的结构比普通工业机器人更为轻巧.一般动力学模型所忽略的复杂特性占比较大,导致协作机器人 的计算预测力矩误差较大.据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上,采用深度循环神经网络中的长 短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿.在实验中采用优化后的基于傅里叶级数的激励 轨迹驱动机器人运动,以电机电流估算关节力矩,获取的原始数据用来训练长短期记忆模型(LSTM补偿网络.网络的训练 结果和评价指标为预测力矩相比实际力矩的均方根误差,计算与实验结果表明,补偿后的协作机器人动力学模型对实际力 矩具有更好的预测效果,各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了61.8%至78.9%不等,表明 了文中所提出补偿方法的有效性 关键词协作机器人:动力学模型:模型误差补偿:循环神经网络:长短期记忆模型 分类号TP242.2 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng,ZHANG Gong,WANG Huo-ming2),HOU Zhi-cheng,YANG Wen-lin,LIANG Ji-min,WANG Jian,GU XingY 1)Intelligent Robot Equipment Center,Guangzhou Institute of Advanced Technology,Chinese Academy of Science,Guangzhou 511458,China 2)School of Mechanical Engineering and Electronic Information,China University of Geosciences,Wuhan 430074,China Corresponding author,E-mail:gong.zhang @giat.ac.cn ABSTRACT Establishing the dynamics model of robot and its parameters is significant for simulation analysis,control algorithm verification,and implementation of human-machine interaction.Especially under various working conditions,the errors of the calcu- lated predicted torque of each axis have the most direct negative effect.The general robot dynamics model rarely takes the minor and complex characteristics into consideration,such as the reducer flexibility,inertia force of motor rotors,and friction.However,as the structure of collaborative robots is lighter and smaller than the ordinary industrial robots,the characteristics neglected by general dynamics models account for a relatively large amount.The above facts result in a large error in the calculation and prediction of collaborative robots analysis.To address the short comings of general robot dynamics model,a network based on long short-term memory (LSTM)in deep recurrent neural network was proposed.The network compensates the general dynamics model of a self- developed six-degree-of-freedom collaborative robot based on the consideration of gravity,Coriolis force,inertial force,and friction force.In the experiment,the nondisassembly experimental measurement combined with least-squares method was used to identify the parameters.The motor current was used to evaluate the joint torque instead of mounting an expensive and inconvenient torque sensor 收稿日期:2020-04-30 基金项目:国家重点研发计划资助项目(2018YFA0902903):国家自然科学基金资助项目(62073092):广东省自然科学基金资助项目 (2021A1515012638):广州市基础研究计划资助项目(202002030320)
基于深度循环神经网络的协作机器人动力学误差补偿 徐 征1),张 弓1) 苣,汪火明1,2),侯至丞1),杨文林1),梁济民1), 王 建1),顾 星1) 1) 广州中国科学院先进技术研究所机器人与智能装备中心,广州 511458 2) 中国地质大学机械与电子信息学院,武汉 430074 苣通信作者,E-mail: gong.zhang@giat.ac.cn 摘 要 由于协作机器人的结构比普通工业机器人更为轻巧,一般动力学模型所忽略的复杂特性占比较大,导致协作机器人 的计算预测力矩误差较大. 据此提出在考虑重力、科里奥利力、惯性力和摩擦力等的基础上,采用深度循环神经网络中的长 短期记忆模型对自主研发的六自由度协作机器人动力学模型进行误差补偿. 在实验中采用优化后的基于傅里叶级数的激励 轨迹驱动机器人运动,以电机电流估算关节力矩,获取的原始数据用来训练长短期记忆模型 (LSTM) 补偿网络. 网络的训练 结果和评价指标为预测力矩相比实际力矩的均方根误差. 计算与实验结果表明,补偿后的协作机器人动力学模型对实际力 矩具有更好的预测效果,各轴预测力矩与实际力矩的均方根误差相比于未补偿的传统模型降低了 61.8% 至 78.9% 不等,表明 了文中所提出补偿方法的有效性. 关键词 协作机器人;动力学模型;模型误差补偿;循环神经网络;长短期记忆模型 分类号 TP242.2 Error compensation of collaborative robot dynamics based on deep recurrent neural network XU Zheng1) ,ZHANG Gong1) 苣 ,WANG Huo-ming1,2) ,HOU Zhi-cheng1) ,YANG Wen-lin1) ,LIANG Ji-min1) ,WANG Jian1) ,GU Xing1) 1) Intelligent Robot & Equipment Center, Guangzhou Institute of Advanced Technology, Chinese Academy of Science, Guangzhou 511458, China 2) School of Mechanical Engineering and Electronic Information, China University of Geosciences, Wuhan 430074, China 苣 Corresponding author, E-mail: gong.zhang@giat.ac.cn ABSTRACT Establishing the dynamics model of robot and its parameters is significant for simulation analysis, control algorithm verification, and implementation of human–machine interaction. Especially under various working conditions, the errors of the calculated predicted torque of each axis have the most direct negative effect. The general robot dynamics model rarely takes the minor and complex characteristics into consideration, such as the reducer flexibility, inertia force of motor rotors, and friction. However, as the structure of collaborative robots is lighter and smaller than the ordinary industrial robots, the characteristics neglected by general dynamics models account for a relatively large amount. The above facts result in a large error in the calculation and prediction of collaborative robots analysis. To address the short comings of general robot dynamics model, a network based on long short-term memory (LSTM) in deep recurrent neural network was proposed. The network compensates the general dynamics model of a selfdeveloped six-degree-of-freedom collaborative robot based on the consideration of gravity, Coriolis force, inertial force, and friction force. In the experiment, the nondisassembly experimental measurement combined with least-squares method was used to identify the parameters. The motor current was used to evaluate the joint torque instead of mounting an expensive and inconvenient torque sensor. 收稿日期: 2020−04−30 基金项目: 国家重点研发计划资助项目( 2018YFA0902903);国家自然科学基金资助项目( 62073092);广东省自然科学基金资助项目 (2021A1515012638);广州市基础研究计划资助项目(202002030320) 工程科学学报,第 43 卷,第 7 期:995−1002,2021 年 7 月 Chinese Journal of Engineering, Vol. 43, No. 7: 995−1002, July 2021 https://doi.org/10.13374/j.issn2095-9389.2020.04.30.003; http://cje.ustb.edu.cn
996 工程科学学报,第43卷,第7期 The excitation trajectory based on the Fourier series was optimized.The raw experimental data were used to train the proposed LSTM network.About the accuracy of the dynamic model and the compensation method for the collaborative robot,the root-mean-square error of the calculated torque relative to the actual measured torque was used to train the network and evaluate the proposed method.The analysis and the results of the experiment show that the compensated collaborative robot dynamics model based on LSTM network displays a good prediction on the actual torque,and the root-mean-square error between predicted and actual torques is reduced from 61.8%to 78.9%compared to the traditional model,the effectiveness of the proposed error compensation policy is verified. KEY WORDS collaborative robot;dynamics model;error compensation;recurrent neural network;long short-term memory 准确的机器人动力学模型是搭建仿真模型, 且安装不便的力矩传感器,以完成补偿方法的实 验证先进控制算法和对控制系统进行深度分析的 验验证 基础-)随着对机器人动态性能要求的提高和协 1 协作机器人动力学模型 作机器人概念的兴起,常规无模型控制方法,如 PID算法不仅轨迹跟踪精度较低,抗干扰能力较 本研究基于自主研发的六自由度协作机器 差,尤其无法实现碰撞检测、柔顺控制等人机交互 人,图1和图2分别为其三维模型图和Denavit- 功能 Hartenberg(D-H)模型图,从图中可以看到轴2、3、 对于多轴串联机器人进行动力学建模一般会 4的相互平行,逆运动学存在封闭解.考虑重力、 考虑重力、科里奥利力、惯性力和摩擦力等主要 科里奥利力、惯性离心力和摩擦力,采用欧拉-拉 因素,但是对于较复杂的特性,例如减速机柔性、 格朗日法计算关节力矩,得到机器人刚体动力学 连杆弹性、摩擦力随工况的变化、电机转子惯性 方程: 力等,较少建立其数学模型4,从而导致计算力矩 T=M(q)q+H(g,q)+G(q)+T (1) 与实际力矩误差较大,阻碍了协作机器人碰撞检 测、拖动示教和柔顺控制的良好实现.有学者对 Axis-6 Axis-4- 此进行了研究,文献[6-8]各自建立了摩擦特性模 型并提出了针对性的补偿方法,也有采用机器学 习方法的,如利用反向传播(Back propagation,BP) Axis-5 神经网络和径向基函数(Radial basis function, RBF)网络进行拟合或补偿0-川,有些也提出了对 应的控制方法,但鲜有研究对各种复杂特性综 Axis-3 合起来考虑的 对于参数辨识技术,有解体测量计算方法3-、 解体实验测量法s6、不解体实验测量方法?1图 Axis- 和理论辨识9等方法.解体方法无法或难以计算 -Axis-2 机器人关节特性2,理论辨识法得到的惯性张量 矩阵在任意形位上不一定是正定的,实际中也不 图1协作机器人三维模型图 Fig.1 3D model of the collaborative robot 可能存在,其控制也不稳定 为此,本文提出利用深度循环神经网络对协 作机器人动力学模型进行误差补偿,首先建立动 力学方程,然后采用不解体实验测量方法结合最 小二乘法对其中参数进行辨识.接着,针对协作机 器人的未建模特性或建模不精确的问题,采用深 度循环神经网络进行补偿,以减小动力学模型误 差并提高力矩预测精度.最后在实验中,以电机电 流等效作为关节力矩信号,把电机电流和电机常 数的乘积作为输出轴力矩,同时结合摩擦力模型 图2协作机器人D-H模型图 计算得到机器人关节的输出力矩,代替价格高昂 Fig.2 D-H structure of the collaborative robot
The excitation trajectory based on the Fourier series was optimized. The raw experimental data were used to train the proposed LSTM network. About the accuracy of the dynamic model and the compensation method for the collaborative robot, the root-mean-square error of the calculated torque relative to the actual measured torque was used to train the network and evaluate the proposed method. The analysis and the results of the experiment show that the compensated collaborative robot dynamics model based on LSTM network displays a good prediction on the actual torque, and the root-mean-square error between predicted and actual torques is reduced from 61.8% to 78.9% compared to the traditional model, the effectiveness of the proposed error compensation policy is verified. KEY WORDS collaborative robot;dynamics model;error compensation;recurrent neural network;long short-term memory 准确的机器人动力学模型是搭建仿真模型, 验证先进控制算法和对控制系统进行深度分析的 基础[1–2] . 随着对机器人动态性能要求的提高和协 作机器人概念的兴起,常规无模型控制方法,如 PID 算法不仅轨迹跟踪精度较低,抗干扰能力较 差,尤其无法实现碰撞检测、柔顺控制等人机交互 功能[3] . 对于多轴串联机器人进行动力学建模一般会 考虑重力、科里奥利力、惯性力和摩擦力等主要 因素,但是对于较复杂的特性,例如减速机柔性、 连杆弹性、摩擦力随工况的变化、电机转子惯性 力等,较少建立其数学模型[4–5] ,从而导致计算力矩 与实际力矩误差较大,阻碍了协作机器人碰撞检 测、拖动示教和柔顺控制的良好实现. 有学者对 此进行了研究,文献 [6–8] 各自建立了摩擦特性模 型并提出了针对性的补偿方法,也有采用机器学 习方法的,如利用反向传播(Back propagation,BP) 神经网络 [9] 和径向基函数 ( Radial basis function, RBF)网络进行拟合或补偿[10–11] ,有些也提出了对 应的控制方法[12] ,但鲜有研究对各种复杂特性综 合起来考虑的. 对于参数辨识技术,有解体测量计算方法[13–14]、 解体实验测量法[15– 16]、不解体实验测量方法[17– 18] 和理论辨识[19] 等方法. 解体方法无法或难以计算 机器人关节特性[20] ,理论辨识法得到的惯性张量 矩阵在任意形位上不一定是正定的,实际中也不 可能存在,其控制也不稳定[21] . 为此,本文提出利用深度循环神经网络对协 作机器人动力学模型进行误差补偿,首先建立动 力学方程,然后采用不解体实验测量方法结合最 小二乘法对其中参数进行辨识. 接着,针对协作机 器人的未建模特性或建模不精确的问题,采用深 度循环神经网络进行补偿,以减小动力学模型误 差并提高力矩预测精度. 最后在实验中,以电机电 流等效作为关节力矩信号,把电机电流和电机常 数的乘积作为输出轴力矩,同时结合摩擦力模型 计算得到机器人关节的输出力矩,代替价格高昂 且安装不便的力矩传感器,以完成补偿方法的实 验验证. 1 协作机器人动力学模型 本研究基于自主研发的六自由度协作机器 人 ,图 1 和图 2 分别为其三维模型图和 DenavitHartenberg(D-H)模型图,从图中可以看到轴 2、3、 4 的相互平行,逆运动学存在封闭解. 考虑重力、 科里奥利力、惯性离心力和摩擦力,采用欧拉–拉 格朗日法计算关节力矩,得到机器人刚体动力学 方程: τ = M(q) q¨ + H(q, q˙)+G(q)+τf (1) Axis-4 Axis-3 Axis-1 Axis-2 Axis-5 Axis-6 图 1 协作机器人三维模型图 Fig.1 3D model of the collaborative robot y x z y y a2 a3 d5 d6 d4 x x z z y y y x z y x x x z z z d1 图 2 协作机器人 D-H 模型图 Fig.2 D-H structure of the collaborative robot · 996 · 工程科学学报,第 43 卷,第 7 期
徐征等:基于深度循环神经网络的协作机器人动力学误差补偿 997 式中:g为关节角向量:g为关节角速度向量:为关 器通信采集位移、速度和电流等信息 节角加速度向量;M(q)为机械臂惯性矩阵; H(g,)为离心力和科里奥利力矩阵:G(g)为重力矩 gm0=gn+∑(@usinGu+-hacosto》) (6) 阵;为摩擦力项 式中:q:()∈R"为关节i在关节空间中的轨迹关于 机器人关节的减速机、轴承等带来的摩擦影 时间1的函数;wr是基频;qio(①)∈R"为常量偏移;每 响较大啊,导致角速度换向处,即在速度零点附 条轨迹包含11个参数,即ak,bk,q0和wr=1 近,计算力矩相对实际误差较大.针对该现象,采 激励轨迹的优劣与观测矩阵抑制噪声的能力 用Stribeck摩擦力模型对关节摩擦机械建模,其摩 和其病态性息息相关,直接影响辨识参数的精度, 擦力矩为: 这里通过观测矩阵W的条件数来定义目标函数: (2) J=Cond(W) (7) Tr Dq+usgn (g) 式中:D为黏滞摩擦系数矩阵;μ为库伦摩擦系数 式中:Cond(W=omax(W)/cmin(W),omax(W)和cmim 综合式(1)和(2),可以得到方程: (W分别为W的最大和最小奇异值. 目标函数值越小,则辨识参数对测量误差的 T=M(g)+(g.q)+G(g)+Dq+usgn(g) (3) 敏感度越低,实验辨识得到的参数精度就有可能 故方程(1)可改成如下线性形式: 更高.同时还要考虑实际机器人有运动性能的限 T:=(g.q.q)0+T (4) 制,以运动范围、起始和停止阶段的速度和加速度 式中,(q,4,为观测矩阵,仅与关节位置、速度、 为约束,则该激励轨迹优化问题可描述为: 加速度及机器人的结构参数相关.表示基本惯性 min() 参数向量,其包括机器人连杆质量、质心和转动惯 qmin≤lqi(tl≤qmax Yi,t 量等参数,但由于结构和安装特点,有部分参数对 gmin≤l9i(tl≤qmax Yi,t 机器人工作时的力矩没有贡献,在方程组中系数始 9min≤li(tl≤max Yi.t (8) gi(to)=gi(MM)=0 Yi.t 终为0,这部分参数是无法辨识得到的;还有部分 qi(to)=qi(mM)=0 Yi,t 元素在动力学方程中组合出现,是线性相关的,无 :(o)=:(M)=0 Yi.t 法辨识得到单独数值,只能求得组合值.经过对惯 式中:qmin、gmin、min、qmax、gmax和amax是各个关节 性参数进行重组后,得到能够可辨识参数的最小 角,关节速度,关节加速度的边界值;to、tM分别为 集合,即最小惯性参数集,式(4)可进一步表达为: 表示起始和终止时刻,由于采用傅里叶变换作为 Tr=Φr(q,q,4)8+Tr (5) 激励曲线,其周期性确保了起始和终止时刻的运 式中:中为重组后的观测矩阵:a为最小惯性参数 动参数一致连续性,在实际优化计算中省略对终 集向量. 止时刻的约束 对于模型精度,本文以预测力矩(计算力矩) 式(8)是一个非线性多约束的优化问题,可以 相对于实际测量力矩的均方根误差作为评价标 采用NSGA等目标优化算法四对其进行优化,得 准.若均方根误差较小,则说明模型精度高,反之 到优化后的激励轨迹如图3所示.三张图中,横轴 则精度较低 均为时间,纵轴依次为角位移,角速度和角加速 度.从图中可以看出,轨迹变化平滑,起止点均为 2激励轨迹生成 零,运动幅值较大,但也未超出限制范围,该优化 不解体实验测量方法需要驱动机器人运动以 后的激励轨迹将用于第4节的实验研究 获取数据,考虑到计算精度和实验可行性,机器人 3 深度循环神经网络误差补偿 运动轨迹即激励轨迹需要满足多种条件.六轴机 器人动力学运算复杂度高,在辨识后三轴的动力 循环神经网络(Recurrent neural network,RNN) 学参数时可以锁定前三轴单独实验,辨识的难度 是一类用于处理序列数据的神经网络,其中的长 大大降低,更具针对性且减小了运算量限于篇 短期记忆(Long short-term memory,LSTM)单元网 幅和运算量,本文仅对协作机器人末端轴4至轴 络相比于普通的人工神经网络,解决了早期 6的动力学参数进行了辨识和研究.实验采用傅 RNN网络存在的长时期依赖,梯度爆炸和梯度消 里叶级数前五项,即式(5)作为激励轨迹.由于是 失等问题?2刘,在对历史信息的保留和对未来信 周期函数,便于重复多次进行该实验,同时与驱动 息的预测上有较大进步.本研究将进一步探索LSTM
q q˙ q¨ M(q) H(q, q˙) G(q) τf 式中: 为关节角向量; 为关节角速度向量; 为关 节 角 加 速 度 向 量 ; 为 机 械 臂 惯 性 矩 阵 ; 为离心力和科里奥利力矩阵; 为重力矩 阵; 为摩擦力项. 机器人关节的减速机、轴承等带来的摩擦影 响较大[15] ,导致角速度换向处,即在速度零点附 近,计算力矩相对实际误差较大. 针对该现象,采 用 Stribeck 摩擦力模型对关节摩擦机械建模,其摩 擦力矩为: τf = Dq˙ +µsgn(q˙) (2) 式中: D 为黏滞摩擦系数矩阵; µ 为库伦摩擦系数. 综合式(1)和(2),可以得到方程: τ = M(q) q¨ + H(q, q˙)+G(q)+ Dq˙ +µsgn(q˙) (3) 故方程(1)可改成如下线性形式: τr = Φ(q, q˙, q¨)θ+τf (4) Φ(q, q˙, q¨) θ 式中, 为观测矩阵,仅与关节位置、速度、 加速度及机器人的结构参数相关. 表示基本惯性 参数向量,其包括机器人连杆质量、质心和转动惯 量等参数,但由于结构和安装特点,有部分参数对 机器人工作时的力矩没有贡献,在方程组中系数始 终为 0,这部分参数是无法辨识得到的;还有部分 元素在动力学方程中组合出现,是线性相关的,无 法辨识得到单独数值,只能求得组合值. 经过对惯 性参数进行重组后,得到能够可辨识参数的最小 集合,即最小惯性参数集,式(4)可进一步表达为: τr = Φr(q, q˙, q¨)θr +τf (5) 式中: Φr为重组后的观测矩阵; θr为最小惯性参数 集向量. 对于模型精度,本文以预测力矩(计算力矩) 相对于实际测量力矩的均方根误差作为评价标 准. 若均方根误差较小,则说明模型精度高,反之 则精度较低. 2 激励轨迹生成 不解体实验测量方法需要驱动机器人运动以 获取数据,考虑到计算精度和实验可行性,机器人 运动轨迹即激励轨迹需要满足多种条件. 六轴机 器人动力学运算复杂度高,在辨识后三轴的动力 学参数时可以锁定前三轴单独实验,辨识的难度 大大降低,更具针对性且减小了运算量[16] . 限于篇 幅和运算量,本文仅对协作机器人末端轴 4 至轴 6 的动力学参数进行了辨识和研究. 实验采用傅 里叶级数前五项,即式(5)作为激励轨迹. 由于是 周期函数,便于重复多次进行该实验,同时与驱动 器通信采集位移、速度和电流等信息. qi(t) = qi,0 + ∑5 k ( ai,ksin(kωf t)+bi,kcos(kωf t) ) (6) qi(t) ∈ R n ωf qi,0 (t) ∈ R n ai,k bi,k qi,0 ωf = 1 式中: 为关节 i 在关节空间中的轨迹关于 时间 t 的函数; 是基频; 为常量偏移;每 条轨迹包含 11 个参数,即 , , 和 . 激励轨迹的优劣与观测矩阵抑制噪声的能力 和其病态性息息相关,直接影响辨识参数的精度, 这里通过观测矩阵 W 的条件数来定义目标函数: J = Cond(W) (7) Cond(W) = σmax (W) /σmin (W) σmax (W) σmin (W) 式中: , 和 分别为 W 的最大和最小奇异值. 目标函数值越小,则辨识参数 θ 对测量误差的 敏感度越低,实验辨识得到的参数精度就有可能 更高. 同时还要考虑实际机器人有运动性能的限 制,以运动范围、起始和停止阶段的速度和加速度 为约束,则该激励轨迹优化问题可描述为: min(J) qmin ⩽ |qi(t)| ⩽ qmax ∀i,t q˙min ⩽ |q˙i(t)| ⩽ q˙max ∀i,t q¨min ⩽ |q˙i(t)| ⩽ q¨max ∀i,t qi(t0) = qi(tM) = 0 ∀i,t q˙i(t0) = q˙i(tM) = 0 ∀i,t q¨i(t0) = q¨i(tM) = 0 ∀i,t (8) qmin q˙min q¨min qmax q˙max q¨maxt0 tM 式中: 、 、 、 、 和 是各个关节 角,关节速度,关节加速度的边界值; 、 分别为 表示起始和终止时刻,由于采用傅里叶变换作为 激励曲线,其周期性确保了起始和终止时刻的运 动参数一致连续性,在实际优化计算中省略对终 止时刻的约束. 式(8)是一个非线性多约束的优化问题,可以 采用 NSGA 等目标优化算法[22] 对其进行优化,得 到优化后的激励轨迹如图 3 所示. 三张图中,横轴 均为时间,纵轴依次为角位移,角速度和角加速 度. 从图中可以看出,轨迹变化平滑,起止点均为 零,运动幅值较大,但也未超出限制范围,该优化 后的激励轨迹将用于第 4 节的实验研究. 3 深度循环神经网络误差补偿 循环神经网络(Recurrent neural network,RNN) 是一类用于处理序列数据的神经网络,其中的长 短期记忆(Long short-term memory,LSTM)单元网 络相比于普通的人工神经网络 ,解决了早期 RNN 网络存在的长时期依赖,梯度爆炸和梯度消 失等问题[23– 24] ,在对历史信息的保留和对未来信 息的预测上有较大进步. 本研究将进一步探索 LSTM 徐 征等: 基于深度循环神经网络的协作机器人动力学误差补偿 · 997 ·
998 工程科学学报,第43卷,第7期 2.5 3 (a) Axis-4 (b) 2.0 -Axis-5 A时 15 --Axis-6 \xis-6 1.0 0.5 0 0 -0.5 -1.0 -1.5 2 -2.0 -3 0 1000200030004000500060007000 01000200030004000500060007000 Time/ms Time/ms 5 (c) Axis-4 Axis-5 3 Axis-6 (s-P)o 2 0 1000200030004000500060007000 Time/ms 图3参数辨识所用激励轨迹.(a)位移:(b)速度:(c)加速度 Fig.3 Excitation trajectory for parameter identification:(a)position;(b)velocity;(c)acceleration 在机器人动力学方面的应用 机器人运动学和动力学数据在时间上连续相 关,且摩擦力的记忆特性和电机参数随温度变化 带来的时变特性,采用LSTM网络可以很好地补 偿这些因素.本研究采用具有细胞状态和门控结 C-1h 构的LSTM细胞单元以期实现较好的补偿效果 如图4所示,LSTM细胞单元增加了细胞状态 tanh 向量C和相关的门控结构,以控制遗忘和记忆的 方法较好地解决了普通RNN Cell存在的梯度爆炸 和梯度消失问题其前向运算过程为: fi=(Wr [h-1,x]+be) 图4LSTM隐含层细胞结构 i4=o(W:·[h-l,x]+b) Fig.4 LSTM cell of hidden layer C:tanh (Wc.[h-1,x]+bc) (9) Cr=fi*C1-1+ir*C LSTM网络训练过程采用是随时间反向传播 or=(Wo [h-1,x]+bo) 算法(Back propagation trough time,BPTT),与经典 h:=o:*tanh(C) 的反向传播算法类似,包括前向计算、反向计算、 式中:o为sigmoid函数;f为遗忘门输出量:W% 计算梯度、更新参数等步骤 W、Wc和W。依次为遗忘门、输入门、更新状和输 其中基于梯度的优化算法种类众多,本文选 出门状态参数;brb、bc和b依次为遗忘门、输人 用适应性动量估计(Adaptive moment estimation, 门、更新状和输出门状态的偏移量:C和h分别为 Adam)算法2.该算法是一种有效的基于梯度的 细胞输出向量和隐含状态,x为输入向量,i和C为 随机优化方法,能够对不同参数计算适应性学习 细胞更新状态中间变量,0为输出门中间变量,以 率且占用存储资源较少,相比于其他随机优化方 上各变量下角标为时间序列编号, 法,Adam算法在实际应用中整体表现更优
在机器人动力学方面的应用. 机器人运动学和动力学数据在时间上连续相 关,且摩擦力的记忆特性和电机参数随温度变化 带来的时变特性,采用 LSTM 网络可以很好地补 偿这些因素. 本研究采用具有细胞状态和门控结 构的 LSTM 细胞单元以期实现较好的补偿效果. 如图 4 所示,LSTM 细胞单元增加了细胞状态 向量 C 和相关的门控结构,以控制遗忘和记忆的 方法较好地解决了普通 RNN Cell 存在的梯度爆炸 和梯度消失问题. 其前向运算过程为: ft = σ(Wf ·[ht−1, xt]+bf) it = σ(Wi ·[ht−1, xt]+bi) C˜ t = tanh(WC ·[ht−1, xt]+bC) Ct = ft∗Ct−1 +it ∗C˜ t ot = σ(Wo [ht−1, xt]+bo) ht = ot ∗ tanh(Ct) (9) C˜ 式中 : σ 为 sigmoid 函数 ; f t 为遗忘门输出量 ; Wf, Wi、WC 和 Wo 依次为遗忘门、输入门、更新状和输 出门状态参数;bf,bi、bC 和 bo 依次为遗忘门、输入 门、更新状和输出门状态的偏移量;C 和 h 分别为 细胞输出向量和隐含状态,x 为输入向量,i 和 为 细胞更新状态中间变量,o 为输出门中间变量,以 上各变量下角标为时间序列编号. LSTM 网络训练过程采用是随时间反向传播 算法 (Back propagation trough time,BPTT),与经典 的反向传播算法类似,包括前向计算、反向计算、 计算梯度、更新参数等步骤. 其中基于梯度的优化算法种类众多,本文选 用适应性动量估 计 (Adaptive moment estimation, Adam) 算法[25] . 该算法是一种有效的基于梯度的 随机优化方法,能够对不同参数计算适应性学习 率且占用存储资源较少,相比于其他随机优化方 法,Adam 算法在实际应用中整体表现更优. (a) 2.5 2.0 1.5 1.0 0.5 0 −0.5 −1.0 −1.5 −2.0 3 2 1 0 −1 −2 −3 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Position/rad Acceleration/(rad·s−2 ) Velocity/(rad·s−1 ) (c) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 (b) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 5 4 3 2 1 0 −1 −2 −3 −4 −5 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 图 3 参数辨识所用激励轨迹. (a)位移;(b)速度;(c)加速度 Fig.3 Excitation trajectory for parameter identification: (a) position; (b) velocity; (c) acceleration Ct−1 ht−1 xt σ σ σ tanh tanh ht ft it Ct Ot Ct ht ~ 图 4 LSTM 隐含层细胞结构 Fig.4 LSTM cell of hidden layer · 998 · 工程科学学报,第 43 卷,第 7 期
徐征等:基于深度循环神经网络的协作机器人动力学误差补偿 999· 综上所述,提出如图5所示的技术框架,包 据,C为细胞输出,H为细胞隐含状态,P为每层 括LSTM网络、数据集的产生、网络训练手段 网络输出,角标L为网络层数,Compensation 等.其中网络的输入和输出层为全连接网络,隐 value是实际力矩和计算力矩的差值.其主要步 含层由LSTM细胞单元组成,其中x为分批数 骤为: Original data Robot dynamic (shift,velocity,current) model (uncompensated) Data set normalization,segmentation Network output ADAM TM LSTM, H. LSTM optimizer Loss Iterative computations Test set 图5基于LSTM机器人动力学补偿的技术框架 Fig.5 Structure of LSTM-based robot dynamic compensation (1)原始数据(位移、速度、加速度、力矩)采集; 网络由开源机器学习平台Tensorflowl.15.0实 (2)原始数据(位移、速度、加速度)经未补偿 现,根据经验和实际情况,确定网络主要超参数如 动力学模型计算得到预测力矩; 表1所示 (3)原始数据和预测力矩经过归一化操作,分 表1网络主要超参数值 为训练集和测试集; Table 1 Hyperparameters of the net (4)训练集进入全连接的输入层: Parameter Value (5)经过包括64个LSTM节点的隐含层迭代 Time step 100 计算(依次计算每个细胞输出): Batch size 50 (6)经过输出层输出经网络补偿后的力矩值; Input size 12 (7)损失为预测力矩(计算力矩)相对于实际 Output size 3 测量力矩的均方根误差; Cell size 60 (8)以该损失最小采用Adam优化器对网络参 Total layer 3 数迭代优化: Learning rate 0.05 (9)反向计算每个LSTM细胞的误差项,包括 按时间和网络层级两个反向传播方向: 其中输入向量依次包括4、5和6各轴的计算 (10)根据相应的误差项计算每个权重的梯度: 力矩、历史各时刻实际力矩、实际速度和实际位 (11)应用更新权重; 移.输出向量依次包括4、5和6各轴的下一时刻 (12)测试集经过网络计算出经补偿后的预测 预测力矩.网络的节点数则根据特征维度和数据 力矩,评估补偿效果 量进行选择,损失即为下一时刻预测力矩相对于
综上所述,提出如图 5 所示的技术框架,包 括 LSTM 网络、数据集的产生、网络训练手段 等. 其中网络的输入和输出层为全连接网络,隐 含 层 由 LSTM 细胞单元组成,其 中 x 为分批数 据 ,C 为细胞输出,H 为细胞隐含状态,P 为每层 网 络 输 出 , 角 标 L 为 网 络 层 数 , Compensation value 是实际力矩和计算力矩的差值. 其主要步 骤为: Input layer Hidden layer Output layer Original data (shift, velocity, current) Robot dynamic model (uncompensated) Data set normalization, segmentation x1 x2 C2 H2 C1 H1 P1 P2 PL CL−1 HL−1 ··· xL ··· ··· LSTM1 LSTM2 LSTML Iterative computations Test set ADAM optimizer Network output Loss Compensation value 图 5 基于 LSTM 机器人动力学补偿的技术框架 Fig.5 Structure of LSTM-based robot dynamic compensation (1)原始数据(位移、速度、加速度、力矩)采集; (2)原始数据(位移、速度、加速度)经未补偿 动力学模型计算得到预测力矩; (3)原始数据和预测力矩经过归一化操作,分 为训练集和测试集; (4)训练集进入全连接的输入层; (5)经过包括 64 个 LSTM 节点的隐含层迭代 计算(依次计算每个细胞输出); (6)经过输出层输出经网络补偿后的力矩值; (7)损失为预测力矩(计算力矩)相对于实际 测量力矩的均方根误差; (8)以该损失最小采用 Adam 优化器对网络参 数迭代优化; (9)反向计算每个 LSTM 细胞的误差项,包括 按时间和网络层级两个反向传播方向; (10)根据相应的误差项计算每个权重的梯度; (11)应用更新权重; (12)测试集经过网络计算出经补偿后的预测 力矩,评估补偿效果. 网络由开源机器学习平台 Tensorflow1.15.0 实 现,根据经验和实际情况,确定网络主要超参数如 表 1 所示. 表 1 网络主要超参数值 Table 1 Hyperparameters of the net Parameter Value Time step 100 Batch size 50 Input size 12 Output size 3 Cell size 60 Total layer 3 Learning rate 0.05 其中输入向量依次包括 4、5 和 6 各轴的计算 力矩、历史各时刻实际力矩、实际速度和实际位 移. 输出向量依次包括 4、5 和 6 各轴的下一时刻 预测力矩. 网络的节点数则根据特征维度和数据 量进行选择,损失即为下一时刻预测力矩相对于 徐 征等: 基于深度循环神经网络的协作机器人动力学误差补偿 · 999 ·
·1000 工程科学学报,第43卷,第7期 下一时刻实际力矩的均方根误差,即: 采集的数据,可分为两部分:训练集F和测试集 Fe.对于训练集,激励轨迹即是第3节中得到的最 L= V货∑e0-r时 (10) 优激励轨迹:对于测试集,可以通过增加新约束条 式中:N为数据集样本数量,实际为机器人连续运动 件的方法再产生一条新的激励轨迹.在式(6)的基 量的采样点数量:0为预测力矩值;为实际力矩 础上增加约束:q:t=3.8)=0,得到测试集轨迹如 数据集来源于激励轨迹驱动下的机器人实际 图6所示 2.5 (a) (b) AXIS- 2.0 Axis-5 2 1.5 AxIs-6 As-t 0.5 0 0 0.5 -1.0 -1.5 -2.0 -3 1000200030004000500060007000 01000200030004000500060007000 Time/ms Time/ms o (c) Axis-4 8 Axis-5 6 Axis-6 2 1000200030004000500060007000 Time/ms 图6测试集的激励轨迹.(a)位移:(b)速度:(c)加速度 Fig.6 Excitation trajectory of test set:(a)position;(b)velocity;(c)acceleration 从图6中可以看出,测试集曲线各处平滑连 技术具有较大的实际应用价值 续,运动幅值较大,但也未超出限制范围,相比于 实验中,各轴电机伺服驱动器与控制器由 图3的训练集曲线,图6中的各轴位移曲线具有两 EtherCAT连接通信,驱动器置为周期性位置模式, 个显著分开的波峰,运动中存在一个零点,且速度 控制器以100Hz固定频率发送图3和图6的激励 和加速度也有较大差异,可在充分利用机器人性 轨迹至驱动器,保证整个运动过程连续流畅.由于 能的同时测试网络的泛化能力.同时,运动过程中 只研究轴4至轴6的动力学特性,轴1至轴3的位 的零点便于在实验中核对误差,起到监控机器人 移指令始终为零 工作状态的作用 网络的训练采用上述的激励轨迹与实验数据 下一步的工作,如网络的训练,需要实验数据 为训练数据集,以理论计算力矩和实际力矩的均 的支撑,故在下一节实验部分继续进行 方根误差为损失函数,训练目标即为该损失函数 4 实验结果 最小.随着网络训练次数增加,损失逐渐减小,如 图7所示. 本次实验仅对该机器人末端的轴4、轴5和 图8和图9分别为测试集激励轨迹下,补偿前 轴6进行分析和实验.由于靠近末端的轴4至轴 和补偿后轴5的实际力矩、预测力矩和误差曲线, 6三轴力臂相对较短,质量相对较小,惯性和重力 可以明显看到经过LSTM补偿后的动力学模型对 矩相对较小,摩擦力和电机转子惯量等未精确建 力矩的预测误差相比未经补偿的有显著提高,各 模的特性会带来更大的相对误差,因此误差补偿 轴补偿前后预测力矩与实际力矩的均方根误差如
下一时刻实际力矩的均方根误差,即: L = √ 1 N ∑N i=1 (ˆτ (i) −τ i ) 2 (10) τˆ (i) τ i 式中:N 为数据集样本数量,实际为机器人连续运动 量的采样点数量; 为预测力矩值; 为实际力矩. 数据集来源于激励轨迹驱动下的机器人实际 qi(t = 3.8) = 0 采集的数据,可分为两部分:训练集 Ftr 和测试集 Fte. 对于训练集,激励轨迹即是第 3 节中得到的最 优激励轨迹;对于测试集,可以通过增加新约束条 件的方法再产生一条新的激励轨迹. 在式(6)的基 础上增加约束: ,得到测试集轨迹如 图 6 所示. (a) (c) 2.5 2.0 1.5 1.0 0.5 0 −0.5 −1.0 −1.5 −2.0 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Position/rad 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 Axis-4 Axis-5 Axis-6 3 2 1 0 −1 −2 −3 Velocity/(rad·s−1 ) (b) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 10 8 6 4 2 0 −2 −4 −6 −8 Acceleration/(rad·s−2 ) 图 6 测试集的激励轨迹. (a)位移;(b)速度;(c)加速度 Fig.6 Excitation trajectory of test set: (a) position; (b) velocity; (c) acceleration 从图 6 中可以看出,测试集曲线各处平滑连 续,运动幅值较大,但也未超出限制范围,相比于 图 3 的训练集曲线,图 6 中的各轴位移曲线具有两 个显著分开的波峰,运动中存在一个零点,且速度 和加速度也有较大差异,可在充分利用机器人性 能的同时测试网络的泛化能力. 同时,运动过程中 的零点便于在实验中核对误差,起到监控机器人 工作状态的作用. 下一步的工作,如网络的训练,需要实验数据 的支撑,故在下一节实验部分继续进行. 4 实验结果 本次实验仅对该机器人末端的轴 4、轴 5 和 轴 6 进行分析和实验. 由于靠近末端的轴 4 至轴 6 三轴力臂相对较短,质量相对较小,惯性和重力 矩相对较小,摩擦力和电机转子惯量等未精确建 模的特性会带来更大的相对误差,因此误差补偿 技术具有较大的实际应用价值. 实验中 ,各轴电机伺服驱动器与控制器 由 EtherCAT 连接通信,驱动器置为周期性位置模式, 控制器以 100 Hz 固定频率发送图 3 和图 6 的激励 轨迹至驱动器,保证整个运动过程连续流畅. 由于 只研究轴 4 至轴 6 的动力学特性,轴 1 至轴 3 的位 移指令始终为零. 网络的训练采用上述的激励轨迹与实验数据 为训练数据集,以理论计算力矩和实际力矩的均 方根误差为损失函数,训练目标即为该损失函数 最小. 随着网络训练次数增加,损失逐渐减小,如 图 7 所示. 图 8 和图 9 分别为测试集激励轨迹下,补偿前 和补偿后轴 5 的实际力矩、预测力矩和误差曲线, 可以明显看到经过 LSTM 补偿后的动力学模型对 力矩的预测误差相比未经补偿的有显著提高,各 轴补偿前后预测力矩与实际力矩的均方根误差如 · 1000 · 工程科学学报,第 43 卷,第 7 期
徐征等:基于深度循环神经网络的协作机器人动力学误差补偿 ·1001· 12 表2各关节计算力矩相对实际力矩的均方根误差 Table 2 RMS error of calculated torque between real value 8 Axis Uncompensated/(N.m) Compensated/(N-m) 3.61 1.21 5 4.84 1.02 6 6.10 2.33 小e心a 5 结论 0100200300400500600700800 Epochs 为了解决协作机器人动力学模型难以建立与 图7网络训练步数与均方根损失 辨识,导致机器人计算预测力矩误差较大的问题, Fig.7 Epochs vs RMS loss 本文针对自主研发的六自由度协作机器人,首先 建立了一般的机器人动力学模型,然后生成了优 -Experiment 化后的激励轨迹并进行了相关实验.同时,在此基 .-Calculated (Uncomp.) Error 础上采用深度循环神经网络中的长短期记忆模型 10 对模型预测力矩和实际力矩之间的误差进行了补 偿.结论如下:协作机器人轴4至轴6结构轻巧, 惯性力和重力较小,摩擦力、转子惯性力等未建模 -10 或未能精确建模的因素影响占比很大,依靠一般 20 动力学方程计算预测力矩有较大误差.采用深度 .30 1000200030004000500060007000 循环神经网络中的长短期记忆模型可有效补偿动 Time/ms 力学模型误差.实验表明轴4、5和6的预测力矩 图8轴5计算力矩(未经补偿)、实际力矩和误差 与实际力矩的均方根误差与传统模型相比,分别 Fig.8 Calculated torque (uncompensated),real toruge,and errors of 下降了66.5%,78.9%和61.8%.由此可见,基于循 axis-5 环神经神经网络的误差补偿技术是可行和有效 30 的,可为后续的动力学控制研究提供良好的基础, -Experiment 20 --Calculated(LSTM comp.) -Error 参考文献 10 [1]An C H,Atkeson CG,Hollerbach J.Model-Based Control of a Robot Manipulator.Cambridge:MIT Press,1988 三-10 [2]Xiang WW K,Yan S Z.Dynamic analysis of space robot manipulator considering clearance joint and parameter uncertainty: -20 Modeling,analysis and quantification.Acta Astron,2020,169:158 -30 [3] Norouzzadeh S,Lorenz T,Hirche S.Towards safe physical 01000200030004000500060007000 Time/ms human-robot interaction:An online optimal control scheme /The 图9轴5经过LSTM网路补偿后的计算力矩、实际力矩和误差 21st IEEE International Symposium on Robot and Human Fig Calculated torque with LSTM compensation,real torque,and Interactive Communication.Paris,2012:503 errors of axis-5 [4]Craig J J.Introduction to Robotics:Mechanics and Control.4th Ed.Pearson,2017 表2所示.从图表中可以看出,补偿后的动力学模 [5] Siciliano B,Sciavicco L,Villani L,et al.Robotics:Modelling. 型对力矩具有良好的预测效果,轴4至轴6预测力 Planning and Control.London:Springer,2015 矩(理论计算)与实际力矩的均方根误差,相比于 [6] Tao Y,Zhao F,Cao J J.Research on friction characteristics identification and compensation of cooperative robot's joints. 传统模型分别降低了66.5%、78.9%和61.8%.这 Modular Mach Tool Autom Manuf Tech,2019(4):28 是由于协作机器人轴4至轴6结构轻巧,惯性力和 (陶岳,赵飞,曹巨江.协作机器人关节摩擦特性辨识与补偿技 重力较小,因此摩擦力等未建模或未能精确建模 术.组合机床与自动化加工技术,2019(4):28) 的因素影响占比很大,造成很大误差 ① Simoni L,Beschi M,Legnani G,et al.On the inclusion of
表 2 所示. 从图表中可以看出,补偿后的动力学模 型对力矩具有良好的预测效果,轴 4 至轴 6 预测力 矩(理论计算)与实际力矩的均方根误差,相比于 传统模型分别降低了 66.5%、78.9% 和 61.8%. 这 是由于协作机器人轴 4 至轴 6 结构轻巧,惯性力和 重力较小,因此摩擦力等未建模或未能精确建模 的因素影响占比很大,造成很大误差. 5 结论 为了解决协作机器人动力学模型难以建立与 辨识,导致机器人计算预测力矩误差较大的问题, 本文针对自主研发的六自由度协作机器人,首先 建立了一般的机器人动力学模型,然后生成了优 化后的激励轨迹并进行了相关实验. 同时,在此基 础上采用深度循环神经网络中的长短期记忆模型 对模型预测力矩和实际力矩之间的误差进行了补 偿. 结论如下:协作机器人轴 4 至轴 6 结构轻巧, 惯性力和重力较小,摩擦力、转子惯性力等未建模 或未能精确建模的因素影响占比很大,依靠一般 动力学方程计算预测力矩有较大误差. 采用深度 循环神经网络中的长短期记忆模型可有效补偿动 力学模型误差. 实验表明轴 4、5 和 6 的预测力矩 与实际力矩的均方根误差与传统模型相比,分别 下降了 66.5%,78.9% 和 61.8%. 由此可见,基于循 环神经神经网络的误差补偿技术是可行和有效 的,可为后续的动力学控制研究提供良好的基础. 参 考 文 献 An C H, Atkeson C G, Hollerbach J. Model-Based Control of a Robot Manipulator. Cambridge: MIT Press, 1988 [1] Xiang W W K, Yan S Z. Dynamic analysis of space robot manipulator considering clearance joint and parameter uncertainty: Modeling, analysis and quantification. Acta Astron, 2020, 169: 158 [2] Norouzzadeh S, Lorenz T, Hirche S. Towards safe physical human-robot interaction: An online optimal control scheme // The 21st IEEE International Symposium on Robot and Human Interactive Communication. Paris, 2012: 503 [3] Craig J J. Introduction to Robotics: Mechanics and Control. 4th Ed. Pearson, 2017 [4] Siciliano B, Sciavicco L, Villani L, et al. Robotics: Modelling, Planning and Control. London: Springer, 2015 [5] Tao Y, Zhao F, Cao J J. Research on friction characteristics identification and compensation of cooperative robot's joints. Modular Mach Tool Autom Manuf Tech, 2019(4): 28 (陶岳, 赵飞, 曹巨江. 协作机器人关节摩擦特性辨识与补偿技 术. 组合机床与自动化加工技术, 2019(4):28) [6] [7] Simoni L, Beschi M, Legnani G, et al. On the inclusion of 12 10 8 6 4 2 0 RMS loss 0 100 200 300 400 Epochs 500 600 700 800 图 7 网络训练步数与均方根损失 Fig.7 Epochs vs RMS loss 30 20 10 0 −10 −20 −30 Torque/(N·m) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Experiment Calculated (Uncomp.) Error 图 8 轴 5 计算力矩(未经补偿)、实际力矩和误差 Fig.8 Calculated torque (uncompensated), real toruqe, and errors of axis-5 30 20 10 0 −10 −20 −30 Torque/(N·m) 0 1000 2000 3000 4000 Time/ms 5000 6000 7000 Experiment Calculated (LSTM comp.) Error 图 9 轴 5 经过 LSTM 网络补偿后的计算力矩、实际力矩和误差 Fig.9 Calculated torque with LSTM compensation, real torque, and errors of axis-5 表 2 各关节计算力矩相对实际力矩的均方根误差 Table 2 RMS error of calculated torque between real value Axis Uncompensated/(N·m) Compensated/(N·m) 4 3.61 1.21 5 4.84 1.02 6 6.10 2.33 徐 征等: 基于深度循环神经网络的协作机器人动力学误差补偿 · 1001 ·
·1002 工程科学学报,第43卷,第7期 temperature in the friction model of industrial robots./FAC. [16]Khalil W,Guegan S.Inverse and direct dynamic modeling of PapersOnLine,2017,50(1):3482 Gough-Stewart robots.IEEE Trans Rob,2004,20(4):754 [8]Ossadnik D.Guadarrama-Olvera J R,Dean-Leon E,et al.Adaptive [17]Swevers J,Naumer B,Pieters S,et al.An experimental robot load friction compensation for humanoid robots without joint-torque identification method for industrial application /Experimental sensors I/IEEE-RAS International Conference on Humanoid Robotics VIlI.Springer,Berlin,Heidelberg,2003:318 Robots (Humanoids).Beijing,2018:980 [18]Ding Y D,Chen B,Wu H T,et al.An identification method of [9]Zhang T,Hong J D,Li QF,et al.Wave friction correction method industrial robot 's dynamic parameters.J South China Univ for a robot based on BP neural network.Chin J Eng,2019,41(8) Technol Nat Sci Ed,2015,43(3):49 1085 (丁亚东,陈柏,吴洪涛,等.一种工业机器人动力学参数的辨识 (张铁,洪景东,李秋奋,等.基于BP神经网络的机器人波动摩擦 方法.华南理工大学学报(自然科学版),2015,43(3):49) 力矩修正方法.工程科学学报,2019,41(8):1085) [19]Khalil W,Restrepo P.An efficient algorithm for the calculation of [10]Vitiello V,Tornambe A.Adaptive compensation of modeled the filtered dynamic model of robots /Proceedings of IEEE friction using a RBF neural network approximation //4th IEEE International Conference on Robotics and Automation. Conference on Decision and Control.New Orleans,2007:4699 Minneapolis,1996:323 [11]Qiu L K,Zhao Y Z,Zhang Y X.Adaptive friction identification [20]Liu Z S,Chen E W,Gan F J.Review of some methods for and compensation based on RBF neural network for the linear identifying inertial parameters of robots and their development./ inverted pendulum Proceedings of 2011 International Hefei Univ Technol Nat Sci,2005,28(9):998 Conference on Electronic Mechanical Engineering and (刘正土,陈恩伟,干方建.机器人惯性参数辨识的若干方法及 Information Technology.Harbin,2011:385 进展.合肥工业大学学报(自然科学版),2005,28(9):998) [12]Yu W,Heredia J A.PD control of robot with RBF networks [21]Yoshida K,Khalil W.Verification of the positive definiteness of compensation Proceedings of the IEEE-INNS-ENNS the inertial matrix of manipulators using base inertial parameters. International Joint Conference on Neural Networks I.JCNN 2000. t J Rob Res,2000,19(5:498 Neural Computing:New Challenges and Perspectives for the New Millennium.Como,2000:329 [22]Deb K,Jain H.An evolutionary many-objective optimization [13]Sun C G,Ma X F,Tan J L.Calculation of inertia parameter of algorithm using reference-point-based nondominated sorting robot manipulator.Robor,1990,12(2):19 approach,Part I:solving problems with box constraints./EEE (孙昌国,马香峰,谭吉林机器人操作器惯性参数的计算.机器 Trans Evol Comput,2014,18(4):577 人,1990,12(2):19) [23]Graves A.Long Short-Term Memory.Berlin:Springer,2012:1735 [14]Armstrong B,Khatib O,Burdick J.The explicit dynamic model [24]Jozefowicz R,Zaremba W,Sutskever I.An empirical exploration and inertial parameters of the PUMA 560 arm /Proceedings of of recurrent network architectures /Proceedings of the 32nd 1986 IEEE International Conference on Robotics and Automation International Conference on International Conference on Machine San Francisco,1986:510 Learning.Lile,France,2015:2342 [15]Olsen M,Petersen H G.A new method for estimating parameters [25]Kingma D,Ba J.Adam:A method for stochastic optimization of a dynamic robot model./EEE Trans Rob Autom,2001,17(1): IInternational Conference for Learning Representations.San 95 Diego,2015:1
temperature in the friction model of industrial robots. IFACPapersOnLine, 2017, 50(1): 3482 Ossadnik D, Guadarrama-Olvera J R, Dean-Leon E, et al. Adaptive friction compensation for humanoid robots without joint-torque sensors // IEEE-RAS International Conference on Humanoid Robots (Humanoids). Beijing, 2018: 980 [8] Zhang T, Hong J D, Li Q F, et al. Wave friction correction method for a robot based on BP neural network. Chin J Eng, 2019, 41(8): 1085 (张铁, 洪景东, 李秋奋, 等. 基于BP神经网络的机器人波动摩擦 力矩修正方法. 工程科学学报, 2019, 41(8):1085) [9] Vitiello V, Tornambe A. Adaptive compensation of modeled friction using a RBF neural network approximation // 46th IEEE Conference on Decision and Control. New Orleans, 2007: 4699 [10] Qiu L K, Zhao Y Z, Zhang Y X. Adaptive friction identification and compensation based on RBF neural network for the linear inverted pendulum // Proceedings of 2011 International Conference on Electronic & Mechanical Engineering and Information Technology. Harbin, 2011: 385 [11] Yu W, Heredia J A. PD control of robot with RBF networks compensation // Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks IJCNN 2000. Neural Computing: New Challenges and Perspectives for the New Millennium. Como, 2000: 329 [12] Sun C G, Ma X F, Tan J L. Calculation of inertia parameter of robot manipulator. Robot, 1990, 12(2): 19 (孙昌国, 马香峰, 谭吉林. 机器人操作器惯性参数的计算. 机器 人, 1990, 12(2):19) [13] Armstrong B, Khatib O, Burdick J. The explicit dynamic model and inertial parameters of the PUMA 560 arm // Proceedings of 1986 IEEE International Conference on Robotics and Automation. San Francisco, 1986: 510 [14] Olsen M, Petersen H G. A new method for estimating parameters of a dynamic robot model. IEEE Trans Rob Autom, 2001, 17(1): 95 [15] Khalil W, Guegan S. Inverse and direct dynamic modeling of Gough-Stewart robots. IEEE Trans Rob, 2004, 20(4): 754 [16] Swevers J, Naumer B, Pieters S, et al. An experimental robot load identification method for industrial application // Experimental Robotics VIII. Springer, Berlin, Heidelberg, 2003: 318 [17] Ding Y D, Chen B, Wu H T, et al. An identification method of industrial robot ’s dynamic parameters. J South China Univ Technol Nat Sci Ed, 2015, 43(3): 49 (丁亚东, 陈柏, 吴洪涛, 等. 一种工业机器人动力学参数的辨识 方法. 华南理工大学学报(自然科学版), 2015, 43(3):49) [18] Khalil W, Restrepo P. An efficient algorithm for the calculation of the filtered dynamic model of robots // Proceedings of IEEE International Conference on Robotics and Automation. Minneapolis, 1996: 323 [19] Liu Z S, Chen E W, Gan F J. Review of some methods for identifying inertial parameters of robots and their development. J Hefei Univ Technol Nat Sci, 2005, 28(9): 998 (刘正士, 陈恩伟, 干方建. 机器人惯性参数辨识的若干方法及 进展. 合肥工业大学学报(自然科学版), 2005, 28(9):998) [20] Yoshida K, Khalil W. Verification of the positive definiteness of the inertial matrix of manipulators using base inertial parameters. Int J Rob Res, 2000, 19(5): 498 [21] Deb K, Jain H. An evolutionary many-objective optimization algorithm using reference-point-based nondominated sorting approach, Part I: solving problems with box constraints. IEEE Trans Evol Comput, 2014, 18(4): 577 [22] [23] Graves A. Long Short-Term Memory. Berlin: Springer, 2012: 1735 Jozefowicz R, Zaremba W, Sutskever I. An empirical exploration of recurrent network architectures // Proceedings of the 32nd International Conference on International Conference on Machine Learning. Lile, France, 2015: 2342 [24] Kingma D, Ba J. Adam: A method for stochastic optimization //International Conference for Learning Representations. San Diego, 2015: 1 [25] · 1002 · 工程科学学报,第 43 卷,第 7 期