第15卷第3期 智能系统学报 Vol.15 No.3 2020年5月 CAAI Transactions on Intelligent Systems May 2020 D0L:10.11992tis.201810017 仿人机器人步态平衡泛化模型的建立与仿真 于建均,李晨,左国玉,阮晓刚,王洋 (北京工业大学信息学部,北京100124) 摘要:通过人体示教计算零力矩点(zero moment point,ZMP),并通过补偿关节角度对其矫正的方法可以解决 机器人步行不稳定的问题,但仍存在算法复杂度过高等问题。本文提出一种人体示教与机器学习相结合的方 法,基于支持向量回归算法建立机器人的步态平衡泛化模型,通过该模型可以实现对模型输入人体示教的关节 角度和ZMP信息后直接得到经稳定性补偿的关节角度,并以此驱动机器人完成步行动作。引入鲸鱼优化算法 (whale optimization algorithm,WOA)优化模型的参数以使模型得到最优的泛化效果,完善步态平衡模型的性 能。WEBOTS仿真平台下,使用模型输出的补偿后的关节角度驱动NAO机器人,其动作自然、稳定且算法复 杂度较低,验证了本文方法的可行性。 关键词:仿人机器人;支持向量回归;步态平衡泛化模型;鲸鱼优化算法;ZMP信息;算法复杂度;NAO机器人: 机器学习 中图分类号:TP242.6文献标志码:A 文章编号:1673-4785(2020)03-0537-09 中文引用格式:于建均,李晨,左国玉,等.仿人机器人步态平衡泛化模型的建立与仿真小.智能系统学报,2020,15(3) 537-545. 英文引用格式:YU Jianjun,LI Chen,ZUO Guoyu,etal.Modeling and simulation of humanoid robot gait balance generalization(J CAAI transactions on intelligent systems,2020,15(3):537-545. Modeling and simulation of humanoid robot gait balance generalization YU Jianjun,LI Chen,ZUO Guoyu,RUAN Xiaogang,WANG Yang (Department of Information,Beijing University of Technology,Beijing 100124,China) Abstract:The problem of robot walking instability can be solved by calculating the zero-moment point (ZMP)through human body teaching and correction by the compensation of joint angles;however,problems such as high algorithm complexity still exist.This paper proposes a method that combines human teaching with machine learning.The gait bal- ance generalization model of a robot is established based on the support vector regression algorithm.The joint angle of human teaching and ZMP information are inputted into the model;then,we get the joint angle compensated by stability, and the robot is driven to complete the walking action.The parameters of the whale optimization algorithm(WOA) model are introduced to make the model obtain the optimal generalization effect and improve the performance of the gait balance model.Under the Webots simulation platform,the NAO robot is driven by the compensated joint angle of the model output.The action is natural and stable,and the algorithm complexity is low,which verifies the feasibility of the method. Keywords:humanoid robot;support vector regression;gait balance generalization model;whale optimization al- gorithm;ZMP information;algorithm complexity;NAO robot,machine learning 仿人机器人由于拥有与人体结构相似的双足高低落差较大的地形场景,且在崎岖多变的地形 式结构,可以较好地适应轮式机器人难以适应的 环境中机动性好,因此仿人机器人可以代替人类 收稿日期:2018-10-16 在复杂和危险的环境下工作,同时也被广泛应用 基金项目:国家自然科学基金项目(61873008):北京市自然科 到服务、医疗康复和教育娱乐等领域。因此仿人 学基金项目(4182008). 通信作者:于建均.E-mail:yujianjun@bjut.edu.cn 机器人的研究也就成为了机器人领域的重要研究
DOI: 10.11992/tis.201810017 仿人机器人步态平衡泛化模型的建立与仿真 于建均,李晨,左国玉,阮晓刚,王洋 (北京工业大学 信息学部,北京 100124) 摘 要:通过人体示教计算零力矩点 (zero moment point, ZMP),并通过补偿关节角度对其矫正的方法可以解决 机器人步行不稳定的问题,但仍存在算法复杂度过高等问题。本文提出一种人体示教与机器学习相结合的方 法,基于支持向量回归算法建立机器人的步态平衡泛化模型,通过该模型可以实现对模型输入人体示教的关节 角度和 ZMP 信息后直接得到经稳定性补偿的关节角度,并以此驱动机器人完成步行动作。引入鲸鱼优化算法 (whale optimization algorithm, WOA) 优化模型的参数以使模型得到最优的泛化效果,完善步态平衡模型的性 能。WEBOTS 仿真平台下,使用模型输出的补偿后的关节角度驱动 NAO 机器人,其动作自然、稳定且算法复 杂度较低,验证了本文方法的可行性。 关键词:仿人机器人;支持向量回归;步态平衡泛化模型;鲸鱼优化算法;ZMP 信息;算法复杂度;NAO 机器人; 机器学习 中图分类号:TP242.6 文献标志码:A 文章编号:1673−4785(2020)03−0537−09 中文引用格式:于建均, 李晨, 左国玉, 等. 仿人机器人步态平衡泛化模型的建立与仿真 [J]. 智能系统学报, 2020, 15(3): 537–545. 英文引用格式:YU Jianjun, LI Chen, ZUO Guoyu, et al. Modeling and simulation of humanoid robot gait balance generalization[J]. CAAI transactions on intelligent systems, 2020, 15(3): 537–545. Modeling and simulation of humanoid robot gait balance generalization YU Jianjun,LI Chen,ZUO Guoyu,RUAN Xiaogang,WANG Yang (Department of Information, Beijing University of Technology, Beijing 100124, China) Abstract: The problem of robot walking instability can be solved by calculating the zero-moment point (ZMP) through human body teaching and correction by the compensation of joint angles; however, problems such as high algorithm complexity still exist. This paper proposes a method that combines human teaching with machine learning. The gait balance generalization model of a robot is established based on the support vector regression algorithm. The joint angle of human teaching and ZMP information are inputted into the model; then, we get the joint angle compensated by stability, and the robot is driven to complete the walking action. The parameters of the whale optimization algorithm (WOA) model are introduced to make the model obtain the optimal generalization effect and improve the performance of the gait balance model. Under the Webots simulation platform, the NAO robot is driven by the compensated joint angle of the model output. The action is natural and stable, and the algorithm complexity is low, which verifies the feasibility of the method. Keywords: humanoid robot; support vector regression; gait balance generalization model; whale optimization algorithm; ZMP information; algorithm complexity; NAO robot; machine learning 仿人机器人由于拥有与人体结构相似的双足 式结构,可以较好地适应轮式机器人难以适应的 高低落差较大的地形场景,且在崎岖多变的地形 环境中机动性好,因此仿人机器人可以代替人类 在复杂和危险的环境下工作,同时也被广泛应用 到服务、医疗康复和教育娱乐等领域。因此仿人 机器人的研究也就成为了机器人领域的重要研究 收稿日期:2018−10−16. 基金项目:国家自然科学基金项目 (61873008);北京市自然科 学基金项目 (4182008). 通信作者:于建均. E-mail:yujianjun@bjut.edu.cn. 第 15 卷第 3 期 智 能 系 统 学 报 Vol.15 No.3 2020 年 5 月 CAAI Transactions on Intelligent Systems May 2020
·538· 智能系统学报 第15卷 方向之一。 稳定性补偿的关节角度。在保留人体示教优点且 控制机器人的稳定步行,传统上是通过规划 保证稳定性的同时降低计算复杂度,增强机器人 ZMP轨迹,并通过逆运动学等方法求取机器人的 动作模仿的实时性。 驱动角度完成的。而人为规划的ZMP轨迹和质 1.1支持向量回归算法 心轨迹过分依靠仿人机器人运动学模型,这种方 支持向量回归模型分为线性回归模型和非线 法在对机器人建模时需进行大量的计算,且运动 性回归模型。考虑到人体示教数据和机器人驱动 模式僵硬单一。由于人体结构与仿人机器人 关节角度是非线性关系,需要建立非线性回归模 的结构有很强的相似性,通过人体示教的方式, 型。给定样本: 机器人模仿其动作的方式,能使机器人动作自 D=1,y),(2,y2),…,(c,),i=1,2,…,0(1) 然,运动方式多样0,但是二者之间的质量分布 式中:x∈Rm是n维输入值;y∈R是一维输出值;i 存在差异,直接使用人体示教的关节角度,容易 为样本数量。SVR算法构造的非线性回归模型 导致仿人机器人在运动过程中摔倒。使用ZMP 的思想是利用核技巧将训练数据映射到高维空间 补偿或线性反馈等方式补偿关节角度可使仿人机 再线性回归以简化运算。本文采用RBF核函数 器人在步行过程中的稳定性提高,但补偿角的计 作为SVR模型的核函数。其回归模型函数为 f(x)=wΦ(x)+b (2) 算过程过于复杂。Seleem等使用Kinect-V2传 式中:x为模型输人的n维变量;w和b为训练得 感器捕捉人体步态数据同时使用多项式拟合并利 到的回归模型参数;(x)为核函数。 用反馈线性化技术稳定双足机器人步行过程,获 在SVM间隔最大化思想下,引人不敏感损失 得了较为自然且多样的步态轨迹,但未能充分利 函数ε、惩罚系数C以及松弛变量、号,可得到 用人体的示教数据,使计算过程过于复杂。面对 E-SVR非线性回归模型: 计算量大这一问题,机器学习通过构建“模型”思 想,大大减少了传统算法的运算量和计算过程。 m,a+c∑+ (u.b5.5')21 i=l Hwang等a应用机器学习的思想对仿人机器人 s.L.y-ωΦ()-b≤e+E (3) 的ZMP轨迹进行规划,并将机器人的关节角度构 ω中(x)+b≤E+” 5,5*≥0 成离散的动作空间,以构建机器人步行模型,进 为了计算更加便捷,通过引入拉格朗日乘子 行步态控制,但只有16个动作的离散动作空间机 、,并通过拉格朗日乘法寻优,可以得到 器人动作僵硬单一。支持向量回归(support vact-. SVR的对偶最优化问题: or regression,SVR)由Cortes等l1提出,是建立在 结构风险最小化原则基础之上的一种机器学习算 maxy-e)- ,a:(y+)+ 法。相较于传统的机器学习算法的经验风险最小 化原则,它在最小化训练误差的同时最小化了泛 ∑a,-a)@,-a)K(x) (4) 化误差的上限,并且其算法复杂度与样本的训练 s.L.0≤≤C,0≤a≤C,i=1,2,…,l 维数无关,避免了维数灾难,是一种有着很强理 (a;-a)=0 论基础的小样本学习方法。 1 式中:K(,x)=xr)x)为核函数,本文采用 基于SVR的机器人步态平衡泛化 RBF核函数。 模型的构建 由于不等式约束问题需满足的KKT条件可 解得SVR的解形式为 采用人体示教的方法,可以使仿人机器人在 不同的步长、步态周期下动作自然地行走且大大 f)=∑a-a)Kkx)+b (5) 简化了动力学建模的计算过程。但在机器人模仿 =1 人体步行动作时,由于两者质量分布不同,质心 式中b=+8- ∑a-a)K 在运动过程中极易发生偏移,需要通过人体示教 综上所述,决定SVR算法非线性模型性能的 信息经过大量计算得到使机器人稳定步行的关节 参数为a、、8,以及RBF核函数中自带的宽度 补偿角度。考虑基于SVR算法建立步态平衡 系数p,其中a、a在式(4)的条件约束下,由惩 泛化模型,根据得到的人体示教信息直接得到经 罚系数C决定
方向之一。 控制机器人的稳定步行,传统上是通过规划 ZMP 轨迹,并通过逆运动学等方法求取机器人的 驱动角度完成的。而人为规划的 ZMP 轨迹和质 心轨迹过分依靠仿人机器人运动学模型,这种方 法在对机器人建模时需进行大量的计算,且运动 模式僵硬单一[1-6]。由于人体结构与仿人机器人 的结构有很强的相似性,通过人体示教的方式, 机器人模仿其动作的方式,能使机器人动作自 然,运动方式多样[7-10] ,但是二者之间的质量分布 存在差异,直接使用人体示教的关节角度,容易 导致仿人机器人在运动过程中摔倒。使用 ZMP 补偿或线性反馈等方式补偿关节角度可使仿人机 器人在步行过程中的稳定性提高,但补偿角的计 算过程过于复杂。Seleem 等 [11] 使用 Kinect-V2 传 感器捕捉人体步态数据同时使用多项式拟合并利 用反馈线性化技术稳定双足机器人步行过程,获 得了较为自然且多样的步态轨迹,但未能充分利 用人体的示教数据,使计算过程过于复杂。面对 计算量大这一问题,机器学习通过构建“模型”思 想,大大减少了传统算法的运算量和计算过程。 Hwang 等 [12] 应用机器学习的思想对仿人机器人 的 ZMP 轨迹进行规划,并将机器人的关节角度构 成离散的动作空间,以构建机器人步行模型,进 行步态控制,但只有 16 个动作的离散动作空间机 器人动作僵硬单一。支持向量回归 (support vactor regression, SVR) 由 Cortes 等 [13] 提出,是建立在 结构风险最小化原则基础之上的一种机器学习算 法。相较于传统的机器学习算法的经验风险最小 化原则,它在最小化训练误差的同时最小化了泛 化误差的上限,并且其算法复杂度与样本的训练 维数无关,避免了维数灾难,是一种有着很强理 论基础的小样本学习方法。 1 基于 SVR 的机器人步态平衡泛化 模型的构建 采用人体示教的方法,可以使仿人机器人在 不同的步长、步态周期下动作自然地行走且大大 简化了动力学建模的计算过程。但在机器人模仿 人体步行动作时,由于两者质量分布不同,质心 在运动过程中极易发生偏移,需要通过人体示教 信息经过大量计算得到使机器人稳定步行的关节 补偿角度[14]。考虑基于 SVR 算法建立步态平衡 泛化模型,根据得到的人体示教信息直接得到经 稳定性补偿的关节角度。在保留人体示教优点且 保证稳定性的同时降低计算复杂度,增强机器人 动作模仿的实时性。 1.1 支持向量回归算法 支持向量回归模型分为线性回归模型和非线 性回归模型。考虑到人体示教数据和机器人驱动 关节角度是非线性关系,需要建立非线性回归模 型。给定样本: D ={(x1, y1),(x2, y2),··· ,(xi , yi), i =1,2,··· , l} (1) xi ∈ R n 式中: 是 n 维输入值; yi ∈ R 是一维输出值; i 为样本数量。SVR 算法构造的非线性回归模型 的思想是利用核技巧将训练数据映射到高维空间 再线性回归以简化运算。本文采用 RBF 核函数 作为 SVR 模型的核函数。其回归模型函数为 f (x) = ω·Φ(x)+b (2) ω b Φ(x) 式中:x 为模型输入的 n 维变量; 和 为训练得 到的回归模型参数; 为核函数。 ε ξi ξ ∗ i ε− 在 SVM 间隔最大化思想下,引入不敏感损失 函数 、惩罚系数 C 以及松弛变量 、 ,可得到 SVR 非线性回归模型: min (ω,b,ξi,ξi ∗ ) 1 2 ∥ω∥ 2 +C ∑l i=1 (ξi +ξi ∗ ) s.t. yi −ωΦ(x)−b ⩽ ε+ξi ωΦ(x)+b ⩽ ε+ξi ∗ ξi , ξi ∗ ⩾ 0 (3) αi α ∗ i 为了计算更加便捷,通过引入拉格朗日乘子 、 ,并通过拉格朗日乘法寻优,可以得 到 SVR 的对偶最优化问题: max (αi,αi ∗ ) ∑l i=1 αi(y−ε)− ∑l i=1 αi ∗ (y+ε)+ ∑l i, j=1 ( αj −αj ∗ ) (αi −αi ∗ )K ( xi , xj ) s.t. 0 ⩽ αi ⩽ C,0 ⩽ αi ∗ ⩽ C,i = 1,2,··· ,l ∑l i=1 (αi −αi ∗ ) = 0 (4) K ( xi , xj ) = Φ(x) T 式中: Φ(x) 为核函数,本文采 用 RBF 核函数。 由于不等式约束问题需满足的 KKT 条件可 解得 SVR 的解形式为 f(x) = ∑l i=1 ( αi −α ∗ i ) K ( xi , xj ) +b (5) b = yi +ε− ∑l i=1 ( αi −α ∗ i ) K ( xi , xj ) 式中 αi α ∗ i ε p αi α ∗ i C 综上所述,决定 SVR 算法非线性模型性能的 参数为 、 、 ,以及 RBF 核函数中自带的宽度 系数 ,其中 、 在式 (4) 的条件约束下,由惩 罚系数 决定。 ·538· 智 能 系 统 学 报 第 15 卷
第3期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·539· 1.2仿人机器人步态平衡泛化模型的构建 2基于WOA的仿人机器人步态平衡 构建步态平衡泛化模型需要在SVR算法非 泛化模型的参数寻优 线性回归模型结构的基础上,确定合适的输入和 输出。二者之间需有一定的相关关系,才能保证 采用人为确定C、p、ε这3个参数的方法很 模型有良好的泛化效果。具体选择如下:以人体 难获得性能较好的泛化模型且低效繁琐,而常用 示教的关节角度和人体步行的ZMP信息作为步 的参数寻优方法,如粒子群优化(particle swarm 态平衡模型的输入。首先,人体示教的关节角度 optimization,.PSO)算法和遗传算法(genetic al-. 是机器人模仿人体动作的基础。其次,在计算关 gorithm,GA)得到的参数在SVR非线性回归模型 节稳定性补偿角度时人体示教的ZMP信息(以 中,由于算法收敛到一定精度时无法继续优化, 能达到的精度有限,有时会产生泛化能力不够的 示教者支撑脚底部的骨骼点轨迹作为人体示教 问题。因此需要采用性能更好的优化算法对 的ZMP轨迹)是在计算关节稳定性补偿角度时 SVR回归模型的3个参数寻优,获取最佳的参 的重要依据,并且由其定义式如式(6)所示,ZMP 数,以获得更好的泛化效果。 信息包含了人体示教的质心信息和质心加速速 2.1鲸鱼优化算法 度信息: 鲸鱼优化算法(whale optimization algorithm, p=c-he (6) WOA)是一种全局随机优化算法,是一种新颖且 式中:p为示教者ZMP点;c为示教者质心;:为 效果很好的优化算法1。其过程分为2个阶段: 示教者质心加速度;h为示教者质心等价高度;g 开发阶段和探索阶段。从一组随机解开始,通过 为重力加速度。 开发阶段找到最优解的大体范围,再通过螺旋收 缩包围的机制找到最优解的具体位置。其数学模 以平衡补偿后的关节角度(即机器人驱动角 型建立如下: 度)作为输出。在稳定的基础上省去稳定性补偿 D=IC·x*(t)-x(t) 角的复杂计算,完成仿人机器人的步行控制。 x(t+1)=x*(t)-A·D 对模型输入人体的关节角度和人体在步行运 A=2a.r-a (7) 动时的ZMP信息,由SVR非线性回归模型代替 C=2.r 人体示教信息和稳定性后的关节角度之间的函数 式中:A、C均为更新系数;a为(0,2)线性递减系 关系直接泛化出经补偿的关节角度,构建模型结 数;r为(0,1)内的随机系数;x()为当前最优解; 构如图1所示。在充分利用人体示教信息的基础 x()为当前解;D为当前解与最优解间的距离。 上,保证了仿人机器人的稳定性并简化了稳定性 当4>1时,算法处于开发阶段。这种搜索方法 补偿角的计算。 体现了WOA在开发阶段,全局(线性递减)和随 机相结合的思想,具有相当的合理性。当A<1 人体示教 仿人机器人 经稳定性补偿后的 时,算法进入探索阶段,以收缩包围机制和螺旋 关节角度 步态平衡 关节角度 轨迹 模型 更新机制与原先更新机制相结合的方式去寻找最 优解。收缩包围机制通过逐步减小A的值,使当 前解接近最优解。螺旋更新机制不同于开发阶段 人体示教 的螺旋更新方式,其搜索精度更高,具体数学模 ZMP 型如下: 轨迹信息 x(0-A·D,p<0.5 图1机器人步态平衡泛化模型结构 x(t+1)= D.e.cos(2πl0+x(t),p≥0.5 (8) Fig.1 Robot gait balance generalization model structure 式中:1为(-1,1)的随机数;b为螺旋型函数;p为 模型结构确立后,由1.1节可知,确定步态平 随机概率即(0,1)的随机数。 衡泛化模型的SVR算法中的C、p、ε这3个参数 当迭代次数达到最大时,最终采用式(9)进行 变量成为了决定模型是否能输出理想的经稳定性 最优解的确定: 补偿后的关节角度的关键步骤,3个参数选取的 D=IC.xmd-x(t川 x(t+l)=xad-A·D (9) 不合适就会直接导致模型的训练误差或泛化误差 不在理想范围之内,出现过拟合和欠拟合的问 式中xa为当前最优解中随机选取的一个解。在 题。如何确定C、p、ε成为了构建模型需要解决 适应性函数选择恰当时(即能判断最优解时), 的问题。 WOA有很好地在参数空间中寻找最优解的能力
1.2 仿人机器人步态平衡泛化模型的构建 构建步态平衡泛化模型需要在 SVR 算法非 线性回归模型结构的基础上,确定合适的输入和 输出。二者之间需有一定的相关关系,才能保证 模型有良好的泛化效果。具体选择如下:以人体 示教的关节角度和人体步行的 ZMP 信息作为步 态平衡模型的输入。首先,人体示教的关节角度 是机器人模仿人体动作的基础。其次,在计算关 节稳定性补偿角度时人体示教的 ZMP 信息 (以 示教者支撑脚底部的骨骼点轨迹作为人体示教 的 ZMP 轨迹) 是在计算关节稳定性补偿角度时 的重要依据,并且由其定义式如式 (6) 所示,ZMP 信息包含了人体示教的质心信息和质心加速速 度信息: p = c− h g c¨ (6) p c c¨ h g 式中: 为示教者 ZMP 点; 为示教者质心; 为 示教者质心加速度; 为示教者质心等价高度; 为重力加速度。 以平衡补偿后的关节角度 (即机器人驱动角 度) 作为输出。在稳定的基础上省去稳定性补偿 角的复杂计算,完成仿人机器人的步行控制。 对模型输入人体的关节角度和人体在步行运 动时的 ZMP 信息,由 SVR 非线性回归模型代替 人体示教信息和稳定性后的关节角度之间的函数 关系直接泛化出经补偿的关节角度,构建模型结 构如图 1 所示。在充分利用人体示教信息的基础 上,保证了仿人机器人的稳定性并简化了稳定性 补偿角的计算。 人体示教 关节角度 轨迹 仿人机器人 步态平衡 模型 经稳定性补偿后的 关节角度 人体示教 ZMP 轨迹信息 图 1 机器人步态平衡泛化模型结构 Fig. 1 Robot gait balance generalization model structure C p ε C p ε 模型结构确立后,由 1.1 节可知,确定步态平 衡泛化模型的 SVR 算法中的 、 、 这 3 个参数 变量成为了决定模型是否能输出理想的经稳定性 补偿后的关节角度的关键步骤,3 个参数选取的 不合适就会直接导致模型的训练误差或泛化误差 不在理想范围之内,出现过拟合和欠拟合的问 题。如何确定 、 、 成为了构建模型需要解决 的问题。 2 基于 WOA 的仿人机器人步态平衡 泛化模型的参数寻优 采用人为确定 C、p、ε 这 3 个参数的方法很 难获得性能较好的泛化模型且低效繁琐,而常用 的参数寻优方法,如粒子群优化 (particle swarm optimization, PSO) 算法和遗传算法 (genetic algorithm, GA) 得到的参数在 SVR 非线性回归模型 中,由于算法收敛到一定精度时无法继续优化, 能达到的精度有限,有时会产生泛化能力不够的 问题。因此需要采用性能更好的优化算法对 SVR 回归模型的 3 个参数寻优,获取最佳的参 数,以获得更好的泛化效果。 2.1 鲸鱼优化算法 鲸鱼优化算法 (whale optimization algorithm, WOA) 是一种全局随机优化算法,是一种新颖且 效果很好的优化算法[15]。其过程分为 2 个阶段: 开发阶段和探索阶段。从一组随机解开始,通过 开发阶段找到最优解的大体范围,再通过螺旋收 缩包围的机制找到最优解的具体位置。其数学模 型建立如下: D = |C· x ∗ (t)− x(t)| x(t+1) = x ∗ (t)− A· D A = 2a ·r− a C = 2 ·r (7) A C a r x ∗ (t) x(t) D |A| > 1 |A| < 1 |A| 式中: 、 均为更新系数; 为 (0,2) 线性递减系 数; 为 (0,1) 内的随机系数; 为当前最优解; 为当前解; 为当前解与最优解间的距离。 当 时,算法处于开发阶段。这种搜索方法 体现了 WOA 在开发阶段,全局 (线性递减) 和随 机相结合的思想,具有相当的合理性。当 时,算法进入探索阶段,以收缩包围机制和螺旋 更新机制与原先更新机制相结合的方式去寻找最 优解。收缩包围机制通过逐步减小 的值,使当 前解接近最优解。螺旋更新机制不同于开发阶段 的螺旋更新方式,其搜索精度更高,具体数学模 型如下: x(t+1) = { x ∗ (t)− A· D, p < 0.5 D· e bl · cos(2πl)+x ∗ (t), p ⩾ 0.5 (8) 式中:l 为 (−1,1) 的随机数; b 为螺旋型函数; p 为 随机概率即 (0,1) 的随机数。 当迭代次数达到最大时,最终采用式 (9) 进行 最优解的确定: { D = |C· xrand − x(t)| x(t+1) = xrand − A· D (9) 式中 xrand 为当前最优解中随机选取的一个解。在 适应性函数选择恰当时 (即能判断最优解时), WOA 有很好地在参数空间中寻找最优解的能力。 第 3 期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·539·
·540· 智能系统学报 第15卷 2.2WOA与传统算法对SVR非线性回归模型参 法的训练参数的优化问题,选择MSE函数作为适 数优化的能力比较 应性函数。 在SVR非线性回归模型中,p过大会使模型 3)使用WOA迭代寻优,在寻优空间内确定 过于简单,学习精度不够;P过小,会出现过拟合, 组C、p、8,使训练的MSE值最小。 模型泛化能力变差。C和ε在选取时也会遇到相 经WOA寻优得到的C、p、E这3个参数,通 似的问题。因此,需要使用寻优算法对模型的 过训练即可获得有理想泛化效果的步态平衡模型。 3个参数进行寻优。 为了比较WOA和常用寻优算法对SVR非线 3仿真实验设计与结果分析 性回归模型寻优性能的差异。分别使用3种算法 为了验证上述方法的有效性,设计构建仿真 (GA、PSO算法和WOA)对SVR非线性回归模型 进行参数寻优并对3种算法的寻优效果进行对比, 环境及过程如下: 具体方法如下:使用风速时间序列预测的数据集 1)使用Kinect2.0对人体步行动作进行数据 (非线性回归问题与步态问题同样具有周期性和非 采集。Kinect2.0是一款能对人体的骨骼点信息进 线性的特点)在同一寻优空间内,分别使用GA、 行跟踪,记录体感的采集器,它能对人体的25个 PSO算法和WOA对SVR非线性回归模型进行参 骨骼点进行跟踪,并记录其三维坐标(x,八,)。 数寻优,使用均方误差(MSE)作为性能指标来评 2)在MATLAB中,对人体示教数据进行处理 估3种算法的参数寻优效果,其结果如表1所示。 并构建平衡泛化模型,具体步骤为:运用空间向 量法进行人体关节角度的计算;通过人体在步行 表13种算法对SVR非线性回归模型寻优效果比较 Table 1 Comparison of effects of three algorithms for SVR 运动双脚的高度选取支撑脚,以此脚底部的骨骼 nonlinear regression model 点作为ZMP信息提取,并进行数据预处理(归一 算法 C、p、E 训练MSE/rad 泛化MSE/rad 化);SVR非线性模型构建;利用模仿学习计算平 C=28、p=5 衡性补偿角的方式到经补偿后的机器人关节角度 GA 0.101 1.36 e=0.21 构成训练集和测试集;WOA参数寻优:步态平衡 C=2.7、p=0.1 泛化模型训练和泛化。 PSO 0.304 0.783 8=0.01 3)在WEBOTS的仿真平台上,使用模型泛化 C=76、p-0.0 补偿后的关节角驱动NAO机器人,观察其运动 WOA 0.095 0.666 =0.01 效果。其中,NAO机器人是由Aldebaran Robot-. ics公司研发的有着13个关节25个自由度的仿 从表1的结果可以看出,WOA在与GA对比 中虽然训练误差差距不明显,但其泛化误差有着 人机器人,适合作为仿人机器人算法的研究平台。 显著优势(GA过拟合)。而与PSO算法对比,训 仿真整体结构如图2所示。 练误差和泛化误差都有着明显的提升。因此可以 测试 看出,WOA在寻优精度上高于其他2种算法,训 集 练误差和泛化能力都优于2种常用的SVR参数 计算 人体 数据 关节角度 训练 SVR 步态平 优化算法。 步行 采集 提取ZMP 集 回归模型 衡模型 2.3基于WOA优化算法的机器人步态平衡泛化 点信息 WOA 模型的参数优化 寻优 在以SVR为基础的步态平衡模型中,为了获 取最佳的仿人机器人步态平衡泛化模型,需对 泛化输出 3个参数使用WOA进行寻优,在此之前,需确定 驱动角度 3个参数的寻优空间,过小会导致最佳参数在寻 优空间之外,过大会影响寻优的效率。结合SVR 图2仿真流程图 模型在关节角度控制应用中的3个关键参数的寻 Fig.2 Simulation flowchart 优范围的经验,对该寻优范围的上下限进行适 3.1 仿人机器人步态平衡模型的训练 当地扩大,具体步骤如下: Kinect2.0采集一组人体行走数据,共177个 1)确定3个参数的寻优范围分别为p0.005,0.3)、 数据点(一个步态周期),前130个作为训练集,后 C(0.05,3)、(1,4),构成WOA的寻优空间。 47个作为测试集。由于仿人机器人的关节较多, 2)构建WOA的适应性函数。针对E-SVR算 在其步行运动过程中,通过调整髋关节和踝关节
2.2 WOA 与传统算法对 SVR 非线性回归模型参 数优化的能力比较 ε 在 SVR 非线性回归模型中,p 过大会使模型 过于简单,学习精度不够;p 过小,会出现过拟合, 模型泛化能力变差。C 和 在选取时也会遇到相 似的问题。因此,需要使用寻优算法对模型的 3 个参数进行寻优。 为了比较 WOA 和常用寻优算法对 SVR 非线 性回归模型寻优性能的差异。分别使用 3 种算法 (GA、PSO 算法和 WOA) 对 SVR 非线性回归模型 进行参数寻优并对 3 种算法的寻优效果进行对比, 具体方法如下:使用风速时间序列预测的数据集 (非线性回归问题与步态问题同样具有周期性和非 线性的特点) 在同一寻优空间内,分别使用 GA、 PSO 算法和 WOA 对 SVR 非线性回归模型进行参 数寻优,使用均方误差 (MSE) 作为性能指标来评 估 3 种算法的参数寻优效果,其结果如表 1 所示。 表 1 3 种算法对 SVR 非线性回归模型寻优效果比较 Table 1 Comparison of effects of three algorithms for SVR nonlinear regression model 算法 C、p、ε 训练MSE/rad 泛化MSE/rad GA ε C=28、p=5、 =0.21 0.101 1.36 PSO ε C=2.7、p=0.1、 =0.01 0.304 0.783 WOA ε C=76、p=0.0、 =0.01 0.095 0.666 从表 1 的结果可以看出,WOA 在与 GA 对比 中虽然训练误差差距不明显,但其泛化误差有着 显著优势 (GA 过拟合)。而与 PSO 算法对比,训 练误差和泛化误差都有着明显的提升。因此可以 看出,WOA 在寻优精度上高于其他 2 种算法,训 练误差和泛化能力都优于 2 种常用的 SVR 参数 优化算法。 2.3 基于 WOA 优化算法的机器人步态平衡泛化 模型的参数优化 在以 SVR 为基础的步态平衡模型中,为了获 取最佳的仿人机器人步态平衡泛化模型,需对 3 个参数使用 WOA 进行寻优,在此之前,需确定 3 个参数的寻优空间,过小会导致最佳参数在寻 优空间之外,过大会影响寻优的效率。结合 SVR 模型在关节角度控制应用中的 3 个关键参数的寻 优范围的经验[16] ,对该寻优范围的上下限进行适 当地扩大,具体步骤如下: p C ε 1) 确定 3 个参数的寻优范围分别为 (0.005,0.3)、 (0.05,3)、 (1,4),构成 WOA 的寻优空间。 2) 构建 WOA 的适应性函数。针对 ε−SVR 算 法的训练参数的优化问题,选择 MSE 函数作为适 应性函数。 ε 3) 使用 WOA 迭代寻优,在寻优空间内确定 一组 C、p、 ,使训练的 MSE 值最小。 经 WOA 寻优得到的 C、p、ε 这 3 个参数,通 过训练即可获得有理想泛化效果的步态平衡模型。 3 仿真实验设计与结果分析 为了验证上述方法的有效性,设计构建仿真 环境及过程如下: 1) 使用 Kinect2.0 对人体步行动作进行数据 采集。Kinect2.0 是一款能对人体的骨骼点信息进 行跟踪,记录体感的采集器,它能对人体的 25 个 骨骼点进行跟踪,并记录其三维坐标 (x,y,z)。 2) 在 MATLAB 中,对人体示教数据进行处理 并构建平衡泛化模型,具体步骤为:运用空间向 量法进行人体关节角度的计算;通过人体在步行 运动双脚的高度选取支撑脚,以此脚底部的骨骼 点作为 ZMP 信息提取,并进行数据预处理 (归一 化);SVR 非线性模型构建;利用模仿学习计算平 衡性补偿角的方式到经补偿后的机器人关节角度 构成训练集和测试集;WOA 参数寻优;步态平衡 泛化模型训练和泛化。 3) 在 WEBOTS 的仿真平台上,使用模型泛化 补偿后的关节角驱动 NAO 机器人,观察其运动 效果。其中,NAO 机器人是由 Aldebaran Robotics 公司研发的有着 13 个关节 25 个自由度的仿 人机器人,适合作为仿人机器人算法的研究平台。 仿真整体结构如图 2 所示。 测试 集 训练 集 SVR 回归模型 步态平 衡模型 计算 关节角度、 提取 ZMP 点信息 人体 步行 数据 采集 WOA 寻优 泛化输出 驱动角度 图 2 仿真流程图 Fig. 2 Simulation flowchart 3.1 仿人机器人步态平衡模型的训练 Kinect2.0 采集一组人体行走数据,共 177 个 数据点 (一个步态周期),前 130 个作为训练集,后 47 个作为测试集。由于仿人机器人的关节较多, 在其步行运动过程中,通过调整髋关节和踝关节 ·540· 智 能 系 统 学 报 第 15 卷
第3期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·541· 8个关节角度便可以实现稳态步行。因此以左腿 分析表2中的数据可以看出,由WOA寻优 为例,对左腿髋关节和踝关节的4个关节角度进 确定的仿人机器人步态平衡泛化模型,对训练集 行步态平衡模型的构建和训练。机器人踝关节的 样本关节角度的拟合效果较为理想,精确度和相 平衡泛化模型结构如图3所示。 关性较高。 人体示教踝 仿人机器人 仿人机器人踝 3.2仿人机器人步态平衡模型的泛化 关节角度 步态平衡 关节滚动角/ 轨迹 模型 俯仰角驱动角度 使用测试集对训练好的步态平衡模型进行测 试,由模型直接泛化得到的经补偿的关节角度与 由传统算法得到的关节角度(理想角度)对比,如 人体示教 ZMP 图5、图6所示。 轨迹W☑ 向信息 0.6 一模型泛化角度 图3踝关节步态平衡泛化模型结构图 0.4 …理想角度 Fig.3 Ankle joint gait balance generalization model struc- 0.2 ture diagram 0 运用WOA对左腿的不同关节角的平衡模型 进行参数寻优,以踝关节滚动角为例,其寻优过 05101520253035404550 时间序列/帧 程的MSE值(均方误差)变化曲线如图4所示。 (a)俯仰角 0.15 一模型泛化角度 理想角度 o 0 5 10152025.3035404550 400 800120016002000 时间序列/帧 选代周期/个 (b)滚动角 图4WOA寻优MSE变化曲线图 图5髋关节泛化结果 Fig.4 WOA optimization MSE curve Fig.5 Hip generalization results 在寻优确定参数的条件下,使用训练集对模 0.10 型进行训练,训练结果如表2所示。 0.05 表2仿人机器人步态平衡泛化模型的训练参数及训练 0 性能指标 经0.05 Table 2 Training parameters and training performance -0.10 模型泛化角度 indicators of humanoid robot gait balance gener- -0.15 理想角度 alization model 日-020 0 5 101520253035404550 时间序列/帧 R(相关系数 均方误差/ 关节角度名称 C、p、e (a)俯仰角 的平方) rad 0.6 C=1.96 0.4 模型泛化角度 理想角度 踝关节滚动角 p=0.010 0.908 0.00133 0.2 =2.42 0 C=2 -0.2 踝关节俯仰角 p-0.011 0.972 0.000172 -0.4 0 5 101520253035404550 =4 时间序列/顿 C=2 (b)滚动角 髋关节俯仰角 p=0.10 0.898 0.00287 图6踝关节泛化结果 =0.4 Fig.6 Ankle generalization results C=1.3 从图5、图6中可以看出,对比模型泛化得到 髋关节滚动角 p=0.0010 0.985 3.62e-06 的关节角度与理想的关节角度,其均方误差和相 64 关系数如表3所示
8 个关节角度便可以实现稳态步行。因此以左腿 为例,对左腿髋关节和踝关节的 4 个关节角度进 行步态平衡模型的构建和训练。机器人踝关节的 平衡泛化模型结构如图 3 所示。 人体示教踝 关节角度 轨迹 仿人机器人 步态平衡 模型 仿人机器人踝 关节滚动角/ 俯仰角驱动角度 人体示教 ZMP 轨迹 X/Z 向信息 图 3 踝关节步态平衡泛化模型结构图 Fig. 3 Ankle joint gait balance generalization model structure diagram 运用 WOA 对左腿的不同关节角的平衡模型 进行参数寻优,以踝关节滚动角为例,其寻优过 程的 MSE 值 (均方误差) 变化曲线如图 4 所示。 MSE ×10−4 8 6 4 2 0 400 800 1 200 1 600 2 000 迭代周期/个 图 4 WOA 寻优 MSE 变化曲线图 Fig. 4 WOA optimization MSE curve 在寻优确定参数的条件下,使用训练集对模 型进行训练,训练结果如表 2 所示。 表 2 仿人机器人步态平衡泛化模型的训练参数及训练 性能指标 Table 2 Training parameters and training performance indicators of humanoid robot gait balance generalization model 关节角度名称 C、p、ε R 2 (相关系数 的平方) 均方误差/ rad 踝关节滚动角 C=1.96 p=0.010 ε=2.42 0.908 0.001 33 踝关节俯仰角 C=2 p=0.011 ε=4 0.972 0.000 172 髋关节俯仰角 C=2 p=0.10 ε=0.4 0.898 0.002 87 髋关节滚动角 C=1.3 p=0.001 0 ε=4 0.985 3.62e-06 分析表 2 中的数据可以看出,由 WOA 寻优 确定的仿人机器人步态平衡泛化模型,对训练集 样本关节角度的拟合效果较为理想,精确度和相 关性较高。 3.2 仿人机器人步态平衡模型的泛化 使用测试集对训练好的步态平衡模型进行测 试,由模型直接泛化得到的经补偿的关节角度与 由传统算法得到的关节角度 (理想角度) 对比,如 图 5、图 6 所示。 左腿髋关节俯仰角/rad 左腿髋关节滚动角/rad 时间序列/帧 时间序列/帧 模型泛化角度 理想角度 模型泛化角度 理想角度 0.6 0.4 0.2 0 −0.2 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 (a) 俯仰角 (b) 滚动角 0.15 0.10 0.05 图 5 髋关节泛化结果 Fig. 5 Hip generalization results 0.10 0.05 0 −0.05 −0.10 −0.15 −0.20 模型泛化角度 理想角度 模型泛化角度 理想角度 时间序列/帧 0 5 10 15 20 25 30 35 40 45 50 时间序列/帧 0 5 10 15 20 25 30 35 40 45 50 (a) 俯仰角 左腿髋关节俯仰角/rad 左腿髋关节滚动角/rad 0.6 0.4 0.2 0 −0.2 −0.4 (b) 滚动角 图 6 踝关节泛化结果 Fig. 6 Ankle generalization results 从图 5、图 6 中可以看出,对比模型泛化得到 的关节角度与理想的关节角度,其均方误差和相 关系数如表 3 所示。 第 3 期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·541·
·542· 智能系统学报 第15卷 表3仿人机器人步态平衡泛化模型在同一步长、步态周 期下的泛化性能指标 Table 3 Generalized performance indicators of humanoid robot gait balance generalization model under the same step and gait cycle 关节角度名称 R(相关系数) 均方误差rad 踝关节滚动角 0.985 0.00504757 踝关节俯仰角 0.970 0.00194947 髋关节俯仰角 0.866 0.0117494 髋关节滚动角 0.995 8.8756e-06 图8模型泛化角度值在WEBOTS仿真平台上的稳定步行 从表3中可以看出,模型得到的关节角度 Fig.8 Model generalized angle values for stable walking on the WEBOTS simulation platform 序列与理想的关节角度序列的相关系数在 0.866以上而均方误差则控制在了0.0117以内, 从上述结果可以看出,通过引入步态平衡泛 证明仿人机器人步态平衡模型有着很好的泛化 化模型可以在减少复杂计算过程的基础上使机器 能力。 人能够完成稳态步行,且具有很好的稳定性。 为了验证机器人在泛化得到的关节角度的驱 以上泛化结果为同一次示教的数据拆分成 动下具有稳定性。利用模型的泛化结果与理想的 的训练集和测试集,因此示教步行动作的步长和 关节角度的差值及式(8)得到机器人的质心偏 步态周期相同。但不同示教人在示教时(甚至同 移量: 示教人在非同一次示教时)可能会产生步长和 6e=J6。 (10) 步态周期上的差异。为了验证步态平衡泛化模 式中:6。为质心偏移量;J为仿人机器人雅克比矩 型不同示教人的示教信息的泛化能力,使用Ki- 阵;6。为模型泛化角度与理想角度的偏差值。 ect采集76个与训练集步长,步态周期均不同的 机器人的在模型泛化角度下驱动机器人运动 人体行走数据点(两个步态周期),用上一节中训 的ZMP轨迹如图7所示。 练好的步态平衡模型对其进行泛化。模型得到 的经补偿后的关节角度与理想角度的对比如图9、 1.1 图10所示,所计算的机器人实际ZMP轨迹如图11 1.0 所示。 0.9 0.40 08 一模型泛化角度 0.30 理想角度 0.7 0.20 0.10 0.6 0 0 1020304050607080 0 0.02 0.040.06 0.080.10 时间序列帧 (a)模型参数C=2、=0.353、p=0.001 图7同一步长、步态周期下在泛化驱动角度下机器人 0.12 一模型泛化角度 ZMP轨迹 0.10 理想角度 Fig.7 Robot ZMP trajectory at generalized driving angle 0.08 under the same step and gait cycle 0.06 从图7中可以看出,通过模型泛化出的关节 0.04 0.02 角度驱动机器人运动,其ZMP轨迹波动很小,且 0 1020304050607080 时间序列帧 在机器人足部的支撑方框之内,证明机器人在模 (b)模型参数C=2、=3.97、p0.001 仿人体步行运动时不会摔倒。 图9不同步长、步态周期下左腿髋关节泛化结果 由如图8可以看出,NAO机器人在WEBOTS Fig.9 Generalization of left hip pitch under different gait 环境下可以平稳地步行。 long and gait cycles
表 3 仿人机器人步态平衡泛化模型在同一步长、步态周 期下的泛化性能指标 Table 3 Generalized performance indicators of humanoid robot gait balance generalization model under the same step and gait cycle 关节角度名称 R(相关系数) 均方误差/rad 踝关节滚动角 0.985 0.005 047 57 踝关节俯仰角 0.970 0.001 949 47 髋关节俯仰角 0.866 0.011 749 4 髋关节滚动角 0.995 8.875 6e-06 从表 3 中可以看出,模型得到的关节角度 序列与理想的关节角度序列的相关系数 在 0.866 以上而均方误差则控制在了 0.011 7 以内, 证明仿人机器人步态平衡模型有着很好的泛化 能力。 为了验证机器人在泛化得到的关节角度的驱 动下具有稳定性。利用模型的泛化结果与理想的 关节角度的差值及式 (8) 得到机器人的质心偏 移量: δc = Jδα (10) δc J δα 式中: 为质心偏移量; 为仿人机器人雅克比矩 阵; 为模型泛化角度与理想角度的偏差值。 机器人的在模型泛化角度下驱动机器人运动 的 ZMP 轨迹如图 7 所示。 Z/m X/m 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0 0.04 0.06 0.08 0.10 0.02 图 7 同一步长、步态周期下在泛化驱动角度下机器人 ZMP 轨迹 Fig. 7 Robot ZMP trajectory at generalized driving angle under the same step and gait cycle 从图 7 中可以看出,通过模型泛化出的关节 角度驱动机器人运动,其 ZMP 轨迹波动很小,且 在机器人足部的支撑方框之内,证明机器人在模 仿人体步行运动时不会摔倒。 由如图 8 可以看出,NAO 机器人在 WEBOTS 环境下可以平稳地步行。 图 8 模型泛化角度值在 WEBOTS 仿真平台上的稳定步行 Fig. 8 Model generalized angle values for stable walking on the WEBOTS simulation platform 从上述结果可以看出,通过引入步态平衡泛 化模型可以在减少复杂计算过程的基础上使机器 人能够完成稳态步行,且具有很好的稳定性。 以上泛化结果为同一次示教的数据拆分成 的训练集和测试集,因此示教步行动作的步长和 步态周期相同。但不同示教人在示教时 (甚至同 一示教人在非同一次示教时) 可能会产生步长和 步态周期上的差异。为了验证步态平衡泛化模 型不同示教人的示教信息的泛化能力,使用 Kinect 采集 76 个与训练集步长,步态周期均不同的 人体行走数据点 (两个步态周期),用上一节中训 练好的步态平衡模型对其进行泛化。模型得到 的经补偿后的关节角度与理想角度的对比如图 9、 图 10 所示,所计算的机器人实际 ZMP 轨迹如图 11 所示。 模型泛化角度 理想角度 0.40 0.30 0.20 0.10 0 −0.10 0 10 20 30 40 50 60 70 80 时间序列/帧 模型泛化角度 理想角度 0.12 0.10 0.08 0.06 0.04 0.02 0 10 20 30 40 50 60 70 80 时间序列/帧 (a) 模型参数 C=2、ε=0.353、p=0.001 (b) 模型参数 C=2、ε=3.97、p=0.001 左腿髋关节俯仰角/rad 左腿髋关节滚动角/rad 图 9 不同步长、步态周期下左腿髋关节泛化结果 Fig. 9 Generalization of left hip pitch under different gait long and gait cycles ·542· 智 能 系 统 学 报 第 15 卷
第3期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·543· 0.3 一模型泛化角度 在不同步长和步态周期的示教数据下模型泛 0.2 0.1 理想角度 化的关节角度误差较小,ZMP轨迹还在机器人足 0 部支撑方框内,因此步态平衡泛化模型能在不同 -0.1 0.2 示教者示教的情况下减少补偿角计算并保证步行 -0.3 -0. 稳定。不足之处有以下两点: 0 10203040.5060 70 80 时间序列/顿 l)由于Kinect是一款非专业的体感采集器, (a)模型参数C=2、=4、p=0.0015 其测量范围有一定的限制,太远或太近都会使测 0.6 量误差过大,无法进行一组两个以上步行动作的 模型泛化角度 0.4 理想角度 采集。同时结合同一步长、步态周期下,泛化的 0.2 起始点与理想的起始点有一些偏差,导致在循环 0 动作时机器人会有一定不自然动作,甚至会导致 -0.2 机器人不稳定、摔倒。因此,在保证机器人稳定 -0. 0 10203040506070 80 的基础上,步态周期间的平滑切换(连续步态周 时间序列/帧 (b)模型参数C=1.96、6=2.42、=0.00104 期的关节角度时间序列预测)是下一阶段工作的 重点之一19 图10不同步长、步态周期下左脚踝关节泛化果 Fig.10 Generalization of left ankle roll under non-syn- 2)在不同步长、步态周期下的模型泛化效果 chronized and gait cycles 与同一步长、步态周期下的相比不够理想。因 1.2 此,进一步优化模型的算法和选择训练模型数据 1.1 是构建针对仿人机器人不同组步行数据下的平 1.0 衡泛化模型和构建步态循环模型的需要解决的 E0.9 0.8 问题。 0.7 4结束语 0.6 -0.02 0 0.020.04 0.06 0.08 仿真结果表明,仿人机器人步态平衡泛化模 m 型可以在相同和不同步长和步态周期下有效地泛 图11不同步长、步态周期下的机器人ZMP轨迹 化机器人经稳定性补偿的关节角度,其泛化角度 Fig.11 Robot ZMP trajectory under different gait long and gait cycle 与理想角度的误差较小。使用泛化得到的角度 从表4的模型泛化结果中可以看到,与同一 在WEBOTS仿真平台上驱动NAO机器人,可使 步长、步态周期下的泛化效果相比,模型对不同 其稳定步行。证明了步态平衡泛化模型在保留模 步长、步态周期下的示教数据泛化得到的4个关 仿学习动作自然,运动方式多样的优点的同时, 节角度值与理想的关节角度值相比虽然最大均 简化了稳定性补偿角的计算过程,增强了机器人 方误差增加到了0.0118,相关系数也降低到了 模仿人体运动的实时性,并保证了机器人运动过 0.794,机器人的实际ZMP也有轻微波动,机器人 程的稳定性。 的稳定性方面也与同一步长、步态周期下的数据 训练的模型存在一定差距。但在WEBOTS仿真 参考文献: 平台上进行仿真,NAO机器人仍能进行较为平稳 [1]WANG Fei,WANG Yaning,WEN Shiguang,et al.Nao 的步行运动。 humanoid robot gait planning based on the linear inverted 表4不同步长、步态周期下的泛化性能指标 pendulum[C]//Proceedings of 2012 24th Chinese Control Table 4 Generalized performance indicators of unsyn- and Decision Conference.Taiyuan,China,2012:986-990 chronized and long gait cycles [2]DONG Enzeng.WANG Dandan,CHEN Chao,et al.Real- 关节角度名称 R(相关系数) 均方误差 ization of biped robot gait planning based on NAO robot 踝关节滚动角 0.995 0.00099308 development platform[Cl//Proceedings of 2016 IEEE Inter- 踝关节俯仰角 0.938 0.00288963 national Conference on Mechatronics and Automation. 髋关节俯仰角 0.794 0.0118455 髋关节滚动角 Harbin,China,2016:1073-1077. 0.989 1.1969e-05 [3]ZHANG Ying,LI Shuanghong,HAN Boyu,et al.Re-
0.3 0.2 0.1 0 −0.1 −0.2 −0.3 −0.4 0 10 20 30 40 50 60 70 80 时间序列/帧 0 10 20 30 40 50 60 70 80 时间序列/帧 左腿踝关节俯仰角/rad 模型泛化角度 理想角度 模型泛化角度 理想角度 (a) 模型参数 C=2、ε=4、p=0.001 5 (b) 模型参数 C=1.96、ε=2.42、p=0.001 04 0.6 0.4 0.2 0 −0.2 左腿踝关节滚动角 −0.4 /rad 图 10 不同步长、步态周期下左脚踝关节泛化果 Fig. 10 Generalization of left ankle roll under non-synchronized and gait cycles 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 −0.02 0 0.02 0.04 0.06 0.08 Z/m X/m 图 11 不同步长、步态周期下的机器人 ZMP 轨迹 Fig. 11 Robot ZMP trajectory under different gait long and gait cycle 从表 4 的模型泛化结果中可以看到,与同一 步长、步态周期下的泛化效果相比,模型对不同 步长、步态周期下的示教数据泛化得到的 4 个关 节角度值与理想的关节角度值相比虽然最大均 方误差增加到了 0.011 8,相关系数也降低到了 0.794,机器人的实际 ZMP 也有轻微波动,机器人 的稳定性方面也与同一步长、步态周期下的数据 训练的模型存在一定差距。但在 WEBOTS 仿真 平台上进行仿真,NAO 机器人仍能进行较为平稳 的步行运动。 表 4 不同步长、步态周期下的泛化性能指标 Table 4 Generalized performance indicators of unsynchronized and long gait cycles 关节角度名称 R(相关系数) 均方误差 踝关节滚动角 0.995 0.000 993 08 踝关节俯仰角 0.938 0.002 889 63 髋关节俯仰角 0.794 0.011 845 5 髋关节滚动角 0.989 1.196 9e-05 在不同步长和步态周期的示教数据下模型泛 化的关节角度误差较小,ZMP 轨迹还在机器人足 部支撑方框内,因此步态平衡泛化模型能在不同 示教者示教的情况下减少补偿角计算并保证步行 稳定。不足之处有以下两点: 1) 由于 Kinect 是一款非专业的体感采集器, 其测量范围有一定的限制,太远或太近都会使测 量误差过大,无法进行一组两个以上步行动作的 采集。同时结合同一步长、步态周期下,泛化的 起始点与理想的起始点有一些偏差,导致在循环 动作时机器人会有一定不自然动作,甚至会导致 机器人不稳定、摔倒。因此,在保证机器人稳定 的基础上,步态周期间的平滑切换 (连续步态周 期的关节角度时间序列预测) 是下一阶段工作的 重点之一[17-19]。 2) 在不同步长、步态周期下的模型泛化效果 与同一步长、步态周期下的相比不够理想。因 此,进一步优化模型的算法和选择训练模型数据 是构建针对仿人机器人不同组步行数据下的平 衡泛化模型和构建步态循环模型的需要解决的 问题。 4 结束语 仿真结果表明,仿人机器人步态平衡泛化模 型可以在相同和不同步长和步态周期下有效地泛 化机器人经稳定性补偿的关节角度,其泛化角度 与理想角度的误差较小。使用泛化得到的角度 在 WEBOTS 仿真平台上驱动 NAO 机器人,可使 其稳定步行。证明了步态平衡泛化模型在保留模 仿学习动作自然,运动方式多样的优点的同时, 简化了稳定性补偿角的计算过程,增强了机器人 模仿人体运动的实时性,并保证了机器人运动过 程的稳定性。 参考文献: WANG Fei, WANG Yaning, WEN Shiguang, et al. Nao humanoid robot gait planning based on the linear inverted pendulum[C]//Proceedings of 2012 24th Chinese Control and Decision Conference. Taiyuan, China, 2012: 986−990. [1] DONG Enzeng, WANG Dandan, CHEN Chao, et al. Realization of biped robot gait planning based on NAO robot development platform[C]//Proceedings of 2016 IEEE International Conference on Mechatronics and Automation. Harbin, China, 2016: 1073−1077. [2] [3] ZHANG Ying, LI Shuanghong, HAN Boyu, et al. Re- 第 3 期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·543·
·544· 智能系统学报 第15卷 search on gait planning and inverse kinematics solving of gait planning and control of underactuated five-link biped biped walking robots[Cl//Proceedings of 2015 8th Interna- robot during single support and impact phases for normal tional Symposium on Computational Intelligence and walking[C]//Proceedings of 2018 IEEE International Con- Design.Hangzhou,China,2015:629-632. ference on Industrial Technology.Lyon,France,2018: [4]KHAZENIFARD A.BAHRAMI F.ANDANI M E.et al. 123-128. An energy efficient gait trajectory planning algorithm for a [12]LIN Jinling,HWANG K S,JIANG Weicheng,et al.Gait seven linked biped robot using movement elements[C]// balance and acceleration of a biped robot based on Q- Proceedings of 2015 23rd Iranian Conference on Electrical learning[J].IEEE access,2016,4:2439-2449. Engineering.Tehran,Iran,2015:1006-1011. [13]CORTES C,VAPNIK V.Support-vector networks[J]. [5]付根平,杨宜民,黄春林.基于粒子群优化算法的双足机 Machine learning,1995,20(3):273-297. 器人步态优化】.华中科技大学学报(自然科学版), [14]于建均,张远,左国玉,等.基于ZMP判据的仿人机器 2011,39S2):355-358. 人步态模仿[J].北京工业大学学报,2018,44(9): 1187-1192 FU Genping,YANG Yimin,HUANG Chunlin.Walking YU Jianjun,ZHANG Yuan,ZUO Guoyu,et al.Hu- pattern optimization based on particle swarm optimization manoid robot gait imitation based on ZMP criterion[J]. for biped robot[J].Journal of Huazhong University of Sci- Journal of Beijing University of Technology,2018,44(9): ence and Technology (nature science edition),2011, 1187-1192 39(S2):355-358 [15]ALZAQEBAH A,MASADEH R,HUDAIB A.Whale [6]YAMAGUCHI A.HYON S H.OGASAWARA T.Rein- optimization algorithm for requirements prioritization[Cl// forcement learning for balancer embedded humanoid loco- Proceedings of 2018 9th International Conference on In- motion[Cl//Proceedings of 2010 10th IEEE-RAS Interna- formation and Communication Systems.Irbid,Jordan. tional Conference on Humanoid Robots.Nashville,USA. 2018:84-89 2010:308-313. [16]FERREIRA J P.CRISOSTOMO M.COIMBRA A P. [7]KANG Zhongrun,DENG Muqing,WANG Cong.Frontal- SVR control of the sagittal balance of a biped robot com- view human gait recognition based on kinect Features and bining torso and ankle joints[Cl//Proceedings of 2010 deterministic learning[C]//Proceedings of 2017 36th World Automation Congress.Kobe,Japan,2010:1-9. Chinese Control Conference.Dalian,China,2017: [17]DING Zhen,YANG Chifu,XING Kai,et al.The real 10834-10839 time gait phase detection based on long short-term [8]SELEEMI A,ASSAL S F M.Sliding mode control of un- memory[C]//Proceedings of 2018 IEEE Third Internation- al Conference on Data Science in Cyberspace.Guang- deractuated five-link biped robot for climbing stairs based zhou,China,2018:33-38 on real human data[C]//Proceedings of 2017 IEEE Interna- [18]雷森,史振威,石天阳,等.基于递归神经网络的风暴潮 tional Conference on Industrial Technology.Toronto, 增水预测[).智能系统学报,2017,12(5):640-644. Canada,2017:878-883 LEI Sen,SHI Zhenwei,SHI Tianyang,et al.Prediction of [9]赵蛛颖,徐文杰,郑雪林,等.基于体感的机器人展示系 storm surge based on recurrent neural network[J].CAAI 统研究与开发U.机器人技术与应用,2012(6):54-57. transactions on intelligent systems,2017,12(5):640-644. ZHAO Shuying,XU Wenjie,ZHENG Xuelin,et al.Re- [19]FENG Yang,LI Yuncheng,LUO Jiebo,et al.Learning ef- search and development of display system of Nao hu- fective Gait features using LSTM[C]//Proceedings of manoid robot based on posture perception[J].Robot tech- 2016 23rd International Conference on Pattern Recogni- nique and application,2012(6):54-57. tion.Cancun,Mexico,2016:325-330. [I0们于建均,门玉森,阮晓钢,等.基于Kinect的Nao机器人 作者简介: 动作模仿系统的研究与实现).智能系统学报,2016 于建均,副教授,主要研究方向为 11(2):180-187 智能机器人的仿生自主控制、智能计 YU Jianjun,MEN Yusen,RUAN Xiaogang,et al.The re- 算与智能优化控制、复杂过程建模、优 化与控制。主持或参与国家“863”计 search and implementation of behavior imitation system 划项目、国家自然科学基金项目以及 about Nao robot based on Kinect[J].CAAl transactions 横向科研课题多项。获国家发明专 on intelligent systems,2016,11(2):180-187 利、实用新型专利、国家软件著作权 [11]SELEEMI A,ASSAL S F M,MOHAMED A M.Cyclic 等10余项,发表学术论文40余篇
search on gait planning and inverse kinematics solving of biped walking robots[C]//Proceedings of 2015 8th International Symposium on Computational Intelligence and Design. Hangzhou, China, 2015: 629−632. KHAZENIFARD A, BAHRAMI F, ANDANI M E, et al. An energy efficient gait trajectory planning algorithm for a seven linked biped robot using movement elements[C]// Proceedings of 2015 23rd Iranian Conference on Electrical Engineering. Tehran, Iran, 2015: 1006−1011. [4] 付根平, 杨宜民, 黄春林. 基于粒子群优化算法的双足机 器人步态优化 [J]. 华中科技大学学报(自然科学版), 2011, 39(S2): 355–358. FU Genping, YANG Yimin, HUANG Chunlin. Walking pattern optimization based on particle swarm optimization for biped robot[J]. Journal of Huazhong University of Science and Technology (nature science edition), 2011, 39(S2): 355–358. [5] YAMAGUCHI A, HYON S H, OGASAWARA T. Reinforcement learning for balancer embedded humanoid locomotion[C]//Proceedings of 2010 10th IEEE-RAS International Conference on Humanoid Robots. Nashville, USA, 2010: 308−313. [6] KANG Zhongrun, DENG Muqing, WANG Cong. Frontalview human gait recognition based on kinect Features and deterministic learning[C]//Proceedings of 2017 36th Chinese Control Conference. Dalian, China, 2017: 10834−10839. [7] SELEEM I A, ASSAL S F M. Sliding mode control of underactuated five-link biped robot for climbing stairs based on real human data[C]//Proceedings of 2017 IEEE International Conference on Industrial Technology. Toronto, Canada, 2017: 878−883. [8] 赵姝颖, 徐文杰, 郑雪林, 等. 基于体感的机器人展示系 统研究与开发 [J]. 机器人技术与应用, 2012(6): 54–57. ZHAO Shuying, XU Wenjie, ZHENG Xuelin, et al. Research and development of display system of Nao humanoid robot based on posture perception[J]. Robot technique and application, 2012(6): 54–57. [9] 于建均, 门玉森, 阮晓钢, 等. 基于 Kinect 的 Nao 机器人 动作模仿系统的研究与实现 [J]. 智能系统学报, 2016, 11(2): 180–187. YU Jianjun, MEN Yusen, RUAN Xiaogang, et al. The research and implementation of behavior imitation system about Nao robot based on Kinect[J]. CAAI transactions on intelligent systems, 2016, 11(2): 180–187. [10] [11] SELEEM I A, ASSAL S F M, MOHAMED A M. Cyclic gait planning and control of underactuated five-link biped robot during single support and impact phases for normal walking[C]//Proceedings of 2018 IEEE International Conference on Industrial Technology. Lyon, France, 2018: 123−128. LIN Jinling, HWANG K S, JIANG Weicheng, et al. Gait balance and acceleration of a biped robot based on Qlearning[J]. IEEE access, 2016, 4: 2439–2449. [12] CORTES C, VAPNIK V. Support-vector networks[J]. Machine learning, 1995, 20(3): 273–297. [13] 于建均, 张远, 左国玉, 等. 基于 ZMP 判据的仿人机器 人步态模仿 [J]. 北京工业大学学报, 2018, 44(9): 1187–1192. YU Jianjun, ZHANG Yuan, ZUO Guoyu, et al. Humanoid robot gait imitation based on ZMP criterion[J]. Journal of Beijing University of Technology, 2018, 44(9): 1187–1192. [14] ALZAQEBAH A, MASADEH R, HUDAIB A. Whale optimization algorithm for requirements prioritization[C]// Proceedings of 2018 9th International Conference on Information and Communication Systems. Irbid, Jordan, 2018: 84−89. [15] FERREIRA J P, CRISÓSTOMO M, COIMBRA A P. SVR control of the sagittal balance of a biped robot combining torso and ankle joints[C]//Proceedings of 2010 World Automation Congress. Kobe, Japan, 2010: 1−9. [16] DING Zhen, YANG Chifu, XING Kai, et al. The real time gait phase detection based on long short-term memory[C]//Proceedings of 2018 IEEE Third International Conference on Data Science in Cyberspace. Guangzhou, China, 2018: 33−38. [17] 雷森, 史振威, 石天阳, 等. 基于递归神经网络的风暴潮 增水预测 [J]. 智能系统学报, 2017, 12(5): 640–644. LEI Sen, SHI Zhenwei, SHI Tianyang, et al. Prediction of storm surge based on recurrent neural network[J]. CAAI transactions on intelligent systems, 2017, 12(5): 640–644. [18] FENG Yang, LI Yuncheng, LUO Jiebo, et al. Learning effective Gait features using LSTM[C]//Proceedings of 2016 23rd International Conference on Pattern Recognition. Cancun, Mexico, 2016: 325−330. [19] 作者简介: 于建均,副教授,主要研究方向为 智能机器人的仿生自主控制、智能计 算与智能优化控制、复杂过程建模、优 化与控制。主持或参与国家“863”计 划项目、国家自然科学基金项目以及 横向科研课题多项。获国家发明专 利、实用新型专利、国家软件著作权 等 10 余项,发表学术论文 40余篇。 ·544· 智 能 系 统 学 报 第 15 卷
第3期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·545· 李晨,硕士研究生,主要研究方向 左国玉,副教授,博士,主要研究 为机器学习、机器人技术。 方向为智能技术系统、机器人学习、机 器人控制、计算智能。主持和参与国 家自然科学基金项目、北京市自然科 学基金项目、北京市教委科技计划 7项。获国家发明专利、实用新型专 利10余项,发表学术论文30余篇。 第五届认知系统和信息处理国际会议国际会议(ICCSIP2020) Fifth International Conference on Cognitive Systems and Information Processing ICCSIP 2020) 认知系统和信息处理国际会议(ICCSIP)每两年举办一次,已成为认知科学、智能系统、机器人等领域学 者与企业的交流桥梁,为促进海内外学者的交流提供了全球化的平台,目前已举办四届,录用的论文在 Springer出版。当前正是认知科学与人工智能的飞速发展期,二者的结合与交融有利于触发瞬间灵感,推动 创新步伐。因此,第五届认知系统和信息处理国际会议(CCSP2020)主题为“面向人工智能的认知计算”, 并于2020年12月18-20号在中国珠海横琴岛召开,希望推动认知、心理、智能、机器人等领域的融通交汇。 此外,还将特别设立科技抗疫专题,欢迎各界人士依托此平台为全球科技抗疫贡献力量。同时国际会议现 场还举办中国人工智能学会认知系统与信息处理专委会的年会。 组织机构: 主办单位:中国人工智能学会 承办单位:中国人工智能学会认知系统与信息处理专委会、珠海复旦创新研究院 协办单位:中国自动化学会认知计算与系统专委会 技术支持:中国计算机学会智能机器人专业组、清华大学、中国科学杂志社、EEE计算智能学会、清瑞 博源智能科技河北有限贵任公司 重要日期: 投稿截止:2020.10.10 录用通知:2020.10.30 会议注册:2020.11.20 更多信息请详见: 公共号: 联系方式: 网址:http://iccsip2020.caai.cn/ 公众号:CAAI认知系统与信息处理专委会 Email:csip2020-2020@163.com 手机号:15952525480
李晨,硕士研究生,主要研究方向 为机器学习、机器人技术。 左国玉,副教授,博士,主要研究 方向为智能技术系统、机器人学习、机 器人控制、计算智能。主持和参与国 家自然科学基金项目、北京市自然科 学基金项目、北京市教委科技计划 7 项。获国家发明专利、实用新型专 利 10 余项,发表学术论文 30 余篇。 第五届认知系统和信息处理国际会议国际会议(ICCSIP 2020) Fifth International Conference on Cognitive Systems and Information Processing(ICCSIP 2020) 认知系统和信息处理国际会议(ICCSIP)每两年举办一次,已成为认知科学、智能系统、机器人等领域学 者与企业的交流桥梁,为促进海内外学者的交流提供了全球化的平台,目前已举办四届,录用的论文在 Springer 出版。当前正是认知科学与人工智能的飞速发展期,二者的结合与交融有利于触发瞬间灵感,推动 创新步伐。因此,第五届认知系统和信息处理国际会议 (ICCSIP 2020) 主题为“面向人工智能的认知计算”, 并于 2020 年 12 月 18-20 号在中国珠海横琴岛召开,希望推动认知、心理、智能、机器人等领域的融通交汇。 此外,还将特别设立科技抗疫专题,欢迎各界人士依托此平台为全球科技抗疫贡献力量。同时国际会议现 场还举办中国人工智能学会认知系统与信息处理专委会的年会。 组织机构: 主办单位:中国人工智能学会 承办单位:中国人工智能学会认知系统与信息处理专委会、珠海复旦创新研究院 协办单位:中国自动化学会认知计算与系统专委会 技术支持:中国计算机学会智能机器人专业组、清华大学、中国科学杂志社、 IEEE 计算智能学会、清瑞 博源智能科技河北有限责任公司 重要日期: 投稿截止:2020.10.10 录用通知:2020.10.30 会议注册:2020.11.20 更多信息请详见: 公共号: 联系方式: 网址:http://iccsip2020.caai.cn/ 公众号:CAAI 认知系统与信息处理专委会 Email:csip2020-2020@163.com 手机号:15952525480 第 3 期 于建均,等:仿人机器人步态平衡泛化模型的建立与仿真 ·545·