【机器学习】仿人机器人步态平衡泛化模型的建立与仿真

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：4.58MB

第15卷第3期智能系统学报 Vol.15 No.3 2020年5月 CAAI Transactions on Intelligent Systems May 2020 D0L:10.11992tis.201810017 仿人机器人步态平衡泛化模型的建立与仿真于建均，李晨，左国玉，阮晓刚，王洋 (北京工业大学信息学部，北京100124) 摘要：通过人体示教计算零力矩点(zero moment point,ZMP),并通过补偿关节角度对其矫正的方法可以解决机器人步行不稳定的问题，但仍存在算法复杂度过高等问题。本文提出一种人体示教与机器学习相结合的方法，基于支持向量回归算法建立机器人的步态平衡泛化模型，通过该模型可以实现对模型输入人体示教的关节角度和ZMP信息后直接得到经稳定性补偿的关节角度，并以此驱动机器人完成步行动作。引入鲸鱼优化算法 (whale optimization algorithm,WOA)优化模型的参数以使模型得到最优的泛化效果，完善步态平衡模型的性能。WEBOTS仿真平台下，使用模型输出的补偿后的关节角度驱动NAO机器人，其动作自然、稳定且算法复杂度较低，验证了本文方法的可行性。关键词：仿人机器人；支持向量回归；步态平衡泛化模型；鲸鱼优化算法；ZMP信息；算法复杂度；NAO机器人：机器学习中图分类号：TP242.6文献标志码：A 文章编号：1673-4785(2020)03-0537-09 中文引用格式：于建均，李晨，左国玉，等.仿人机器人步态平衡泛化模型的建立与仿真小.智能系统学报，2020,15(3) 537-545. 英文引用格式：YU Jianjun,LI Chen,ZUO Guoyu,etal.Modeling and simulation of humanoid robot gait balance generalization(J CAAI transactions on intelligent systems,2020,15(3):537-545. Modeling and simulation of humanoid robot gait balance generalization YU Jianjun,LI Chen,ZUO Guoyu,RUAN Xiaogang,WANG Yang (Department of Information,Beijing University of Technology,Beijing 100124,China) Abstract:The problem of robot walking instability can be solved by calculating the zero-moment point (ZMP)through human body teaching and correction by the compensation of joint angles;however,problems such as high algorithm complexity still exist.This paper proposes a method that combines human teaching with machine learning.The gait bal- ance generalization model of a robot is established based on the support vector regression algorithm.The joint angle of human teaching and ZMP information are inputted into the model;then,we get the joint angle compensated by stability, and the robot is driven to complete the walking action.The parameters of the whale optimization algorithm(WOA) model are introduced to make the model obtain the optimal generalization effect and improve the performance of the gait balance model.Under the Webots simulation platform,the NAO robot is driven by the compensated joint angle of the model output.The action is natural and stable,and the algorithm complexity is low,which verifies the feasibility of the method. Keywords:humanoid robot;support vector regression;gait balance generalization model;whale optimization al- gorithm;ZMP information;algorithm complexity;NAO robot,machine learning 仿人机器人由于拥有与人体结构相似的双足高低落差较大的地形场景，且在崎岖多变的地形式结构，可以较好地适应轮式机器人难以适应的环境中机动性好，因此仿人机器人可以代替人类收稿日期：2018-10-16 在复杂和危险的环境下工作，同时也被广泛应用基金项目：国家自然科学基金项目(61873008)：北京市自然科到服务、医疗康复和教育娱乐等领域。因此仿人学基金项目(4182008). 通信作者：于建均.E-mail:yujianjun@bjut.edu.cn 机器人的研究也就成为了机器人领域的重要研究

DOI: 10.11992/tis.201810017 仿人机器人步态平衡泛化模型的建立与仿真于建均，李晨，左国玉，阮晓刚，王洋（北京工业大学信息学部，北京 100124）摘要：通过人体示教计算零力矩点 (zero moment point, ZMP)，并通过补偿关节角度对其矫正的方法可以解决机器人步行不稳定的问题，但仍存在算法复杂度过高等问题。本文提出一种人体示教与机器学习相结合的方法，基于支持向量回归算法建立机器人的步态平衡泛化模型，通过该模型可以实现对模型输入人体示教的关节角度和 ZMP 信息后直接得到经稳定性补偿的关节角度，并以此驱动机器人完成步行动作。引入鲸鱼优化算法 (whale optimization algorithm, WOA) 优化模型的参数以使模型得到最优的泛化效果，完善步态平衡模型的性能。WEBOTS 仿真平台下，使用模型输出的补偿后的关节角度驱动 NAO 机器人，其动作自然、稳定且算法复杂度较低，验证了本文方法的可行性。关键词：仿人机器人；支持向量回归；步态平衡泛化模型；鲸鱼优化算法；ZMP 信息；算法复杂度；NAO 机器人；机器学习中图分类号：TP242.6 文献标志码：A 文章编号：1673−4785(2020)03−0537−09 中文引用格式：于建均, 李晨, 左国玉, 等. 仿人机器人步态平衡泛化模型的建立与仿真 [J]. 智能系统学报, 2020, 15(3): 537–545. 英文引用格式：YU Jianjun, LI Chen, ZUO Guoyu, et al. Modeling and simulation of humanoid robot gait balance generalization[J]. CAAI transactions on intelligent systems, 2020, 15(3): 537–545. Modeling and simulation of humanoid robot gait balance generalization YU Jianjun，LI Chen，ZUO Guoyu，RUAN Xiaogang，WANG Yang (Department of Information, Beijing University of Technology, Beijing 100124, China) Abstract: The problem of robot walking instability can be solved by calculating the zero-moment point (ZMP) through human body teaching and correction by the compensation of joint angles; however, problems such as high algorithm complexity still exist. This paper proposes a method that combines human teaching with machine learning. The gait balance generalization model of a robot is established based on the support vector regression algorithm. The joint angle of human teaching and ZMP information are inputted into the model; then, we get the joint angle compensated by stability, and the robot is driven to complete the walking action. The parameters of the whale optimization algorithm (WOA) model are introduced to make the model obtain the optimal generalization effect and improve the performance of the gait balance model. Under the Webots simulation platform, the NAO robot is driven by the compensated joint angle of the model output. The action is natural and stable, and the algorithm complexity is low, which verifies the feasibility of the method. Keywords: humanoid robot; support vector regression; gait balance generalization model; whale optimization algorithm; ZMP information; algorithm complexity; NAO robot; machine learning 仿人机器人由于拥有与人体结构相似的双足式结构，可以较好地适应轮式机器人难以适应的高低落差较大的地形场景，且在崎岖多变的地形环境中机动性好，因此仿人机器人可以代替人类在复杂和危险的环境下工作，同时也被广泛应用到服务、医疗康复和教育娱乐等领域。因此仿人机器人的研究也就成为了机器人领域的重要研究收稿日期：2018−10−16. 基金项目：国家自然科学基金项目 (61873008)；北京市自然科学基金项目 (4182008). 通信作者：于建均. E-mail：yujianjun@bjut.edu.cn. 第 15 卷第 3 期智能系统学报 Vol.15 No.3 2020 年 5 月 CAAI Transactions on Intelligent Systems May 2020

·538· 智能系统学报第15卷方向之一。稳定性补偿的关节角度。在保留人体示教优点且控制机器人的稳定步行，传统上是通过规划保证稳定性的同时降低计算复杂度，增强机器人 ZMP轨迹，并通过逆运动学等方法求取机器人的动作模仿的实时性。驱动角度完成的。而人为规划的ZMP轨迹和质 1.1支持向量回归算法心轨迹过分依靠仿人机器人运动学模型，这种方支持向量回归模型分为线性回归模型和非线法在对机器人建模时需进行大量的计算，且运动性回归模型。考虑到人体示教数据和机器人驱动模式僵硬单一。由于人体结构与仿人机器人关节角度是非线性关系，需要建立非线性回归模的结构有很强的相似性，通过人体示教的方式，型。给定样本：机器人模仿其动作的方式，能使机器人动作自 D=1,y),(2,y2),…,(c,),i=1,2,…,0(1) 然，运动方式多样0，但是二者之间的质量分布式中：x∈Rm是n维输入值；y∈R是一维输出值；i 存在差异，直接使用人体示教的关节角度，容易为样本数量。SVR算法构造的非线性回归模型导致仿人机器人在运动过程中摔倒。使用ZMP 的思想是利用核技巧将训练数据映射到高维空间补偿或线性反馈等方式补偿关节角度可使仿人机再线性回归以简化运算。本文采用RBF核函数器人在步行过程中的稳定性提高，但补偿角的计作为SVR模型的核函数。其回归模型函数为 f(x)=wΦ(x)+b (2) 算过程过于复杂。Seleem等使用Kinect-V2传式中：x为模型输人的n维变量；w和b为训练得感器捕捉人体步态数据同时使用多项式拟合并利到的回归模型参数；(x)为核函数。用反馈线性化技术稳定双足机器人步行过程，获在SVM间隔最大化思想下，引人不敏感损失得了较为自然且多样的步态轨迹，但未能充分利函数ε、惩罚系数C以及松弛变量、号，可得到用人体的示教数据，使计算过程过于复杂。面对 E-SVR非线性回归模型：计算量大这一问题，机器学习通过构建“模型”思想，大大减少了传统算法的运算量和计算过程。 m,a+c∑+ (u.b5.5')21 i=l Hwang等a应用机器学习的思想对仿人机器人 s.L.y-ωΦ()-b≤e+E (3) 的ZMP轨迹进行规划，并将机器人的关节角度构 ω中(x)+b≤E+” 5,5*≥0 成离散的动作空间，以构建机器人步行模型，进为了计算更加便捷，通过引入拉格朗日乘子行步态控制，但只有16个动作的离散动作空间机、,并通过拉格朗日乘法寻优，可以得到器人动作僵硬单一。支持向量回归(support vact-. SVR的对偶最优化问题： or regression,SVR)由Cortes等l1提出，是建立在结构风险最小化原则基础之上的一种机器学习算 maxy-e)- ,a:(y+)+ 法。相较于传统的机器学习算法的经验风险最小化原则，它在最小化训练误差的同时最小化了泛 ∑a,-a)@,-a)K(x） (4) 化误差的上限，并且其算法复杂度与样本的训练 s.L.0≤≤C,0≤a≤C,i=1,2,…,l 维数无关，避免了维数灾难，是一种有着很强理 (a;-a)=0 论基础的小样本学习方法。 1 式中：K(,x)=xr)x)为核函数，本文采用基于SVR的机器人步态平衡泛化 RBF核函数。模型的构建由于不等式约束问题需满足的KKT条件可解得SVR的解形式为采用人体示教的方法，可以使仿人机器人在不同的步长、步态周期下动作自然地行走且大大 f)=∑a-a)Kkx)+b (5) 简化了动力学建模的计算过程。但在机器人模仿 =1 人体步行动作时，由于两者质量分布不同，质心式中b=+8- ∑a-a)K 在运动过程中极易发生偏移，需要通过人体示教综上所述，决定SVR算法非线性模型性能的信息经过大量计算得到使机器人稳定步行的关节参数为a、、8,以及RBF核函数中自带的宽度补偿角度。考虑基于SVR算法建立步态平衡系数p,其中a、a在式(4)的条件约束下，由惩泛化模型，根据得到的人体示教信息直接得到经罚系数C决定

方向之一。控制机器人的稳定步行，传统上是通过规划 ZMP 轨迹，并通过逆运动学等方法求取机器人的驱动角度完成的。而人为规划的 ZMP 轨迹和质心轨迹过分依靠仿人机器人运动学模型，这种方法在对机器人建模时需进行大量的计算，且运动模式僵硬单一[1-6]。由于人体结构与仿人机器人的结构有很强的相似性，通过人体示教的方式，机器人模仿其动作的方式，能使机器人动作自然，运动方式多样[7-10] ，但是二者之间的质量分布存在差异，直接使用人体示教的关节角度，容易导致仿人机器人在运动过程中摔倒。使用 ZMP 补偿或线性反馈等方式补偿关节角度可使仿人机器人在步行过程中的稳定性提高，但补偿角的计算过程过于复杂。Seleem 等 [11] 使用 Kinect-V2 传感器捕捉人体步态数据同时使用多项式拟合并利用反馈线性化技术稳定双足机器人步行过程，获得了较为自然且多样的步态轨迹，但未能充分利用人体的示教数据，使计算过程过于复杂。面对计算量大这一问题，机器学习通过构建“模型”思想，大大减少了传统算法的运算量和计算过程。 Hwang 等 [12] 应用机器学习的思想对仿人机器人的 ZMP 轨迹进行规划，并将机器人的关节角度构成离散的动作空间，以构建机器人步行模型，进行步态控制，但只有 16 个动作的离散动作空间机器人动作僵硬单一。支持向量回归 (support vactor regression, SVR) 由 Cortes 等 [13] 提出,是建立在结构风险最小化原则基础之上的一种机器学习算法。相较于传统的机器学习算法的经验风险最小化原则，它在最小化训练误差的同时最小化了泛化误差的上限，并且其算法复杂度与样本的训练维数无关，避免了维数灾难，是一种有着很强理论基础的小样本学习方法。 1 基于 SVR 的机器人步态平衡泛化模型的构建采用人体示教的方法，可以使仿人机器人在不同的步长、步态周期下动作自然地行走且大大简化了动力学建模的计算过程。但在机器人模仿人体步行动作时，由于两者质量分布不同，质心在运动过程中极易发生偏移，需要通过人体示教信息经过大量计算得到使机器人稳定步行的关节补偿角度[14]。考虑基于 SVR 算法建立步态平衡泛化模型，根据得到的人体示教信息直接得到经稳定性补偿的关节角度。在保留人体示教优点且保证稳定性的同时降低计算复杂度，增强机器人动作模仿的实时性。 1.1 支持向量回归算法支持向量回归模型分为线性回归模型和非线性回归模型。考虑到人体示教数据和机器人驱动关节角度是非线性关系，需要建立非线性回归模型。给定样本： D ={(x1, y1),(x2, y2),··· ,(xi , yi), i =1,2,··· , l} (1) xi ∈ R n 式中：是 n 维输入值； yi ∈ R 是一维输出值； i 为样本数量。SVR 算法构造的非线性回归模型的思想是利用核技巧将训练数据映射到高维空间再线性回归以简化运算。本文采用 RBF 核函数作为 SVR 模型的核函数。其回归模型函数为 f (x) = ω·Φ(x)+b (2) ω b Φ(x) 式中：x 为模型输入的 n 维变量；和为训练得到的回归模型参数；为核函数。 ε ξi ξ ∗ i ε− 在 SVM 间隔最大化思想下，引入不敏感损失函数、惩罚系数 C 以及松弛变量、，可得到 SVR 非线性回归模型：    min (ω,b,ξi,ξi ∗ ) 1 2 ∥ω∥ 2 +C ∑l i=1 (ξi +ξi ∗ ) s.t. yi −ωΦ(x)−b ⩽ ε+ξi ωΦ(x)+b ⩽ ε+ξi ∗ ξi , ξi ∗ ⩾ 0 (3) αi α ∗ i 为了计算更加便捷，通过引入拉格朗日乘子、，并通过拉格朗日乘法寻优，可以得到 SVR 的对偶最优化问题：    max (αi,αi ∗ ) ∑l i=1 αi(y−ε)− ∑l i=1 αi ∗ (y+ε)+ ∑l i, j=1 ( αj −αj ∗ ) (αi −αi ∗ )K ( xi , xj ) s.t. 0 ⩽ αi ⩽ C,0 ⩽ αi ∗ ⩽ C,i = 1,2,··· ,l ∑l i=1 (αi −αi ∗ ) = 0 (4) K ( xi , xj ) = Φ(x) T 式中： Φ(x) 为核函数，本文采用 RBF 核函数。由于不等式约束问题需满足的 KKT 条件可解得 SVR 的解形式为 f(x) = ∑l i=1 ( αi −α ∗ i ) K ( xi , xj ) +b (5) b = yi +ε− ∑l i=1 ( αi −α ∗ i ) K ( xi , xj ) 式中 αi α ∗ i ε p αi α ∗ i C 综上所述,决定 SVR 算法非线性模型性能的参数为、、，以及 RBF 核函数中自带的宽度系数，其中、在式 (4) 的条件约束下，由惩罚系数决定。 ·538· 智能系统学报第 15 卷

第3期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·539· 1.2仿人机器人步态平衡泛化模型的构建 2基于WOA的仿人机器人步态平衡构建步态平衡泛化模型需要在SVR算法非泛化模型的参数寻优线性回归模型结构的基础上，确定合适的输入和输出。二者之间需有一定的相关关系，才能保证采用人为确定C、p、ε这3个参数的方法很模型有良好的泛化效果。具体选择如下：以人体难获得性能较好的泛化模型且低效繁琐，而常用示教的关节角度和人体步行的ZMP信息作为步的参数寻优方法，如粒子群优化(particle swarm 态平衡模型的输入。首先，人体示教的关节角度 optimization,.PSO)算法和遗传算法(genetic al-. 是机器人模仿人体动作的基础。其次，在计算关 gorithm,GA)得到的参数在SVR非线性回归模型节稳定性补偿角度时人体示教的ZMP信息（以中，由于算法收敛到一定精度时无法继续优化，能达到的精度有限，有时会产生泛化能力不够的示教者支撑脚底部的骨骼点轨迹作为人体示教问题。因此需要采用性能更好的优化算法对的ZMP轨迹)是在计算关节稳定性补偿角度时 SVR回归模型的3个参数寻优，获取最佳的参的重要依据，并且由其定义式如式(6)所示，ZMP 数，以获得更好的泛化效果。信息包含了人体示教的质心信息和质心加速速 2.1鲸鱼优化算法度信息：鲸鱼优化算法(whale optimization algorithm, p=c-he (6) WOA)是一种全局随机优化算法，是一种新颖且式中：p为示教者ZMP点；c为示教者质心；：为效果很好的优化算法1。其过程分为2个阶段：示教者质心加速度；h为示教者质心等价高度；g 开发阶段和探索阶段。从一组随机解开始，通过为重力加速度。开发阶段找到最优解的大体范围，再通过螺旋收缩包围的机制找到最优解的具体位置。其数学模以平衡补偿后的关节角度（即机器人驱动角型建立如下：度)作为输出。在稳定的基础上省去稳定性补偿 D=IC·x*(t)-x(t) 角的复杂计算，完成仿人机器人的步行控制。 x(t+1)=x*(t)-A·D 对模型输入人体的关节角度和人体在步行运 A=2a.r-a (7) 动时的ZMP信息，由SVR非线性回归模型代替 C=2.r 人体示教信息和稳定性后的关节角度之间的函数式中：A、C均为更新系数；a为(0,2)线性递减系关系直接泛化出经补偿的关节角度，构建模型结数；r为(0,1)内的随机系数；x()为当前最优解；构如图1所示。在充分利用人体示教信息的基础 x()为当前解；D为当前解与最优解间的距离。上，保证了仿人机器人的稳定性并简化了稳定性当4>1时，算法处于开发阶段。这种搜索方法补偿角的计算。体现了WOA在开发阶段，全局（线性递减）和随机相结合的思想，具有相当的合理性。当A<1 人体示教仿人机器人经稳定性补偿后的时，算法进入探索阶段，以收缩包围机制和螺旋关节角度步态平衡关节角度轨迹模型更新机制与原先更新机制相结合的方式去寻找最优解。收缩包围机制通过逐步减小A的值，使当前解接近最优解。螺旋更新机制不同于开发阶段人体示教的螺旋更新方式，其搜索精度更高，具体数学模 ZMP 型如下：轨迹信息 x(0-A·D,p<0.5 图1机器人步态平衡泛化模型结构 x(t+1)= D.e.cos(2πl0+x(t),p≥0.5 (8) Fig.1 Robot gait balance generalization model structure 式中：1为(-1,1)的随机数；b为螺旋型函数；p为模型结构确立后，由1.1节可知，确定步态平随机概率即(0,1)的随机数。衡泛化模型的SVR算法中的C、p、ε这3个参数当迭代次数达到最大时，最终采用式(9)进行变量成为了决定模型是否能输出理想的经稳定性最优解的确定：补偿后的关节角度的关键步骤，3个参数选取的 D=IC.xmd-x(t川 x(t+l)=xad-A·D (9) 不合适就会直接导致模型的训练误差或泛化误差不在理想范围之内，出现过拟合和欠拟合的问式中xa为当前最优解中随机选取的一个解。在题。如何确定C、p、ε成为了构建模型需要解决适应性函数选择恰当时（即能判断最优解时），的问题。 WOA有很好地在参数空间中寻找最优解的能力

1.2 仿人机器人步态平衡泛化模型的构建构建步态平衡泛化模型需要在 SVR 算法非线性回归模型结构的基础上，确定合适的输入和输出。二者之间需有一定的相关关系，才能保证模型有良好的泛化效果。具体选择如下：以人体示教的关节角度和人体步行的 ZMP 信息作为步态平衡模型的输入。首先，人体示教的关节角度是机器人模仿人体动作的基础。其次，在计算关节稳定性补偿角度时人体示教的 ZMP 信息 (以示教者支撑脚底部的骨骼点轨迹作为人体示教的 ZMP 轨迹) 是在计算关节稳定性补偿角度时的重要依据，并且由其定义式如式 (6) 所示，ZMP 信息包含了人体示教的质心信息和质心加速速度信息： p = c− h g c¨ (6) p c c¨ h g 式中：为示教者 ZMP 点；为示教者质心；为示教者质心加速度；为示教者质心等价高度；为重力加速度。以平衡补偿后的关节角度 (即机器人驱动角度) 作为输出。在稳定的基础上省去稳定性补偿角的复杂计算，完成仿人机器人的步行控制。对模型输入人体的关节角度和人体在步行运动时的 ZMP 信息，由 SVR 非线性回归模型代替人体示教信息和稳定性后的关节角度之间的函数关系直接泛化出经补偿的关节角度，构建模型结构如图 1 所示。在充分利用人体示教信息的基础上，保证了仿人机器人的稳定性并简化了稳定性补偿角的计算。人体示教关节角度轨迹仿人机器人步态平衡模型经稳定性补偿后的关节角度人体示教 ZMP 轨迹信息图 1 机器人步态平衡泛化模型结构 Fig. 1 Robot gait balance generalization model structure C p ε C p ε 模型结构确立后，由 1.1 节可知，确定步态平衡泛化模型的 SVR 算法中的、、这 3 个参数变量成为了决定模型是否能输出理想的经稳定性补偿后的关节角度的关键步骤，3 个参数选取的不合适就会直接导致模型的训练误差或泛化误差不在理想范围之内，出现过拟合和欠拟合的问题。如何确定、、成为了构建模型需要解决的问题。 2 基于 WOA 的仿人机器人步态平衡泛化模型的参数寻优采用人为确定 C、p、ε 这 3 个参数的方法很难获得性能较好的泛化模型且低效繁琐，而常用的参数寻优方法，如粒子群优化 (particle swarm optimization, PSO) 算法和遗传算法 (genetic algorithm, GA) 得到的参数在 SVR 非线性回归模型中，由于算法收敛到一定精度时无法继续优化，能达到的精度有限，有时会产生泛化能力不够的问题。因此需要采用性能更好的优化算法对 SVR 回归模型的 3 个参数寻优，获取最佳的参数，以获得更好的泛化效果。 2.1 鲸鱼优化算法鲸鱼优化算法 (whale optimization algorithm, WOA) 是一种全局随机优化算法，是一种新颖且效果很好的优化算法[15]。其过程分为 2 个阶段：开发阶段和探索阶段。从一组随机解开始，通过开发阶段找到最优解的大体范围，再通过螺旋收缩包围的机制找到最优解的具体位置。其数学模型建立如下：    D = |C· x ∗ (t)− x(t)| x(t+1) = x ∗ (t)− A· D A = 2a ·r− a C = 2 ·r (7) A C a r x ∗ (t) x(t) D |A| > 1 |A| < 1 |A| 式中：、均为更新系数；为 (0,2) 线性递减系数；为 (0,1) 内的随机系数；为当前最优解；为当前解；为当前解与最优解间的距离。当时，算法处于开发阶段。这种搜索方法体现了 WOA 在开发阶段，全局 (线性递减) 和随机相结合的思想，具有相当的合理性。当时，算法进入探索阶段，以收缩包围机制和螺旋更新机制与原先更新机制相结合的方式去寻找最优解。收缩包围机制通过逐步减小的值，使当前解接近最优解。螺旋更新机制不同于开发阶段的螺旋更新方式，其搜索精度更高，具体数学模型如下： x(t+1) = { x ∗ (t)− A· D, p < 0.5 D· e bl · cos(2πl)+x ∗ (t), p ⩾ 0.5 (8) 式中：l 为 (−1,1) 的随机数； b 为螺旋型函数； p 为随机概率即 (0,1) 的随机数。当迭代次数达到最大时，最终采用式 (9) 进行最优解的确定： { D = |C· xrand − x(t)| x(t+1) = xrand − A· D (9) 式中 xrand 为当前最优解中随机选取的一个解。在适应性函数选择恰当时 (即能判断最优解时)， WOA 有很好地在参数空间中寻找最优解的能力。第 3 期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·539·

·540· 智能系统学报第15卷 2.2WOA与传统算法对SVR非线性回归模型参法的训练参数的优化问题，选择MSE函数作为适数优化的能力比较应性函数。在SVR非线性回归模型中，p过大会使模型 3)使用WOA迭代寻优，在寻优空间内确定过于简单，学习精度不够；P过小，会出现过拟合，组C、p、8,使训练的MSE值最小。模型泛化能力变差。C和ε在选取时也会遇到相经WOA寻优得到的C、p、E这3个参数，通似的问题。因此，需要使用寻优算法对模型的过训练即可获得有理想泛化效果的步态平衡模型。 3个参数进行寻优。为了比较WOA和常用寻优算法对SVR非线 3仿真实验设计与结果分析性回归模型寻优性能的差异。分别使用3种算法为了验证上述方法的有效性，设计构建仿真 (GA、PSO算法和WOA)对SVR非线性回归模型进行参数寻优并对3种算法的寻优效果进行对比，环境及过程如下：具体方法如下：使用风速时间序列预测的数据集 1)使用Kinect2.0对人体步行动作进行数据 (非线性回归问题与步态问题同样具有周期性和非采集。Kinect2.0是一款能对人体的骨骼点信息进线性的特点)在同一寻优空间内，分别使用GA、行跟踪，记录体感的采集器，它能对人体的25个 PSO算法和WOA对SVR非线性回归模型进行参骨骼点进行跟踪，并记录其三维坐标(x,八，)。数寻优，使用均方误差(MSE)作为性能指标来评 2)在MATLAB中，对人体示教数据进行处理估3种算法的参数寻优效果，其结果如表1所示。并构建平衡泛化模型，具体步骤为：运用空间向量法进行人体关节角度的计算；通过人体在步行表13种算法对SVR非线性回归模型寻优效果比较 Table 1 Comparison of effects of three algorithms for SVR 运动双脚的高度选取支撑脚，以此脚底部的骨骼 nonlinear regression model 点作为ZMP信息提取，并进行数据预处理（归一算法 C、p、E 训练MSE/rad 泛化MSE/rad 化)；SVR非线性模型构建；利用模仿学习计算平 C=28、p=5 衡性补偿角的方式到经补偿后的机器人关节角度 GA 0.101 1.36 e=0.21 构成训练集和测试集；WOA参数寻优：步态平衡 C=2.7、p=0.1 泛化模型训练和泛化。 PSO 0.304 0.783 8=0.01 3)在WEBOTS的仿真平台上，使用模型泛化 C=76、p-0.0 补偿后的关节角驱动NAO机器人，观察其运动 WOA 0.095 0.666 =0.01 效果。其中，NAO机器人是由Aldebaran Robot-. ics公司研发的有着13个关节25个自由度的仿从表1的结果可以看出，WOA在与GA对比中虽然训练误差差距不明显，但其泛化误差有着人机器人，适合作为仿人机器人算法的研究平台。显著优势(GA过拟合)。而与PSO算法对比，训仿真整体结构如图2所示。练误差和泛化误差都有着明显的提升。因此可以测试看出，WOA在寻优精度上高于其他2种算法，训集练误差和泛化能力都优于2种常用的SVR参数计算人体数据关节角度训练 SVR 步态平优化算法。步行采集提取ZMP 集回归模型衡模型 2.3基于WOA优化算法的机器人步态平衡泛化点信息 WOA 模型的参数优化寻优在以SVR为基础的步态平衡模型中，为了获取最佳的仿人机器人步态平衡泛化模型，需对泛化输出 3个参数使用WOA进行寻优，在此之前，需确定驱动角度 3个参数的寻优空间，过小会导致最佳参数在寻优空间之外，过大会影响寻优的效率。结合SVR 图2仿真流程图模型在关节角度控制应用中的3个关键参数的寻 Fig.2 Simulation flowchart 优范围的经验，对该寻优范围的上下限进行适 3.1 仿人机器人步态平衡模型的训练当地扩大，具体步骤如下： Kinect2.0采集一组人体行走数据，共177个 1)确定3个参数的寻优范围分别为p0.005,0.3)、数据点（一个步态周期），前130个作为训练集，后 C(0.05,3)、(1,4),构成WOA的寻优空间。 47个作为测试集。由于仿人机器人的关节较多， 2)构建WOA的适应性函数。针对E-SVR算在其步行运动过程中，通过调整髋关节和踝关节

2.2 WOA 与传统算法对 SVR 非线性回归模型参数优化的能力比较 ε 在 SVR 非线性回归模型中，p 过大会使模型过于简单，学习精度不够；p 过小，会出现过拟合，模型泛化能力变差。C 和在选取时也会遇到相似的问题。因此，需要使用寻优算法对模型的 3 个参数进行寻优。为了比较 WOA 和常用寻优算法对 SVR 非线性回归模型寻优性能的差异。分别使用 3 种算法 (GA、PSO 算法和 WOA) 对 SVR 非线性回归模型进行参数寻优并对 3 种算法的寻优效果进行对比，具体方法如下：使用风速时间序列预测的数据集 (非线性回归问题与步态问题同样具有周期性和非线性的特点) 在同一寻优空间内，分别使用 GA、 PSO 算法和 WOA 对 SVR 非线性回归模型进行参数寻优，使用均方误差 (MSE) 作为性能指标来评估 3 种算法的参数寻优效果，其结果如表 1 所示。表 1 3 种算法对 SVR 非线性回归模型寻优效果比较 Table 1 Comparison of effects of three algorithms for SVR nonlinear regression model 算法 C、p、ε 训练MSE/rad 泛化MSE/rad GA ε C=28、p=5、 =0.21 0.101 1.36 PSO ε C=2.7、p=0.1、 =0.01 0.304 0.783 WOA ε C=76、p=0.0、 =0.01 0.095 0.666 从表 1 的结果可以看出，WOA 在与 GA 对比中虽然训练误差差距不明显，但其泛化误差有着显著优势 (GA 过拟合)。而与 PSO 算法对比，训练误差和泛化误差都有着明显的提升。因此可以看出，WOA 在寻优精度上高于其他 2 种算法，训练误差和泛化能力都优于 2 种常用的 SVR 参数优化算法。 2.3 基于 WOA 优化算法的机器人步态平衡泛化模型的参数优化在以 SVR 为基础的步态平衡模型中，为了获取最佳的仿人机器人步态平衡泛化模型，需对 3 个参数使用 WOA 进行寻优，在此之前，需确定 3 个参数的寻优空间，过小会导致最佳参数在寻优空间之外，过大会影响寻优的效率。结合 SVR 模型在关节角度控制应用中的 3 个关键参数的寻优范围的经验[16] ，对该寻优范围的上下限进行适当地扩大，具体步骤如下： p C ε 1) 确定 3 个参数的寻优范围分别为 (0.005,0.3)、 (0.05,3)、 (1,4)，构成 WOA 的寻优空间。 2) 构建 WOA 的适应性函数。针对 ε−SVR 算法的训练参数的优化问题，选择 MSE 函数作为适应性函数。 ε 3) 使用 WOA 迭代寻优，在寻优空间内确定一组 C、p、，使训练的 MSE 值最小。经 WOA 寻优得到的 C、p、ε 这 3 个参数，通过训练即可获得有理想泛化效果的步态平衡模型。 3 仿真实验设计与结果分析为了验证上述方法的有效性，设计构建仿真环境及过程如下： 1) 使用 Kinect2.0 对人体步行动作进行数据采集。Kinect2.0 是一款能对人体的骨骼点信息进行跟踪，记录体感的采集器，它能对人体的 25 个骨骼点进行跟踪，并记录其三维坐标 (x，y，z)。 2) 在 MATLAB 中，对人体示教数据进行处理并构建平衡泛化模型，具体步骤为：运用空间向量法进行人体关节角度的计算；通过人体在步行运动双脚的高度选取支撑脚，以此脚底部的骨骼点作为 ZMP 信息提取，并进行数据预处理 (归一化)；SVR 非线性模型构建；利用模仿学习计算平衡性补偿角的方式到经补偿后的机器人关节角度构成训练集和测试集；WOA 参数寻优；步态平衡泛化模型训练和泛化。 3) 在 WEBOTS 的仿真平台上，使用模型泛化补偿后的关节角驱动 NAO 机器人，观察其运动效果。其中，NAO 机器人是由 Aldebaran Robotics 公司研发的有着 13 个关节 25 个自由度的仿人机器人，适合作为仿人机器人算法的研究平台。仿真整体结构如图 2 所示。测试集训练集 SVR 回归模型步态平衡模型计算关节角度、提取 ZMP 点信息人体步行数据采集 WOA 寻优泛化输出驱动角度图 2 仿真流程图 Fig. 2 Simulation flowchart 3.1 仿人机器人步态平衡模型的训练 Kinect2.0 采集一组人体行走数据，共 177 个数据点 (一个步态周期)，前 130 个作为训练集，后 47 个作为测试集。由于仿人机器人的关节较多，在其步行运动过程中，通过调整髋关节和踝关节 ·540· 智能系统学报第 15 卷

第3期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·541· 8个关节角度便可以实现稳态步行。因此以左腿分析表2中的数据可以看出，由WOA寻优为例，对左腿髋关节和踝关节的4个关节角度进确定的仿人机器人步态平衡泛化模型，对训练集行步态平衡模型的构建和训练。机器人踝关节的样本关节角度的拟合效果较为理想，精确度和相平衡泛化模型结构如图3所示。关性较高。人体示教踝仿人机器人仿人机器人踝 3.2仿人机器人步态平衡模型的泛化关节角度步态平衡关节滚动角/ 轨迹模型俯仰角驱动角度使用测试集对训练好的步态平衡模型进行测试，由模型直接泛化得到的经补偿的关节角度与由传统算法得到的关节角度（理想角度）对比，如人体示教 ZMP 图5、图6所示。轨迹W☑ 向信息 0.6 一模型泛化角度图3踝关节步态平衡泛化模型结构图 0.4 …理想角度 Fig.3 Ankle joint gait balance generalization model struc- 0.2 ture diagram 0 运用WOA对左腿的不同关节角的平衡模型进行参数寻优，以踝关节滚动角为例，其寻优过 05101520253035404550 时间序列/帧程的MSE值（均方误差）变化曲线如图4所示。 (a)俯仰角 0.15 一模型泛化角度理想角度 o 0 5 10152025.3035404550 400 800120016002000 时间序列/帧选代周期/个 (b)滚动角图4WOA寻优MSE变化曲线图图5髋关节泛化结果 Fig.4 WOA optimization MSE curve Fig.5 Hip generalization results 在寻优确定参数的条件下，使用训练集对模 0.10 型进行训练，训练结果如表2所示。 0.05 表2仿人机器人步态平衡泛化模型的训练参数及训练 0 性能指标经0.05 Table 2 Training parameters and training performance -0.10 模型泛化角度 indicators of humanoid robot gait balance gener- -0.15 理想角度 alization model 日-020 0 5 101520253035404550 时间序列/帧 R(相关系数均方误差/ 关节角度名称 C、p、e (a)俯仰角的平方) rad 0.6 C=1.96 0.4 模型泛化角度理想角度踝关节滚动角 p=0.010 0.908 0.00133 0.2 =2.42 0 C=2 -0.2 踝关节俯仰角 p-0.011 0.972 0.000172 -0.4 0 5 101520253035404550 =4 时间序列/顿 C=2 (b)滚动角髋关节俯仰角 p=0.10 0.898 0.00287 图6踝关节泛化结果 =0.4 Fig.6 Ankle generalization results C=1.3 从图5、图6中可以看出，对比模型泛化得到髋关节滚动角 p=0.0010 0.985 3.62e-06 的关节角度与理想的关节角度，其均方误差和相 64 关系数如表3所示

8 个关节角度便可以实现稳态步行。因此以左腿为例，对左腿髋关节和踝关节的 4 个关节角度进行步态平衡模型的构建和训练。机器人踝关节的平衡泛化模型结构如图 3 所示。人体示教踝关节角度轨迹仿人机器人步态平衡模型仿人机器人踝关节滚动角/ 俯仰角驱动角度人体示教 ZMP 轨迹 X/Z 向信息图 3 踝关节步态平衡泛化模型结构图 Fig. 3 Ankle joint gait balance generalization model structure diagram 运用 WOA 对左腿的不同关节角的平衡模型进行参数寻优，以踝关节滚动角为例，其寻优过程的 MSE 值 (均方误差) 变化曲线如图 4 所示。 MSE ×10−4 8 6 4 2 0 400 800 1 200 1 600 2 000 迭代周期/个图 4 WOA 寻优 MSE 变化曲线图 Fig. 4 WOA optimization MSE curve 在寻优确定参数的条件下，使用训练集对模型进行训练，训练结果如表 2 所示。表 2 仿人机器人步态平衡泛化模型的训练参数及训练性能指标 Table 2 Training parameters and training performance indicators of humanoid robot gait balance generalization model 关节角度名称 C、p、ε R 2 (相关系数的平方) 均方误差/ rad 踝关节滚动角 C=1.96 p=0.010 ε=2.42 0.908 0.001 33 踝关节俯仰角 C=2 p=0.011 ε=4 0.972 0.000 172 髋关节俯仰角 C=2 p=0.10 ε=0.4 0.898 0.002 87 髋关节滚动角 C=1.3 p=0.001 0 ε=4 0.985 3.62e-06 分析表 2 中的数据可以看出，由 WOA 寻优确定的仿人机器人步态平衡泛化模型，对训练集样本关节角度的拟合效果较为理想，精确度和相关性较高。 3.2 仿人机器人步态平衡模型的泛化使用测试集对训练好的步态平衡模型进行测试，由模型直接泛化得到的经补偿的关节角度与由传统算法得到的关节角度 (理想角度) 对比，如图 5、图 6 所示。左腿髋关节俯仰角/rad 左腿髋关节滚动角/rad 时间序列/帧时间序列/帧模型泛化角度理想角度模型泛化角度理想角度 0.6 0.4 0.2 0 −0.2 0 5 10 15 20 25 30 35 40 45 50 0 5 10 15 20 25 30 35 40 45 50 (a) 俯仰角 (b) 滚动角 0.15 0.10 0.05 图 5 髋关节泛化结果 Fig. 5 Hip generalization results 0.10 0.05 0 −0.05 −0.10 −0.15 −0.20 模型泛化角度理想角度模型泛化角度理想角度时间序列/帧 0 5 10 15 20 25 30 35 40 45 50 时间序列/帧 0 5 10 15 20 25 30 35 40 45 50 (a) 俯仰角左腿髋关节俯仰角/rad 左腿髋关节滚动角/rad 0.6 0.4 0.2 0 −0.2 −0.4 (b) 滚动角图 6 踝关节泛化结果 Fig. 6 Ankle generalization results 从图 5、图 6 中可以看出，对比模型泛化得到的关节角度与理想的关节角度，其均方误差和相关系数如表 3 所示。第 3 期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·541·

·542· 智能系统学报第15卷表3仿人机器人步态平衡泛化模型在同一步长、步态周期下的泛化性能指标 Table 3 Generalized performance indicators of humanoid robot gait balance generalization model under the same step and gait cycle 关节角度名称 R(相关系数) 均方误差rad 踝关节滚动角 0.985 0.00504757 踝关节俯仰角 0.970 0.00194947 髋关节俯仰角 0.866 0.0117494 髋关节滚动角 0.995 8.8756e-06 图8模型泛化角度值在WEBOTS仿真平台上的稳定步行从表3中可以看出，模型得到的关节角度 Fig.8 Model generalized angle values for stable walking on the WEBOTS simulation platform 序列与理想的关节角度序列的相关系数在 0.866以上而均方误差则控制在了0.0117以内，从上述结果可以看出，通过引入步态平衡泛证明仿人机器人步态平衡模型有着很好的泛化化模型可以在减少复杂计算过程的基础上使机器能力。人能够完成稳态步行，且具有很好的稳定性。为了验证机器人在泛化得到的关节角度的驱以上泛化结果为同一次示教的数据拆分成动下具有稳定性。利用模型的泛化结果与理想的的训练集和测试集，因此示教步行动作的步长和关节角度的差值及式(8)得到机器人的质心偏步态周期相同。但不同示教人在示教时（甚至同移量：示教人在非同一次示教时)可能会产生步长和 6e=J6。 (10) 步态周期上的差异。为了验证步态平衡泛化模式中：6。为质心偏移量；J为仿人机器人雅克比矩型不同示教人的示教信息的泛化能力，使用Ki- 阵；6。为模型泛化角度与理想角度的偏差值。 ect采集76个与训练集步长，步态周期均不同的机器人的在模型泛化角度下驱动机器人运动人体行走数据点（两个步态周期），用上一节中训的ZMP轨迹如图7所示。练好的步态平衡模型对其进行泛化。模型得到的经补偿后的关节角度与理想角度的对比如图9、 1.1 图10所示，所计算的机器人实际ZMP轨迹如图11 1.0 所示。 0.9 0.40 08 一模型泛化角度 0.30 理想角度 0.7 0.20 0.10 0.6 0 0 1020304050607080 0 0.02 0.040.06 0.080.10 时间序列帧 (a)模型参数C=2、=0.353、p=0.001 图7同一步长、步态周期下在泛化驱动角度下机器人 0.12 一模型泛化角度 ZMP轨迹 0.10 理想角度 Fig.7 Robot ZMP trajectory at generalized driving angle 0.08 under the same step and gait cycle 0.06 从图7中可以看出，通过模型泛化出的关节 0.04 0.02 角度驱动机器人运动，其ZMP轨迹波动很小，且 0 1020304050607080 时间序列帧在机器人足部的支撑方框之内，证明机器人在模 (b)模型参数C=2、=3.97、p0.001 仿人体步行运动时不会摔倒。图9不同步长、步态周期下左腿髋关节泛化结果由如图8可以看出，NAO机器人在WEBOTS Fig.9 Generalization of left hip pitch under different gait 环境下可以平稳地步行。 long and gait cycles

表 3 仿人机器人步态平衡泛化模型在同一步长、步态周期下的泛化性能指标 Table 3 Generalized performance indicators of humanoid robot gait balance generalization model under the same step and gait cycle 关节角度名称 R(相关系数) 均方误差/rad 踝关节滚动角 0.985 0.005 047 57 踝关节俯仰角 0.970 0.001 949 47 髋关节俯仰角 0.866 0.011 749 4 髋关节滚动角 0.995 8.875 6e-06 从表 3 中可以看出，模型得到的关节角度序列与理想的关节角度序列的相关系数在 0.866 以上而均方误差则控制在了 0.011 7 以内，证明仿人机器人步态平衡模型有着很好的泛化能力。为了验证机器人在泛化得到的关节角度的驱动下具有稳定性。利用模型的泛化结果与理想的关节角度的差值及式 (8) 得到机器人的质心偏移量： δc = Jδα (10) δc J δα 式中：为质心偏移量；为仿人机器人雅克比矩阵；为模型泛化角度与理想角度的偏差值。机器人的在模型泛化角度下驱动机器人运动的 ZMP 轨迹如图 7 所示。 Z/m X/m 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0 0.04 0.06 0.08 0.10 0.02 图 7 同一步长、步态周期下在泛化驱动角度下机器人 ZMP 轨迹 Fig. 7 Robot ZMP trajectory at generalized driving angle under the same step and gait cycle 从图 7 中可以看出，通过模型泛化出的关节角度驱动机器人运动，其 ZMP 轨迹波动很小，且在机器人足部的支撑方框之内，证明机器人在模仿人体步行运动时不会摔倒。由如图 8 可以看出，NAO 机器人在 WEBOTS 环境下可以平稳地步行。图 8 模型泛化角度值在 WEBOTS 仿真平台上的稳定步行 Fig. 8 Model generalized angle values for stable walking on the WEBOTS simulation platform 从上述结果可以看出，通过引入步态平衡泛化模型可以在减少复杂计算过程的基础上使机器人能够完成稳态步行，且具有很好的稳定性。以上泛化结果为同一次示教的数据拆分成的训练集和测试集，因此示教步行动作的步长和步态周期相同。但不同示教人在示教时 (甚至同一示教人在非同一次示教时) 可能会产生步长和步态周期上的差异。为了验证步态平衡泛化模型不同示教人的示教信息的泛化能力，使用 Kinect 采集 76 个与训练集步长，步态周期均不同的人体行走数据点 (两个步态周期)，用上一节中训练好的步态平衡模型对其进行泛化。模型得到的经补偿后的关节角度与理想角度的对比如图 9、图 10 所示，所计算的机器人实际 ZMP 轨迹如图 11 所示。模型泛化角度理想角度 0.40 0.30 0.20 0.10 0 −0.10 0 10 20 30 40 50 60 70 80 时间序列/帧模型泛化角度理想角度 0.12 0.10 0.08 0.06 0.04 0.02 0 10 20 30 40 50 60 70 80 时间序列/帧 (a) 模型参数 C=2、ε=0.353、p=0.001 (b) 模型参数 C=2、ε=3.97、p=0.001 左腿髋关节俯仰角/rad 左腿髋关节滚动角/rad 图 9 不同步长、步态周期下左腿髋关节泛化结果 Fig. 9 Generalization of left hip pitch under different gait long and gait cycles ·542· 智能系统学报第 15 卷

第3期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·543· 0.3 一模型泛化角度在不同步长和步态周期的示教数据下模型泛 0.2 0.1 理想角度化的关节角度误差较小，ZMP轨迹还在机器人足 0 部支撑方框内，因此步态平衡泛化模型能在不同 -0.1 0.2 示教者示教的情况下减少补偿角计算并保证步行 -0.3 -0. 稳定。不足之处有以下两点： 0 10203040.5060 70 80 时间序列/顿 l)由于Kinect是一款非专业的体感采集器， (a)模型参数C=2、=4、p=0.0015 其测量范围有一定的限制，太远或太近都会使测 0.6 量误差过大，无法进行一组两个以上步行动作的模型泛化角度 0.4 理想角度采集。同时结合同一步长、步态周期下，泛化的 0.2 起始点与理想的起始点有一些偏差，导致在循环 0 动作时机器人会有一定不自然动作，甚至会导致 -0.2 机器人不稳定、摔倒。因此，在保证机器人稳定 -0. 0 10203040506070 80 的基础上，步态周期间的平滑切换（连续步态周时间序列/帧 (b)模型参数C=1.96、6=2.42、=0.00104 期的关节角度时间序列预测)是下一阶段工作的重点之一19 图10不同步长、步态周期下左脚踝关节泛化果 Fig.10 Generalization of left ankle roll under non-syn- 2)在不同步长、步态周期下的模型泛化效果 chronized and gait cycles 与同一步长、步态周期下的相比不够理想。因 1.2 此，进一步优化模型的算法和选择训练模型数据 1.1 是构建针对仿人机器人不同组步行数据下的平 1.0 衡泛化模型和构建步态循环模型的需要解决的 E0.9 0.8 问题。 0.7 4结束语 0.6 -0.02 0 0.020.04 0.06 0.08 仿真结果表明，仿人机器人步态平衡泛化模 m 型可以在相同和不同步长和步态周期下有效地泛图11不同步长、步态周期下的机器人ZMP轨迹化机器人经稳定性补偿的关节角度，其泛化角度 Fig.11 Robot ZMP trajectory under different gait long and gait cycle 与理想角度的误差较小。使用泛化得到的角度从表4的模型泛化结果中可以看到，与同一在WEBOTS仿真平台上驱动NAO机器人，可使步长、步态周期下的泛化效果相比，模型对不同其稳定步行。证明了步态平衡泛化模型在保留模步长、步态周期下的示教数据泛化得到的4个关仿学习动作自然，运动方式多样的优点的同时，节角度值与理想的关节角度值相比虽然最大均简化了稳定性补偿角的计算过程，增强了机器人方误差增加到了0.0118，相关系数也降低到了模仿人体运动的实时性，并保证了机器人运动过 0.794,机器人的实际ZMP也有轻微波动，机器人程的稳定性。的稳定性方面也与同一步长、步态周期下的数据训练的模型存在一定差距。但在WEBOTS仿真参考文献：平台上进行仿真，NAO机器人仍能进行较为平稳 [1]WANG Fei,WANG Yaning,WEN Shiguang,et al.Nao 的步行运动。 humanoid robot gait planning based on the linear inverted 表4不同步长、步态周期下的泛化性能指标 pendulum[C]//Proceedings of 2012 24th Chinese Control Table 4 Generalized performance indicators of unsyn- and Decision Conference.Taiyuan,China,2012:986-990 chronized and long gait cycles [2]DONG Enzeng.WANG Dandan,CHEN Chao,et al.Real- 关节角度名称 R(相关系数) 均方误差 ization of biped robot gait planning based on NAO robot 踝关节滚动角 0.995 0.00099308 development platform[Cl//Proceedings of 2016 IEEE Inter- 踝关节俯仰角 0.938 0.00288963 national Conference on Mechatronics and Automation. 髋关节俯仰角 0.794 0.0118455 髋关节滚动角 Harbin,China,2016:1073-1077. 0.989 1.1969e-05 [3]ZHANG Ying,LI Shuanghong,HAN Boyu,et al.Re-

0.3 0.2 0.1 0 −0.1 −0.2 −0.3 −0.4 0 10 20 30 40 50 60 70 80 时间序列/帧 0 10 20 30 40 50 60 70 80 时间序列/帧左腿踝关节俯仰角/rad 模型泛化角度理想角度模型泛化角度理想角度 (a) 模型参数 C=2、ε=4、p=0.001 5 (b) 模型参数 C=1.96、ε=2.42、p=0.001 04 0.6 0.4 0.2 0 −0.2 左腿踝关节滚动角 −0.4 /rad 图 10 不同步长、步态周期下左脚踝关节泛化果 Fig. 10 Generalization of left ankle roll under non-synchronized and gait cycles 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 −0.02 0 0.02 0.04 0.06 0.08 Z/m X/m 图 11 不同步长、步态周期下的机器人 ZMP 轨迹 Fig. 11 Robot ZMP trajectory under different gait long and gait cycle 从表 4 的模型泛化结果中可以看到，与同一步长、步态周期下的泛化效果相比，模型对不同步长、步态周期下的示教数据泛化得到的 4 个关节角度值与理想的关节角度值相比虽然最大均方误差增加到了 0.011 8，相关系数也降低到了 0.794，机器人的实际 ZMP 也有轻微波动，机器人的稳定性方面也与同一步长、步态周期下的数据训练的模型存在一定差距。但在 WEBOTS 仿真平台上进行仿真，NAO 机器人仍能进行较为平稳的步行运动。表 4 不同步长、步态周期下的泛化性能指标 Table 4 Generalized performance indicators of unsynchronized and long gait cycles 关节角度名称 R(相关系数) 均方误差踝关节滚动角 0.995 0.000 993 08 踝关节俯仰角 0.938 0.002 889 63 髋关节俯仰角 0.794 0.011 845 5 髋关节滚动角 0.989 1.196 9e-05 在不同步长和步态周期的示教数据下模型泛化的关节角度误差较小，ZMP 轨迹还在机器人足部支撑方框内，因此步态平衡泛化模型能在不同示教者示教的情况下减少补偿角计算并保证步行稳定。不足之处有以下两点： 1) 由于 Kinect 是一款非专业的体感采集器，其测量范围有一定的限制，太远或太近都会使测量误差过大，无法进行一组两个以上步行动作的采集。同时结合同一步长、步态周期下，泛化的起始点与理想的起始点有一些偏差，导致在循环动作时机器人会有一定不自然动作，甚至会导致机器人不稳定、摔倒。因此，在保证机器人稳定的基础上，步态周期间的平滑切换 (连续步态周期的关节角度时间序列预测) 是下一阶段工作的重点之一[17-19]。 2) 在不同步长、步态周期下的模型泛化效果与同一步长、步态周期下的相比不够理想。因此，进一步优化模型的算法和选择训练模型数据是构建针对仿人机器人不同组步行数据下的平衡泛化模型和构建步态循环模型的需要解决的问题。 4 结束语仿真结果表明，仿人机器人步态平衡泛化模型可以在相同和不同步长和步态周期下有效地泛化机器人经稳定性补偿的关节角度，其泛化角度与理想角度的误差较小。使用泛化得到的角度在 WEBOTS 仿真平台上驱动 NAO 机器人，可使其稳定步行。证明了步态平衡泛化模型在保留模仿学习动作自然，运动方式多样的优点的同时，简化了稳定性补偿角的计算过程，增强了机器人模仿人体运动的实时性，并保证了机器人运动过程的稳定性。参考文献： WANG Fei, WANG Yaning, WEN Shiguang, et al. Nao humanoid robot gait planning based on the linear inverted pendulum[C]//Proceedings of 2012 24th Chinese Control and Decision Conference. Taiyuan, China, 2012: 986−990. [1] DONG Enzeng, WANG Dandan, CHEN Chao, et al. Realization of biped robot gait planning based on NAO robot development platform[C]//Proceedings of 2016 IEEE International Conference on Mechatronics and Automation. Harbin, China, 2016: 1073−1077. [2] [3] ZHANG Ying, LI Shuanghong, HAN Boyu, et al. Re- 第 3 期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·543·

·544· 智能系统学报第15卷 search on gait planning and inverse kinematics solving of gait planning and control of underactuated five-link biped biped walking robots[Cl//Proceedings of 2015 8th Interna- robot during single support and impact phases for normal tional Symposium on Computational Intelligence and walking[C]//Proceedings of 2018 IEEE International Con- Design.Hangzhou,China,2015:629-632. ference on Industrial Technology.Lyon,France,2018: [4]KHAZENIFARD A.BAHRAMI F.ANDANI M E.et al. 123-128. An energy efficient gait trajectory planning algorithm for a [12]LIN Jinling,HWANG K S,JIANG Weicheng,et al.Gait seven linked biped robot using movement elements[C]// balance and acceleration of a biped robot based on Q- Proceedings of 2015 23rd Iranian Conference on Electrical learning[J].IEEE access,2016,4:2439-2449. Engineering.Tehran,Iran,2015:1006-1011. [13]CORTES C,VAPNIK V.Support-vector networks[J]. [5]付根平，杨宜民，黄春林.基于粒子群优化算法的双足机 Machine learning,1995,20(3):273-297. 器人步态优化】.华中科技大学学报（自然科学版）， [14]于建均，张远，左国玉，等.基于ZMP判据的仿人机器 2011,39S2):355-358. 人步态模仿[J].北京工业大学学报，2018,44(9)： 1187-1192 FU Genping,YANG Yimin,HUANG Chunlin.Walking YU Jianjun,ZHANG Yuan,ZUO Guoyu,et al.Hu- pattern optimization based on particle swarm optimization manoid robot gait imitation based on ZMP criterion[J]. for biped robot[J].Journal of Huazhong University of Sci- Journal of Beijing University of Technology,2018,44(9): ence and Technology (nature science edition),2011, 1187-1192 39(S2):355-358 [15]ALZAQEBAH A,MASADEH R,HUDAIB A.Whale [6]YAMAGUCHI A.HYON S H.OGASAWARA T.Rein- optimization algorithm for requirements prioritization[Cl// forcement learning for balancer embedded humanoid loco- Proceedings of 2018 9th International Conference on In- motion[Cl//Proceedings of 2010 10th IEEE-RAS Interna- formation and Communication Systems.Irbid,Jordan. tional Conference on Humanoid Robots.Nashville,USA. 2018:84-89 2010:308-313. [16]FERREIRA J P.CRISOSTOMO M.COIMBRA A P. [7]KANG Zhongrun,DENG Muqing,WANG Cong.Frontal- SVR control of the sagittal balance of a biped robot com- view human gait recognition based on kinect Features and bining torso and ankle joints[Cl//Proceedings of 2010 deterministic learning[C]//Proceedings of 2017 36th World Automation Congress.Kobe,Japan,2010:1-9. Chinese Control Conference.Dalian,China,2017: [17]DING Zhen,YANG Chifu,XING Kai,et al.The real 10834-10839 time gait phase detection based on long short-term [8]SELEEMI A,ASSAL S F M.Sliding mode control of un- memory[C]//Proceedings of 2018 IEEE Third Internation- al Conference on Data Science in Cyberspace.Guang- deractuated five-link biped robot for climbing stairs based zhou,China,2018:33-38 on real human data[C]//Proceedings of 2017 IEEE Interna- [18]雷森，史振威，石天阳，等.基于递归神经网络的风暴潮 tional Conference on Industrial Technology.Toronto, 增水预测[).智能系统学报，2017,12(5)：640-644. Canada,2017:878-883 LEI Sen,SHI Zhenwei,SHI Tianyang,et al.Prediction of [9]赵蛛颖，徐文杰，郑雪林，等.基于体感的机器人展示系 storm surge based on recurrent neural network[J].CAAI 统研究与开发U.机器人技术与应用，2012(6)：54-57. transactions on intelligent systems,2017,12(5):640-644. ZHAO Shuying,XU Wenjie,ZHENG Xuelin,et al.Re- [19]FENG Yang,LI Yuncheng,LUO Jiebo,et al.Learning ef- search and development of display system of Nao hu- fective Gait features using LSTM[C]//Proceedings of manoid robot based on posture perception[J].Robot tech- 2016 23rd International Conference on Pattern Recogni- nique and application,2012(6):54-57. tion.Cancun,Mexico,2016:325-330. [I0们于建均，门玉森，阮晓钢，等.基于Kinect的Nao机器人作者简介：动作模仿系统的研究与实现).智能系统学报，2016 于建均，副教授，主要研究方向为 11(2):180-187 智能机器人的仿生自主控制、智能计 YU Jianjun,MEN Yusen,RUAN Xiaogang,et al.The re- 算与智能优化控制、复杂过程建模、优化与控制。主持或参与国家“863”计 search and implementation of behavior imitation system 划项目、国家自然科学基金项目以及 about Nao robot based on Kinect[J].CAAl transactions 横向科研课题多项。获国家发明专 on intelligent systems,2016,11(2):180-187 利、实用新型专利、国家软件著作权 [11]SELEEMI A,ASSAL S F M,MOHAMED A M.Cyclic 等10余项，发表学术论文40余篇

search on gait planning and inverse kinematics solving of biped walking robots[C]//Proceedings of 2015 8th International Symposium on Computational Intelligence and Design. Hangzhou, China, 2015: 629−632. KHAZENIFARD A, BAHRAMI F, ANDANI M E, et al. An energy efficient gait trajectory planning algorithm for a seven linked biped robot using movement elements[C]// Proceedings of 2015 23rd Iranian Conference on Electrical Engineering. Tehran, Iran, 2015: 1006−1011. [4] 付根平, 杨宜民, 黄春林. 基于粒子群优化算法的双足机器人步态优化 [J]. 华中科技大学学报(自然科学版), 2011, 39(S2): 355–358. FU Genping, YANG Yimin, HUANG Chunlin. Walking pattern optimization based on particle swarm optimization for biped robot[J]. Journal of Huazhong University of Science and Technology (nature science edition), 2011, 39(S2): 355–358. [5] YAMAGUCHI A, HYON S H, OGASAWARA T. Reinforcement learning for balancer embedded humanoid locomotion[C]//Proceedings of 2010 10th IEEE-RAS International Conference on Humanoid Robots. Nashville, USA, 2010: 308−313. [6] KANG Zhongrun, DENG Muqing, WANG Cong. Frontalview human gait recognition based on kinect Features and deterministic learning[C]//Proceedings of 2017 36th Chinese Control Conference. Dalian, China, 2017: 10834−10839. [7] SELEEM I A, ASSAL S F M. Sliding mode control of underactuated five-link biped robot for climbing stairs based on real human data[C]//Proceedings of 2017 IEEE International Conference on Industrial Technology. Toronto, Canada, 2017: 878−883. [8] 赵姝颖, 徐文杰, 郑雪林, 等. 基于体感的机器人展示系统研究与开发 [J]. 机器人技术与应用, 2012(6): 54–57. ZHAO Shuying, XU Wenjie, ZHENG Xuelin, et al. Research and development of display system of Nao humanoid robot based on posture perception[J]. Robot technique and application, 2012(6): 54–57. [9] 于建均, 门玉森, 阮晓钢, 等. 基于 Kinect 的 Nao 机器人动作模仿系统的研究与实现 [J]. 智能系统学报, 2016, 11(2): 180–187. YU Jianjun, MEN Yusen, RUAN Xiaogang, et al. The research and implementation of behavior imitation system about Nao robot based on Kinect[J]. CAAI transactions on intelligent systems, 2016, 11(2): 180–187. [10] [11] SELEEM I A, ASSAL S F M, MOHAMED A M. Cyclic gait planning and control of underactuated five-link biped robot during single support and impact phases for normal walking[C]//Proceedings of 2018 IEEE International Conference on Industrial Technology. Lyon, France, 2018: 123−128. LIN Jinling, HWANG K S, JIANG Weicheng, et al. Gait balance and acceleration of a biped robot based on Qlearning[J]. IEEE access, 2016, 4: 2439–2449. [12] CORTES C, VAPNIK V. Support-vector networks[J]. Machine learning, 1995, 20(3): 273–297. [13] 于建均, 张远, 左国玉, 等. 基于 ZMP 判据的仿人机器人步态模仿 [J]. 北京工业大学学报, 2018, 44(9): 1187–1192. YU Jianjun, ZHANG Yuan, ZUO Guoyu, et al. Humanoid robot gait imitation based on ZMP criterion[J]. Journal of Beijing University of Technology, 2018, 44(9): 1187–1192. [14] ALZAQEBAH A, MASADEH R, HUDAIB A. Whale optimization algorithm for requirements prioritization[C]// Proceedings of 2018 9th International Conference on Information and Communication Systems. Irbid, Jordan, 2018: 84−89. [15] FERREIRA J P, CRISÓSTOMO M, COIMBRA A P. SVR control of the sagittal balance of a biped robot combining torso and ankle joints[C]//Proceedings of 2010 World Automation Congress. Kobe, Japan, 2010: 1−9. [16] DING Zhen, YANG Chifu, XING Kai, et al. The real time gait phase detection based on long short-term memory[C]//Proceedings of 2018 IEEE Third International Conference on Data Science in Cyberspace. Guangzhou, China, 2018: 33−38. [17] 雷森, 史振威, 石天阳, 等. 基于递归神经网络的风暴潮增水预测 [J]. 智能系统学报, 2017, 12(5): 640–644. LEI Sen, SHI Zhenwei, SHI Tianyang, et al. Prediction of storm surge based on recurrent neural network[J]. CAAI transactions on intelligent systems, 2017, 12(5): 640–644. [18] FENG Yang, LI Yuncheng, LUO Jiebo, et al. Learning effective Gait features using LSTM[C]//Proceedings of 2016 23rd International Conference on Pattern Recognition. Cancun, Mexico, 2016: 325−330. [19] 作者简介：于建均，副教授，主要研究方向为智能机器人的仿生自主控制、智能计算与智能优化控制、复杂过程建模、优化与控制。主持或参与国家“863”计划项目、国家自然科学基金项目以及横向科研课题多项。获国家发明专利、实用新型专利、国家软件著作权等 10 余项，发表学术论文 40余篇。 ·544· 智能系统学报第 15 卷

第3期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·545· 李晨，硕士研究生，主要研究方向左国玉，副教授，博士，主要研究为机器学习、机器人技术。方向为智能技术系统、机器人学习、机器人控制、计算智能。主持和参与国家自然科学基金项目、北京市自然科学基金项目、北京市教委科技计划 7项。获国家发明专利、实用新型专利10余项，发表学术论文30余篇。第五届认知系统和信息处理国际会议国际会议(ICCSIP2020) Fifth International Conference on Cognitive Systems and Information Processing ICCSIP 2020) 认知系统和信息处理国际会议(ICCSIP)每两年举办一次，已成为认知科学、智能系统、机器人等领域学者与企业的交流桥梁，为促进海内外学者的交流提供了全球化的平台，目前已举办四届，录用的论文在 Springer出版。当前正是认知科学与人工智能的飞速发展期，二者的结合与交融有利于触发瞬间灵感，推动创新步伐。因此，第五届认知系统和信息处理国际会议(CCSP2020)主题为“面向人工智能的认知计算”，并于2020年12月18-20号在中国珠海横琴岛召开，希望推动认知、心理、智能、机器人等领域的融通交汇。此外，还将特别设立科技抗疫专题，欢迎各界人士依托此平台为全球科技抗疫贡献力量。同时国际会议现场还举办中国人工智能学会认知系统与信息处理专委会的年会。组织机构：主办单位：中国人工智能学会承办单位：中国人工智能学会认知系统与信息处理专委会、珠海复旦创新研究院协办单位：中国自动化学会认知计算与系统专委会技术支持：中国计算机学会智能机器人专业组、清华大学、中国科学杂志社、EEE计算智能学会、清瑞博源智能科技河北有限贵任公司重要日期：投稿截止：2020.10.10 录用通知：2020.10.30 会议注册：2020.11.20 更多信息请详见：公共号：联系方式：网址：http://iccsip2020.caai.cn/ 公众号：CAAI认知系统与信息处理专委会 Email:csip2020-2020@163.com 手机号：15952525480

李晨，硕士研究生，主要研究方向为机器学习、机器人技术。左国玉，副教授，博士，主要研究方向为智能技术系统、机器人学习、机器人控制、计算智能。主持和参与国家自然科学基金项目、北京市自然科学基金项目、北京市教委科技计划 7 项。获国家发明专利、实用新型专利 10 余项，发表学术论文 30 余篇。第五届认知系统和信息处理国际会议国际会议（ICCSIP 2020） Fifth International Conference on Cognitive Systems and Information Processing（ICCSIP 2020）认知系统和信息处理国际会议（ICCSIP）每两年举办一次，已成为认知科学、智能系统、机器人等领域学者与企业的交流桥梁，为促进海内外学者的交流提供了全球化的平台，目前已举办四届，录用的论文在 Springer 出版。当前正是认知科学与人工智能的飞速发展期，二者的结合与交融有利于触发瞬间灵感，推动创新步伐。因此，第五届认知系统和信息处理国际会议 (ICCSIP 2020) 主题为“面向人工智能的认知计算”，并于 2020 年 12 月 18-20 号在中国珠海横琴岛召开，希望推动认知、心理、智能、机器人等领域的融通交汇。此外，还将特别设立科技抗疫专题，欢迎各界人士依托此平台为全球科技抗疫贡献力量。同时国际会议现场还举办中国人工智能学会认知系统与信息处理专委会的年会。组织机构：主办单位：中国人工智能学会承办单位：中国人工智能学会认知系统与信息处理专委会、珠海复旦创新研究院协办单位：中国自动化学会认知计算与系统专委会技术支持：中国计算机学会智能机器人专业组、清华大学、中国科学杂志社、 IEEE 计算智能学会、清瑞博源智能科技河北有限责任公司重要日期：投稿截止：2020.10.10 录用通知：2020.10.30 会议注册：2020.11.20 更多信息请详见：公共号：联系方式：网址：http://iccsip2020.caai.cn/ 公众号：CAAI 认知系统与信息处理专委会 Email：csip2020-2020@163.com 手机号：15952525480 第 3 期于建均，等：仿人机器人步态平衡泛化模型的建立与仿真 ·545·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录