D0I:10.13374/i.issn1001-053x.1993.06.012 第15卷第6期 北京科技大学学报 Vol.15 No.6 1993年12月 Journal of University of Science and Technology Beijing Dec.1993 位置/力的自学习混合控制及其应用 罗飞*余达太*孙一康* 摘要:综合了Raibert和Craig提出的机器人位置/力的Hybrid Control及Yoshikawa提出的机 器人动态混合控制算法的基本思想,针对作业环境及其力学扰动难以辨识及机构振动等问题,提 出了基于机器人装配作业的PI自学习混合控制方法,并根据此方法实现了三自由度机器人的圆柱 二维插入作业。实验结果表明,该方法可以有效地实现机器人的销孔装配作业并抑制或缓冲机构 的振动现象, 关键词:机器人,混合控制,控制系统,机器人/自学习 中图分类号:TP242 Learning Hybrid Position/Force Control and Its Application Luo Fei*Yu Datai**Sun Yikang* ABSTRACT:This paper combines the robot position/force hybrid control algorithm proposed by Raibert and Craig and the robot dynamic hybrid control algorithm proposed by Yoshikawa.Taking account of the difficulty to identify the environment,especially the effect of mechanical disturbance,and the vibrations of mechanism,a PI learning hybrid control algorithm for using robot to do assembly task was presented.This algorithm was realized in a peg insertion by a three DOF robot.The experiment results showed that this algorithm could effectly realize the peg-and-hole task,and restrain and weaken the vibrations of mechanism. KEY WORDS:robot,learning,hybrid control,control systems,robots self-learning Mason首先提出通过适当的人为约束来改变自然约束的力控制方法;Raibert和Craig】 根据Mason的理论提出了位置与力的混合控制(Hybrid Control)方法。但是,该方法未考 虑机器人的动力学特征,不能解决由环境变化而引起控制系统不稳定的问题。Yoshikawa3】 提出的动态混合控制算法在一定程度上实现了对理想约束力和运动加速度的跟踪,但却未能 保证速度或位置的准确控制。这是由于机器人系统模型的不确定性和外界力学干扰所带来的 结果。 本文借助于微电子技术的原理,实现人的学习功能。基于上述思想以及关于学习控制误 1993-09-18收稿第-作者男,36岁,博士生 +中日合作项目 *自动化系(Department of Automation) *◆机器人研究所(Robotics Research Institute)
第 卷 第 期 年 月 北 京 科 技 大 学 学 报 面 忱 。 址二 位置 力 的 自学 习混合控制及其应用 十 罗 飞 ’ 余达 太 “ 孙一 康 ’ 摘要 综合了 成 和 提 出的 机 器人 位置 力 的 。 咖 及 城 认公 提 出 的 机 器 人 动 态 混 合控制算 法 的基 本 思 想 , 针对作业环境及其力学扰动难 以 辨 识及 机构振 动等 问题 , 提 出 了基于 机器 人装配作业的 自学习 混合控制方法 , 并根据此方法实 现 了三 自由度 机 器 人 的 圆 柱 二维插人作业 。 实验结果表 明 , 该方法可 以 有效地 实现机器 人的销孔 装配作 业并抑 制 或缓冲机构 的振动现象 。 关键词 机器 人 , 混合控制 , 控制 系 统 , 机器 人 厂自学 习 中图分类号 玩 而 十 加 。 万’ 派 介 ’ 刀 助 汤 , 颐 压众 兀以上 以 , 五犯 , 场 污 认吼 以 双沮 代芜 皿 心 】 、 以」 」 爪斌】 以 二 一 一 , 心恤 扭 蓝℃ 此瓜 二 , 鹿 , , 招 , 盯 一 ’ 首先提 出通过适 当的人 为约 束来改 变 自然 约束 的力控 制方法 和 服 ’ 】 根 据 的理论提 出了位置 与力 的混合控制 方 法 。 但 是 , 该方 法 未 考 虑 机 器 人 的 动力 学 特 征 , 不能 解决由环境 变 化 而 引起控制 系 统 不稳 定 的 问题 。 议 呱 ’ 提 出 的动态 混合控制算法在 一定 程度上 实现 了对理 想约束力 和运 动加速度 的跟踪 , 但却未能 保证速 度或位 置 的准确 控制 。 这 是 由于 机器人 系 统模型 的不确 定性 和外界力 学干扰所带来的 结果 。 本 文借助 于 微 电子技术 的原理 , 实现 人的学 习 功能 。 基于上述 思想 以 及 关 于学 习控制误 卯 一 伪 一 收 稿 第一 作者 男 , 岁 , 博士 生 十 中 日 合作项 目 自动 化 系 决 叫 机器 人 研 究 所 晓 艾曰比 ‘ DOI :10.13374/j .issn1001-053x.1993.06.012
.606 北京科技大学学报 1993年No.6 差的收敛性结果【),提出PI自学习混合控制方案,以期解决在不知道系统动特性和外部扰动 的情况下,通过实时反复学习计算控制,进行位置与力的混合控制在机器人装配作业中的理 论及其应用的探讨。 1PI自学习Hybrid控制的系统分析 机器人在进行装配作业时,包含对象外力在内的自由度动态方程可以表示为如下形 式: M0)6+h(0、8)+g(0)=V-J'F (1) 其中: :关节坐标向量; g(0):重力向量; M():正定对称惯性矩阵; V:关节驱动力和反馈作用等组成的向量; h(0,):粘性摩擦、哥氏力、向心力等 F:外力向量; 组成的向量; J:雅可比矩阵。 设q为作业基座坐标向量;W为基座坐标下的驱动力和反馈作用向量,则有如下关系: 9=J8 q=r(8) V=J"w 日=J19-J1j6 (2) 将(2)式代人(I)式,则基座坐标系下的动态方程可用下式描述。 M.(g)q+h(q,9)+9.(g)+F=W (3) 设由m个方向的位移组成位置控制向量q;n一m个方向的分量组成力控制向量q, 则: g”=〔9、42…9mJ' (4) 相应地有: -[ (5) 其中:eP、e分别为位置与力的误差向量。 设机器人系统采用具有积分补偿的伺服控制,q”、9分别为位置和力的目标值,则其 输人W为: Kmp(q2-q)+Km(qi-g")+Km(qi-q")dt W= K,(-f)+K。(-+K,(-fa] (6) 其中:KpKa、K。、∈Rmm Kp,Ka、Ka、eRam)xa) 它们分别为位置和力的反馈增益矩阵,且均仅有相应的对角正值常数;“为关节驱动力的控
北 京 科 技 大 学 学 报 男 年 差 的收敛性 结果 【呜 , 提 出 自学 习混合控制方 案 , 以期解 决在 不 知道 系 统动特性 和外部扰动 的情 况下 , 通 过 实时反复学 习计算控 制 , 进行位 置 与 力 的 混 合控制 在 机 器 人 装 配 作 业 中 的理 论 及其应 用 的探讨 。 自学习 控制的系统分析 机 器人 在 进行 装 配 作 业 时 , 包 含 对 象外 力 在 内 的 自由度 动 态 方 程 可 以 表 示 为如 下 形 式 ,’ , 。 、 乡 。 一 一 , 其 中 伏 关 节 坐标 向量 重力 向量 正 定 对称惯性 矩 阵 关节 驱 动力 和反 馈作 用等组 成 的 向量 , 句 粘 性 摩擦 、 哥 氏力 、 向心 力等 外力 向量 组 成 的 向量 二 雅可 比矩 阵 。 设 为作 业基座 坐标 向量 为基座 坐 标下 的驱 动力 和反 馈作用 向量 , 则有 如下 关 系 毛一 , 。 一 一 , 万一 一 , ,’ 一 一 , 于占 将 式 代 人 式 , 则基 座 坐标系 下 的动 态方程 可 用下 式描述 。 。 。 , 设 由 。 个 方 向 的 位 移 组 成 位 置 控 制 向 量 ‘ 几 。 一 阴 个 方 向 的 分 量 组 成力 控 制 向 量 ’ 二 【 、 · · … ’ 。 二 ’ 少 。 、 、 。 十 , “ ” ‘ 。 相 应地 有 」 其 中 ’ 、 分别 为位 置 与力 的误差 向量 。 设 机 器 人 系统采 用具有 积分 补偿 的伺服 控制 , 、 二 、 、 二分 别 为位 置 和 力 的 目标 值 , 则 其 输人 为 , 。 一 、 ’ , 母二一 吞 , 凡 万一 凡 方 一 尹 十 灼 ‘丁 ‘、 丁一 “ ” 一 了 “ 刀 一 , ‘ 」 其 中 ,。 、 川 、 , 凡 、 称 、 价 分 任 ” 一 ” ‘ ” 一 它们 分 别 为位 置 和 力 的反 馈增益 矩 阵 , 且 均 仅有相 应 的 对角 正 值 常数 为关 节 驱 动 力 的控
Vol.15 No.6 罗飞等:位置/力的自学习混合控制及其应用 ·607. 制输入。 现在的问题是如何确定u。设 e”=g-q”; ek=ga-qk e'=日-f; el=qa-qi (7) 则根据PI学习控制误差的收敛性56!有: Φ,e+rp∫edt1 k+=山g十 (8) L e:+r,Serdt] 其中:e。=0;e。:uo=0;①。、中r「p「为相应的对角常数矩阵。据此,可以构造出 如图1所示的系统结构。 图1中的Φ、下分别为: w=diag(Φ,、Φ);T=diag(rp、rr)(9) 机器人动态 memory memory为RAM存贮单元。即通过自学习 系统 被修正的控制输人“k+,更新上一次被存贮 的4x后,作为当前伺服系统的输人。通过 中与厂的系数选择,可以保证位置与力的 误差5)。 iek+1l≤ple,0≤p≤1 或ie+1目≤le,l 图1PI自学习混合控制系统结构 因此,图1所示的系统是全局稳定的。 Fig.1 System configuration of PI laming hybrid control 2基于PI自学习Hybrid控制的插入过程 对于目前水平的机器人来讲,即使是最简单的装配作业,也是一个复杂的控制过程。但 是,如果把某个装配动作进行分解,可以发现它们非常单纯与简单。因此,可以通过这些简 单的基本动作集的组合,实现从作业的描述、装配作业规划到上述位置与力的自学习Hybd 控制的有机结合,实现机器人的复杂作业。为了保证机器人在装配作业中的位置、姿态与力 的控制,机器人最少需要6个自由度。为了简化问题的复杂性而又不失一般性,可以把机器 人力控的方向限定在垂直方向。这样,就可以利用3个自由度的机器人来讨论销孔的装配问 题。 如图2所示,令受环境约束的坐标要素为1,其他为0,则受约束的坐标可以用SX来表 示;不受约束的坐标可以用(I-S)X表示(1为n次单位矩阵)。即:S=[S、S、S,] 为位置与力的控制标志。其中: 〔0位置控制 S,= (1力控制 销孔插入过程可以分解为4步,如图3所示。 (a)通过位置控制把部件移动到图3中的(a)所示位置(S=[0、0、0])
罗飞等 位置 力 的 自学 习 混合控制及其应用 制输人 。 现 在 的 问题是如 何确 定 。 。 设 。 尸 召二一 夕 。 ‘ 一 万一 则根据 学 习控制误差 的收敛性 〔, 有 。 二 二一 荟 二 一 荟 一 , 一 ‘ · …电 “ 十 · ‘ “ £ 亡 鸣 厂 , 」 其 中 二 。 。 一 巾 , 、 。 二 、 为 相 应 的 对角 常 数 矩 阵 。 据 此 , 可 以 构 造 出 如 图 所示 的系 统结构 。 图 中的 小 、 分别 为 中 血 叭 、 鸣 二 , 、 耳 扛幻 为 存 贮单元 。 即通过 自学 习 被 修正 的控制输人 ,更 新上 一次 被存贮 的 后 , 作为 当前伺服 系 统 的输人 。 通过 中 与 的系 数选 择 , 可 以 保证位置与 力 的 误差 , 。 。 , 户 、 , 毛 户 毛 或 气 十 , 毛 、 因此 , 图 所示 的系 统是 全局稳定 的 。 瑰 】 翻价 八 甲、 一 一 ‘ 吠 口 图 自学 习混合控制系统结构 娜助 叨曲妙。 位翔 嗯 必向 佣 叭 基于 自学 习 控制的插入过程 对于 目前水平 的机器 人来讲 , 即 使是 最 简单的装 配作 业 , 也是一 个复杂 的控 制过 程 。 但 是 , 如果把某个装 配动作进行分解 , 可 以 发现它们非 常单纯 与 简单 。 因此 , 可 以 通过这 些简 单 的基 本动作集 的组合 , 实现从作 业 的描述 、 装 配作 业规划 到 上 述 位 置 与力 的 自学 习 控制 的有 机结合 , 实现机器人 的复杂作 业 。 为 了保证机器人在 装配作 业 中的位 置 、 姿态 与力 的控制 , 机器人最 少需 要 个 自由度 。 为 了简化 问题 的复杂性 而 又 不 失 一 般性 , 可 以把 机器 人 力控 的方 向限定 在垂 直方 向 。 这 样 , 就可 以 利 用 个 自由度 的 机器人 来讨论销孔 的装 配 问 题 。 如 图 所示 , 令受环境约束 的坐 标要 素为 , 其他 为 , 则受 约束 的坐 标可 以 用 来 表 示 不 受约束 的 坐 标 可 以 用 一 表 示 为 。 次 单位 矩 阵 。 即 二 、 又 、 凡 、 丁 为位置 与 力 的控制 标志 。 其 中 位置控制 力控 制 八卫‘ 飞 、 一 销孔 插入过程 可 以 分解 为 步 , 如 图 所示 。 通 过位置控制把部 件移 动到 图 中的 〔 所示 位置 二 、 、 丁
.608. 北京科技人学学报 1993年No.6 (b)在Z的正方向施加一个力,把部 件移向洞内,直到与洞口发尘接触为止(S= [0、1、01'): (c)首先达到图3(b)所示的两点接触 状态,这是通过X,Z的正方向分别施加一 定的力米实现的。然后在保持两点接触的 状态下.转动部件,直到0为0°、达到图 3(C)的状态为止.(S=[1.1.0]T: (d)在保持X方向的力和转矩为零的 情况下,在Z的正方向施加一个较大的力 将部件插人洞(S=[1.1.1])。 从上述作业过程可知,装配作业可以 分解为若干个基本动作单元。在这个实验 图2位置与力的约束 中,它可以分为0点接触状态:1点接触 Fig.2 Constraint of position and force 状态;2点接触状态和3点接触状态。在 0点接触状态,机器人不受运动约束,可 以在二维空间作任意运动;在】点接触状 念、能够运动的自由度为n一1,且受到回 转运动屮心的约束;在2点接触状态,能够 2廿0 运动的自由度为n一2,且约束在2个接触 法线的交点:3点接触状态则完全固定了 机器人的位置与姿态,只能进行具有力约 图3销孔插入过程 束的挖制。上述4种动作形态。对非元余 Fig.3 Peg insertion procedure 门由度机器人的二维装配作业,是具有一般性的。对于一维空间装配作业或多面体装配对 象,可以按同样的方法」纳出史为复杂的装配作业基本动作单元的集合并与环境数据存贮在 上位计算机内存单元之中。上位计算机根据位置与力传感器的信息状态进行分析、判断、给 出对基本动作集合元素的合理组合,完成位置与力的自学习Hybd控制的实时切换、实现 机器人的复杂装配作业。 在本实验系统中,如图2所示,手部坐标向量为【X、Y。日].基座坐标向量为y=【X. Z.].力传感器检测到的信号在手部坐标系下的向量泰=【、、mx]T,经过坐标变换 P后i,到基本坐标系下的向量为∫=【∫,五、m]且∫=P: 系统的实验装置由II本NEC PC98XL2微处理机和PRODALL CTZ-O33直角坐标机 器人组成:插人部件为Φ11.95mm的圆柱销、被插入部件的孔径为中12.01mm,深度为 20mm.系统由C语言实现.采样周期为4.2ms,反馈系数如下选取。 ".=diag[0.2.0.2、0.2]C。=diag[0.008、0.008、0.008] Φ,=diag[0.75.0.75.0.75][,=diag[0.0025、0.0025.0.0025]
匕 京 科 技 人 学 学 报 卯 年 白 在 的正 方 向施 加 一 个 力 , 把部 件 移向洞内 , 直到 与洞 口 发生接 触 为止 【 、 、 了 首先达到 图 所示 的 两点接触 状态 这 是通 过 , 的正 方 向分 别施加 一 定 的 力 来 实 现 的 。 然 后 在 保 持 两 点 接 触 的 状态 下 转 功 部 件 , 直 到 为 , 达到 图 的状 态 为止 , , 了 在保持 方 向的力 和转 矩 为零 的 情 况 下 , 在 的 正 方 向施 加一 个较 大 的 力 将 部 件插 入 洞 一 , , ” 。 从上 述 作 业过 程 可 知 , 装 配作 业可 以 分解 为若于 个基 本 动 作单 元 。 在 这 个实验 中 , 它 可 以 分 为 点 接 触状 态 点接 触 状 态 点接 触状态 和 点接 触状 态 。 在 点接 触状态 , 机 器 人不 受 运 动约 束 , 可 以 在 气 维空 间作任 意 运 动 在 点 接 触状 态 能 够运 动 的 自由度 为 , 一 , 且 受到 回 转运 动 ‘扣心 的约 束 在 点 接触状 态 , 能够 运 动 的 白由度 为 。 一 、 且 约 束在 个接 触 法 线的 交点 点接 触状态 则完 全 定 了 机 器 人的 位 置 与姿态 , 只 能进行具 有力约 束的控 制 。 卜述 种 动 作形态 。 对 非冗余 厂 图 位 与 力的约束 渭喊,城 对丘价 翻日 如万 亏母、 ,‘一 、﹃ 图 销孔插入 过程 瑰 饨 如嫂致汕, 冈旧汕此 山度 机 器 人的二 维 装配作 业 , 是 具有 一 般性 的 。 对于 气 维 空 间 装 配 作 业 或 多 面 体装 配 对 象 , 可 以 按 同样的 方 法 纳 出 更为复杂 的装配 作 业基 本动作单 元 的集 合并 与环境 数据 存 贮在 卜位 计 算机 内存单 元 之 中 。 上 位计 算机 根据 位 置 与力传感 器 的信息状 态进 行 分 析 、 判 断 、 给 出对基 本 动作集 合元 素 的 合理 组 合 , 完成 位 置 与 力的 白学 习 控 制 的 实 时 切 换 、 实 现 机 器 人的 复杂装 配 作 业 。 在 本实 验 系统 中 , 如图 所示 , 手 部 坐 标 向 量 为 戈 、 欢 、 们 , 基 座 坐 标 向量 为 二 , , 。 力传感 器 检测 到 的信号 在手 部 坐 标 系 卜的 向量 关二 五、 五 、 。 门 了, 经 过 坐 标 变换 后 , 到 基 本坐 标 系 卜的 勺量 为 厂一 【几 儿 、 ” 且 弓 。 。 系统 的 实验 装置 山 本 微处理 机 和 一 直 角 坐 标 机 器 人组 成 插 入 部 件 为 中 日 的 圆 柱 销 , 被 插 人 部 件 的 孔 径 为 中 刀 , 深 度 为 们门 。 系统 由 语 言实现 采样 周 期 为 此 , 反 馈 系数 如下 选取 。 中。 二 · 、 · 、 , “ 【 · 、 、 中 , · 、 · 、 · , · 、 、 ·
Vol.15 No.6 罗飞等:位置/力的自学习混合控制及其应用 ·609 3实验结果 本实验按前述4个步聚完成了如图3所示()~(d)的插入过程,图4是插入演示照 片。图5给出了力和力矩的输出结果。为了更清楚地观察力的变化情况,以一∫的形式输出。 由于输出结果是从传感器读出的值,所以存在一些误差。在保持两点接触时,为了克服 摩擦的影响、有必要让人大于∫。从实验结果可以看出,该方法与一般PD或PI控制方法 相比、振动现象被消除了许多,结果是良好的。 301 201 0 -104 z-20 8-0.25507310025150 T/3 图4圆柱插入过程的照片 图5力和力矩的输出 Fig.4 Picture of peg insertion procedure Fig.5 Output of force and torque 4结论 通过位置与力的自学习混合控制方法分析,给出了系统结构,并结合三白由度机器人 圆柱的插人实验,说明了PI自学习Hybd控制在即使不知道系统的动态特性和外界力学干 扰,且对机器人的重力项未加补偿的情况下,也能对系统进行有效的控制。该方法不仅能完 成机器人的装配作业,而且大幅度减缓了以往方法的振动现象。 参考文献 1 Mason M T.IEEE Trans Syst Man Cyber,1981,SMC-11(6):418 2 Raibert M H.Craig J J.Trans ASME,J Dyn Syst Meas Contr,1981,102 375 3 Yoshikawa T.Sugie T.Tanaka M.Proc,1987 IEEE Int Conf on Robotics and Automation,1987,2005 4 Kawamura S.Miyazaki F.Arimoto S.Proc of ICAR'85.Tokyo.1985,235 5 Arimoto S.In:Narendra S ed:Adaptive and Learning Systems.1986,379
罗 飞等 位置 力 的 自学 习 混 合控制 及 其应 用 实验结果 本 实验按 前述 个 步 聚 完 成 了 如 图 所 示 一 的 插 人 过 程 , 图 是 插 人 演 示 照 片 。 图 给 出了力 和 力矩 的输 出结 果 。 为了更清楚地观 察力 的变化情况 , 关以 一 关的形 式 输 出 。 由于 输 出结果 是 从传感 器读 出的值 , 所 以 存在 一 些误差 。 在 保持 两点 接触 时 , 为 了 克服 摩擦 的影 响 , 有 必要 让 关大 于 人 。 从实验 结果 可 以看 出 , 该方法 与 一 般 或 控 制 方 法 相 比 , 振 动现 象被 消除 了许多 , 结 果 是 良好 的 。 图 圆柱插入过程 的照 片 巧 “ 班名 贬祀币 厄此 图 力和 力矩 的输出 珑 咖 此 。 闭 勿仰犯 结 论 通 过 位置 与 力 的 自学 习混 合控 制方 法 分 析 , 给 出 了 系 统结 构 , 并 结 合三 自由度 机 器 人 圆柱 的插 人 实验 , 说 明 了 自学 习 控 制 在 即使不 知道 系 统 的动 态特性 和 外 界 力 学 干 扰 , 且 对机 器 人 的重 力项 未加 补偿 的情 况下 , 也 能 对 系统进 行 有效 的控制 。 该方 法 不仅能完 成机 器 人 的装配 作业 , 而且 大 幅度减 缓 了 以 往方 法 的振 动 现象 。 参 考 文 献 , , 一 , , , , , , , , , , , 甜 , 丙 ‘ , , , , 飞