正在加载图片...
·1028· 智能系统学报 第14卷 GP(nlk,)= V()>0,YEeR,≠ 1 ep26.-ue''.-W (4) V()<0,YgeR,≠ (12) V(2)24 V(G)=0,()=0 式(3)、(4)中:GP()为高斯过程概率密度函 为了得到式(10)中DS的稳定条件,可以构 数,或可简化表示为N);K为GMM中高斯分布 造如下的Lyapunov函数: 的个数/混合模型的个数;为第k个高斯分布的 V0=2g-)'《-),geR (13) 权重,且∑,=1:4为该密度函数的均值向量; 由式(12)、(13)可以求得保证DS全局稳定的 为协方差矩阵;相应的GMM的待确定参数可 充分条件 以表示为0={w,,,k=1,2,…,K;且全部参数 (A+B)=0 (14) 表示为0={0,2,…,0x}。 A:+(A)<0 k=1,2,…,K 给定(、:的条件概率分布为 将式(14)作为DS的约束条件,则DS满足全 p(515.K)=N(215.5) (5) 局收敛的特性。同时,考虑高斯混合模型的性质 其中: 和式(14)的条件,其共同组成了具有全局渐进稳 i=pa+iaea(6-pa) 定的动态系统的完整的约束条件。此后,需要求 (6) 解动态系统模型的相应参数,得到对于动态系统 =2i-卫t2E2x (7) 完整的描述。 由此,¢对应于(的条件概率可以定义为 pt)-∑ANia) 3动态系统参数学习 (8) k=1 为了学习得到具有全局渐近稳定的DS,需要 wrp(k) wN(Sua.Ea) B= (9) 对其参数进行求解。由以上可知DS的未知参数 uN(Gu2马) 为0={w1,,…,心44,2,…,;,2,…,0本文 通过将动态系统参数学习的过程转化为求解一个 由条件期望可求得整个高斯混合模型中¢的 非线性优化问题,在保证模型全局渐近稳定的约 总的期望为 束条件下求解优化问题来计算日的最优值。使用 =fg0= H((A +B) (10) 对数似然函数作为优化的目标函数 N 其中: argminJ=-7∑∑ logp(0) (15) Ak=Siacd H()=cp(sk) 对应的约束条件为 k=1.2.…,K (11) (A'+Bx)=0 A+(A)<0 >0 B:=Hak-Aullck 0<w≤1 k=1,2,…,K (16) 式(10)、(11)得到的动态系统表示为一组线 性动态系统的非线性加权的形式,也即得到了关 2=1 于示教运动的动态系统模型的具体表达形式。 式中T=∑工是训练数据点总的数量,也即示教 2动态系统全局稳定的充分条件 数据的数量。 由以上得到的动态系统模型,为了保证动态 对于以上优化问题,可以将其化为非线性规 系统模型在示教的目标点具有全局收敛的特性以 划问题,借助于标准的优化约束技术可以很好 及提高其泛化能力,也即将在不同的初始点开始 地解决,最终得到具有全局渐近稳定的动态 最终到达同一目标点的模仿学习任务转化为具有 系统的最优参数θ,实现对于动态系统的完整 全局收敛的学习任务,则需要考虑其稳定性问 描述。 题。对于由i=f(G)定义的动态系统,根据Lya- 4机器人模仿学习系统的设计 punov稳定性理论:其在点处全局渐近稳定的 充分条件是存在一个连续可微的Lyapunov函数 在以上内容的基础上,设计了基于DS的机 V():R→R满足: 器人模仿学习系统。所设计的机器人模仿学习系GP(ζn|µk ,Σk) = 1 √ (2π) 2d |Σk | exp{ − 1 2 (ζn −µk) T Σ −1 k (ζn −µk) } (4) GP(·) N(·) K ωk k ∑K k=1 ωk = 1 µk Σk θk = {ωk ,µk ,Σk}, k = 1,2,··· ,K θ = {θ1, θ2,··· , θK} 式 (3)、(4) 中: 为高斯过程概率密度函 数,或可简化表示为 ; 为 GMM 中高斯分布 的个数/混合模型的个数; 为第 个高斯分布的 权重,且 ; 为该密度函数的均值向量; 为协方差矩阵;相应的 GMM 的待确定参数可 以表示为 ;且全部参数 表示为 。 给定 ζ、ζ˙ 的条件概率分布为 p ( ζ˙|ζ, k ) = N ( ζ˙| ˜ ζ˙ k ,Σ˜ ζ˙ζ˙k ) (5) 其中: ˜ ζ˙ k = µζ˙k +Σζζ˙ kΣ −1 ζζk ( ζ −µζk ) (6) Σ˜ ζ˙ζ˙k = Σζ˙ζ˙k −Σζζ˙ kΣ −1 ζζkΣζζ˙k (7) 由此, ζ˙ 对应于 ζ 的条件概率可以定义为 p ( ζ˙|ζ ) = ∑K k=1 βkN ( ζ˙| ˜ ζ˙ k ,Σ˜ ζ˙ζ˙k ) (8) βk = ωk p(ζ|k) ∑K k=1 ωk p(ζ|k) = ωkN ( ζ|µζk ,Σζζk ) ∑K i=1 ωiN ( ζ|µζi ,Σζζi ) (9) 由条件期望可求得整个高斯混合模型中 ζ˙ 的 总的期望为 ζ˙ = ˜f (ζ) = ∑K k=1 Hk (ζ) (Akζ + Bk) (10) 其中:    Ak = Σζζ˙ kΣ −1 ζζk Hk (ζ) = ωk p(ζ|k) ∑K i=1 ωip(ζ|i) Bk = µζ˙k − Akµζk ∀k = 1,2,··· ,K (11) 式 (10)、(11) 得到的动态系统表示为一组线 性动态系统的非线性加权的形式,也即得到了关 于示教运动的动态系统模型的具体表达形式。 2 动态系统全局稳定的充分条件 ζ˙ = f (ζ) ζ ∗ V (ζ) : R d → R 由以上得到的动态系统模型,为了保证动态 系统模型在示教的目标点具有全局收敛的特性以 及提高其泛化能力,也即将在不同的初始点开始 最终到达同一目标点的模仿学习任务转化为具有 全局收敛的学习任务,则需要考虑其稳定性问 题。对于由 定义的动态系统,根据 Lya￾punov 稳定性理论:其在点 处全局渐近稳定的 充分条件是存在一个连续可微的 Lyapunov 函数 满足:    V (ζ) > 0,∀ζ ∈ R d , ζ , ζ ∗ V˙ (ζ) < 0,∀ζ ∈ R d , ζ , ζ ∗ V (ζ ∗ ) = 0,V˙ (ζ ∗ ) = 0 (12) 为了得到式 (10) 中 DS 的稳定条件,可以构 造如下的 Lyapunov 函数: V (ζ) = 1 2 (ζ −ζ ∗ ) T (ζ −ζ ∗ ),∀ζ ∈ R d (13) 由式 (12)、(13) 可以求得保证 DS 全局稳定的 充分条件 { (Akζ ∗ + Bk) = 0 Ak +(Ak) T < 0 ∀k = 1,2,··· ,K (14) 将式 (14) 作为 DS 的约束条件,则 DS 满足全 局收敛的特性。同时,考虑高斯混合模型的性质 和式 (14) 的条件,其共同组成了具有全局渐进稳 定的动态系统的完整的约束条件。此后,需要求 解动态系统模型的相应参数,得到对于动态系统 完整的描述。 3 动态系统参数学习 θ = {ω1,ω2,··· ,ωk ;µ1,µ2,··· ,µk ;Σ1,Σ2,··· ,Σk} θ 为了学习得到具有全局渐近稳定的 DS,需要 对其参数进行求解。由以上可知 DS 的未知参数 为 。本文 通过将动态系统参数学习的过程转化为求解一个 非线性优化问题,在保证模型全局渐近稳定的约 束条件下求解优化问题来计算 的最优值。使用 对数似然函数作为优化的目标函数 argmin θ J (θ) = − 1 T ∑N n=1 ∑Tn t=0 logp ( ζt,n|θ ) (15) 对应的约束条件为    (Akζ ∗ + Bk) = 0 Ak +(Ak) T < 0 Σk > 0 0 < ωk ⩽ 1 ∑K k=1 ωk = 1 ∀k = 1,2,··· ,K (16) T = ∑N n=1 式中 Tn 是训练数据点总的数量,也即示教 数据的数量。 θ 对于以上优化问题,可以将其化为非线性规 划问题,借助于标准的优化约束技术可以很好 地解决,最终得到具有全局渐近稳定的动态 系统的最优参数 ,实现对于动态系统的完整 描述。 4 机器人模仿学习系统的设计 在以上内容的基础上,设计了基于 DS 的机 器人模仿学习系统。所设计的机器人模仿学习系 ·1028· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有