5.7线性二次型最优控制问题 最优控制问题的一般提法 (1)给出系统的状态方程x=f(x,u) (2)给出控制量u的限制条件 (3)明确始端条件: 给定[,X(0,固定始端的控制问题 6固定,x(0)任意,自由始端的控制问题 (4)明确终端条件:类似于始端条件 (5)给出性能指标 J=p[x(t)]+L[x(t), u(t), t]dt 任务:寻求一个最优控制(1),使系统的状态轨线x(t) 从初态x(t)出发到达x(),且沿此轨线,性能指标最 小,即 J(u(t=min (u(t) (t)
5.7 线性二次型最优控制问题 一.最优控制问题的一般提法 (1)给出系统的状态方程 (2)给出控制量 的限制条件 (3)明确始端条件: 给定 ,固定始端的控制问题; 固定, 任意,自由始端的控制问题. (4)明确终端条件:类似于始端条件 (5)给出性能指标 任务:寻求一个最优控制 ,使系统的状态轨线 从初态 出发到达 ,且沿此轨线,性能指标最 小,即 x = f (x,u) • u [ , ( )] 0 0 t x t 0 t ( ) 0 x t = + f t t J x t f L x t u t t dt 0 [ ( )] [ ( ), ( ), ] u (t) x (t) ( ) 0 x t ( ) f x t ( ( )) min ( ( )) ( ) J u t J u t u t =
分类:对ut无约束--泛函求极值问题,变分法 对u(t)有约束-庞特里亚金极大值原理,动态规划 离散系统 本课程: 线性系统x=Ax+Bn,xO)=x0t0t LQ问题:二次型性能指标 J=x()S()+[x()Qx()+n(O)/(ojt S,Q:半正定,对称矩阵 R:正定,对称矩阵 求'(t)使J(n^(t)=minJ/(l(t)
• 分类:对u(t)无约束-------泛函求极值问题,变分法 对u(t)有约束-------庞特里亚金极大值原理,动态规划 离散系统 本课程: 线性系统 LQ问题:二次型性能指标 求 使 , (0) , [0, ] 0 f x = Ax+ Bu x = x t t • 正定 对称矩阵 半正定 对称矩阵 : , , : , [ ( ) ( ) ( ) ( )] 2 1 ( ) ( ) 2 1 0 R S Q J x t Sx t x t Qx t u t Ru t dt f t t T T f f T = + + u (t) ( ( )) min ( ( )) ( ) J u t J u t u t =
有限时间LQ调节问题 调节问题:受外部动态扰动时,保持x(t)回到零平衡态; 有限时间:t为有限值 IQ问题:二次型性能指标 定理:系统x=4x+B,xO)=x0,∈[0n 使性能指标 x()S()+.x()0()+)()m 为最小的输入,可由下面的状态反馈解给出 (t=rB P(t)x(t) 其中 P(t)为满足终端条件P(t)=S的矩阵Rica微分方 程的正半定对称解阵 P(t)=P(t)A+AP(t)+e-P(tbr B P(t)
二. 有限时间LQ调节问题 调节问题:受外部动态扰动时,保持x(t)回到零平衡态; 有限时间: 为有限值; LQ问题:二次型性能指标。 定理:系统 使性能指标 为最小的输入,可由下面的状态反馈解给出 其中 P(t)为满足终端条件 的矩阵Riccati微分方 程的正半定对称解阵 f t , (0) , [0, ] 0 f x = Ax+ Bu x = x t t • = + + f t t T T f f T J x t Sx t x t Qx t u t Ru t dt 0 [ ( ) ( ) ( ) ( )] 2 1 ( ) ( ) 2 1 ( ) ( ) ( ) 1 u t R B P t x t − T = − P(t f ) = S ( ) ( ) ( ) ( ) ( ) 1 P t P t A A P t Q P t BR B P t T − T • − = + + −
此时,性能指标J的最小值为 min xP(0)x,Vx≠0 证明:该定理给出的是充分条件,实际上也是必要条件
此时,性能指标J的最小值为 证明:该定理给出的是充分条件,实际上也是必要条件。 (0) , 0 2 1 J min = x0 P x0 x0 T
x(t)P(t)x(t)-x(0)P(0)x(0 x' p(ox jdt L P(t)x+x p(o)x+x p(oxlat 2x4P(1)+P(t)+P()4x+uBP()x+xP(t)Bn;dt S xOx+x' P(BR P(x+u'B' P(x+x'P(Buydt 1x Ox-u' Ru+[u+r BP(tx] R[u+rB P(xlat
− − − • • • • = − − + + + = − + + + = + + + + = + + = − f f f f f t T T T T T t T T T T T T t T T T T T t T T T T t T f f f T x Qx u Ru u R B P t x R u R B P t x dt x Qx x P t BR B P t x u B P t x x P t Bu dt x A P t P t P t A x u B P t x x P t Bu dt x P t x x P t x x P t x dt x P t x dt dt d x t P t x t x P x 0 1 1 0 1 0 0 0 { [ ( ) ] [ ( ) ]} 2 1 { ( ) ( ) ( ) ( ) } 2 1 { [ ( ) ( ) ( ) ] ( ) ( ) } 2 1 [ ( ) ( ) ( ) ] 2 1 [ ( ) ] 2 1 (0) (0) (0) 2 1 ( ) ( ) ( ) 2 1
J=2xX()P()x(y)+2xx+nRnlh x(O)P(O)(0)+Lu+R B P(tx] Rlu+RB P(t)x]dt 可见 u(t=RB P(Ox(t) J*=J('()=x2(0)P(0)x(0)
(0) (0) (0) 2 1 ( ( )) ( ) ( ) ( ) [ ( ) ] [ ( ) ] 2 1 (0) (0) (0) 2 1 [ ] 2 1 ( ) ( ) ( ) 2 1 1 0 1 1 0 J J u x P x u t R B P t x t x P x u R B P t x R u R B P t x dt J x t P t x t x Qx u Ru dt T T t T T T T t T T f f f T f f = • = = − = + + + = + + − − − 可见
·综上,有限调节时间IQ问题的综合步骤是: (1)A,B,P(t)=S,QR代入 Riccati=线性矩阵微分方程,解 出增益矩阵P(t (2)构造状态反馈 RB P(t)x(t) 此时闭环状态方程为 x=lA- br B p(tlx x(0)=x B A RB P
• 综上,有限调节时间LQ问题的综合步骤是: (1)A,B,P(tf)=S,Q,R代入Riccati非线性矩阵微分方程,解 出增益矩阵P(t); (2)构造状态反馈 此时闭环状态方程为 ( ) ( ) ( ) 1 u t R B P t x t − T = − 0 1 (0) [ ( )] , x x x A BR B P t x T = = − − • A B C ( ) 1 R B P t − T u x y -
注意: 有限时间IQ调节问题的最优调节系统是状态反馈系统, 反馈矩阵是唯一的。 对象系统虽然是定常的,但闭环系统却是时变的。 Riccati矩阵微分方程是非线性微分方程,难求解析解,可 离散计算。 前述的定理也适用时变线性系统。 无限时间LQ调节问题的最优解 提法:线性系统x=Ax+Bn,x(0)=x 性能指标 Lx(tox(t)+u(tRu(tldt Q,R:正定,对称矩阵;l()无约東
• 注意: --有限时间LQ调节问题的最优调节系统是状态反馈系统, 反馈矩阵是唯一的。 --对象系统虽然是定常的,但闭环系统却是时变的。 --Riccati矩阵微分方程是非线性微分方程,难求解析解,可 离散计算。 --前述的定理也适用时变线性系统。 二.无限时间LQ调节问题的最优解 提法: 线性系统 性能指标 0 x = Ax + Bu, x(0) = x • , :正定,对称矩阵; ( )无约束 [ ( ) ( ) ( ) ( )] 2 1 0 Q R u t J x t Qx t u t Ru t dt T T = +
寻求最优控制,使初态转移到0,且J最小 无限时间调节问题与有限时间调节问题提法上的区别: (1)此处对象为线性定常系统; (2)不考虑终端指标; (3){A,B}可控。 无限调节时间调节器可以看作是终端指标为0,终端时 间趋于无穷,受控系统是定常可控的有限调节时间调节 器问题。 Kalman指出,此时矩阵微分方程的解P(t),当t> 时,P(t)的极限存在且唯一,即 lim P(t)=P 常阵P即为无限调节时间调节器的增益矩阵
寻求最优控制,使初态转移到0,且J最小。 无限时间调节问题与有限时间调节问题提法上的区别: (1)此处对象为线性定常系统; (2)不考虑终端指标; (3){A,B}可控。 无限调节时间调节器可以看作是终端指标为0,终端时 间趋于无穷,受控系统是定常可控的有限调节时间调节 器问题。 Kalman指出,此时矩阵微分方程的解P(t),当 时,P(t)的极限存在且唯一,即 常阵P即为无限调节时间调节器的增益矩阵。t f → P t P t = → lim ( )
求解P的问题变为求解 Riccati代数矩阵方程 PA+A P+Q-PBR B P=0 的正定解。P正定(比较有限调节时间时P(t)半正定) 旦求得P即可得到 u(t=r B px( 闭环系统为 x=[A-br-B Plx 仍保持为定常系统。 对P的要求:最优系统必须是稳定的,即[A-BR-BP] 的所有特征值均具负实部。 可以证明:以上方法构成的最优闭环系统必是大范围渐 近稳定的
求解P的问题变为求解Riccati代数矩阵方程 的正定解。P正定(比较有限调节时间时P(t)半正定) 一旦求得P,即可得到 闭环系统为 仍保持为定常系统。 对P的要求:最优系统必须是稳定的,即 的所有特征值均具负实部。 可以证明:以上方法构成的最优闭环系统必是大范围渐 近稳定的。 0 1 + + − = − PA A P Q PBR B P T T ( ) ( ) 1 u t R B Px t − T = − − • x = A− BR B P x T [ ] 1 [ ] 1 A BR B P − T −