最优控制理论 选用教材:王朝珠、秦化淑编著最优控制理论科学出版社 教学参考书:符曦编著系统最优化及控制机械工业出版社 解学书最优控制一理论与应用清华大学出版社
最优控制理论 选用教材: 王朝珠、秦化淑 编著 最优控制理论 科学出版社 教学参考书:符曦编著 系统最优化及控制 机械工业出版社 解学书 最优控制—理论与应用 清华大学出版社
第一章绪论 第二章数学准备 第三章用变分法求解最优控制问题 第四章极小值原理及其应用 第五章线性二次型问题的最优控制 第六章动态规划法
第一章 绪 论 第二章 数 学 准 备 第三章 用变分法求解最优控制问题 第四章 极小值原理及其应用 第五章 线性二次型问题的最优控制 第六章 动态规划法
第一章绪论 最优控制是系统设计的一种方法。它所研究的中心问题是如何选择控制信号才 能保证控制系统的性能在某种意义下最优 1-1最优控制发展简史 :最优控制的发展 第二次世界大战以后发展起来的自动调节原理,对设计与分析单输入单输出的线 性定常系统是有效的;然而近代航空及空间技术的发展对控制精度提出了很高的 耍求,并且被控制的对象是多输入多输岀的,参数是时变的。面临这些新的情 况.建立在传递函数基础上的自动调节原理就日益显出它的局限性来。这种局限 性首先表现在对于时变系统,传递函数根本无法定义,对多输入多输出系统从传 递函数概念得出的工程结论往往难于应用。由于工程技术的需要,以状态空间概 念为基础的最优控制理论渐渐发展起来。最优控制理论是现代控制理论的核心, 20世纪50年代发展起来的,已形成系统的理论。 最优控制理论所要解决的问题是:按照控制对象的动态特性,选择一个容许控制, 使得被控对象按照技术要求运转,同时使性能指标达到最优值
第一章 绪 论 1-1最优控制发展简史 最优控制是系统设计的一种方法。它所研究的中心问题是如何选择控制信号才 能保证控制系统的性能在某种意义下最优。 一:最优控制的发展 第二次世界大战以后发展起来的自动调节原理,对设计与分析单输入单输出的线 性定常系统是有效的;然而近代航空及空间技术的发展对控制精度提出了很高的 耍求,并且被控制的对象是多输入多输出的,参数是时变的。面临这些新的情 况.建立在传递函数基础上的自动调节原理就日益显出它的局限性来。这种局限 性首先表现在对于时变系统,传递函数根本无法定义,对多输入多输出系统从传 递函数概念得出的工程结论往往难于应用。由于工程技术的需要,以状态空间概 念为基础的最优控制理论渐渐发展起来。最优控制理论是现代控制理论的核心, 20世纪50年代发展起来的,已形成系统的理论。 最优控制理论所要解决的问题是:按照控制对象的动态特性,选择一个容许控制, 使得被控对象按照技术要求运转,同时使性能指标达到最优值
二:研究最优控制的方法 从数学方面看,最优控制问题就是求解一类带有约束条件的泛函极值问题,因此 这是一个变分学的问题:然而变分理论只是解决容许控制属于开集的一类最优控 制问题,而在工程实践中还常遇到容许控制属于闭集的一类最优控制问题,这就 要求人们研究新方法 在研究最优控制的方法中,有两种方法最富成效:一种是苏联学者庞特里雅金提 出的“极大值原理”;另一种是美国学者贝尔曼提出的“动态规划” 极大值原理是庞特里雅金等人在1956至动态规划是贝尔曼在1953年至 1958年间逐步创立的,先是推测出极大1958年间逐步创立的,他依据最优 值原理的结论,随后又提供了一种证明性原理发展了变分学中的哈密顿-雅 方法。 可比理论,构成了动态规划
二:研究最优控制的方法 从数学方面看,最优控制问题就是求解一类带有约束条件的泛函极值问题,因此 这是一个变分学的问题:然而变分理论只是解决容许控制属于开集的一类最优控 制问题,而在工程实践中还常遇到容许控制属于闭集的一类最优控制问题,这就 要求人们研究新方法。 在研究最优控制的方法中,有两种方法最富成效:一种是苏联学者庞特里雅金提 出的“极大值原理”;另一种是美国学者贝尔曼提出的“动态规划”。 极大值原理是庞特里雅金等人在1956至 1958年间逐步创立的,先是推测出极大 值原理的结论,随后又提供了一种证明 方法。 动态规划是贝尔曼在1953年至 1958年间逐步创立的,他依据最优 性原理发展了变分学中的哈密顿-雅 可比理论,构成了动态规划
求解最优控制问题,可以采用解析法或数值计算法 由于电子计算机技术的发展,使得设计计算和实时控制有了实际可用的计算工具 为实际应用一些更完善的数学方法提供了工程实现的物质条件,高速度、大容量 计算机的应用,一方面使控制理论的工程实现有了可能,另一方面又提出了许多 需要解决的理论课题,因此这门学科目前是正在发展的,极其活跃的科学领域之 最优控制理论在一些大型的或复杂的控制系统设计中,已经取得了富有成效的 实际应用。目前很多大学在自动控制理论课程中已经开始适当增加这方面的内容, 而对于自动控制方面的研究生则普遍作为必修课程
由于电子计算机技术的发展,使得设计计算和实时控制有了实际可用的计算工具, 为实际应用—些更完善的数学方法提供了工程实现的物质条件,高速度、大容量 计算机的应用,一方面使控制理论的工程实现有了可能,另一方面又提出了许多 需要解决的理论课题,因此这门学科目前是正在发展的,极其活跃的科学领域之 一。 最优控制理论在一些大型的或复杂的控制系统设计中, 已经取得了富有成效的 实际应用。目前很多大学在自动控制理论课程中已经开始适当增加这方面的内容, 而对于自动控制方面的研究生则普遍作为必修课程。 求解最优控制问题,可以采用解析法或数值计算法
1-2最优控制问题的实例 例1.1月球上的软着陆问题 飞船靠其发动机产生一与月球重力方向相反的推力 u(t),以使飞船在月球表面实现软着陆,要寻求发动 u(r) 机推力的最优控制规律,以便使燃料的消耗为最少 m() 设飞船质量为m(),高度为h(),垂直速度为v(),发 动机推力为u(t),月球表面的重力加速度为常数g。设 V(#) 不带燃料的飞船质量为M,初始燃料的总质量为 h(r) F.初始高度为ho,初始的垂直速度为v,那么飞船的 运动方程式可以表示为: h(t)=v(1) h(0)=h ()=-g a)初始条件 v(0) m() mi()=-k(t) m(0)=M+F 终端条件m()=0 约束条件0≤(t)≤a v(t,)=0 性能指标是使燃料消耗为最小,即J=m(t)达到最大值 我们的任务是寻求发动机推力的最优控制规律u(t),它应满足约束条件,使飞船由 初始状态转移到终端状态,并且使性能指标为极值(极大值)
1-2 最优控制问题的实例 例1.1月球上的软着陆问题 飞船靠其发动机产生一与月球重力方向相反的推力 u(t),以使飞船在月球表面实现软着陆,要寻求发动 机推力的最优控制规律,以便使燃料的消耗为最少。 设飞船质量为m(t),高度为h(t),垂直速度为v(t),发 动机推力为u(t),月球表面的重力加速度为常数g。设 不带燃料的飞船质量为M, 初始燃料的总质量为 F.初始高度为h0,初始的垂直速度为v0,那么飞船的 运动方程式可以表示为: = − = − + = ( ) ( ) ( ) ( ) ( ) ( ) ( ) m t ku t m t u t v t g h t v t 初始条件 = + = = m M F v v h h (0) (0) (0) 0 0 终端条件 ( ) 0 ( ) 0 = = f f v t h t 性能指标是使燃料消耗为最小,即 约束条件 0 u(t) ( ) f J = m t 达到最大值 我们的任务是寻求发动机推力的最优控制规律u(t),它应满足约束条件,使飞船由 初始状态转移到终端状态,并且使性能指标为极值(极大值)
例1-2拦截问题 在某一惯性坐标系内,设拦截器质心的位置矢量和速度矢量为:xLxL 目标质心的位置矢量和速度矢量为:XMxM F()为拦截器的推力 X=X-x L V=x-x 则拦截器与目标的相对运动方程为: X=v 讠=a(t)+ F() m(t F(t 其中a(t)是除控制加速度外的固有相对加速度,是已知的。 初始条件为:x(t0)=xv(to)=Vm(t0)=m0 终端条件为:x()=0v(t)任意m()≥m
例1—2拦截问题 在某一惯性坐标系内,设拦截器质心的位置矢量和速度矢量为: L x L x 目标质心的位置矢量和速度矢量为: F(t)为拦截器的推力 M x M x L M L M x = x − x v = x − x 则拦截器与目标的相对运动方程为: c F t m m t F t v a t x v ( ) ( ) ( ) ( ) = − = + = 其中a(t)是除控制加速度外的固有相对加速度,是已知的。 初始条件为: 0 0 0 0 0 0 x(t ) = x v(t ) = v m(t ) = m 终端条件为: x(t f ) = 0 v(t f )任意 f me m(t )
从工程实际考虑,约束条件为0≤F()≤mxF() 如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标: J=IC+ F(t]dt 为最小 综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(),驱使系统从初始 状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)
从工程实际考虑,约束条件为 0 F(t) max F(t) 如果我们既要求拦截过程的时间尽量短,又要求燃料消耗尽量少,则可取性能指标: = + f t t J c F t dt 0 [ ( )] 1 为最小 综上所述,所谓最优防天拦截问题,即选择满足约束条件的控制F(t),驱使系统从初始 状态出发的解,在某个时刻满足终端条件,且使性能指标为极值(极小值)
1-3最优控制问题的提法 在叙述最优控制问题的提法之前,先讨论一些基本概念。 1:受控系统的数学模型 个集中参数的受控系统总可以用一组一阶微分方程来描述,即状态方程,其 般形式为 X(t)=f(X(t),l(1)2t) X=[x1,2x2,…,xn]是n维状态向量 u=lu,u 为维控制向量 f(Y(t),u(t),t)为维函数向量 f(X(1)(,t)1「f(x(m),x2()…xn(t),u1()a2()…2(,1) X(t)=f(X(),l(t),)= f2(X()())f(x1(,x2()…x,(1()n2(0)…n() f(X(.())Lf,(x(2x2(O)…x()n(O),n2(2)…a2(.)
1-3最优控制问题的提法 在叙述最优控制问题的提法之前,先讨论一些基本概念。 1:受控系统的数学模型 一个集中参数的受控系统总可以用一组一阶微分方程来描述,即状态方程,其一 般形式为: X(t) = f (X(t),u(t),t) T n X [x , x , , x ] = 1 2 是n维状态向量 T u u u up [ , , , ] = 1 2 为p维控制向量 f (X (t),u(t),t) 为n维函数向量 = = = ( ( ), ( ) ( ), ( ), ( ) ( ), ) ( ( ), ( ) ( ), ( ), ( ) ( ), ) ( ( ), ( ) ( ), ( ), ( ) ( ), ) ( ( ), ( ), ) ( ( ), ( ), ) ( ( ), ( ), ) ( ) ( ( ), ( ), ) 1 2 1 2 2 1 2 1 2 1 1 2 1 2 2 1 f x t x t x t u t u t u t t f x t x t x t u t u t u t t f x t x t x t u t u t u t t f X t u t t f X t u t t f X t u t t X t f X t u t t n n p n p n p n
2:目标集 如果把状态视为η维欧氏空间中的一个点,在最优控制问题中,起始状态(初 态)通常是已知的,即 X(0)=X(0) 而所达到的状态(末态)可以是状态空间中的一个点,或事先规定的范围内, 对末态的要求可以用末态约束条件来表示 81(x(t),tx)=0 81(x(tr)t)≤0 满足末态约束的状态集合称为目标集,记为M,即: M={x(tr)x(t)∈R",81(x(t,t)=0.82(x(r),t)≤0} 至于末态时刻,可以事先规定,也可以是未知的。 有时初态也没有完全给定,这时,初态集合可以类似地用初态约束来表示
2:目标集 如果把状态视为n维欧氏空间中的一个点,在最优控制问题中,起始状态(初 态)通常是已知的,即 ( ) (0) X t 0 = X 而所达到的状态(末态)可以是状态空间中的一个点,或事先规定的范围内, 对末态的要求可以用末态约束条件来表示: = ( ( ), ) 0 ( ( ), ) 0 1 1 f f f f g x t t g x t t 满足末态约束的状态集合称为目标集,记为M,即: { ( ); ( ) , ( ( ), ) 0, ( ( ), ) 0} = 1 f f = 2 f f n f f M x t x t R g x t t g x t t 至于末态时刻,可以事先规定,也可以是未知的。 有时初态也没有完全给定,这时,初态集合可以类似地用初态约束来表示