《自动控制原理》课程教学资源：第七章线性系统的校正方法

9.1最优控制的概念设系统的状态方程为 &=f(x,, t) (9.1) 性能指标的数学表达式一般可以表示为 J=[x(t ), ][x(),u(t), ]dr (9.2) 所谓最优控制,就是要确定在[to,t]中的最优控制u,将系统(9.1)的状态从x(to)转移到x(ty),或者x(ty)的一个集合并使性能指标(9.2)最优。

团购合买资源类别：文库，文档格式：PDF，文档页数：29，文件大小：306.53KB

自动控制原理电子教案浙江工业大学自动化研究所 1 第 9 章最优控制 9.1 最优控制的概念设系统的状态方程为 x&= f (x, u,t) (9.1) 性能指标的数学表达式一般可以表示为 ∫ = + f t t f f J x t t L x t u t t dt 0 θ[ ( ), ] [ ( ), ( ), ] (9.2) 所谓最优控制，就是要确定在[ , ] 0 f t t 中的最优控制u ，将系统(9.1)的状态从 ( ) 0 x t 转移到 ( ) f x t ，或者 ( ) f x t 的一个集合，并使性能指标(9.2)最优。 9.2 变分法与泛函的极值条件 1.泛函的概念如果对于自变量t ，存在一类函数{x(t)}，对于每个函数 x(t) ，有一个 J 值与之对应，则变量 J 称为依赖于函数 x(t) 的泛函数，简称为泛函，记作 J[x(t)]。如果泛函 J[x]满足下列关系： [ ] [ ] [ ] [ ] [ ] J x y J x J y J ax aJ x + = + = (9.3) 式中， a 是实数； x, y 是函数空间中的函数，则泛函 J 是线性泛函。 2.泛函的变分泛函 J[x(t)]的变量 x(t) 的变分δx ，定义为 ( ) ( ) * δx = x t − x t ，其中， ( ) * x t 为一标称函数（即最优控制中的最优轨线）， x(t) 为 ( ) * x t 邻域内与 ( ) * x t 属于同一函数类的某一函数。如果泛函 J[x(t)]的增量 ∆J[x(t),δx] = J[x(t) +δx]− J[x(t)] (9.4) 可以表示为如下形式 ∆J[x(t),δx] = L[x(t),δx]+ β[x(t),δx] δx (9.5) 其中，L[x(t),δx]是δx 的线性泛函，且当 δx → 0 时，β[x(t),δx] → 0 ，则线性泛函 L[x(t),δx]称为泛函 J[x(t)]的变分（一阶变分），记作δJ 。由变分的定义可以看出，泛函的变分是一种线性映射，所以，它的运算规则类似于函数的线性运算。设 F1 和 F2 是 x ，x&和t 的函数，则有如下的变分规则：（1） 1 2 1 2 δ (F + F ) = δF +δF （2） 1 2 1 2 2 1 δ (F F ) = F δF + F δF （3） F x x t dt F x x t dt ∫ ∫ δ ( , &, ) = δ ( , &, ) （4） x dt d δx&= δ 3.泛函的极值若泛函 J[x(t)] 在 x = x *(t) 附近的任一曲线上的值不小于 J[x*(t)] ，即 ∆J = J[x(t)]− J[x *(t)] ≥ 0 ，则泛函 J[x(t)]在曲线 x = x *(t) 上达到极小值

自动控制原理电子教案浙江工业大学自动化研究所 2 泛函 J[x(t)]在曲线 x = x *(t) 上达到极小值的必要条件为（证明略） ( *,∆ ) = ( *+ε∆ ) ε =0 = 0 ε δ J x x d d J x x (9.6) 在等式约束下的泛函极值问题，称为条件泛函极值问题。对于条件泛函极值问题，可以应用拉格朗日乘子法将其转化为无约束条件极值问题。 9.3 变分法求解无约束最优控制问题设系统的状态方程为 x&(t) = f [x(t), u(t),t] 0 0 x(t ) = x (9.7) 性能指标为 ∫ = + f t t f f J x t t L x t u t t dt 0 θ[ ( ), ] [ ( ), ( ), ] (9.8) 最优控制问题就是以状态方程（9.7）为约束，确定使泛函（9.8）达到极值所要满足的必要条件。在上面的最优控制问题中，因为对控制变量u(t) 没有约束，所以通常称为无约束最优控制问题。无约束最优控制问题是一个求有等式约束的泛函极值问题，可以采用拉格朗日乘子法把有约束条件问题转化为无约束条件问题。构造增广泛函为 ∫ = + + − f t t T a f f J x t t L x t u t t f x t u t t x t dt 0 θ[ ( ), ] { [ ( ), ( ), ] λ [ ( ( ), ( ), ) &( )]} (9.9) 构造哈密顿函数为 H(x, u, ,t) L(x, u,t) f (x, u,t) T λ = + λ (9.10) 式中， n λ ∈ R 为拉格朗日乘子向量。则增广泛函为 = + ∫ − f t t T J a x t f t f H x u t x dt 0 θ[ ( ), ] { [ , ,λ, ] λ &} (9.11) 设初始时刻 0t 及其状态给定为 0 0 x(t ) = x 。根据终端状态边界条件，可按以下几种情况讨论 1. f t 给定，终端自由，即 ( ) f x t 任意增广泛函 a J 为 ∫ = + − f t t T J a x t f H x u t x dt 0 θ[ ( )] [ ( , ,λ, ) λ &] (9.12) 取 a J 的一阶变分并令其为零，得 ( ) [( ) ( ) ( ) ] 0 0 − − = ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ = = ∫ f f t t T T T T T t t T a x x dt H u u H x x H x x J δλ &δλ λ δ& λ δ δ δ θ δ (9.13) 由于 ∫ ∫ = − f f f t t t T t T t t T xdt x xdt 0 0 0 λ δ& λ δ λ &δ (9.14) 将式（9.14）代入式（9.13），并注意到δx(t0 ) = 0 ，可得 ( ) [( ) ( ) ( ) ] 0 0 − = ∂ ∂ + ∂ ∂ + + ∂ ∂ − + ∂ ∂ = = ∫ f f t t T T T t t T a x dt H u u H x x H x x J δλ λ λ δ λ δ δ θ δ & & (9.15) 由于在上式中， f t ，δx ，δu 和δλ 都是任意的，并且相互独立，所以，增广性能指标泛函 a J 的一阶变分为零，即最优控制问题（9.7），（9.8）取极值的必要条件为正则方程

自动控制原理电子教案浙江工业大学自动化研究所 8 终端约束 0 0 x(t ) = x M[x(t f ),t f ] = 0 f t T f v x M x (t ) [ ( ) ] ∂ ∂ + ∂ ∂ = θ λ f t T f t M v t H(t ) [ ] ∂ ∂ + ∂ ∂ = − θ 9.4 极小值原理控制变量 u(t) 受到限制时的最优控制问题，通常称为有约束最优控制问题。对于有约束最优控制问题，不能应用变分法求解，而需要采用本节所介绍的极小值原理求解。 9.4.1 连续系统的极小值原理设系统的状态方程为 x&(t) = f [x(t), u(t),t] 0 0 x(t ) = x （9.35）式中， n x ∈ R ； p u ∈Ω∈ R ；Ω 为有界闭集。不等式约束为 G[x(t), u(t),t] ≥ 0 （9.36）其中，G 为 m 维连续可微向量函数，m ≤ p 。系统从初始状态 0 x 转移到终端状态 ( ) f x t ，要求终端状态 ( ) f x t 满足等式约束 M[x(t f ),t f ] = 0 （9.37）其中， M 为 q 维连续可微向量函数， q ≤ n 。性能指标为 ∫ = + f t t f f J x t t L x t u t t dt 0 θ[ ( ), ] [ ( ), ( ), ] (9.38) 最优控制问题就是寻找最优容许控制u(t) ，使目标函数 J 最小。为了将不等式约束问题转化为等式约束问题，引入两个新的向量： 1）引入一个新的 p 维控制变量ω(t) ω&(t) = u(t) ， ω(t0 ) = 0 （9.39）这样，就可以容许u(t) 不连续。因为当u(t) 不连续时，ω(t) 也是连续的。而当u(t) 是分段连续函数时，ω(t) 也是分段光滑连续函数。 2）引入另一个新的 m 维控制变量 z(t) [ ( )] [ ( ), ( ), ] 2 z&t = G x t u t t ， z(t0 ) = 0 （9.40）由于上式左边恒为非负，所以满足G 是非负的要求。通过以上变换，将上述有不等式约束的最优控制问题，转化为了下列具有等式约束的条件极值问题，通常称为波尔扎（Bolza）问题：系统的状态方程为 x&(t) = f [x(t),ω&(t),t] （9.41） [ ( )] [ ( ), ( ), ] 2 z&t = G x t ω&t t （9.42） 0 0 x(t ) = x ， z(t0 ) = 0 ， ω(t0 ) = 0 终端时刻 f t 未给定，终端状态约束为 M[x(t f ),t f ] = 0 （9.43）要求确定最优控制ω&(t) ，使性能指标 ∫ = + f t t f f J x t t L x t t t dt 0 θ[ ( ), ] [ ( ),ω&( ), ] (9.44)

自动控制原理电子教案浙江工业大学自动化研究所 9 为极小。引入拉格朗日乘子向量λ 及Γ ，写出增广性能指标泛函为 ∫ = + + + − + Γ − f t t T T f f T a f f J x t t v M x t t L x t f x t x G x t z dt 0 [ ( ), ] [ ( ), ] { [ , , ] [ ( , , ) ] [ ( , , ) ]} 2 θ ω& λ ω& & ω& & ∫ = + + − + Γ − f t t T T f f T f f x t t v M x t t H x t x G x t z dt 0 [ ( ), ] [ ( ), ] { [ , , , ] [ ( , , ) ]} 2 θ ω&λ λ & ω& & (9.45) 式中，哈密顿函数 H(x,ω&, λ,t) 定义为 H(x, , ,t) L(x, ,t) f (x, ,t) T ω&λ = ω& + λ ω& （9.46）为了简化问题，定义拉格朗日标量函数Φ 为 ( , , , , , , ) ( , , , ) [ ( , , ) ] 2 x x z t H x t x G x t z T T Φ &ω& &λ Γ = ω&λ − λ &+ Γ ω& − & （9.47）于是， a J 可以写成 ∫ = + + Φ Γ f t t f f T a f f J x t t v M x t t x x z t dt 0 θ[ ( ), ] [ ( ), ] ( , &,ω&, &, λ, , ) （9.48）对 a J 取一阶变分，得 ∫ ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ = Φ + = = f f f t t T T T T f t t T T f t t T a z dt z x x x x x t x M v x t t M v t J * * 0 * * [( ) ( ) ( ) ( ) ] [ ] [( ) ] ( ) & & & & & & δω δ ω δ δ δ θ δ θ δ （9.49）式中， * f t 为最优终端时刻。对上式积分项中的后三项分别进行分部积分，并利用关系式 f f f f x(t ) x(t ) x(t )δ t δ = δ * + & （9.50）可得 ∫ ∂ ∂Φ − ∂ ∂Φ − ∂ ∂Φ − ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂Φ + ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂ + ∂ ∂Φ = Φ − = = = * 0 * * * [( ) δ ( ) ( ) δ ] [ ( ) ] δ ( ) [( ) δ ( ) δ ] [ ] δ * f f f f t t T T T t t T T f T t t T f t t T T a z dt dt z d dt d x dt x d x z z x t x v x M x t t M v x t J x & & & & & & & & δω ω ω ω θ θ δ （9.51）根据泛函取极值的必要条件，应有δJ a = 0 。由于式（9.51）中 f δ t ， ( ) * f δx t ， δx ，δω 和δz 都是任意的，并且相互独立，所以增广性能指标泛函 a J 取极值的必要条件为 = 0 ∂ ∂Φ − ∂ ∂Φ dt x d x & （9.52） = 0 ∂ ∂Φ dt ω& d ， = 0 ∂ ∂Φ dt z d & （9.53） [ ( ) ] * = 0 ∂ ∂ + ∂ ∂ + ∂ ∂Φ Φ − = f t t T T t M v t x x θ & & （9.54） [ ( ) ] * = 0 ∂ ∂Φ + ∂ ∂ + ∂ ∂ = f t t T x v x M x & θ （9.55） ( ) * = 0 ∂ ∂Φ = f t t ω& ， ( ) * = 0 ∂ ∂Φ = f t t z& （9.56）由式（9.47）得 Γ ∂ ∂ + ∂ ∂ = ∂ ∂Φ T x G x H x ( )

自动控制原理电子教案浙江工业大学自动化研究所 10 = −λ ∂ ∂Φ x& 代入式（9.52），得 Γ ∂ ∂ + ∂ ∂ − = T x G x H dt d ( ) λ 即 Γ ∂ ∂ − ∂ ∂ = − T x G x H λ & ( ) （9.57）若不等式约束函数G 内不含 x ，即为 G[u(t),t] ≥ 0 （9.58）则由于 ≡ 0 ∂ ∂ x G ，由式（9.57）得 x H ∂ ∂ λ &= − （9.59）由式（9.54）和（9.55），并注意到 = −λ ∂ ∂Φ x& ，可计算出 * f t = t 时的 H 及λ 值 * ( ) [ ] * f t t T f t M v t H t = ∂ ∂ − ∂ ∂ = − θ （9.60） * ( ) [ ( ) ] * f t t T f v x M x t = ∂ ∂ + ∂ ∂ = θ λ （9.61）当系统在最优控制 ( ) * u t 作用下，沿最优轨迹 ( ) * x t 进行状态转移时的 f t 即是最优时刻 * f t ，略去式（9.60）和（9.61）中的符号（*），即得横截条件为 [ ( , , , ) ( ) ] = 0 ∂ ∂ + ∂ ∂ + = f t t T v t M t H x u t θ λ （9.62） f t t T f v x M x t = ∂ ∂ + ∂ ∂ ( ) = [ ( ) ] θ λ （9.63）式（9.53）表明，在最优轨线上， ∂ω& ∂Φ 和 ∂z& ∂Φ 都为常数。又由式（9.56）可知，该常数为零，所以，沿最优轨迹 ∂ω& ∂Φ = ≡ 0 ∂ ∂Φ z& （9.64）由于Φ 中包含 x&，ω&和 z&，若将极值曲线上的 x&，ω&和 z&，分别用 * x& ， * ω& 和 * z& 表示，则式（9.64）可以写成 0 * * ≡ ∂ ∂Φ = ∂ ∂Φ ω& z& （9.65）上面得到了使性能指标 a J 取极值的必要条件。为了使性能指标取极值，还必须满足充分条件：维尔斯特拉斯函数 E 沿最优轨线为非负，即 ( , , , , , , ) ( , , , , , , ) ( ) ( ) * * * * * * * * * * * x x x E x x z t x x z t T & & & & & & & & & − ∂ ∂Φ = Φ ω λ Γ − Φ ω λ Γ − * * * * * * * * * * * * (x , x, , z, , ,t) x (x , x , , z , , ,t) x = Φ &ω& &λ Γ + λ T &− Φ & ω& & λ Γ − λ T & ( , , , ) ( , , , ) 0 * * * * * = H x ω&λ t − H x ω& λ t ≥ （9.66）以ω&(t) = u(t) ， ( ) ( ) * * ω& t = u t 代入上式得 ( , , , ) ( , , , ) * * * * * H x u λ t ≤ H x u λ t （9.67）

点击下载完整版文档（PDF格式）

共29页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录

《自动控制原理》课程教学资源：第七章线性系统的校正方法

《自动控制原理》课程教学资源：第七章 线性系统的校正方法

《自动控制原理》课程教学资源：第七章线性系统的校正方法