第十八章动态优化模型 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制 函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又 化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方 法 1变分法简介 变分法是研究泛函极值问题的一种经典数学方法,有者广泛的应用。下面先介绍变 分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值 原理。 1.1变分法的基本概念 1.1.1泛函 设S为一函数集合,若对于每一个函数x()∈S有一个实数J与之对应,则称J是 对应在S上的泛函,记作J(x()》。S称为J的容许函数集。 通俗地说,泛函就是“函数的函数”。 例如对于xy平面上过定点A(x,)和B(x2,)的每一条光滑曲线(x),绕x轴 旋转得一旋转体,旋转体的侧面积是曲线y(x)的泛函J((x》。由微积分知识不难写 出 J(x》=2(xW1+y2(x)d (1) 容许函数集可表示为 S-{y(x)川x)∈C[x,x2],y(x)=1,yx2)=y2} (2) 最简单的一类泛函表为 J(x(t))=F(t.x,)dt (3) 被积函数F包含自变量1,未知函数x及导数京。(1)式是最简泛函。 1.12泛函的极值 泛函J(x(t)在x。()eS取得极小值是指,对于任意一个与x(1)接近的 x()∈S,都有J(x()≥J(x()。所谓接近,可以用距离d(x(),x()<来度量。 而距离定义为 0.x,o》=maxx0-Oit0-0 泛函的极大值可以类似地定义。x,()称为泛函的极值函数或极值曲线, 泛函的自变量,函数x()在x()的增最记为 òx(t)=x(t)-x(t) 也称函数的变分。由它引起的泛函的增量记作 =J(x)+x(0)-J(x() 如果△J可以表为 -218
-218- 第十八章 动态优化模型 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制 函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又 简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方 法。 §1 变分法简介 变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变 分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值 原理。 1.1 变分法的基本概念 1.1.1 泛函 设 S 为一函数集合,若对于每一个函数 x(t)∈ S 有一个实数 J 与之对应,则称 J 是 对应在 S 上的泛函,记作 J (x(t)) 。 S 称为 J 的容许函数集。 通俗地说,泛函就是“函数的函数”。 例如对于 xy 平面上过定点 ( , ) 1 1 A x y 和 ( , ) 2 2 B x y 的每一条光滑曲线 y(x) ,绕 x 轴 旋转得一旋转体,旋转体的侧面积是曲线 y(x) 的泛函 J ( y(x)) 。由微积分知识不难写 出 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + (1) 容许函数集可表示为 { ( ) | ( ) [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y x y x ∈C x x y x = y y x = y (2) 最简单的一类泛函表为 ∫ = 2 1 ( ( )) ( , , ) t t J x t F t x x& dt (3) 被积函数 F 包含自变量t ,未知函数 x 及导数 x& 。(1)式是最简泛函。 1.1.2 泛函的极值 泛函 J (x(t)) 在 x0 (t)∈ S 取得极小值是指,对于任意一个与 ( ) 0 x t 接近的 x(t)∈ S ,都有 ( ( )) ( ( )) 0 J x t ≥ J x t 。所谓接近,可以用距离 ( ( ), ( )) < ε 0 d x t x t 来度量, 而距离定义为 ( ( ), ( )) max{| ( ) ( ) |,| ( ) ( ) |} 0 0 0 1 2 d x t x t x t x t x t x t t t t = − & − & ≤ ≤ 泛函的极大值可以类似地定义。 ( ) 0 x t 称为泛函的极值函数或极值曲线。 1.1.3 泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为 泛函的自变量,函数 x(t) 在 ( ) 0 x t 的增量记为 ( ) ( ) ( ) 0 δ x t = x t − x t 也称函数的变分。由它引起的泛函的增量记作 ( ( ) ( )) ( ( )) 0 0 ΔJ = J x t +δx t − J x t 如果 ΔJ 可以表为
△J=L(x(),x()+r(x(),x()》 其中L为成的线性项,而r是成的高阶项,则L称为泛函在()的变分,记作 (x。()。用变动的x()代替x(),就有(x()。 泛函变分的一个重要形式是它可以表为对参数α的导数 a0+a0. (4) 这是因为当变分存在时,增量 △J=J(x)+a)-J(x()=L(x(1),a)+x(0),a) 根据L和r的性质有 L(x(t),)=L(x(1).r) i s().)(). 亦=0 a 所以 a)im)-( =▣4a@+aa-红高- 114极值与变分 利用变分的表达式(4)可以得到泛函极值与变分的关系: 若J(x(》在x()达到极值(极大或极小),则 6J(x()=0 (5) 这是因为对任意给定的,J(x+a)是变量a的函数,该函数在=0处达到极 值。根据函数极值的必要条件知 &k+ama-0 于是由(4)式直接得到(5)式。 1.1.5.变分法的基本引理 引理(x)∈Cx,x】,x)eC[x,x】,x)=x)=0,有 [广p(x)nx)t≡0, J='F,x0),()d 6 的极值,一般是用泛函极值的必要条件去寻找一条曲线x(),使给定的二阶连续可微 函数F沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为x()。 1.2.1端点固定的情况 设容许曲线x()满足边界条件 -219
-219- ( ( ), ( )) ( ( ), ( )) 0 0 ΔJ = L x t δx t + r x t δx t 其中 L 为δx 的线性项,而 r 是δx 的高阶项,则 L 称为泛函在 ( ) 0 x t 的变分,记作 ( ( )) 0 δJ x t 。用变动的 x(t) 代替 ( ) 0 x t ,就有δJ (x(t))。 泛函变分的一个重要形式是它可以表为对参数α 的导数: 0 ( ( )) ( ( ) ( )) + = ∂ ∂ = αδ α α δJ x t J x t x t (4) 这是因为当变分存在时,增量 ΔJ = J (x(t) +αδx) − J (x(t)) = L(x(t),αδx) + r(x(t),αδx) 根据 L 和 r 的性质有 L(x(t),αδx) =αL(x(t),δx) 0 ( ( ), ) lim ( ( ), ) lim 0 0 = = → → x x r x t x r x t x δ αδ αδ α αδ α α 所以 α αδ αδ α α α ( ) ( ) ( ) lim 0 0 J x x J x J x x + − + = ∂ ∂ → = ( , ) ( ) ( , ) ( , ) lim 0 L x x J x L x x r x x δ δ α αδ αδ α = = + = → 1.1.4 极值与变分 利用变分的表达式(4)可以得到泛函极值与变分的关系: 若 J (x(t)) 在 ( ) 0 x t 达到极值(极大或极小),则 δJ (x0 (t)) = 0 (5) 这是因为对任意给定的δx , ( ) 0 J x +αδx 是变量α 的函数,该函数在α = 0 处达到极 值。根据函数极值的必要条件知 ( 0 + ) 0 = 0 ∂ ∂ αδ α = α J x x 于是由(4)式直接得到(5)式。 1.1.5. 变分法的基本引理 引理 ( ) [ , ] 1 2 ϕ x ∈C x x , ( ) [ , ] 1 2 1 ∀η x ∈C x x , ( ) ( ) 0 η x1 =η x2 = ,有 ∫ ≡ 2 1 ( ) ( ) 0 x x ϕ x η x dx , 则 ( ) 0, [ , ] 1 2 ϕ x ≡ x ∈ x x 。 1.2 无约束条件的泛函极值 求泛函 ∫ = f t t J F t x t x t dt 0 ( , ( ), &( )) (6) 的极值,一般是用泛函极值的必要条件去寻找一条曲线 x(t) ,使给定的二阶连续可微 函数 F 沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为 ( ) * x t 。 1.2.1 端点固定的情况 设容许曲线 x(t) 满足边界条件
x(lo)=xx(l,)=x (7) 且二次可微 首先计算(6)式的变分 =品Fru0+a0.0+a0lenh =[F(t,x,x+F(t,x,)ldt 对上式右端第二项做分布积分,并利用x(化,)=(L,)=0,有 x.d 再代回到(8)式,并利用泛函取极值的必要条件,有 =E-年Fmdh=0 因为的任意性,及x(,)=()=0,所以由基本引理得到著名的欧拉方程 -0 (9) 它是这类最简泛函取极值的必要条件。 (9)式又可记作 F-F.-F.t-F.元=0 (10) 通常这是x()的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确 定。 这时F三0,欧拉方程为F(,x)=0,这个方程以隐函数形式给出x(),但它一 般不满足边界条件,因此,变分问题无解。 DF不依赖x,即F=F,) 欧拉方程为 F,u,)=0 dt 将上式积分一次,便得首次积分F:(1,)=C,由此可求出=p(1,C),积分后得到 可能的极值曲线族 x=o(tc (iF只依赖于x,即F=F() 这时F=0,Fs=0,F=0,欧拉方程为 f=0 由此可设求=0或F。=0,如果求=0,则得到含有两个参数的直线族x=C1+C2· -20
-220- 0 0 x(t ) = x , f f x(t ) = x (7) 且二次可微。 首先计算(6)式的变分: 0 ( ( ) ( )) + = ∂ ∂ = αδ α α δJ J x t x t ∫ + + = ∂ ∂ = f t t F t x t x t x t x t dt 0 0 ( , ( ) ( ), ( ) ( )) αδ αδ α α & & ∫ = + f t t Fx t x x x Fx t x x x dt 0 [ ( , , &) ( , , &) &] δ & δ (8) 对上式右端第二项做分布积分,并利用δx(t0 ) = δx(t f ) = 0 ,有 ∫ ∫ = − f f t t x t t x F t x x xdt dt d F t x x xdt 0 0 & ( , , &)δ& & ( , , &)δ , 再代回到(8)式,并利用泛函取极值的必要条件,有 ∫ = − = f t t x x F xdt dt d J F 0 δ [ & ]δ 0 因为δx 的任意性,及δx(t0 ) = δx(t f ) = 0 ,所以由基本引理得到著名的欧拉方程 x − Fx = 0 dt d F & (9) 它是这类最简泛函取极值的必要条件。 (9)式又可记作 Fx − Ftx& − Fxx& x& − Fx&x& & x& = 0 (10) 通常这是 x(t) 的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确 定。 1.2.2 最简泛函的几种特殊情形 (i) F 不依赖于 x& ,即 F = F(t, x) 这时 Fx& ≡ 0,欧拉方程为 Fx (t, x) = 0,这个方程以隐函数形式给出 x(t) ,但它一 般不满足边界条件,因此,变分问题无解。 (ii) F 不依赖 x ,即 F = F(t, x&) 欧拉方程为 F (t, x) = 0 dt d x & & 将上式积分一次,便得首次积分 1 F (t, x) c x& & = ,由此可求出 ( , )1 x& = ϕ t c ,积分后得到 可能的极值曲线族 x ( ) t c dt ∫ = 1 ϕ , (iii) F 只依赖于 x& ,即 F = F(x&) 这时 Fx = 0,Ftx& = 0,Fxx& = 0,欧拉方程为 & x&Fx&x& = 0 由此可设 & x& = 0 或 Fx&x& = 0,如果 & x& = 0 ,则得到含有两个参数的直线族 1 2 x = c t + c
另外若F=0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c的 直线族x=+C,它包含于上面含有两个参数的直线族x=C1+C?:中,于是,在 F=F(x)情况下,极值曲线必然是直线族。 (iv)F只依懒于x和,即F=F(x,) 这时有F=0,故欧拉方程为 F-=0 此方程具有首次积分 F-F;=c 事实上,注意到F不依赖于1,于是有 品F-识)=+f-期-=-F)=0 例1(最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是 约翰·贝努里(J.Bemnoulli)于1696年提出的。问题的提法是这样的:设A和B是铅 直平面上不在同一铅直线上的两点,在所有连结A和B的平面曲线中,求一曲线,当 质点仅受重力作用,且初速为零,沿此曲线从A滑行至B时,使所需时间最短。 解将A点取为坐标原点,x轴水平向右,y轴垂直向下,B点为B(x2,2)。根 据能量守恒定律,质点在曲线x)上任一点处的速度少满足(5为弧长) 将ds=V1+y(x)d代入上式得 -dx V28 于是质点滑行时间应表为(x)的泛函 oc- 端点条件为 0)=0,x2)=y2 最速降线满足欧拉方程,因为 不含自变量x,所以方程(10)可写作 F,-Fwy-Fyy"=0 等价于 &F-yF)=0 作一次积分得 -221
-221- 另外若 Fx&x& = 0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c 的 直线族 x = kt + c ,它包含于上面含有两个参数的直线族 1 2 x = c t + c 中,于是,在 F = F(x&) 情况下,极值曲线必然是直线族。 (iv) F 只依赖于 x 和 x& ,即 F = F(x, x&) 这时有 Ftx& = 0 ,故欧拉方程为 Fx − x&Fxx& − & x&Fx&x& = 0 此方程具有首次积分为 1 F xF c − & x& = 事实上,注意到 F 不依赖于t ,于是有 ( − x ) = x + x − x − x = ( x − Fx ) = 0 dt d F x F dt d F xF F x F x xF x dt d & & & & & & & && && & & 。 例 1 (最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是 约翰·贝努里(J. Bernoulli)于 1696 年提出的。问题的提法是这样的:设 A 和 B 是铅 直平面上不在同一铅直线上的两点,在所有连结 A 和 B 的平面曲线中,求一曲线,当 质点仅受重力作用,且初速为零,沿此曲线从 A 滑行至 B 时,使所需时间最短。 解 将 A 点取为坐标原点,x 轴水平向右, y 轴垂直向下,B 点为 ( , ) 2 2 B x y 。根 据能量守恒定律,质点在曲线 y(x) 上任一点处的速度 dt ds 满足( s 为弧长) mgy dt ds m ⎟ = ⎠ ⎞ ⎜ ⎝ ⎛ 2 2 1 将ds 1 y' (x) dx 2 = + 代入上式得 dx gy y dt 2 1 ' 2 + = 于是质点滑行时间应表为 y(x) 的泛函 dx gy y J y x x ∫ + = 2 0 2 2 1 ' ( ( )) 端点条件为 2 2 y(0) = 0, y(x ) = y 最速降线满足欧拉方程,因为 y y F y y 2 1 ' ( , ') + = 不含自变量 x ,所以方程(10)可写作 Fy − Fyy' y'−Fy' y' y' '= 0 等价于 (F − y' Fy' ) = 0 dx d 作一次积分得
(1+y2)=c 令y=cg号则方程化为 y号-6sm号-90-cw0 C. 又因 =9(1-cos0)d0 积分之,得 x=号0-sin0)+c 由边界条件0)=0,可知C2=0,故得 x-(0-sine) y=91-c0s8 这是摆线(圆滚线)的参数方程,其中常数C可利用另一边界条件(x,)=乃2来确定。 例2最小旋转面问题 Jx)》=2πx)W1+y2(x)d S=(ylyeC'[x.x1(x)=y.y(x2)=y} 解因F=y1+y2不包含x,故有首次积分 F-yR,=+y-y中6 化简得y=CV1+y2 令y=shl,代入上式,y=cV1+shi=cchl 由于k=少=h加=cd sht 积分之,得x=c1+C 消去1,就得到y=Cch- 。 这是悬链线方程 2.3最简泛函的推广 最简泛函取极值的必要条件可以推广到其它情况, (1)含多个函数的泛函 -222
-222- 1 2 y(1+ y' ) = c 令 , 2 ' θ y = ctg 则方程化为 (1 cos ) 2 2 sin 1 ' 2 1 2 1 1 θ θ = = − + = c c y c y 又因 θ θ θ θ θ θ d c ctg c d y dy dx (1 cos ) 2 2 2 cos 2 sin ' 1 1 = = = − 积分之,得 2 1 ( sin ) 2 c c x = θ − θ + 由边界条件 y(0) = 0 ,可知 0 c2 = ,故得 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = − = − (1 cos ). 2 ( sin ) 2 1 1 θ θ θ c y c x 这是摆线(圆滚线)的参数方程,其中常数 1 c 可利用另一边界条件 2 2 y(x )= y 来确定。 例 2 最小旋转面问题 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + { | [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y y ∈C x x y x = y y x = y 解 因 1 ' 2 F = y + y 不包含 x ,故有首次积分 1 2 2 ' 1 ' ' ' 1 ' ' c y y F y F y y y y y = + − = + − 化简得 2 1 y = c 1+ y' 令 y'= sht ,代入上式, y c sh t c cht 1 2 = 1 1+ = 由于 c dt sht c shtdt y dy dx 1 1 ' = = = 积分之,得 1 2 x = c t + c 消去t ,就得到 1 2 1 c x c y c ch − = 。 这是悬链线方程。 1.2.3 最简泛函的推广 最简泛函取极值的必要条件可以推广到其它情况。 (ⅰ)含多个函数的泛函
使泛函 Jx,(x》=F(x,y,y,')d 取极值且满足固定边界条件 x)=,x2)=2,(x)=,(x2)=2 的极值曲线y=y(x),:=z(x)必满足欧拉方程组 0 d F-在F=0 (i)含高阶导数的泛函 使泛函 J(y(x))=[F(x.y.y.y")dx 取极值且满足固定边界条件 x)=,y(x2)=2y(x)=yy(x2)=y2 的极值曲线y=y(x)必满足微分方程 ()含多元函数的泛函 设(x,y)∈c2,(x,y)∈D,使泛函 J(e(x,y》=jJF(x,八,)d 取极值且在区域D的边界线1上取已知值的极值函数:=(x,)必满足方程 上式称为奥式方程 1.2.4端点变动的情况(横截条件) 设容许曲线x()在。固定,在另一端点1=1,时不固定,是沿着给定的曲线 x=()上变动。于是端点条件表示为 x()=x x()=y() 这里1是变动的,不妨用参数形式表示为 寻找端点变动情况的必要条件,可仿照前面端点固定情况进行推导,即有 F.xx. 0=N=a (11) -223-
-223- 使泛函 ∫ = 2 1 ( ( ), ( )) ( , , ', , ') x x J y x z x F x y y z z dx 取极值且满足固定边界条件 ( ) , ( ) , ( ) , ( ) . 1 1 2 2 1 1 2 2 y x = y y x = y z x = z z x = z 的极值曲线 y = y(x),z = z(x)必满足欧拉方程组 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ − = − = 0 0 ' ' z z y y F dx d F F dx d F (ii)含高阶导数的泛函 使泛函 ∫ = 2 1 ( ( )) ( , , ', ") x x J y x F x y y y dx 取极值且满足固定边界条件 1 1 y(x ) = y , 2 2 1 1 2 2 y(x )= y ,y'(x ) = y' , y'(x ) = y' 的极值曲线 y = y(x) 必满足微分方程 " 0 2 2 y − y' + Fy = dx d F dx d F (iii) 含多元函数的泛函 设 z(x, y)∈c ,(x, y)∈D 2 ,使泛函 ∫∫ = D J (z(x, y)) F(x, y,z,z x ,z y )dxdy 取极值且在区域 D 的边界线l 上取已知值的极值函数 z = z(x, y) 必满足方程 = 0 ∂ ∂ − ∂ ∂ − x y z z Fz y F x F 上式称为奥式方程。 1.2.4 端点变动的情况(横截条件) 设容许曲线 x(t) 在 0t 固定,在另一端点 f t = t 时不固定,是沿着给定的曲线 x =ψ(t)上变动。于是端点条件表示为 ⎩ ⎨ ⎧ = = ( ) ( ) ( ) 0 0 x t t x t x ψ 这里t 是变动的,不妨用参数形式表示为 f dt f t = t +α 寻找端点变动情况的必要条件,可仿照前面端点固定情况进行推导,即有 0 0 ( , , ) 0 = + + + ∂ ∂ = = ∫ α α αδ αδ α δJ F t x x x x dt f dt f t t & & f t t t t x t t x Fx xdt F x F dt dt d F f f f = = = − + + ∫ & δ & δ 0 ( ) (11)
再对(11)式做如下分析: ()对每一个固定的1,x()都满足欧拉方程,即(11)式右端的第一项积分为 (i)为考察(11)式的第二、第三项,建立d山,与之间的关系,因为 x(i+adi)+adx(t+adt)=w(t+adi) 对a求导并令a=0得 (u,)d,+l,=4)d 即 ix=(t)dt (12) 把(I2)代入()并利用d山,的任意性,得 [F+(w-)F]a,=0 (13) (13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。 横截条件有两种常见的特殊情况 (i)当x=()是垂直横轴的直线时,1,周定,x,)自由,并称x,)为自由 端点。此时(11)式中山,=0及,的任意性,便得自由端点的横截条件 Fa,=0 (14) ()当x=()是平行横轴的直线时,1,自由,x,)固定,并称x化,)为平动 端点。此时中=0,(13)式的横截条件变为 F-Fs=0 (15) 注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件· (t)=f(t,x(),) (16) 寻求最优性能指标(目标函数) J(u)》=p(4y,xty》+Fu,x(),(0)d (17) 其中(1)是控制策略,x()是轨线,固定,1y及x()自由,x()∈R”,()∈R (不受限,充满R空间),f,O,F连续可微。 下面推导取得目标函数极值的最优控制策略!()和最优轨线x'()的必要条件。 采用拉格朗日乘子法,化条件极值为无条件极值,即考虑 J(x.u.)=(x(I))+[F(t.x.u)+f(t.x.u)-ldt (18) 的无条件极值,首先定义(16)式和(17)式的哈密顿(Hamilton)函数为 H,x,2)=F,x,0)+(0f,x,0 (19) 将其代入(18)式,得到泛函
-224- 再对(11)式做如下分析: (i)对每一个固定的 f t , x(t) 都满足欧拉方程,即(11)式右端的第一项积分为 零; (ii)为考察(11)式的第二、第三项,建立dt f 与 f t t x = δ 之间的关系,因为 ( ) ( ) ( ) f f f f f dt f x t +αdt +αδx t +αdt =ψ t +α 对α 求导并令α = 0得 f f t t f f x t dt x t dt f &( ) + δ =ψ&( ) = 即 f f f t t x t x t dt f = [ &( ) − &( )] = δ ψ (12) 把(12)代入(11)并利用dt f 的任意性,得 [ + ( − ) ] = = 0 f Fx t t F x & ψ& & (13) (13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。 横截条件有两种常见的特殊情况: (i)当 x =ψ(t)是垂直横轴的直线时, f t 固定, ( )f x t 自由,并称 ( )f x t 为自由 端点。此时(11)式中dt f = 0 及 f t t x = δ 的任意性,便得自由端点的横截条件 = = 0 f Fx& t t (14) (ii)当 x =ψ(t)是平行横轴的直线时, f t 自由, ( )f x t 固定,并称 ( )f x t 为平动 端点。此时ψ& = 0,(13)式的横截条件变为 − = = 0 f Fx t t F x & & (15) 注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件。 1.3 有约束条件的泛函极值 在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动 态系统 x&(t) = f (t, x(t),u(t)) (16) 寻求最优性能指标(目标函数) ∫ = + f t t J u t t f x t f F t x t u t dt 0 ( ( )) ϕ( , ( )) ( , ( ), ( )) (17) 其中u(t)是控制策略,x(t) 是轨线, 0t 固定, f t 及 ( )f x t 自由, n x(t)∈ R , m u(t)∈ R (不受限,充满 m R 空间), f ,ϕ,F 连续可微。 下面推导取得目标函数极值的最优控制策略 ( ) * u t 和最优轨线 ( ) * x t 的必要条件。 采用拉格朗日乘子法,化条件极值为无条件极值,即考虑 ∫ = + + − f t t T J x u t f x t f F t x u t f t x u x dt 0 ( , , ) ( , ( )) [ ( , , ) ( )( ( , , ) )] 1 λ ϕ λ & (18) 的无条件极值,首先定义(16)式和(17)式的哈密顿(Hamilton)函数为 H(t, x,u, ) F(t, x,u) (t) f (t, x,u) T λ = + λ (19) 将其代入(18)式,得到泛函
J,(x,4,)=p,x,》+[H,x,4)-]d (20) 下面先对其求变分 d,=&ouy+adly,y)+aa,》 +[/Hu,x+am,u+ad2+ai)-(a+aiar+ahlo =(p1+(d,)》'p,+(d,)'Hu,x,4,2,-(d,)'(2'x +['[()'H,+()Hn+(6)'H,-(6)x-x]dh =(d,)'[o,.+FL,x,4,),]+[('pr +【)PH,+(yH+(myH-(yh-严,+(yid 注意到,≠,),=()-,d,因而 ,=(d山,)》P[p,+Hu,x,4,]+[(y)(p,- +'[(x)'(H,+)+(6)'(H,-x)+(u)'H.] 再令,=0,由d山,(),6说的任意性,便得 ()x,入必满足正则方程: ①状态方程文=H,=fL,x,) ②协态方程i=-H。 ()哈密顿函数H(化,x,山,)作为u的函数,也必满足 H.=0 并由此方程求得 (ii)求x,无,时,必利用边界条件 ①x)=x0 (用于确定x) ②2u)=p0 (用于确定尤) ,=-H化,x,4刘,(确定) 1.4最大(小)值原理 如果受控系统 =f(t,x,u),x(to)=xo 其控制策略)的全体构成有界集U,求)∈U,使性能指标 J(u(t))=((1))+[F(1.x.u)dt 达到最大(小)值 最大(小)值原理:如果f(,x,x》和F(,x,)都是连续可微的, -225
-225- ∫ = + − f t t T J x u t f x t f H t x u x dt 0 ( , , ) ( , ( )) [ ( , , , ) ] 1 λ ϕ λ λ & (20) 下面先对其求变分 { ( , ( ) ( )) 1 f f f f J ϕ t αdt x t αδx t α δ + + ∂ ∂ = 0 [ ( , , , ) ( ) ( )] } 0 = + + + + + − + + ∫ α α H t x αδx u αδu λ αδλ λ αδλ x αδx dt T t dt t f f & & [ ] f f f f t t T T t t f T t f T x t f T f x t dt dt H t x u dt x = + + = − = ( ) ( ) ( ) ( , , , ) ( ) ( ) ( ) δ ϕ ϕ λ λ & x H u H H x x dt T T T u T x T t t f [( ) ( ) ( ) ( ) ] 0 δ δ δλ δλ & λ δ& + + + λ − − ∫ ( ) ( ) [ ( , , , ) ] [ ( )] f f f x t T t t t f T f = dt ϕ + F t x u t = + δx t ϕ ∫ ∫ + + + − − = + f f f t t T f t t T t t T T u T x T x H u H H x dt t x x dt 0 0 [(δ ) (δ ) (δλ) λ (δλ) ] λ ( )δ (δ ) λ & & 注意到 ( ) t t f x x t f δ = ≠ δ , t t f f dt f x x t x t f = ( ) − &( ) δ = δ ,因而 f f f x t t T t t t f T f J dt H t x u x t = + = + − = ( ) [ ( , , , ) ] [ ( )] ( ) δ 1 ϕ λ δ ϕ λ ∫ + + + − + f t t u T T x T x H H x u H dt 0 [(δ ) ( λ) (δλ) ( ) (δ ) ] λ & & 再令 0 δJ1 = ,由dt f ,δx(t f ),δx,δu,δλ 的任意性,便得 (i) * * x ,λ 必满足正则方程: ① 状态方程 x = H = f (t, x,u) λ & ② 协态方程 λ = −Hx & 。 (ii)哈密顿函数 ( , , , ) * * H t x u λ 作为u 的函数,也必满足 Hu = 0 并由此方程求得 * u 。 (iii)求 * * * x ,λ ,u 时,必利用边界条件 ① 0 0 x(t ) = x , (用于确定 * x ) ② ( ) ( ) f f x t λ t = ϕ , (用于确定 * λ ) ③ f f t u t t H t x = − = ϕ ( , , ,λ) , (确定 f t ) 1.4 最大(小)值原理 如果受控系统 x& = f (t, x,u), 0 0 x(t ) = x 其控制策略u(t)的全体构成有界集U ,求u(t)∈U ,使性能指标 ∫ = + f t t J u t t f x t f F t x u dt 0 ( ( )) ϕ( , ( )) ( , , ) 达到最大(小)值。 最大(小)值原理:如果 f (t, x,u) , ( , ( )) f f ϕ t x t 和 F(t, x,u) 都是连续可微的
那么最优控制策略()和相应的最优轨线x()由下列的必要条件决定: ()最优轨线x'(),协态向量()由下列的必要条件决定: dx =f(t,x,u),u(t)U, d m)哈密顿函数 Ox H(t.xu.A)=F(t.xu)+a'()f(t.xu) 作为()的函数,最优策略山()必须使 H(t.x,u)max H(t.xu.) 或使 H(L,x',u,)=minH(,x',4,)(最小值原理) ()满足相应的边界条件 ①若两端点固定,则正则方程的边界条件为 x(0)=x。,x(tr)=xr ②若始端固定,终端,也固定,而x化)自由,则正则方程的边界条件为 x0)=x0,y)=p,y,x》。 ③若始端固定,终端1,x(t,)都自由,则正则方程的边界条件为 x(0)=xo,(0y)=p,x(y》: H(,x》+p,(,(u》=0 2生产设备的最大经济效益 台新设备投 入到生 一方面该设备随着运行时间的推移其磨损 此 专卖价将 右使用 的时间 的经济效益大 21问题分析与假设 ()设备的转卖价是时间1的函数,记为x()。x()的大小与设备的磨损程度和 保养费的多少密切相关。记初始转卖价x(0)=x。· ()设各随其运行时间的推移,磨损程度越来越大。1时刻设备的磨损程度可以 用1时刻转卖价的损失值来刻画,常称其为磨损函数或废弃函数,记为m()。 ()保养设备可以减缓设备的磨损速度,提高转卖价。如果()是单位时间的保 养费 g)是1时刻的保养效益系数(每用一元保养费所增加的转卖 那么单位时 间的保养效益为g()()。另外,保养费不能过大(如单位时间保养费超过单位时间 值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W,则()∈W (v)设单位时间的产值与转卖价的比值记为P,则x()表示在1时刻单位时间 的产值,即1时刻的生产率。 -226
-226- 那么最优控制策略 ( ) * u t 和相应的最优轨线 ( ) * x t 由下列的必要条件决定: (i)最优轨线 ( ) * x t ,协态向量 ( ) * λ t 由下列的必要条件决定: f (t, x,u) dt dx = ,u(t)∈U , x H dt d ∂ ∂ = − λ . (ii)哈密顿函数 ( , , , ) ( , , ) ( ) ( , , ) * * * * * H t x u F t x u t f t x u T λ = + λ 作为u(t) 的函数,最优策略 ( ) * u t 必须使 ( , , , ) max ( , , , ) * * * * * H t x u λ H t x u λ u∈U = 或使 ( , , , ) min ( , , , ) * * * * * H t x u λ H t x u λ u∈U = (最小值原理) (iii)满足相应的边界条件 ① 若两端点固定,则正则方程的边界条件为 0 x(0) = x , f f x(t ) = x 。 ② 若始端固定,终端 f t 也固定,而 ( )f x t 自由,则正则方程的边界条件为 0 x(0) = x , ( ) ( , ( )) f x(t ) f f t t x t f λ = ϕ 。 ③ 若始端固定,终端 , ( ) f f t x t 都自由,则正则方程的边界条件为 0 x(0) = x , ( ) ( , ( )) f x(t ) f f t t x t f λ = ϕ , ( , ( ), ( ), ( )) + ( , ( )) = 0 f f f f t f f H t x t u t t t x t f λ ϕ 。 §2 生产设备的最大经济效益 某工厂购买了一台新设备投入到生产中。一方面该设备随着运行时间的推移其磨损 程度愈来愈大,因此其转卖价将随着使用设备的时间增加而减小;另一方面生产设备总 是要进行日常保养,花费一定的保养费,保养可以减缓设备的磨损程度,提高设备的转 卖价。那么,怎样确定最优保养费和设备转卖时间,才能使这台设备的经济效益最大。 2.1 问题分析与假设 (i)设备的转卖价是时间t 的函数,记为 x(t) 。 x(t) 的大小与设备的磨损程度和 保养费的多少密切相关。记初始转卖价 0 x(0) = x 。 (ii)设备随其运行时间的推移,磨损程度越来越大。t 时刻设备的磨损程度可以 用t 时刻转卖价的损失值来刻画,常称其为磨损函数或废弃函数,记为m(t) 。 (iii)保养设备可以减缓设备的磨损速度,提高转卖价。如果u(t)是单位时间的保 养费, g(t)是t 时刻的保养效益系数(每用一元保养费所增加的转卖价),那么单位时 间的保养效益为 g(t)u(t) 。另外,保养费不能过大(如单位时间保养费超过单位时间产 值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W ,则u(t)∈W 。 (iv)设单位时间的产值与转卖价的比值记为 p ,则 px(t) 表示在t 时刻单位时间 的产值,即t 时刻的生产率
(v)转卖价x()及单位时间的保养费()都是时间t的连续可微函数。为了统一 标准,采用它们的贴现值。对于贴现值的计算,例如转卖价x()的贴现值计算,如果 它的贴现因子为6(经过单位时间的单位费用贴现),那么由 (d=) dt. x0=1 解得 x(6)=e6-4) 令1,=0,使得1时刻单位费用的贴现(称贴现系数)为,所以设备在1时刻转卖价 x(t)的贴现为x(I)e-。仿此计算,1)的贴现为(t)e-,单位时间产值的贴现为 px(t)e-s (v)欲确定的转卖时间1,和转卖价x(L)都是自由的。 当 中设备磨损的不可 控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选 单位时间的保养费()作为控制策略。这样,生产设备的最大经济效益模型可以构成 为在设备磨损一保养系统的(转卖价)状态方程 s0=-m0)+g00 dt (21) x0)=x 之下,在满足0≤t)≤U的函数集W中寻求最优控制策略“(),使系统的经济效益 这一性能指标 Je》=x,e+px0-dh (22) 为最大,其中1,x()都是自由的。 23模利求解 首先写出问题的哈密顿函数 H=Ipx()-(em()+g(m()] (23 再由协态方程及边界条件求出),即由 (d0=-H,=-pe 2,)=91=e 解得 0=0-e+号e 下面利用最大值原理求()。先将(23)式改变为 -227
-227- (v)转卖价 x(t) 及单位时间的保养费u(t) 都是时间t 的连续可微函数。为了统一 标准,采用它们的贴现值。对于贴现值的计算,例如转卖价 x(t) 的贴现值计算,如果 它的贴现因子为δ (经过单位时间的单位费用贴现),那么由 ⎪ ⎩ ⎪ ⎨ ⎧ = = ( ) 1 ( ) ( ) 1 1 1 x t x t dt dx t δ 解得 ( ) 1 1 ( ) t t x t e− − = δ 令 0 t1 = ,便得t 时刻单位费用的贴现(称贴现系数)为 t e−δ ,所以设备在t 时刻转卖价 x(t) 的贴现为 t x t e−δ ( ) 。仿此计算, u(t) 的贴现为 t u t e−δ ( ) ,单位时间产值的贴现为 t px t e−δ ( ) 。 (vi)欲确定的转卖时间 f t 和转卖价 ( )f x t 都是自由的。 2.2 模型构造 根据以上的分析与假设可知:考察的对象是设备在生产中的磨损—保养系统;转卖 价体现了磨损和保养的综合指标,可以选作系统的状态变量;在生产中设备磨损的不可 控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选 单位时间的保养费u(t) 作为控制策略。这样,生产设备的最大经济效益模型可以构成 为在设备磨损—保养系统的(转卖价)状态方程 ⎪ ⎩ ⎪ ⎨ ⎧ = = − + 0 (0) ( ) ( ) ( ) ( ) x x m t g t u t dt dx t (21) 之下,在满足0 ≤ u(t) ≤ U 的函数集W 中寻求最优控制策略 ( ) * u t ,使系统的经济效益 这一性能指标 ∫ − − = + − f f t t t f J u t x t e px t u t e dt 0 ( ( )) ( ) [ ( ) ( )] δ δ (22) 为最大,其中 , ( ) f f t x t 都是自由的。 2.3 模型求解 首先写出问题的哈密顿函数 H [ px(t) u(t)]e [ m(t) g(t)m(t)] t = − + − + − λ δ (23) 再由协态方程及边界条件求出λ(t) ,即由 ⎪ ⎩ ⎪ ⎨ ⎧ = = = − = − − − f f t f x t t x t e H pe dt d t δ δ λ ϕ λ ( ) ( ) ( ) 解得 t t e p e p t δ f δ δ δ λ − − ( ) = (1− ) + 下面利用最大值原理求 ( ) * u t 。先将(23)式改变为