第十八章动态优化模型 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制 函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又 简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方 §1变分法简介 变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变 分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值 原理。 1.1变分法的基本概念 1.1.1泛函 设S为一函数集合,若对于每一个函数x(1)∈S有一个实数J与之对应,则称J是 对应在S上的泛函,记作J(x()。S称为J的容许函数集。 通俗地说,泛函就是“函数的函数”。 例如对于xy平面上过定点A(x1,y1)和B(x2,y2)的每一条光滑曲线y(x),绕x轴 旋转得一旋转体,旋转体的侧面积是曲线y(x)的泛函J(y(x))。由微积分知识不难写 出 J(y(x))= 2ry(x)v1+y'(x)d (1) 容许函数集可表示为 S=t(lyxECIxx,ly(x=y,y(x,=yl (2) 最简单的一类泛函表为 被积函数F包含自变量t,未知函数x及导数文。(1)式是最简泛函。 1.1.2泛函的极值 泛函J(x(1)在x0(1)∈S取得极小值是指,对于任意一个与x0(1)接近的 x()∈S,都有J(x(1)≥J(x0(1)。所谓接近,可以用距离d(x()x0()<E来度量, 而距离定义为 d(x(),x0()=max{x(1)-x0(0)lx(m)-x(1)} 泛函的极大值可以类似地定义。x0(D)称为泛函的极值函数或极值曲线。 1.1.3泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为 泛函的自变量,函数x(1)在x0(1)的增量记为 x(1)=x(1)-x0(1) 也称函数的变分。由它引起的泛函的增量记作 △J=J(x0(1)+bt(D)-J(x0(1) 如果△J可以表为
-218- 第十八章 动态优化模型 动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制 函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又 简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方 法。 §1 变分法简介 变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变 分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值 原理。 1.1 变分法的基本概念 1.1.1 泛函 设 S 为一函数集合,若对于每一个函数 x(t)∈ S 有一个实数 J 与之对应,则称 J 是 对应在 S 上的泛函,记作 J (x(t)) 。 S 称为 J 的容许函数集。 通俗地说,泛函就是“函数的函数”。 例如对于 xy 平面上过定点 ( , ) 1 1 A x y 和 ( , ) 2 2 B x y 的每一条光滑曲线 y(x) ,绕 x 轴 旋转得一旋转体,旋转体的侧面积是曲线 y(x) 的泛函 J ( y(x)) 。由微积分知识不难写 出 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + (1) 容许函数集可表示为 { ( ) | ( ) [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y x y x ∈C x x y x = y y x = y (2) 最简单的一类泛函表为 ∫ = 2 1 ( ( )) ( , , ) t t J x t F t x x& dt (3) 被积函数 F 包含自变量t ,未知函数 x 及导数 x& 。(1)式是最简泛函。 1.1.2 泛函的极值 泛函 J (x(t)) 在 x0 (t)∈ S 取得极小值是指,对于任意一个与 ( ) 0 x t 接近的 x(t)∈ S ,都有 ( ( )) ( ( )) 0 J x t ≥ J x t 。所谓接近,可以用距离 ( ( ), ( )) < ε 0 d x t x t 来度量, 而距离定义为 ( ( ), ( )) max{| ( ) ( ) |,| ( ) ( ) |} 0 0 0 1 2 d x t x t x t x t x t x t t t t = − & − & ≤ ≤ 泛函的极大值可以类似地定义。 ( ) 0 x t 称为泛函的极值函数或极值曲线。 1.1.3 泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为 泛函的自变量,函数 x(t) 在 ( ) 0 x t 的增量记为 ( ) ( ) ( ) 0 δ x t = x t − x t 也称函数的变分。由它引起的泛函的增量记作 ( ( ) ( )) ( ( )) 0 0 ΔJ = J x t +δx t − J x t 如果 ΔJ 可以表为
△=L(x0(1),ax(t)+r(x0(D),ax(1) 其中L为&x的线性项,而r是&x的高阶项,则L称为泛函在x0(1)的变分,记作 a(x0(1)。用变动的x()代替x0(D),就有a/(x() 泛函变分的一个重要形式是它可以表为对参数a的导数: a(x()=J(x()+a(m)a=0 (4) 这是因为当变分存在时,增量 A=J((0+aax)-J(x(D)=L(x(o), aax)+r(x(o), aar) 根据L和r的性质有 L(x(o),aax)=aL(x(o), ax) r(x(0),aar) lim rr(), adr) 6x=0 r 所以 J(x+aax )a==lim a lim L(x, a&x)+r(x,aax),L(x, ax)=a(x) 1.1.4极值与变分 利用变分的表达式(4)可以得到泛函极值与变分的关系: 若J(x()在x0(1)达到极值(极大或极小),则 (x0(1)=0 这是因为对任意给定的&,J/(x0+aoi)是变量a的函数,该函数在a=0处达到极 值。根据函数极值的必要条件知 于是由(4)式直接得到(5)式。 1.1.5.变分法的基本引理 引理(x)∈C[x1,x2],Vm(x)∈C[x1,x2],n(x1)=m(x2)=0,有 则(x)≡0,x∈[x1,x2] 12无约束条件的泛函极值 求泛函 J= F(,x(o),i(o))dt 的极值,一般是用泛函极值的必要条件去寻找一条曲线x(1),使给定的二阶连续可微 函数F沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为x(1)。 12.1端点固定的情况 设容许曲线x(1)满足边界条件
-219- ( ( ), ( )) ( ( ), ( )) 0 0 ΔJ = L x t δx t + r x t δx t 其中 L 为δx 的线性项,而 r 是δx 的高阶项,则 L 称为泛函在 ( ) 0 x t 的变分,记作 ( ( )) 0 δJ x t 。用变动的 x(t) 代替 ( ) 0 x t ,就有δJ (x(t))。 泛函变分的一个重要形式是它可以表为对参数α 的导数: 0 ( ( )) ( ( ) ( )) + = ∂ ∂ = αδ α α δJ x t J x t x t (4) 这是因为当变分存在时,增量 ΔJ = J (x(t) +αδx) − J (x(t)) = L(x(t),αδx) + r(x(t),αδx) 根据 L 和 r 的性质有 L(x(t),αδx) =αL(x(t),δx) 0 ( ( ), ) lim ( ( ), ) lim 0 0 = = → → x x r x t x r x t x δ αδ αδ α αδ α α 所以 α αδ αδ α α α ( ) ( ) ( ) lim 0 0 J x x J x J x x + − + = ∂ ∂ → = ( , ) ( ) ( , ) ( , ) lim 0 L x x J x L x x r x x δ δ α αδ αδ α = = + = → 1.1.4 极值与变分 利用变分的表达式(4)可以得到泛函极值与变分的关系: 若 J (x(t)) 在 ( ) 0 x t 达到极值(极大或极小),则 δJ (x0 (t)) = 0 (5) 这是因为对任意给定的δx , ( ) 0 J x +αδx 是变量α 的函数,该函数在α = 0 处达到极 值。根据函数极值的必要条件知 ( 0 + ) 0 = 0 ∂ ∂ αδ α = α J x x 于是由(4)式直接得到(5)式。 1.1.5. 变分法的基本引理 引理 ( ) [ , ] 1 2 ϕ x ∈C x x , ( ) [ , ] 1 2 1 ∀η x ∈C x x , ( ) ( ) 0 η x1 =η x2 = ,有 ∫ ≡ 2 1 ( ) ( ) 0 x x ϕ x η x dx , 则 ( ) 0, [ , ] 1 2 ϕ x ≡ x ∈ x x 。 1.2 无约束条件的泛函极值 求泛函 ∫ = f t t J F t x t x t dt 0 ( , ( ), &( )) (6) 的极值,一般是用泛函极值的必要条件去寻找一条曲线 x(t) ,使给定的二阶连续可微 函数 F 沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为 ( ) * x t 。 1.2.1 端点固定的情况 设容许曲线 x(t) 满足边界条件
x(0)=x0,x()=x (7) 且二次可微 首先计算(6)式的变分: J(x(r)+aar()aso rDF((+a&r(0), (0+ax()lasodr [F(,x,x)+F1(t,x,x)61t 对上式右端第二项做分布积分,并利用a(t0)=bx(t1)=0,有 F2(,x,x) h=- F(t, x, x)adt 再代回到(8)式,并利用泛函取极值的必要条件,有 d [F-F JOrdt=0 dt 因为x的任意性,及m(10)=(1)=0,所以由基本引理得到著名的欧拉方程 F-F=0 (9) 它是这类最简泛函取极值的必要条件。 (9)式又可记作 F-F F.x=0 通常这是x(t)的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确 122最简泛函的几种特殊情形 (i)F不依赖于文,即F=F(t,x) 这时F=0,欧拉方程为F2(,x)=0,这个方程以隐函数形式给出x(1),但它 般不满足边界条件,因此,变分问题无解。 (i)F不依赖x,即F=F(t,x) 欧拉方程为 (t,x)=0 将上式积分一次,便得首次积分F(t,x)=C1,由此可求出x=p(1,C1),积分后得到 可能的极值曲线族 x=∫och (i)F只依赖于x,即F=F(x) 这时F2=0,F=0,Fx=0,欧拉方程为 由此可设=0或F=0,如果x=0,则得到含有两个参数的直线族x=c1+c2
-220- 0 0 x(t ) = x , f f x(t ) = x (7) 且二次可微。 首先计算(6)式的变分: 0 ( ( ) ( )) + = ∂ ∂ = αδ α α δJ J x t x t ∫ + + = ∂ ∂ = f t t F t x t x t x t x t dt 0 0 ( , ( ) ( ), ( ) ( )) αδ αδ α α & & ∫ = + f t t Fx t x x x Fx t x x x dt 0 [ ( , , &) ( , , &) &] δ & δ (8) 对上式右端第二项做分布积分,并利用δx(t0 ) = δx(t f ) = 0 ,有 ∫ ∫ = − f f t t x t t x F t x x xdt dt d F t x x xdt 0 0 & ( , , &)δ& & ( , , &)δ , 再代回到(8)式,并利用泛函取极值的必要条件,有 ∫ = − = f t t x x F xdt dt d J F 0 δ [ & ]δ 0 因为δx 的任意性,及δx(t0 ) = δx(t f ) = 0 ,所以由基本引理得到著名的欧拉方程 x − Fx = 0 dt d F & (9) 它是这类最简泛函取极值的必要条件。 (9)式又可记作 Fx − Ftx& − Fxx& x& − Fx&x& & x& = 0 (10) 通常这是 x(t) 的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确 定。 1.2.2 最简泛函的几种特殊情形 (i) F 不依赖于 x& ,即 F = F(t, x) 这时 Fx& ≡ 0,欧拉方程为 Fx (t, x) = 0,这个方程以隐函数形式给出 x(t) ,但它一 般不满足边界条件,因此,变分问题无解。 (ii) F 不依赖 x ,即 F = F(t, x&) 欧拉方程为 F (t, x) = 0 dt d x & & 将上式积分一次,便得首次积分 1 F (t, x) c x& & = ,由此可求出 ( , )1 x& = ϕ t c ,积分后得到 可能的极值曲线族 x ( ) t c dt ∫ = 1 ϕ , (iii) F 只依赖于 x& ,即 F = F(x&) 这时 Fx = 0,Ftx& = 0,Fxx& = 0,欧拉方程为 & x&Fx&x& = 0 由此可设 & x& = 0 或 Fx&x& = 0,如果 & x& = 0 ,则得到含有两个参数的直线族 1 2 x = c t + c
另外若F=0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c的 直线族x=k+c,它包含于上面含有两个参数的直线族x=c1t+c2中,于是,在 F=F(x)情况下,极值曲线必然是直线族 (iv)F只依赖于x和x,即F=F(x,x) 这时有F=0,故欧拉方程为 F-xF.-xF.=0 此方程具有首次积分为 F-xF.=CI 事实上,注意到F不依赖于t,于是有 XF=Fx+F x-xI F=X(Fr-F) dt 例1(最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是 约翰·贝努里(J. Bernoulli)于1696年提出的。问题的提法是这样的:设A和B是铅 直平面上不在同一铅直线上的两点,在所有连结A和B的平面曲线中,求一曲线,当 质点仅受重力作用,且初速为零,沿此曲线从A滑行至B时,使所需时间最短。 解将A点取为坐标原点,x轴水平向右,y轴垂直向下,B点为B(x2y2)。根 据能量守恒定律,质点在曲线y(x)上任一点处的速度,满足(s为弧长) Ids 将d=√l+y2(x)d代入上式得 于是质点滑行时间应表为y(x)的泛函 J(y(x))= dx 2 端点条件为 (0)=0,y(x2)=y2 最速降线满足欧拉方程,因为 FO,y)= y 不含自变量x,所以方程(10)可写作 F.-Fy-Frvy=0 等价于 (F-yF)=0 作一次积分得
-221- 另外若 Fx&x& = 0有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c 的 直线族 x = kt + c ,它包含于上面含有两个参数的直线族 1 2 x = c t + c 中,于是,在 F = F(x&) 情况下,极值曲线必然是直线族。 (iv) F 只依赖于 x 和 x& ,即 F = F(x, x&) 这时有 Ftx& = 0 ,故欧拉方程为 Fx − x&Fxx& − & x&Fx&x& = 0 此方程具有首次积分为 1 F xF c − & x& = 事实上,注意到 F 不依赖于t ,于是有 ( − x ) = x + x − x − x = ( x − Fx ) = 0 dt d F x F dt d F xF F x F x xF x dt d & & & & & & & && && & & 。 例 1 (最速降线问题)最速降线问题是历史上变分法开始发展的第一个问题。它是 约翰·贝努里(J. Bernoulli)于 1696 年提出的。问题的提法是这样的:设 A 和 B 是铅 直平面上不在同一铅直线上的两点,在所有连结 A 和 B 的平面曲线中,求一曲线,当 质点仅受重力作用,且初速为零,沿此曲线从 A 滑行至 B 时,使所需时间最短。 解 将 A 点取为坐标原点,x 轴水平向右, y 轴垂直向下,B 点为 ( , ) 2 2 B x y 。根 据能量守恒定律,质点在曲线 y(x) 上任一点处的速度 dt ds 满足( s 为弧长) mgy dt ds m ⎟ = ⎠ ⎞ ⎜ ⎝ ⎛ 2 2 1 将ds 1 y' (x) dx 2 = + 代入上式得 dx gy y dt 2 1 ' 2 + = 于是质点滑行时间应表为 y(x) 的泛函 dx gy y J y x x ∫ + = 2 0 2 2 1 ' ( ( )) 端点条件为 2 2 y(0) = 0, y(x ) = y 最速降线满足欧拉方程,因为 y y F y y 2 1 ' ( , ') + = 不含自变量 x ,所以方程(10)可写作 Fy − Fyy' y'−Fy' y' y' '= 0 等价于 (F − y' Fy' ) = 0 dx d 作一次积分得
令y=cg,则方程化为 ,sin=-(1-cos0 又因 dx (-cos0)d8 积分之,得 由边界条件y(0)=0,可知c2=0,故得 x=(0-sin8 这是摆线(圆滚线)的参数方程,其中常数c1可利用另一边界条件y(x2)=y2来确定。 例2最小旋转面问题 J((x)=2r.y(x)vl+y(x)dx S=lyECIx,x2l, y(x)=y,y(x2)=y2) 解因F=y√1+y2不包含x,故有首次积分 化简得 令y=sh,代入上式,y=ch+sht=cht 由于d shit C 积分之,得x=c1t+c2 消去1,就得到y 这是悬链线方程 123最简泛函的推广 最简泛函取极值的必要条件可以推广到其它情况 (i)含多个函数的泛函
-222- 1 2 y(1+ y' ) = c 令 , 2 ' θ y = ctg 则方程化为 (1 cos ) 2 2 sin 1 ' 2 1 2 1 1 θ θ = = − + = c c y c y 又因 θ θ θ θ θ θ d c ctg c d y dy dx (1 cos ) 2 2 2 cos 2 sin ' 1 1 = = = − 积分之,得 2 1 ( sin ) 2 c c x = θ − θ + 由边界条件 y(0) = 0 ,可知 0 c2 = ,故得 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = − = − (1 cos ). 2 ( sin ) 2 1 1 θ θ θ c y c x 这是摆线(圆滚线)的参数方程,其中常数 1 c 可利用另一边界条件 2 2 y(x )= y 来确定。 例 2 最小旋转面问题 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + { | [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y y ∈C x x y x = y y x = y 解 因 1 ' 2 F = y + y 不包含 x ,故有首次积分 1 2 2 ' 1 ' ' ' 1 ' ' c y y F y F y y y y y = + − = + − 化简得 2 1 y = c 1+ y' 令 y'= sht ,代入上式, y c sh t c cht 1 2 = 1 1+ = 由于 c dt sht c shtdt y dy dx 1 1 ' = = = 积分之,得 1 2 x = c t + c 消去t ,就得到 1 2 1 c x c y c ch − = 。 这是悬链线方程。 1.2.3 最简泛函的推广 最简泛函取极值的必要条件可以推广到其它情况。 (ⅰ)含多个函数的泛函
使泛函 J(0y(x),x(x)=F(x,y,y,=,2)h 取极值且满足固定边界条件 y(x1)=y1,y(x2)=y2,x(x1)==1,2(x2)=2 的极值曲线y=y(x)二=二(x)必满足欧拉方程组 d F=0 d (i)含高阶导数的泛函 使泛函 J(y(x)=F(x,V,y',y")dx 取极值且满足固定边界条件 y(x1)=y1,y(x2)=y2,y(x1)=y1,y(x2)=y2 的极值曲线y=y(x)必满足微分方程 F dx) dx F,=0 (i)含多元函数的泛函 设x(x,y)∈c,(x,y)∈D,使泛函 JE(x, y))=F(x, y,=,=r,=y )dxdy 取极值且在区域D的边界线l上取已知值的极值函数z=(x,y)必满足方程 F--F F.=0 ay 上式称为奥式方程。 124端点变动的情况(横截条件) 设容许曲线x(1)在l固定,在另一端点t=t时不固定,是沿着给定的曲线 x=v()上变动。于是端点条件表示为 x(0)=x x(1)=y(1) 这里t是变动的,不妨用参数形式表示为 t=t+adt 寻找端点变动情况的必要条件,可仿照前面端点固定情况进行推导,即有 0==0.F(x+6x+)u ∫(F-0F)+F浏m,+F山 (11) dt
-223- 使泛函 ∫ = 2 1 ( ( ), ( )) ( , , ', , ') x x J y x z x F x y y z z dx 取极值且满足固定边界条件 ( ) , ( ) , ( ) , ( ) . 1 1 2 2 1 1 2 2 y x = y y x = y z x = z z x = z 的极值曲线 y = y(x),z = z(x)必满足欧拉方程组 ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ − = − = 0 0 ' ' z z y y F dx d F F dx d F (ii)含高阶导数的泛函 使泛函 ∫ = 2 1 ( ( )) ( , , ', ") x x J y x F x y y y dx 取极值且满足固定边界条件 1 1 y(x ) = y , 2 2 1 1 2 2 y(x )= y ,y'(x ) = y' , y'(x ) = y' 的极值曲线 y = y(x) 必满足微分方程 " 0 2 2 y − y' + Fy = dx d F dx d F (iii) 含多元函数的泛函 设 z(x, y)∈c ,(x, y)∈D 2 ,使泛函 ∫∫ = D J (z(x, y)) F(x, y,z,z x ,z y )dxdy 取极值且在区域 D 的边界线l 上取已知值的极值函数 z = z(x, y) 必满足方程 = 0 ∂ ∂ − ∂ ∂ − x y z z Fz y F x F 上式称为奥式方程。 1.2.4 端点变动的情况(横截条件) 设容许曲线 x(t) 在 0t 固定,在另一端点 f t = t 时不固定,是沿着给定的曲线 x =ψ(t)上变动。于是端点条件表示为 ⎩ ⎨ ⎧ = = ( ) ( ) ( ) 0 0 x t t x t x ψ 这里t 是变动的,不妨用参数形式表示为 f dt f t = t +α 寻找端点变动情况的必要条件,可仿照前面端点固定情况进行推导,即有 0 0 ( , , ) 0 = + + + ∂ ∂ = = ∫ α α αδ αδ α δJ F t x x x x dt f dt f t t & & f t t t t x t t x Fx xdt F x F dt dt d F f f f = = = − + + ∫ & δ & δ 0 ( ) (11)
再对(11)式做如下分析: (i)对每一个固定的t,x(O)都满足欧拉方程,即(11)式右端的第一项积分为 零; (i)为考察(1式的第二、第三项,建立dr与&m之间的关系,因为 x(t+adt )+aax(t +adt)=v(t+adt,) 对a求导并令a=0得 x(t, )dt xlet =v(t )dt axl =lv(t,)-x(r)]dt, (12) 把(12)代入(11)并利用dt的任意性,得 IF+(-xF (13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件 橫截条件有两种常见的特殊情况: (i)当x=W()是垂直横轴的直线时,t固定,x(t)自由,并称x(t)为自由 端点。此时(11)式中d=0及&,的任意性,便得自由端点的横截条件 0 (14) (i)当x=v()是平行横轴的直线时,t自由,x(1)固定,并称x()为 端点。此时v=0,(13)式的横截条件变为 F-ⅸF 0 (15) 注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件, 1.3有约束条件的泛函极值 在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动 态系统 x(1)=f(t,x(D,l() (16) 寻求最优性能指标(目标函数) J((1)=gp(tr,x(t)+F(,x(1,u()dt (17) 其中()是控制策略,x()是轨线,固定,t及x(1)自由,x(1)∈R",(1)∈R (不受限,充满R″空间),f,φ,F连续可微。 下面推导取得目标函数极值的最优控制策略u()和最优轨线x(t)的必要条件。 采用拉格朗日乘子法,化条件极值为无条件极值,即考虑 J(x,L,4)=(t1,x(t)+[F(,x,)+2()((1,x,)-x) (18) 的无条件极值,首先定义(16)式和(17)式的哈密顿( Hamilton)函数为 H(,x,l,4)=F(t,x,l)+x()f(t1x,l) (19) 将其代入(18)式,得到泛函
-224- 再对(11)式做如下分析: (i)对每一个固定的 f t , x(t) 都满足欧拉方程,即(11)式右端的第一项积分为 零; (ii)为考察(11)式的第二、第三项,建立dt f 与 f t t x = δ 之间的关系,因为 ( ) ( ) ( ) f f f f f dt f x t +αdt +αδx t +αdt =ψ t +α 对α 求导并令α = 0得 f f t t f f x t dt x t dt f &( ) + δ =ψ&( ) = 即 f f f t t x t x t dt f = [ &( ) − &( )] = δ ψ (12) 把(12)代入(11)并利用dt f 的任意性,得 [ + ( − ) ] = = 0 f Fx t t F x & ψ& & (13) (13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。 横截条件有两种常见的特殊情况: (i)当 x =ψ(t)是垂直横轴的直线时, f t 固定, ( )f x t 自由,并称 ( )f x t 为自由 端点。此时(11)式中dt f = 0 及 f t t x = δ 的任意性,便得自由端点的横截条件 = = 0 f Fx& t t (14) (ii)当 x =ψ(t)是平行横轴的直线时, f t 自由, ( )f x t 固定,并称 ( )f x t 为平动 端点。此时ψ& = 0,(13)式的横截条件变为 − = = 0 f Fx t t F x & & (15) 注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件。 1.3 有约束条件的泛函极值 在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动 态系统 x&(t) = f (t, x(t),u(t)) (16) 寻求最优性能指标(目标函数) ∫ = + f t t J u t t f x t f F t x t u t dt 0 ( ( )) ϕ( , ( )) ( , ( ), ( )) (17) 其中u(t)是控制策略,x(t) 是轨线, 0t 固定, f t 及 ( )f x t 自由, n x(t)∈ R , m u(t)∈ R (不受限,充满 m R 空间), f ,ϕ,F 连续可微。 下面推导取得目标函数极值的最优控制策略 ( ) * u t 和最优轨线 ( ) * x t 的必要条件。 采用拉格朗日乘子法,化条件极值为无条件极值,即考虑 ∫ = + + − f t t T J x u t f x t f F t x u t f t x u x dt 0 ( , , ) ( , ( )) [ ( , , ) ( )( ( , , ) )] 1 λ ϕ λ & (18) 的无条件极值,首先定义(16)式和(17)式的哈密顿(Hamilton)函数为 H(t, x,u, ) F(t, x,u) (t) f (t, x,u) T λ = + λ (19) 将其代入(18)式,得到泛函
J1(x,1)=0(1,x(1)+[[H(x,u,)-2xt (20) 下面先对其求变分 d,=o(t, +adt,x(t,)+aa(t,)) LH(t,x+ ad, u+aou, 2+ain)-(a+asa)(+a& )] aso x()9,+(r)9,+(d,)H(x,)--(d,)(米 I(ax) H +(Su)H +(Sn)H,-(on)x-1 ar]dt d,)9,+P(x,nD-,1+(6()9m (&)H2+(oi)H+(6)H2-()i-( (ax)adt 注意到a≠(r) ()-x(1)dtr,因而 d=(,)1,+H(xn2x(-,1+()(9,-4) +∫()(团2+)+(0)(H2-)+(△)H 再令1=0,由dtr2i(),,bu,的任意性,便得 (i)x,必满足正则方程: ①状态方程x=H2=f(1,x,) ②协态方程A=-H (i)哈密顿函数H(t1,x,u,x)作为u的函数,也必满足 H=0 并由此方程求得u。 (i)求x",,l时,必利用边界条件 ①x(t0)=x0, (用于确定x) ②A()=93) (用于确定A) ③9,=-H(,x,,4)=,(确定t) 14最大(小)值原理 如果受控系统 x=∫(t,x,u),x(t0)=x0 其控制策略u(1)的全体构成有界集U,求(D)∈U,使性能指标 (()=g(t,x(tr) (1x,)o 达到最大(小)值。 最大(小)值原理:如果f(t,x,4),g(tr,x()和F(t,x,)都是连续可微的
-225- ∫ = + − f t t T J x u t f x t f H t x u x dt 0 ( , , ) ( , ( )) [ ( , , , ) ] 1 λ ϕ λ λ & (20) 下面先对其求变分 { ( , ( ) ( )) 1 f f f f J ϕ t αdt x t αδx t α δ + + ∂ ∂ = 0 [ ( , , , ) ( ) ( )] } 0 = + + + + + − + + ∫ α α H t x αδx u αδu λ αδλ λ αδλ x αδx dt T t dt t f f & & [ ] f f f f t t T T t t f T t f T x t f T f x t dt dt H t x u dt x = + + = − = ( ) ( ) ( ) ( , , , ) ( ) ( ) ( ) δ ϕ ϕ λ λ & x H u H H x x dt T T T u T x T t t f [( ) ( ) ( ) ( ) ] 0 δ δ δλ δλ & λ δ& + + + λ − − ∫ ( ) ( ) [ ( , , , ) ] [ ( )] f f f x t T t t t f T f = dt ϕ + F t x u t = + δx t ϕ ∫ ∫ + + + − − = + f f f t t T f t t T t t T T u T x T x H u H H x dt t x x dt 0 0 [(δ ) (δ ) (δλ) λ (δλ) ] λ ( )δ (δ ) λ & & 注意到 ( ) t t f x x t f δ = ≠ δ , t t f f dt f x x t x t f = ( ) − &( ) δ = δ ,因而 f f f x t t T t t t f T f J dt H t x u x t = + = + − = ( ) [ ( , , , ) ] [ ( )] ( ) δ 1 ϕ λ δ ϕ λ ∫ + + + − + f t t u T T x T x H H x u H dt 0 [(δ ) ( λ) (δλ) ( ) (δ ) ] λ & & 再令 0 δJ1 = ,由dt f ,δx(t f ),δx,δu,δλ 的任意性,便得 (i) * * x ,λ 必满足正则方程: ① 状态方程 x = H = f (t, x,u) λ & ② 协态方程 λ = −Hx & 。 (ii)哈密顿函数 ( , , , ) * * H t x u λ 作为u 的函数,也必满足 Hu = 0 并由此方程求得 * u 。 (iii)求 * * * x ,λ ,u 时,必利用边界条件 ① 0 0 x(t ) = x , (用于确定 * x ) ② ( ) ( ) f f x t λ t = ϕ , (用于确定 * λ ) ③ f f t u t t H t x = − = ϕ ( , , ,λ) , (确定 f t ) 1.4 最大(小)值原理 如果受控系统 x& = f (t, x,u), 0 0 x(t ) = x 其控制策略u(t)的全体构成有界集U ,求u(t)∈U ,使性能指标 ∫ = + f t t J u t t f x t f F t x u dt 0 ( ( )) ϕ( , ( )) ( , , ) 达到最大(小)值。 最大(小)值原理:如果 f (t, x,u) , ( , ( )) f f ϕ t x t 和 F(t, x,u) 都是连续可微的
那么最优控制策略v'(1)和相应的最优轨线x()由下列的必要条件决定: (i)最优轨线x(1),协态向量(1)由下列的必要条件决定: dx dt =f(t,x,u),(1)∈U, da aH (i)哈密顿函数 H(, x, u,2)=F(,x, u)+d(of(, x, u) 作为l()的函数,最优策略a()必须使 H(,x, u,1)=max H(,x, u, 2) 或使 H(t,x,u’,x)=minH(t,x,l,x)(最小值原理) (ⅲi)满足相应的边界条件 ①若两端点固定,则正则方程的边界条件为 x(0)=x0,x(t)=x; ②若始端固定,终端t也固定,而x()自由,则正则方程的边界条件为 x(0)=x0,A()=0,(,x(1) ③若始端固定,终端t,x()都自由,则正则方程的边界条件为 x(0)=x,()=0x)(,x(), H(r,x().a(.A()+9,(r,x(1)=0 §2生产设备的最大经济效益 某工厂购买了一台新设备投入到生产中。一方面该设备随着运行时间的推移其磨损 程度愈来愈大,因此其转卖价将随着使用设备的时间增加而减小;另一方面生产设备总 是要进行日常保养,花费一定的保养费,保养可以减缓设备的磨损程度,提高设备的转 卖价。那么,怎样确定最优保养费和设备转卖时间,才能使这台设备的经济效益最大 2.1问题分析与假设 (i)设备的转卖价是时间t的函数,记为x(1)。x()的大小与设备的磨损程度和 保养费的多少密切相关。记初始转卖价x(0)=x0。 (ⅱi)设备随其运行时间的推移,磨损程度越来越大。t时刻设备的磨损程度可以 用t时刻转卖价的损失值来刻画,常称其为磨损函数或废弃函数,记为m()。 (i)保养设备可以减缓设备的磨损速度,提高转卖价。如果a(1)是单位时间的保 养费,g(1)是t时刻的保养效益系数(每用一元保养费所增加的转卖价),那么单位时 间的保养效益为g(Du(1)。另外,保养费不能过大(如单位时间保养费超过单位时间产 值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W,则(1)∈W (iv)设单位时间的产值与转卖价的比值记为P,则px(1)表示在t时刻单位时间 的产值,即t时刻的生产率
-226- 那么最优控制策略 ( ) * u t 和相应的最优轨线 ( ) * x t 由下列的必要条件决定: (i)最优轨线 ( ) * x t ,协态向量 ( ) * λ t 由下列的必要条件决定: f (t, x,u) dt dx = ,u(t)∈U , x H dt d ∂ ∂ = − λ . (ii)哈密顿函数 ( , , , ) ( , , ) ( ) ( , , ) * * * * * H t x u F t x u t f t x u T λ = + λ 作为u(t) 的函数,最优策略 ( ) * u t 必须使 ( , , , ) max ( , , , ) * * * * * H t x u λ H t x u λ u∈U = 或使 ( , , , ) min ( , , , ) * * * * * H t x u λ H t x u λ u∈U = (最小值原理) (iii)满足相应的边界条件 ① 若两端点固定,则正则方程的边界条件为 0 x(0) = x , f f x(t ) = x 。 ② 若始端固定,终端 f t 也固定,而 ( )f x t 自由,则正则方程的边界条件为 0 x(0) = x , ( ) ( , ( )) f x(t ) f f t t x t f λ = ϕ 。 ③ 若始端固定,终端 , ( ) f f t x t 都自由,则正则方程的边界条件为 0 x(0) = x , ( ) ( , ( )) f x(t ) f f t t x t f λ = ϕ , ( , ( ), ( ), ( )) + ( , ( )) = 0 f f f f t f f H t x t u t t t x t f λ ϕ 。 §2 生产设备的最大经济效益 某工厂购买了一台新设备投入到生产中。一方面该设备随着运行时间的推移其磨损 程度愈来愈大,因此其转卖价将随着使用设备的时间增加而减小;另一方面生产设备总 是要进行日常保养,花费一定的保养费,保养可以减缓设备的磨损程度,提高设备的转 卖价。那么,怎样确定最优保养费和设备转卖时间,才能使这台设备的经济效益最大。 2.1 问题分析与假设 (i)设备的转卖价是时间t 的函数,记为 x(t) 。 x(t) 的大小与设备的磨损程度和 保养费的多少密切相关。记初始转卖价 0 x(0) = x 。 (ii)设备随其运行时间的推移,磨损程度越来越大。t 时刻设备的磨损程度可以 用t 时刻转卖价的损失值来刻画,常称其为磨损函数或废弃函数,记为m(t) 。 (iii)保养设备可以减缓设备的磨损速度,提高转卖价。如果u(t)是单位时间的保 养费, g(t)是t 时刻的保养效益系数(每用一元保养费所增加的转卖价),那么单位时 间的保养效益为 g(t)u(t) 。另外,保养费不能过大(如单位时间保养费超过单位时间产 值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W ,则u(t)∈W 。 (iv)设单位时间的产值与转卖价的比值记为 p ,则 px(t) 表示在t 时刻单位时间 的产值,即t 时刻的生产率
(v)转卖价x(1)及单位时间的保养费u(1)都是时间t的连续可微函数。为了统 标准,采用它们的贴现值。对于贴现值的计算,例如转卖价x(1)的贴现值计算,如果 它的贴现因子为δ(经过单位时间的单位费用贴现),那么由 dx(tu) x(1)=1 解得 令1=0,便得时刻单位费用的贴现(称贴现系数)为e“,所以设备在时刻转卖价 x(1)的贴现为x(1)e“。仿此计算,u()的贴现为l(1)e,单位时间产值的贴现为 px(e-or (vi)欲确定的转卖时间t,和转卖价x()都是自由的。 22模型构造 根据以上的分析与假设可知:考察的对象是设备在生产中的磨损一保养系统;转卖 价体现了磨损和保养的综合指标,可以选作系统的状态变量:;在生产中设备磨损的不可 控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选 单位时间的保养费(1)作为控制策略。这样,生产设备的最大经济效益模型可以构成 为在设备磨损一保养系统的(转卖价)状态方程 (1) d=-m(1)+g()n() (21) 之下,在满足0≤u(1)≤U的函数集W中寻求最优控制策略u(),使系统的经济效益 这一性能指标 J(u(1) [px(1)-u(0)e-dt 为最大,其中t,x()都是自由的。 2.3模型求解 首先写出问题的哈密顿函数 H=[px(1)-l(1)]ea+A-m()+g(t)m(D) (23) 再由协态方程及边界条件求出A(1),即由 d() A()=0m) A()=(1-P)e+Pe-a 下面利用最大值原理求a(1)。先将(23)式改变为
-227- (v)转卖价 x(t) 及单位时间的保养费u(t) 都是时间t 的连续可微函数。为了统一 标准,采用它们的贴现值。对于贴现值的计算,例如转卖价 x(t) 的贴现值计算,如果 它的贴现因子为δ (经过单位时间的单位费用贴现),那么由 ⎪ ⎩ ⎪ ⎨ ⎧ = = ( ) 1 ( ) ( ) 1 1 1 x t x t dt dx t δ 解得 ( ) 1 1 ( ) t t x t e− − = δ 令 0 t1 = ,便得t 时刻单位费用的贴现(称贴现系数)为 t e−δ ,所以设备在t 时刻转卖价 x(t) 的贴现为 t x t e−δ ( ) 。仿此计算, u(t) 的贴现为 t u t e−δ ( ) ,单位时间产值的贴现为 t px t e−δ ( ) 。 (vi)欲确定的转卖时间 f t 和转卖价 ( )f x t 都是自由的。 2.2 模型构造 根据以上的分析与假设可知:考察的对象是设备在生产中的磨损—保养系统;转卖 价体现了磨损和保养的综合指标,可以选作系统的状态变量;在生产中设备磨损的不可 控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选 单位时间的保养费u(t) 作为控制策略。这样,生产设备的最大经济效益模型可以构成 为在设备磨损—保养系统的(转卖价)状态方程 ⎪ ⎩ ⎪ ⎨ ⎧ = = − + 0 (0) ( ) ( ) ( ) ( ) x x m t g t u t dt dx t (21) 之下,在满足0 ≤ u(t) ≤ U 的函数集W 中寻求最优控制策略 ( ) * u t ,使系统的经济效益 这一性能指标 ∫ − − = + − f f t t t f J u t x t e px t u t e dt 0 ( ( )) ( ) [ ( ) ( )] δ δ (22) 为最大,其中 , ( ) f f t x t 都是自由的。 2.3 模型求解 首先写出问题的哈密顿函数 H [ px(t) u(t)]e [ m(t) g(t)m(t)] t = − + − + − λ δ (23) 再由协态方程及边界条件求出λ(t) ,即由 ⎪ ⎩ ⎪ ⎨ ⎧ = = = − = − − − f f t f x t t x t e H pe dt d t δ δ λ ϕ λ ( ) ( ) ( ) 解得 t t e p e p t δ f δ δ δ λ − − ( ) = (1− ) + 下面利用最大值原理求 ( ) * u t 。先将(23)式改变为