《数学模型与数学实验》课程书籍文献（数学建模算法大全）第18章变分法模型.pdf_大学文库

-218- 第十八章动态优化模型动态过程的另一类问题是所谓的动态优化问题，这类问题一般要归结为求最优控制函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时，问题又简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方法。 §1 变分法简介变分法是研究泛函极值问题的一种经典数学方法，有着广泛的应用。下面先介绍变分法的基本概念和基本结果，然后介绍动态系统最优控制问题求解的必要条件和最大值原理。 1.1 变分法的基本概念 1.1.1 泛函设 S 为一函数集合，若对于每一个函数 x(t)∈ S 有一个实数 J 与之对应，则称 J 是对应在 S 上的泛函，记作 J (x(t)) 。 S 称为 J 的容许函数集。通俗地说，泛函就是“函数的函数”。例如对于 xy 平面上过定点 ( , ) 1 1 A x y 和 ( , ) 2 2 B x y 的每一条光滑曲线 y(x) ，绕 x 轴旋转得一旋转体，旋转体的侧面积是曲线 y(x) 的泛函 J ( y(x)) 。由微积分知识不难写出 J y x y x y x dx x x ( ( )) 2 ( ) 1 ' ( ) 2 1 2 ∫ = π + （1）容许函数集可表示为 { ( ) | ( ) [ , ], ( ) , ( ) } 1 2 1 1 2 2 1 S = y x y x ∈C x x y x = y y x = y （2）最简单的一类泛函表为 ∫ = 2 1 ( ( )) ( , , ) t t J x t F t x x& dt （3）被积函数 F 包含自变量t ，未知函数 x 及导数 x& 。（1）式是最简泛函。 1.1.2 泛函的极值泛函 J (x(t)) 在 x0 (t)∈ S 取得极小值是指，对于任意一个与 ( ) 0 x t 接近的 x(t)∈ S ，都有 ( ( )) ( ( )) 0 J x t ≥ J x t 。所谓接近，可以用距离 ( ( ), ( )) < ε 0 d x t x t 来度量，而距离定义为 ( ( ), ( )) max{| ( ) ( ) |,| ( ) ( ) |} 0 0 0 1 2 d x t x t x t x t x t x t t t t = − & − & ≤ ≤ 泛函的极大值可以类似地定义。 ( ) 0 x t 称为泛函的极值函数或极值曲线。 1.1.3 泛函的变分如同函数的微分是增量的线性主部一样，泛函的变分是泛函增量的线性主部。作为泛函的自变量，函数 x(t) 在 ( ) 0 x t 的增量记为 ( ) ( ) ( ) 0 δ x t = x t − x t 也称函数的变分。由它引起的泛函的增量记作 ( ( ) ( )) ( ( )) 0 0 ΔJ = J x t +δx t − J x t 如果 ΔJ 可以表为

-224- 再对（11）式做如下分析：（i）对每一个固定的 f t ， x(t) 都满足欧拉方程，即（11）式右端的第一项积分为零；（ii）为考察（11）式的第二、第三项，建立dt f 与 f t t x = δ 之间的关系，因为 ( ) ( ) ( ) f f f f f dt f x t +αdt +αδx t +αdt =ψ t +α 对α 求导并令α = 0得 f f t t f f x t dt x t dt f &( ) + δ =ψ&( ) = 即 f f f t t x t x t dt f = [ &( ) − &( )] = δ ψ （12）把（12）代入（11）并利用dt f 的任意性，得 [ + ( − ) ] = = 0 f Fx t t F x & ψ& & （13）（13）式就是确定欧拉方程通解中另一常数的定解条件，称为横截条件。横截条件有两种常见的特殊情况：（i）当 x =ψ(t)是垂直横轴的直线时， f t 固定， ( )f x t 自由，并称 ( )f x t 为自由端点。此时（11）式中dt f = 0 及 f t t x = δ 的任意性，便得自由端点的横截条件 = = 0 f Fx& t t （14）（ii）当 x =ψ(t)是平行横轴的直线时， f t 自由， ( )f x t 固定，并称 ( )f x t 为平动端点。此时ψ& = 0，（13）式的横截条件变为 − = = 0 f Fx t t F x & & （15）注意，横截条件与欧拉方程联立才能构成泛函极值的必要条件。 1.3 有约束条件的泛函极值在最优控制系统中，常常要涉及到有约束条件泛函的极值问题，其典型形式是对动态系统 x&(t) = f (t, x(t),u(t)) （16）寻求最优性能指标（目标函数） ∫ = + f t t J u t t f x t f F t x t u t dt 0 ( ( )) ϕ( , ( )) ( , ( ), ( )) （17）其中u(t)是控制策略，x(t) 是轨线， 0t 固定， f t 及 ( )f x t 自由， n x(t)∈ R ， m u(t)∈ R （不受限，充满 m R 空间）， f ,ϕ,F 连续可微。下面推导取得目标函数极值的最优控制策略 ( ) * u t 和最优轨线 ( ) * x t 的必要条件。采用拉格朗日乘子法，化条件极值为无条件极值，即考虑 ∫ = + + − f t t T J x u t f x t f F t x u t f t x u x dt 0 ( , , ) ( , ( )) [ ( , , ) ( )( ( , , ) )] 1 λ ϕ λ & （18）的无条件极值，首先定义（16）式和（17）式的哈密顿（Hamilton）函数为 H(t, x,u, ) F(t, x,u) (t) f (t, x,u) T λ = + λ （19）将其代入（18）式，得到泛函

-226- 那么最优控制策略 ( ) * u t 和相应的最优轨线 ( ) * x t 由下列的必要条件决定：（i）最优轨线 ( ) * x t ，协态向量 ( ) * λ t 由下列的必要条件决定： f (t, x,u) dt dx = ，u(t)∈U ， x H dt d ∂ ∂ = − λ . （ii）哈密顿函数 ( , , , ) ( , , ) ( ) ( , , ) * * * * * H t x u F t x u t f t x u T λ = + λ 作为u(t) 的函数，最优策略 ( ) * u t 必须使 ( , , , ) max ( , , , ) * * * * * H t x u λ H t x u λ u∈U = 或使 ( , , , ) min ( , , , ) * * * * * H t x u λ H t x u λ u∈U = (最小值原理) （iii）满足相应的边界条件 ① 若两端点固定，则正则方程的边界条件为 0 x(0) = x ， f f x(t ) = x 。 ② 若始端固定，终端 f t 也固定，而 ( )f x t 自由，则正则方程的边界条件为 0 x(0) = x ， ( ) ( , ( )) f x(t ) f f t t x t f λ = ϕ 。 ③ 若始端固定，终端 , ( ) f f t x t 都自由，则正则方程的边界条件为 0 x(0) = x ， ( ) ( , ( )) f x(t ) f f t t x t f λ = ϕ ， ( , ( ), ( ), ( )) + ( , ( )) = 0 f f f f t f f H t x t u t t t x t f λ ϕ 。 §2 生产设备的最大经济效益某工厂购买了一台新设备投入到生产中。一方面该设备随着运行时间的推移其磨损程度愈来愈大，因此其转卖价将随着使用设备的时间增加而减小；另一方面生产设备总是要进行日常保养，花费一定的保养费，保养可以减缓设备的磨损程度，提高设备的转卖价。那么，怎样确定最优保养费和设备转卖时间，才能使这台设备的经济效益最大。 2.1 问题分析与假设（i）设备的转卖价是时间t 的函数，记为 x(t) 。 x(t) 的大小与设备的磨损程度和保养费的多少密切相关。记初始转卖价 0 x(0) = x 。（ii）设备随其运行时间的推移，磨损程度越来越大。t 时刻设备的磨损程度可以用t 时刻转卖价的损失值来刻画，常称其为磨损函数或废弃函数，记为m(t) 。（iii）保养设备可以减缓设备的磨损速度，提高转卖价。如果u(t)是单位时间的保养费， g(t)是t 时刻的保养效益系数（每用一元保养费所增加的转卖价），那么单位时间的保养效益为 g(t)u(t) 。另外，保养费不能过大（如单位时间保养费超过单位时间产值时，保养失去了意义），只能在有界函数集中选取，记有界函数集为W ，则u(t)∈W 。（iv）设单位时间的产值与转卖价的比值记为 p ，则 px(t) 表示在t 时刻单位时间的产值，即t 时刻的生产率

-227- （v）转卖价 x(t) 及单位时间的保养费u(t) 都是时间t 的连续可微函数。为了统一标准，采用它们的贴现值。对于贴现值的计算，例如转卖价 x(t) 的贴现值计算，如果它的贴现因子为δ （经过单位时间的单位费用贴现），那么由 ⎪ ⎩ ⎪ ⎨ ⎧ = = ( ) 1 ( ) ( ) 1 1 1 x t x t dt dx t δ 解得 ( ) 1 1 ( ) t t x t e− − = δ 令 0 t1 = ，便得t 时刻单位费用的贴现（称贴现系数）为 t e−δ ，所以设备在t 时刻转卖价 x(t) 的贴现为 t x t e−δ ( ) 。仿此计算， u(t) 的贴现为 t u t e−δ ( ) ，单位时间产值的贴现为 t px t e−δ ( ) 。（vi）欲确定的转卖时间 f t 和转卖价 ( )f x t 都是自由的。 2.2 模型构造根据以上的分析与假设可知：考察的对象是设备在生产中的磨损—保养系统；转卖价体现了磨损和保养的综合指标，可以选作系统的状态变量；在生产中设备磨损的不可控性强，其微弱的可控性也是通过保养体现，加之保养本身具有较强的可控性，所以选单位时间的保养费u(t) 作为控制策略。这样，生产设备的最大经济效益模型可以构成为在设备磨损—保养系统的（转卖价）状态方程 ⎪ ⎩ ⎪ ⎨ ⎧ = = − + 0 (0) ( ) ( ) ( ) ( ) x x m t g t u t dt dx t （21）之下，在满足0 ≤ u(t) ≤ U 的函数集W 中寻求最优控制策略 ( ) * u t ，使系统的经济效益这一性能指标 ∫ − − = + − f f t t t f J u t x t e px t u t e dt 0 ( ( )) ( ) [ ( ) ( )] δ δ （22）为最大，其中 , ( ) f f t x t 都是自由的。 2.3 模型求解首先写出问题的哈密顿函数 H [ px(t) u(t)]e [ m(t) g(t)m(t)] t = − + − + − λ δ （23）再由协态方程及边界条件求出λ(t) ，即由 ⎪ ⎩ ⎪ ⎨ ⎧ = = = − = − − − f f t f x t t x t e H pe dt d t δ δ λ ϕ λ ( ) ( ) ( ) 解得 t t e p e p t δ f δ δ δ λ − − ( ) = (1− ) + 下面利用最大值原理求 ( ) * u t 。先将（23）式改变为

《数学模型与数学实验》课程书籍文献（数学建模算法大全）第18章 变分法模型

《数学模型与数学实验》课程书籍文献（数学建模算法大全）第18章变分法模型