-61- 按照（3），（4）逆向计算出 ( ) * 1 1 f x ，为全

正在加载图片...

按照(3),(4)逆向计算出f1(x1),为全过程的最优值。记状态x的最优决策为 (x),由x和u(x)按照状态转移方程计算出最优状态,记作x。并得到相应的最优决策,记作u(x)。于是最优策略为{u1(x1),2(x2),…,un(xn)}。算法程序的框图如图2所示。图的左边部分是函数序列的递推计算,可输出全过程最优值f1(x1),如果需要还以输出后部子过程最优值函数序列f(x)和最优决策序列u4(x6)。计算过程中存 ∫(x后)是备计算∫1之用,在∫-1算完后可用∫1将∫替换掉;存l(xk)是备右边部分读4(x)之用。图的右边部分是最优状态和最优决策序列的正向计算,可输出最优策略 {a1(x1),u2(x2)…,un(xn)}和最优轨线{x1,x2,…,xn} §4动态规划与静态规划的关系动态规划与静态规划(线性和非线性规划等)研究的对象本质上都是在若干约束条件下的函数极值问题。两种规划在很多情况下原则上可以相互转换动态规划可以看作求决策412…,Ln使指标函数Vn(x1,u1,l2…,n)达到最优 (最大或最小)的极值问题,状态转移方程、端点条件以及允许状态集、允许决策集等是约束条件,原则上可以用非线性规划方法求解些静态规划只要适当引入阶段变量、状态、决策等就可以用动态规划方法求解下面用例子说明。例4用动态规划解下列非线性规划 max∑g(ul) ll=a,lk≥ 其中gA(4)为任意的已知函数。解按变量u的序号划分阶段,看作n段决策过程。设状态为x1 问题中的变量u13u2,…,ln为决策。状态转移方程为 x1=a,xk+1=xk-l42k=1,2,…,n 取gA(uk)为阶段指标,最优值函数的基本方程为(注意到xn1=0) f (x = max [g, (xk)+fk(kd] 0≤xk≤a,k=n,n-1…2l; fn+1(0)=0. 按照逆序解法求出对应于x每个取值的最优决策u(x),计算至f(a)后即可利用状态转移方程得到最优状态序列{x}和最优决策序列{4(x)} 与静态规划相比,动态规划的优越性在于: (ⅱ)能够得到全局最优解。由于约束条件确定的约束集合往往很复杂,即使指标函数较简单,用非线性规划方法也很难求出全局最优解。而动态规划方法把全过程化为-61- 按照（3），（4）逆向计算出 ( ) * 1 1 f x ，为全过程的最优值。记状态 ki x 的最优决策为 ( ) * ki ki u x ，由 * 1 x 和 ( ) * ki ki u x 按照状态转移方程计算出最优状态，记作 * k x 。并得到相应的最优决策，记作 ( ) * * k k u x 。于是最优策略为{ ( ), ( ), , ( )} * * * 2 * 2 * 1 * 1 n n u x u x L u x 。算法程序的框图如图 2 所示。图的左边部分是函数序列的递推计算，可输出全过程最优值 ( ) * 1 1 f x ，如果需要还可以输出后部子过程最优值函数序列 ( ) k ki f x 和最优决策序列 ( ) * k ki u x 。计算过程中存 ( ) k ki f x 是备计算 k −1 f 之用，在 k −1 f 算完后可用 k −1 f 将 k f 替换掉；存 ( ) * k ki u x 是备右边部分读 ( ) * * k k u x 之用。图的右边部分是最优状态和最优决策序列的正向计算，可输出最优策略 { ( ), ( ), , ( )} * * * 2 * 2 * 1 * 1 n n u x u x L u x 和最优轨线{ , , , } * * 2 * 1 n x x L x 。 §4 动态规划与静态规划的关系动态规划与静态规划（线性和非线性规划等）研究的对象本质上都是在若干约束条件下的函数极值问题。两种规划在很多情况下原则上可以相互转换。动态规划可以看作求决策u u un , , , 1 2 L 使指标函数 ( , , , ) 1n 1 u1 u2 un V x ， L 达到最优（最大或最小）的极值问题，状态转移方程、端点条件以及允许状态集、允许决策集等是约束条件，原则上可以用非线性规划方法求解。一些静态规划只要适当引入阶段变量、状态、决策等就可以用动态规划方法求解。下面用例子说明。例 4 用动态规划解下列非线性规划 ∑= n k gk uk 1 max ( ) ； s.t. ∑= = ≥ n k uk a uk 1 , 0 . 其中 ( ) gk uk 为任意的已知函数。解按变量uk 的序号划分阶段，看作n 段决策过程。设状态为 1 2 1 , , , n+ x x L x ，取问题中的变量u u un , , , 1 2 L 为决策。状态转移方程为 , , 1,2, , . x1 = a xk +1 = xk − uk k = L n 取 ( ) gk uk 为阶段指标，最优值函数的基本方程为（注意到 xn+1 = 0 ） ( ) max [ ( ) ( )] 1 1 0 + + ≤ ≤ = k k + k k u x k k f x g x f x k k ； 0 ≤ xk ≤ a, k = n,n −1,L,2,1； f n+1 (0) = 0. 按照逆序解法求出对应于 k x 每个取值的最优决策 ( ) * k k u x ，计算至 ( ) 1f a 后即可利用状态转移方程得到最优状态序列{ } * k x 和最优决策序列{ ( )} * * k k u x 。与静态规划相比，动态规划的优越性在于：（i）能够得到全局最优解。由于约束条件确定的约束集合往往很复杂，即使指标函数较简单，用非线性规划方法也很难求出全局最优解。而动态规划方法把全过程化为

<<向上翻页向下翻页>>

点击下载：《数学建模》算法全收录（算法大全）：第04章动态规划