-38-     =  = = + +  + + ( ) o

点击下载：《数学建模》课程教学资源（教材讲义）第四章动态规划 dynamic programming

正在加载图片...

fn+(xn+1)=0或 f4(x)=opt{vk(xk,uk)②fk41(xk+1)}k=n,…1 (2) 在上述方程中,当⑧为加法时取fn1(xk+1)=0:当②为乘法时,取fn+1(x+)=1。动态规划递归方程是动态规划的最优性原理的基础,即:最优策略的子策略,构成最优子策略。用状态转移方程(1)和递归方程(2)求解动态规划的过程,是由k=η+1逆推至k=1,故这种解法称为逆序解法。当然,对某些动态规划问题,也可采用顺序解法。这时,状态转移方程和递归方程分别为: k=Tk+(xk+1,uk+1),k=1,…,H f(x1)=0或1 fk+1(xk+1)=opt{vk+1(xk+1,uk+1)②f(x)},k=1,…, +∈Uk(xk) 纵上所述,如果一个问题能用动态规划方法求解,那么,我们可以按下列步骤,首先建立起动态规划的数学模型: (i)将过程划分成恰当的阶段 (ⅱi)正确选择状态变量xk’使它既能描述过程的状态,又满足无后效性,同时确定允许状态集合Xk (ⅲi)选择决策变量u’确定允许决策集合Uk(x)。 (ⅳv)写出状态转移方程。 (v)确定阶段指标vk(xk,lk)及指标函数的形式(阶段指标之和,阶段指标之积,阶段指标之极大或极小等)。 (ⅵi)写出基本方程即最优值函数满足的递归方程,以及端点条件 §3逆序解法的计算框图以自由终端、固定始端、指标函数取和的形式的逆序解法为例给出计算框图,其它情况容易在这个基础上修改得到。般化的自由终端条件为 fn+1(xn+;)=q(xn+1),i=1,2,…,nt1 (3) 其中φ为已知。固定始端条件可表示为X1={x1}={x1}。如果状态κ和决策以是连续变量,用数值方法求解时需按照精度要求进行离散化。设状态x的允许集合为 Xk={xh|i=1,2,…,nk},k=12,…,n 决策l5(x)的允许集合为 U={u|j=1,2,…,n},=12.…n,k=1,2 状态转移方程和阶段指标应对xk的每个取值x和u的每个取值u计算,即 T=T4(x,u),v=v(x,u)。最优值函数应对x的每个取值x计算。基本方程可以表为-38-     =  = = + +  + + ( ) opt { ( , ) ( )}, , ,1 ( ) 0 1 1 1 ( ) 1 1 f x v x u f x k n  f x k k k k k u U x k k n n k k k 或（2）在上述方程中，当  为加法时取 f n+1 (xk +1 ) = 0 ；当  为乘法时，取 f n+1 (xk +1 ) =1。动态规划递归方程是动态规划的最优性原理的基础，即：最优策略的子策略，构成最优子策略。用状态转移方程（1）和递归方程（2）求解动态规划的过程，是由 k = n +1 逆推至 k =1 ，故这种解法称为逆序解法。当然，对某些动态规划问题，也可采用顺序解法。这时，状态转移方程和递归方程分别为： xk = Tk+1 (xk+1 ,uk+1 ), k = 1,  ,n ，     =  = = + + +  + + + + + f x v x u f x k n f x k k k k k u U x k k k k k ( ) opt { ( , ) ( )}, 1, , ( 0 1 1 1 1 ( ) 1 1 1 1 1 1 1  ）或纵上所述，如果一个问题能用动态规划方法求解，那么，我们可以按下列步骤，首先建立起动态规划的数学模型：（i）将过程划分成恰当的阶段。（ii）正确选择状态变量 k x ，使它既能描述过程的状态，又满足无后效性，同时确定允许状态集合 Xk 。（iii）选择决策变量 k u ，确定允许决策集合 ( ) k k U x 。（iv）写出状态转移方程。（v）确定阶段指标 ( , ) k k uk v x 及指标函数 Vkn 的形式（阶段指标之和，阶段指标之积，阶段指标之极大或极小等）。（vi）写出基本方程即最优值函数满足的递归方程，以及端点条件。 §3 逆序解法的计算框图以自由终端、固定始端、指标函数取和的形式的逆序解法为例给出计算框图，其它情况容易在这个基础上修改得到。一般化的自由终端条件为 1 1 1 1 ( ) ( ), 1,2, , n+ n+ i = n+ i = nn+ f x  x i  (3) 其中  为已知。固定始端条件可表示为 { } { } * 1 1 1 X = x = x 。如果状态 k x 和决策 k u 是连续变量，用数值方法求解时需按照精度要求进行离散化。设状态 k x 的允许集合为 Xk = {xki | i =1,2,  ,nk }, k =1,2,  ,n . 决策 ( ) ki ki u x 的允许集合为 U u j nki i nk k n j ki ki { | 1,2, , }, 1,2, , , 1,2, , = ( ) =  =  =  . 状态转移方程和阶段指标应对 k x 的每个取值 ki x 和 ki u 的每个取值 ( j) uki 计算，即 ( , ) ( j) k k ki uki T = T x ， ( , ) ( j) k ki uki v = v x 。最优值函数应对 k x 的每个取值 ki x 计算。基本方程可以表为

<<向上翻页向下翻页>>

点击下载：《数学建模》课程教学资源（教材讲义）第四章动态规划 dynamic programming