正在加载图片...
fn+(xn+1)=0或 f4(x)=opt{vk(xk,uk)②fk41(xk+1)}k=n,…1 (2) 在上述方程中,当⑧为加法时取fn1(xk+1)=0:当②为乘法时,取fn+1(x+)=1。 动态规划递归方程是动态规划的最优性原理的基础,即:最优策略的子策略,构成最优 子策略。用状态转移方程(1)和递归方程(2)求解动态规划的过程,是由k=η+1逆 推至k=1,故这种解法称为逆序解法。当然,对某些动态规划问题,也可采用顺序解 法。这时,状态转移方程和递归方程分别为: k=Tk+(xk+1,uk+1),k=1,…,H f(x1)=0或1 fk+1(xk+1)=opt{vk+1(xk+1,uk+1)②f(x)},k=1,…, +∈Uk(xk) 纵上所述,如果一个问题能用动态规划方法求解,那么,我们可以按下列步骤,首 先建立起动态规划的数学模型: (i)将过程划分成恰当的阶段 (ⅱi)正确选择状态变量xk’使它既能描述过程的状态,又满足无后效性,同时确 定允许状态集合Xk (ⅲi)选择决策变量u’确定允许决策集合Uk(x)。 (ⅳv)写出状态转移方程。 (v)确定阶段指标vk(xk,lk)及指标函数的形式(阶段指标之和,阶段指标之 积,阶段指标之极大或极小等)。 (ⅵi)写出基本方程即最优值函数满足的递归方程,以及端点条件 §3逆序解法的计算框图 以自由终端、固定始端、指标函数取和的形式的逆序解法为例给出计算框图,其它 情况容易在这个基础上修改得到。 般化的自由终端条件为 fn+1(xn+;)=q(xn+1),i=1,2,…,nt1 (3) 其中φ为已知。固定始端条件可表示为X1={x1}={x1}。 如果状态κ和决策以是连续变量,用数值方法求解时需按照精度要求进行离散 化。设状态x的允许集合为 Xk={xh|i=1,2,…,nk},k=12,…,n 决策l5(x)的允许集合为 U={u|j=1,2,…,n},=12.…n,k=1,2 状态转移方程和阶段指标应对xk的每个取值x和u的每个取值u计算,即 T=T4(x,u),v=v(x,u)。最优值函数应对x的每个取值x计算。基本方 程可以表为-38-     =  = = + +  + + ( ) opt { ( , ) ( )}, , ,1 ( ) 0 1 1 1 ( ) 1 1 f x v x u f x k n  f x k k k k k u U x k k n n k k k 或 (2) 在上述方程中,当  为加法时取 f n+1 (xk +1 ) = 0 ;当  为乘法时,取 f n+1 (xk +1 ) =1。 动态规划递归方程是动态规划的最优性原理的基础,即:最优策略的子策略,构成最优 子策略。用状态转移方程(1)和递归方程(2)求解动态规划的过程,是由 k = n +1 逆 推至 k =1 ,故这种解法称为逆序解法。当然,对某些动态规划问题,也可采用顺序解 法。这时,状态转移方程和递归方程分别为: xk = Tk+1 (xk+1 ,uk+1 ), k = 1,  ,n ,     =  = = + + +  + + + + + f x v x u f x k n f x k k k k k u U x k k k k k ( ) opt { ( , ) ( )}, 1, , ( 0 1 1 1 1 ( ) 1 1 1 1 1 1 1  ) 或 纵上所述,如果一个问题能用动态规划方法求解,那么,我们可以按下列步骤,首 先建立起动态规划的数学模型: (i)将过程划分成恰当的阶段。 (ii)正确选择状态变量 k x ,使它既能描述过程的状态,又满足无后效性,同时确 定允许状态集合 Xk 。 (iii)选择决策变量 k u ,确定允许决策集合 ( ) k k U x 。 (iv)写出状态转移方程。 (v)确定阶段指标 ( , ) k k uk v x 及指标函数 Vkn 的形式(阶段指标之和,阶段指标之 积,阶段指标之极大或极小等)。 (vi)写出基本方程即最优值函数满足的递归方程,以及端点条件。 §3 逆序解法的计算框图 以自由终端、固定始端、指标函数取和的形式的逆序解法为例给出计算框图,其它 情况容易在这个基础上修改得到。 一般化的自由终端条件为 1 1 1 1 ( ) ( ), 1,2, , n+ n+ i = n+ i = nn+ f x  x i  (3) 其中  为已知。固定始端条件可表示为 { } { } * 1 1 1 X = x = x 。 如果状态 k x 和决策 k u 是连续变量,用数值方法求解时需按照精度要求进行离散 化。设状态 k x 的允许集合为 Xk = {xki | i =1,2,  ,nk }, k =1,2,  ,n . 决策 ( ) ki ki u x 的允许集合为 U u j nki i nk k n j ki ki { | 1,2, , }, 1,2, , , 1,2, , = ( ) =  =  =  . 状态转移方程和阶段指标应对 k x 的每个取值 ki x 和 ki u 的每个取值 ( j) uki 计算,即 ( , ) ( j) k k ki uki T = T x , ( , ) ( j) k ki uki v = v x 。最优值函数应对 k x 的每个取值 ki x 计算。基本方 程可以表为
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有