在基本方程中， rk (xk , uk )， xk+1=T(xk , uk

点击下载：吉林大学：《运筹学》课程电子教案（PPT课件）第五章动态规划 5.2 动态规划的基本概念和最优化原理

正在加载图片...

在基本方程中，「(，)，k+1=T()都是已知函数，最优子策略人(xk)与+1(x1)之间是递推关系，要求出人(x 及()，需要先求出+1(x+1)，这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的。另一方面，由于k+1阶段的状态xk+1=T(x,u)是由前面的状态和决策所形成的，在计算+1(x+1)时还不能具体确定x+1 的，这就要求必须就k+1阶段的各个可能状态计算+1(X+1) 因此动态规划不但能求出整个问题的最优策略和最优目标值，而且还能求出决策过程中所有可能状态的最优策略及最优目标值。在基本方程中， rk (xk , uk )， xk+1=T(xk , uk )都是已知函数，最优子策略fk（xk）与fk+1（xk+1）之间是递推关系，要求出fk（xk）及uk (xk )，需要先求出fk+1（xk+1），这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的。另一方面，由于k+1阶段的状态xk+1=T(xk , uk )是由前面的状态和决策所形成的，在计算fk+1（xk+1）时还不能具体确定xk+1 的，这就要求必须就k+1阶段的各个可能状态计算fk+1（xk+1），因此动态规划不但能求出整个问题的最优策略和最优目标值，而且还能求出决策过程中所有可能状态的最优策略及最优目标值

<<向上翻页

点击下载：吉林大学：《运筹学》课程电子教案（PPT课件）第五章动态规划 5.2 动态规划的基本概念和最优化原理