正在加载图片...
在基本方程中,「(,),k+1=T()都是已知函数,最 优子策略人(xk)与+1(x1)之间是递推关系,要求出人(x 及(),需要先求出+1(x+1),这就决定了应用动态规划 基本方程求最优策略总是逆着阶段的顺序进行的。 另一方面,由于k+1阶段的状态xk+1=T(x,u)是由前面的状 态和决策所形成的,在计算+1(x+1)时还不能具体确定x+1 的,这就要求必须就k+1阶段的各个可能状态计算+1(X+1) 因此动态规划不但能求出整个问题的最优策略和最优目标值, 而且还能求出决策过程中所有可能状态的最优策略及最优目标 值。 在基本方程中, rk (xk , uk ), xk+1=T(xk , uk )都是已知函数,最 优子策略fk(xk)与fk+1(xk+1)之间是递推关系,要求出fk(xk) 及uk (xk ),需要先求出fk+1(xk+1),这就决定了应用动态规划 基本方程求最优策略总是逆着阶段的顺序进行的。 另一方面,由于k+1阶段的状态xk+1=T(xk , uk )是由前面的状 态和决策所形成的,在计算fk+1(xk+1)时还不能具体确定xk+1 的,这就要求必须就k+1阶段的各个可能状态计算fk+1(xk+1), 因此动态规划不但能求出整个问题的最优策略和最优目标值, 而且还能求出决策过程中所有可能状态的最优策略及最优目标 值
<<向上翻页
©2008-现在 cucdc.com 高等教育资讯网 版权所有