正在加载图片...
3.确定决策变量u及允许决策变量集合Dk()。 4.根据状态变量之间的递推关系,写出状态转移方程: Xk+I=T(xk uk(Xx)) 5.建立指标函数。一般用rk(X)描写阶段效应,五(xk) 表示k一n阶段的最优子策略函数。 6建立动态规划基本方程: f(Xk)=opt{K&,u4(X)》*人1(X+1)) u∈Dk(u) f+1(Xt1)=C k=n,n-1,..,1 以上是建立动态规划模型的过程,这个过程是正确求 解动态规划的基础。 在动态规划基本方程中,「k&,),+1=T(,)都是 已知函数,最优子策略人(xk)与+1(x1)之间是递推关 系,要求出(xk)及u(X),需要先求出五+1(xk+1),这就 决定了应用动态规划基本方程求最优策略总是逆着阶段的 顺序进行的。由后向前逐步计算,最终可以算出全过程的 最优策略函数值及最优策略。 ⒊确定决策变量uk及允许决策变量集合Dk (uk )。 ⒋根据状态变量之间的递推关系,写出状态转移方程: xk+1=T(xk , uk (xk )) ⒌建立指标函数。一般用rk (xk , uk )描写阶段效应,fk(xk) 表示k—n阶段的最优子策略函数。 ⒍建立动态规划基本方程: fk(xk)= opt{ rk (xk , uk (xk ))﹡fk+1(xk+1)} uk∈ Dk (uk ) fn+1(xn+1)=C k=n,n-1,…,1 以上是建立动态规划模型的过程,这个过程是正确求 解动态规划的基础。 在动态规划基本方程中, rk (xk , uk ), xk+1=T(xk , uk )都是 已知函数,最优子策略fk(xk)与fk+1(xk+1)之间是递推关 系,要求出fk(xk)及uk (xk ),需要先求出fk+1(xk+1),这就 决定了应用动态规划基本方程求最优策略总是逆着阶段的 顺序进行的。由后向前逐步计算,最终可以算出全过程的 最优策略函数值及最优策略
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有