正在加载图片...
§2动态规划的最优性原理 多阶段决策过程的特点是每个阶段都要进行决策,具有 个阶段的决策过程的策略是由个相继进行的阶段决策构成的 决策序列。由于前阶段的终止状态又是后一阶段的初始状态, 因此确定阶段最优决策不能只从本阶段的效应出发,必须通盘 考虑,整体规划。就是说,阶段k的最优决策不应只是本阶段 的最优,而必须是本阶段及其所有后续阶段的总体最优,即关 于整个后部子过程的最优决策。 对此,贝尔曼在深入研究的基础上,针对具有无后效性的 多阶段决策过程的特点,提出了著名的多阶段决策的最优性原 理: “整个过程的最优策略具有这样的性质:即无论过程过去 的状态和决策如何,对前面的决策所形成的状态而言,余下的 诸决策必须构成最优策略。’ 简而言之,最优性原理的含意就是:最优策略的任何一部 分子策略也必须是最优的。 §2 动态规划的最优性原理 多阶段决策过程的特点是每个阶段都要进行决策,具有n 个阶段的决策过程的策略是由n个相继进行的阶段决策构成的 决策序列。由于前阶段的终止状态又是后一阶段的初始状态, 因此确定阶段最优决策不能只从本阶段的效应出发,必须通盘 考虑,整体规划。就是说,阶段k的最优决策不应只是本阶段 的最优,而必须是本阶段及其所有后续阶段的总体最优,即关 于整个后部子过程的最优决策。 对此,贝尔曼在深入研究的基础上,针对具有无后效性的 多阶段决策过程的特点,提出了著名的多阶段决策的最优性原 理: “整个过程的最优策略具有这样的性质:即无论过程过去 的状态和决策如何,对前面的决策所形成的状态而言,余下的 诸决策必须构成最优策略。” 简而言之,最优性原理的含意就是:最优策略的任何一部 分子策略也必须是最优的
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有