正在加载图片...
、马氏决策规划 在赋值马氏过程中,如果在某状态选用不同 的决策能够改变相应的状态转移矩阵及报酬 矩阵,就产生了动态随机系统求值最优策略 的问题。马氏决策规划就是研究这类问题的 下面我们通过实例来介绍马氏决策规划中有 限阶段的一种求解方法—值迭代法。设系 统目标为总期望报酬最大化三、马氏决策规划 在赋值马氏过程中,如果在某状态选用不同 的决策能够改变相应的状态转移矩阵及报酬 矩阵,就产生了动态随机系统求值最优策略 的问题。马氏决策规划就是研究这类问题的。 下面我们通过实例来介绍马氏决策规划中有 限阶段的一种求解方法——值迭代法。设系 统目标为总期望报酬最大化
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有