正在加载图片...
四、状态转移方程 在动态规划中,本阶段的状态往往是上阶段决策的结果。所以如果给 定了第k阶段的状态Sk和该阶段的决策Uk(Sk),则第k+1段的状态Sk 由于k阶段决策的完成也就完全确定了,它们之间的关系可用如下公式表示: SkHI=TK (Sk, UK) 其中,Tk表示从状态Sk出发经过Uk向下一阶段的转移( Transfer),换 言之,即Sk+1是从状态Sk出发经过决策Uk转移的结果 由于上式表示了由k段到第k+1段的状态转移规律,所以就称为状态 转移方程。在例51中状态转移方程即Sk+1=U 五、指标函数 用于衡量所选定策略优劣的数量指标称作指标函数。一个n阶段的决策 过程,从1到n叫作问题的原过程,对于任意一个给定的k(1≡k≡n),从k 段到第n段称为原过程的一个后部子过程用Vn(S1,Bn)表示初始状态为 s1采用策略Pn时原过程的效益值用kn(SA,Pn)表示在第k阶段状态 2021/2/242021/2/24 7 四、状态转移方程 在动态规划中,本阶段的状态往往是上阶段决策的结果。所以如果给 定了第 k 阶段的状态 k s 和该阶段的决策Uk ( k s ),则第 k+1 段的状态 k+1 s 由于 k 阶段决策的完成也就完全确定了 ,它们之间的关系可用如下公式表示: k+1 s =Tk ( k s ,U k ) 其中,Tk 表示从状态 k s 出发经过Uk 向下一阶段的转移(Transfer) ,换 言之,即 k+1 s 是从状态 k s 出发经过决策U k 转移的结果。 由于上式表示了由 k 段到第 k+1 段的状态转移规律,所以就称为状态 转移方程。在例 5.1 中,状态转移方程即 k+1 s =U k 。 五、指标函数 用于衡量所选定策略优劣的数量指标称作指标函数。 一个 n 阶段的决策 过程, 从 1 到 n 叫作问题的原过程,对于任意一个给定的 k(1 ≦k≦n),从 k 段到第 n 段称为原过程的一个后部子过程.用V1,n (s1,P1,n )表示初始状态为 s1采用策略 P1,n 时原过程的效益值,用Vk ,n ( k s , Pk ,n )表示在第 k 阶段状态
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有