正在加载图片...
4、状态转移方程 sk—第k阶段的状态变量 lk()--表示第阶段处于状态时的决策变量 状态转移方程:SA1=T(SA2uk) 5、策略:由各阶段的决策组成的序列称为策略 原过程的策略pn(s1)---从第一阶段初始状态s开 始到第n阶段全过程的策略 p1n(s1)={1(s)a2(s2)…un(sn)} 后部子过程的策略pn(sA)--从第阶段状态S开 始到第n阶段的策略 即pn(sk)={x4(3)421(Sx)…un(sn) P={策略}允许策略集合4、状态转移方程 sk 第k阶段的状态变量 ( ) k k u s − −表示第k阶段处于状态sk 时的决策变量 ( , ) k 1 k k uk s = T s 状态转移方程: + 5、策略:由各阶段的决策组成的序列称为策略 ( ) 始到第 阶段全过程的策略 原过程的策略 从第一阶段初始状态 开 n p s s 1,n 1 − − − 1 即p1,n (s1 ) = u1 (s1 ),u2 (s2 ), un (sn ) P = 策略——允许策略集合 ( ) 始到第 阶段的策略 后部子过程的策略 从第 阶段状态 开 n p s k s k ,n k − − − k 即pk ,n (sk ) = uk (sk ),uk+1 (sk+1 ), un (sn )
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有