正在加载图片...
当k=1时,R*表示总目标效益函数的最优值。 R*=r1(S1,X1*)⊙r2(S 2,^2 ⊙rn(Sn,xn*) (x1*,2*,…,x)称为最优策略 fk(sk) =optik(sk, Xk) o k+1 (Sk+1 k+1 @ ⊙rn(sn,xn*)} fk(sk):由第k阶段的状态s到终点的最优效益值。 当k=1,且s1唯一时,R*=千1(S1 88 当k=1时,R*表示总目标效益函数的最优值。 R*=r1(s1,x1 *) ⊙ r2(s2,x2 *) ⊙ … ⊙ rn(sn,xn *) ( x1 * , x2 * ,…, xn *)称为最优策略 fk(sk)=opt{rk(sk,xk *) ⊙ rk+1(sk+1,xk+1 *) ⊙ …⊙ rn(sn,xn *)} fk(sk):由第k阶段的状态sk到终点的最优效益值。 当k=1,且s1唯一时,R*=f1(s1)
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有