若在上面所述的马氏过程中,当它在任意时刻 从状态i转移到状态j时可以获得相应的收益记 为 这种马氏过程随着状态转移可得到一系列的报 酬(效益),我们称其为赋值马氏过程,称 R= 为报酬矩阵。 NRN 上述工厂若某月初销路好,下月初仍销路好可 获利9千元,下月初转为销路差可获利3千元, 若某月初销路差,下月初转为销路好课获利3 千元,下月初仍为销路差要亏本7千元。 则报酬矩阵为 93 R若在上面所述的马氏过程中,当它在任意时刻 从状态i 转移到状态j时可以获得相应的收益记 为 , 这种马氏过程随着状态转移可得到一系列的报 酬(效益),我们称其为赋值马氏过程,称 R= 为报酬矩阵。 上述工厂若某月初销路好,下月初仍销路好可 获利9千元,下月初转为销路差可获利3千元, 若某月初销路差,下月初转为销路好课获利3 千元,下月初仍为销路差要亏本7千元。 则报酬矩阵为 11 12 21 22 9 3 3 7 r r R r r = = − ij r * ij N N r