正在加载图片...
仍以上述工厂为例,设该工厂在每个状态可选的 决策是不登广告(记作方式1)或登广告(记作 方式2)。若不登广告,自然无广告费;若登广 告,要花额外的广告费,但下月初为销路好的概 率可增加。 决策方式1的状态转移矩阵及报酬矩阵为: 「0.50.5 93 P R 0.40.6 3-7 选决策方式2的状态转移矩阵及报酬矩阵为: 0.80.2 「44 0.70.3 R 问题是在若干月内采取什么决策才能使其总期望 报酬最大仍以上述工厂为例,设该工厂在每个状态可选的 决策是不登广告(记作方式1)或登广告(记作 方式2)。若不登广告,自然无广告费;若登广 告,要花额外的广告费,但下月初为销路好的概 率可增加。 决策方式1的状态转移矩阵及报酬矩阵为: 选决策方式2的状态转移矩阵及报酬矩阵为: 问题是在若干月内采取什么决策才能使其总期望 报酬最大。 1 0.5 0.5 0.4 0.6 P   =     1 9 3 3 7 R   =     − 2 0.8 0.2 0.7 0.3 P   =     2 4 4 1 19 R   =     −
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有