正在加载图片...
233 f=maxf1,,…fm} 但是,当甲不知道乙会采取什么策略时,如果甲是一个避险者,那么他必将作最坏的打 算,以求取得较好的效果。首先,甲要从收益表中找出自己的每一种策略x1下至少可获得的 收益(即所能获得的最小收益),即先求解min{n,f12,…,fm}(=12,…,m),然后从这些最小 收益策略中选择出收益最大的策略,即“从最小收益中选择最大收益”。从收益矩阵来看这个 决策过程,即甲首先选出自己的收益矩阵∫的各行的最小值,然后从这些最小值中再选出最 大值: max min =max mIr 1sism1sj≤n 就是求解策略博弈的最小最大原理,其合理性表现为:如果甲采取按照最小最大原理确定的 策略,那么不论乙采取什么策略,甲都可至少得到这个最小最大收益。由此可见,最小最大原 理是能够确保局中人收益的一种原理。今后,我们把局中人甲按照最小最大原理所确定的策略, 叫做甲的稳妥策略。 对于局中人乙来说,他的决策行为和决策过程同甲是一样的,只不过乙要依赖于收益矩 阵g。乙决策的最小最大原理是:乙先选出收益矩阵g的各列的最小值,然后从这些最小值 中选出最大值 max min gij =max min g 1≤ jsn lsis 局中人乙按照最小最大原理确定的策略,称为乙的稳妥策略。 读者可能会问:甲先找出他的收益矩阵各列的最大值,然后再从这些最大值中选出最小 值,不也是一种很好的决策办法吗?其实,这种决策办法叫做最大最小法,照此办法做出的决 策,在甲不知道乙会采取什么策略的情况下不能保证甲的最大最小收益能够达到。原因在于最 大最小法需要确定出乙的每种策略下甲的最大可能的收益。假如甲按照最大最小法选出了策略 (x,y),那么当乙采用策略y时,甲可得到最大最小收益f但是,若乙采用的不是策略y 而是策略νk(k≠j),那么甲如不重新选择他的收益矩阵第k列的最大值的话,他的最大最小 收益f就不一定能够达到,这正是最大最小法同最小最大原理的区别 实际中,在甲不知道乙会采取什么策略的情况下选定了自己的策略以后,乙的策略才出 台,为甲也获悉了乙的这一行动时,甲很有可能来不及调整自己原定的策略,从而给甲带来 定的损失。因此,最大最小法在保证局中人收益方面不如最小最大原理那么保险。 当甲和乙的稳妥策略都已选定时,二者结合起来能否成为博弈的结果呢?答案是未必。 请看下面二人零和博弈的事例 例1.高度不确定的博弈 考虑二人博弈G2=(X,fY,g),甲的策略集合X={x,x2},乙的策略集合Y={v,y2}, 甲和乙的收益矩阵∫和g通过博弈的收益表给出(见表2) 对于甲来说, maxi min,f=2;对于乙来说,max,min;g=-3。这说明甲的稳妥策 略是x2,乙的稳妥策略是y2 表2:甲和乙的收益表 但是,当甲采取x2时,乙采取y2的收益g2=-3小于采 取y1的收益g21=-1,因而乙要改用策略y。在乙改用y后 甲采取策略x的收益f12=2小于采取x的收益f1=4,因而x4-41-1 甲也要改用策略x。而当甲改用x后,乙采用y的收益□x2,=213,=3 g1:=-4小于采用y2的收益g12,于是乙又要改回到y2:在乙改回到y2后,甲也要改回到收 益最大的策略x2。这就让我们看到:当甲采取x2时,乙要采用y;然后甲改用x1,乙随之改 用y2;甲再改用x2,乙又改用y,如此不断往复下去,博弈的结局是高度不确定的第八章 博弈论 233 fi j = maxf1j , f 2 j ,  , fm j 但是,当甲不知道乙会采取什么策略时,如果甲是一个避险者,那么他必将作最坏的打 算,以求取得较好的效果。首先,甲要从收益表中找出自己的每一种策略 xi 下至少可获得的 收益(即所能获得的最小收益),即先求解 minfi1 , fi2 ,  , fin (i =1,2,  ,m) ,然后从这些最小 收益策略中选择出收益最大的策略,即“从最小收益中选择最大收益”。从收益矩阵来看这个 决策过程,即甲首先选出自己的收益矩阵 f 的各行的最小值,然后从这些最小值中再选出最 大值: i j i m j n i j i j f f     = 1 1 max min max min 这就是求解策略博弈的最小最大原理,其合理性表现为:如果甲采取按照最小最大原理确定的 策略,那么不论乙采取什么策略,甲都可至少得到这个最小最大收益。由此可见,最小最大原 理是能够确保局中人收益的一种原理。今后,我们把局中人甲按照最小最大原理所确定的策略, 叫做甲的稳妥策略。 对于局中人乙来说,他的决策行为和决策过程同甲是一样的,只不过乙要依赖于收益矩 阵 g 。乙决策的最小最大原理是:乙先选出收益矩阵 g 的各列的最小值,然后从这些最小值 中选出最大值: i j j n i m i j j i g g     = 1 1 max min max min 局中人乙按照最小最大原理确定的策略,称为乙的稳妥策略。 读者可能会问:甲先找出他的收益矩阵各列的最大值,然后再从这些最大值中选出最小 值,不也是一种很好的决策办法吗?其实,这种决策办法叫做最大最小法,照此办法做出的决 策,在甲不知道乙会采取什么策略的情况下不能保证甲的最大最小收益能够达到。原因在于最 大最小法需要确定出乙的每种策略下甲的最大可能的收益。假如甲按照最大最小法选出了策略 (xi , y j) , 那么当乙采用策略 y j 时,甲可得到最大最小收益 i j f 。但是,若乙采用的不是策略 y j , 而是策略 yk (k  j) ,那么甲如不重新选择他的收益矩阵第 k 列的最大值的话,他的最大最小 收益 i j f 就不一定能够达到,这正是最大最小法同最小最大原理的区别。 实际中,在甲不知道乙会采取什么策略的情况下选定了自己的策略以后,乙的策略才出 台,为甲也获悉了乙的这一行动时,甲很有可能来不及调整自己原定的策略,从而给甲带来一 定的损失。因此,最大最小法在保证局中人收益方面不如最小最大原理那么保险。 当甲和乙的稳妥策略都已选定时,二者结合起来能否成为博弈的结果呢?答案是未必。 请看下面二人零和博弈的事例。 例 1. 高度不确定的博弈 考虑二人博弈 G2 = (X , f ;Y, g) ,甲的策略集合 X = x1 , x2  ,乙的策略集合 Y = y1 , y2 , 甲和乙的收益矩阵 f 和 g 通过博弈的收益表给出(见表 2)。 对于甲来说, maxi min j fi j = 2 ;对于乙来说, max j min i gi j = −3 。这说明甲的稳妥策 略是 x2 ,乙的稳妥策略是 y 2 。 但是,当甲采取 x2 时,乙采取 y 2 的收益 g22 = −3 小于采 取 y1 的收益 g21 = −1 ,因而乙要改用策略 y1 。在乙改用 y1 后, 甲采取策略 x2 的收益 f 21 = 2 小于采取 x1 的收益 f11 = 4 ,因而 甲也要改用策略 x1 。而当甲改用 x1 后,乙采用 y1 的收益 g11 = −4 小于采用 y 2 的收益 g12 ,于是乙又要改回到 y 2 ;在乙改回到 y 2 后,甲也要改回到收 益最大的策略 x2 。这就让我们看到:当甲采取 x2 时,乙要采用 y1 ;然后甲改用 x1 ,乙随之改 用 y 2 ;甲再改用 x2 ,乙又改用 y1 ,如此不断往复下去,博弈的结局是高度不确定的。 表 2: 甲和乙的收益表 乙 甲 y1 y 2 x1 4, − 4 1, −1 x2 2, − 2 3, − 3
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有