正在加载图片...
从A可看出,局中人Ⅰ的最大贏得是9,要想得到这个赢得,他就得选择纯策略α3。由于,假 定局中人I也是理智的,他考虑到了局中人I打算出a3的心理于是侵准备以β3对付之。使局中人 不但得不到9,反而失掉10,局中人Ⅰ当然也会猜到局中人II的这一心理,故想出a4来对付,使 局中人II得不到10而失掉6…,所以,如果双方都不想冒险,都不存在侥幸心理,而是考虑到 对方必然会设法使自己的所得最少这一点,就应该从各自可能出现的最不利的情形中选择一种最为 有利的情形作为决策的依据,这就是所谓“理智行为”,也是对策双方实际上都能接受的一种隐妥方 例3中,局中人I分析出纯策略α1,a2,α3,a4可能带来的最少赢得(矩阵A中每行的最小 元素)分别为 max{8,2,-10,-3}=2 在这些最少赢得(最不利的情形)中最好的结果(最有利的情形)是嬴得为2。因此,局中人I 只要以α2参加对策,无论局中人ⅡI取什么样的纯策略,都能保证局中人I的收入不会少于2,而出 其它纯策略,其收入都有可能小于2,甚至输给对方。因此,对局中人ⅠI来说,各纯策略β1,β2 β可能带来的对其最不利的结果(矩阵A中每列中最大元素)分别为 min 在这些最不利的结果中,最好的结果(输得最少)也是2,即局中人ⅠI只要选择纯策略β(无 论局中人Ⅰ采取什么纯策略,都能保持自己的支付不会多于2,而采取其它任何策略,都有可能使 自己的所失多于2。上面的分析表明,局中人Ⅰ、II的“理智行为”分别是,选择纯策略a2和β2, 这时局中人I的贏得值和局中人Ⅱ的所失值的绝对值相等(都是2),局中人Ⅰ是按最大最小原则 局中人II是按最小最大原则选择各自的纯策略,这对双方来说都是一种最为稳妥的行为,因此,a 2,β2分别为局中人Ⅰ、II的最优纯策略。 于是我们引出矩阵对策解的概念: 定义1设G={s,s;A}为矩阵对策,其中S1={a1,a },S2={B1,B2,…Bn} A={an}m×n若等式 max(mn ai )=min(max a 成立,记G=a,则称Ⅴ为对策G的值,上式称为成立的纯局势(aμ,βy)为G在纯策略下的 解(或平衡局势)。α,βμ分别称为局中人Ⅰ、II的最优纯策略。 由定义1可知,在矩阵对策中两个局中人都采取最优纯策略(如果最优纯策略存在)才是理智 的行动 例3中,对策解为(a2,β2),对策值为Va=2。 例4,求解矩阵对策G={s,s2;A},其中 45 从 A 可看出,局中人 I 的最大赢得是 9,要想得到这个赢得,他就得选择纯策略α3。由于,假 定局中人 II 也是理智的,他考虑到了局中人 I 打算出α3 的心理于是侵准备以β3 对付之。使局中人 不但得不到 9,反而失掉 10,局中人 I 当然也会猜到局中人 II 的这一心理,故想出α4 来对付,使 局中人 II 得不到 10 而失掉 6……,所以,如果双方都不想冒险,都不存在侥幸心理,而是考虑到 对方必然会设法使自己的所得最少这一点,就应该从各自可能出现的最不利的情形中选择一种最为 有利的情形作为决策的依据,这就是所谓“理智行为”,也是对策双方实际上都能接受的一种隐妥方 法。 例 3 中,局中人 I 分析出纯策略α1,α2,α3,α4 可能带来的最少赢得(矩阵 A 中每行的最小 元素)分别为: -8,②,-10,-3 max {-8,2,-10,-3}=2 在这些最少赢得(最不利的情形)中最好的结果(最有利的情形)是赢得为 2。因此,局中人 I 只要以α2 参加对策,无论局中人 II 取什么样的纯策略,都能保证局中人 I 的收入不会少于 2,而出 其它纯策略,其收入都有可能小于 2,甚至输给对方。因此,对局中人 II 来说,各纯策略β1,β2, β3 可能带来的对其最不利的结果(矩阵 A 中每列中最大元素)分别为: 9,②,6 min {9,2,6}=2 在这些最不利的结果中,最好的结果(输得最少)也是 2,即局中人 II 只要选择纯策略β2(无 论局中人 I 采取什么纯策略,都能保持自己的支付不会多于 2,而采取其它任何策略,都有可能使 自己的所失多于 2。上面的分析表明,局中人 I、II 的“理智行为”分别是,选择纯策略α2 和β2, 这时局中人 I 的赢得值和局中人 II 的所失值的绝对值相等(都是 2),局中人 I 是按最大最小原则。 局中人 II 是按最小最大原则选择各自的纯策略,这对双方来说都是一种最为稳妥的行为,因此,α 2,β2 分别为局中人 I、II 的最优纯策略。 于是我们引出矩阵对策解的概念: 定义 1 设 G = {s1,s2;A}为矩阵对策,其中 S1 = {α1,α2,…αm},S2 = {β1,β2,…βn}。 A={aij}m×n 若等式 i max (min ) min(max ) aij = aij i j j i 成立,记 VG = ai*j*,则称 V 为对策 G 的值,上式称为成立的纯局势(αi*,βj*)为 G 在纯策略下的 解(或平衡局势)。αi*,βj*分别称为局中人 I、II 的最优纯策略。 由定义 1 可知,在矩阵对策中两个局中人都采取最优纯策略(如果最优纯策略存在)才是理智 的行动。 例 3 中,对策解为(α2,β2),对策值为 VG =2。 例 4,求解矩阵对策 G = {s1,s2;A},其中 -7 1 -8 3 2 4 A= 16 -1 -3 -3 0 5
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有