第十一章二人有限零和对策 二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论,是研究 决策主体的行为发生直接相互作用时的决 策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博 弈论专家:纳什、泽尔腾、海萨尼。博弈 论已经成为当代经济学的基石
第十一章 二人有限零和对策 二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论,是研究 决策主体的行为发生直接相互作用时的决 策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博 弈论专家:纳什、泽尔腾、海萨尼。博弈 论已经成为当代经济学的基石
第 基本概 、对策现象与对策论 1.对策现象 ①下棋:围棋源于我国殷代 ②齐王赛马:齐王与大将田忌赛马,各自的马都分为三 等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下--上,上--中,中--下 结果田忌胜出。 顾石头剪子布 ③猜手小孩A与B猜手若规定赢01-1 得1分,平得0分,输得-1分,剪子-101 则A的赢得可用右表来表示 布 10
第一节 基本概念 一、对策现象与对策论 1. 对策现象 ①下棋:围棋源于我国殷代。 1 -1 0 -1 0 1 0 1 -1 A 石头 剪子 石头 剪子 布 赢 B 布 猜手:小孩A与B猜手,若规定赢 得1分,平得0分,输得 -1分, 则 A的赢得可用右表来表示。 ③ 齐王赛马:齐王与大将田忌赛马,各自的马都分为三 等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下----上,上----中,中----下, 结果田忌胜出。 ②
2.对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经 济行为》。二次大战前后,由于军事需要,抽象成数学 模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等 提出了讨价还价模型和合作对策的“核”的概念。同时 ,非合作对策也开始创立。纳什于1950和1951年发表了 两篇关于非合作对策的文章,图克于1950年定义了“囚 徒困境”问题 60年代,泽尔腾(1965)引入动态分析,提出“精 练纳什均衡”概念。海萨尼(1967-1968)则把不完全信 息引入对策论的研究
2 . 对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经 济行为》。二次大战前后,由于军事需要,抽象成数学 模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等 提出了讨价还价模型和合作对策的“核”的概念。同时 ,非合作对策也开始创立。纳什于1950和1951年发表了 两篇关于非合作对策的文章,图克于1950年定义了“囚 徒困境”问题。 60年代,泽尔腾(1965)引入动态分析,提出“精 练纳什均衡”概念。海萨尼(1967-1968)则把不完全信 息引入对策论的研究
对策问题的组成 局中人(参加者):一局对策的参加者。 2策略:局中人在一局对策中对付对手的一个完整的方案 策略集:局中人在一局对策中所有策略的全体。记为S (分为有限和无限)问:田忌和齐王的S 3.局势:在一局对策中,每个局中人都选定一策略后的各 策略总和 如在二人对策中,设S1={a1…,an},S2={A,…,Bn} 则局势为(a,B)i=1…,m,j=l…,n 4.支付:局势给定后,局中人的得失(是局势的函数)。 分为零和:各局中人的得失之和为0 非零和:各局中人的得失之和非0
二 、对策问题的组成 1.局中人(参加者):一局对策的参加者。 2.策略:局中人在一局对策中对付对手的一个完整的方案。 策略集:局中人在一局对策中所有策略的全体。记为S (分为有限和无限)问:田忌和齐王的S=? 3. 局势:在一局对策中,每个局中人都选定一策略后的各 策略总和。 0 0 零和:各局中人的得失之和为 分为 非零和:各局中人的得失之和非 4. 支付:局势给定后,局中人的得失(是局势的函数)。 如在二人对策中 , , , , , , ,设 1 1 2 1 , 1, , , 1, , m n i j S S i m j n = = 则局势为( , ) = =
第二节矩阵对策的最优纯策略 矩阵对策 设二人有限零和对策问题的局中人为I,∏ 策略集为S1={a,a2 },S2={B1,B2 Bi 则支付可以用矩阵A :表示 其中an为的得(也是∏的失),∏的得即为an0 故又称二人有限零和对策为矩阵对策,记为G=(S1,S2A
M 第二节 矩阵对策的最优纯策略 1 2 11 1 1 1 2 S { },S { } A , , m n n m mn ij ij a a a a a a G S S A = = = 1 2 1 2 设二人有限零和对策问题的局中人为 , 策略集为 , , , , , , 则支付可以用矩阵 = 表示, 其中 为 的得(也是 的失), 的得即为- 。 故又称二人有限零和对策为矩阵对策,记为 ( ) 一、矩阵对策 mn1
、理智局中人的选择 在矩阵对策中,局中人将如何选取自己的策略呢? B B2 B 13 举例说明,若A ,∏都想谋取最大的赢得,I当然想出α3,但∏估计到I 的心理,便出β,使I而输掉8。于是为了保险起见I出a2 因为肯定不会输。即I若不存在侥幸心理(理智的),必出a2, 而∏此时必出,否则输得更多。结果,在局势(a2,B3)下, 的得是a23=2,这时双方都无意见,分析a2的特点,是行中最小 的最大,列中最大的最小。 I选 max min 即理智局中人的选择 ∏选 min max a→>B
二 、理智局中人的选择 在矩阵对策中,局中人将如何选取自己的策略呢? * * max min min max ij i i j ij j j i a a → → 选 即理智局中人的选择 选 3 3 2 2 3 2 3 23 23 1 3 2 A 4 3 2 6 1 8 a a − − − 举例说明,若 = , 都想谋取最大的赢得, 当然想出 ,但 估计到 的心理,便出 ,使 反而输掉8。于是为了保险起见 出 , 因为肯定不会输。即 若不存在侥幸心理(理智的),必出 , 而 此时必出 ,否则输得更多。结果,在局势( , )下, 的得是 =2,这时双方都无意见,分析 的特点,是行中最小 的最大,列中最大的最小。 1 2 3 1 2 3
、最优纯策略与鞍点 1.对策G的解和值:使得a,≤a,≤a,的(a,B.)称为 G的解,a1与B,分别是1,∏的最优纯策略,a; 称为G的值,记为V。。 2.鞍点:若局势(a,B.)对应的 a,.-maxmina-min max a 则称(a,B,)为鞍点 分析上例中的a23它就满足a23≤a2≤a
三、最优纯策略与鞍点 * * * * * * * * * * G 1. G , G G V ij i j i j i j i j i j a a a a 对策 的解和值:使得 的( )称为 的解, 与 分别是 , 的最优纯策略, 称为 的值,记为 。 * * * * * * 2. max min min max i j ij ij i j i i j j i j a a a 鞍点:若局势( , )对应的 = = 则称( , )为鞍点。 23 3 23 2 i j 分析上例中的 ,它就满足 a a a a
定理1: G在纯策略中有解(a,B,)◇(α,B.)是鞍点 证明:← irmin a.= min max a= max min a= max a min d ak k.max a C 故 1J= C 即(,B.)是G的解
定理1: * * * * , , i j i j G在纯策略中有解( ) ( )是鞍点 * * * * * * * * * * * * * * * * * * * * : min min max max min max min ,max , 1, , 1, , ( , ) ij ij i j ij j j j i i i i j i j ij i j j i ij i j i j i j ij i j i j i j a a a a a a a a a a a a i m j n a a a G === = = = = 证明 记 故 即 是 的解
iisa maxa. <a.< min a min max a.<maxa,≤a,.<mina,≤ max min a 但对于任意A,有 max min a≤ min max a 只有a..= min max a= max min a 即(,,B,)是鞍点 证毕
* * * * * * * * * * * * * * * * 1, , 1, , max min min max max min max min A, max min min max min max max min ( , ) ij i j i j ij i j i j i j ij ij ij i j i j j j j i i i ij ij i i j j ij ij i j j j i i i j a a a i m j n a a a a a a a a a a a a a = = = = 但对于任意 有 只有 即 是鞍点 证毕
例1 22-27-2 4③853 V=3 8-6 1-6 (c,B,)=(a2,B2) 例2 min max a=2 0-22 max min a 23-4 鞍点不存在 即在纯策略意义下无解
例 1 -2 2 -2 7 4 3 8 5 8 -6 2 -1 −2−63 * * G 2 2 V 3 ( , ) ( , ) i j = = 例 2 0 2 2 5 4 3 2 3 4 − − − −2−−43 5 4 2 min max 2 max min 2 , ij j i ij i j aa = = − 鞍点不存在 即在纯策略意义下无解