第九章博弈论与寡头市场分析 第一节博弈论基本概念 1定义 博弈论或称对策论( Game Theory),直译为 游戏理论。现实生活中的游戏有两个基本特征: 一是至少有两人参加;二是参与人的决策相互 影响。如打扑克、下象棋顾客与商人的讨价还 价、寡头厂商之间的产量决策和价格决策等。 因此我们把具备上述两个特征的活动统称为博 弈。博弈论就是用数学方法研究决策相互影响 的理性人是如何进行决策以获取最大收益的
1 第九章 博弈论与寡头市场分析 第一节 博弈论基本概念 1.定义 博弈论或称对策论(Game Theory),直译为 游戏理论。现实生活中的游戏有两个基本特征: 一是至少有两人参加;二是参与人的决策相互 影响。如打扑克、下象棋顾客与商人的讨价还 价、寡头厂商之间的产量决策和价格决策等。 因此我们把具备上述两个特征的活动统称为博 弈。博弈论就是用数学方法研究决策相互影响 的理性人是如何进行决策以获取最大收益的
2.构成完整博弈过程 需要规定的四件事: 例1:硬币博弈。 1)参与人:两个小孩甲 )参与人或局中人。即 和乙; 有哪些人参与博弈。 2)行动或策略:甲乙两 2)行动或策略。什么人 人各往地上抛一个硬币, 在什么时候行动;当他 甲先抛,乙后抛,要么反 动时,他具有什么样的信 面朝上,要么正面朝上; 息;他能做什么,不能做3)结果:若硬币同为正 什么。 面或反面,甲嬴得乙一个 3)结果。对参与人的不 不硬币,若硬币一正一反 则甲输给乙一个硬币; 同行动,这场博弈的结果 或结局是什么。 4)报酬:一个一元硬币。 本例中每个参与人的输赢 4)报酬。博弈的结果给可用货币值表示。但也并 参与人带来的好处。 非都是如此
2 2.构成完整博弈过程 需要规定的四件事: 1)参与人或局中人。即 有哪些人参与博弈。 2)行动或策略。什么人 在什么时候行动;当他行 动时,他具有什么样的信 息;他能做什么,不能做 什么。 3)结果。对参与人的不 同行动,这场博弈的结果 或结局是什么。 4)报酬。博弈的结果给 参与人带来的好处。 例1:硬币博弈。 1)参与人:两个小孩甲 和乙; 2)行动或策略:甲乙两 人各往地上抛一个硬币, 甲先抛,乙后抛,要么反 面朝上,要么正面朝上; 3)结果:若硬币同为正 面或反面,甲赢得乙一个 硬币,若硬币一正一反, 则甲输给乙一个硬币; 4)报酬:一个一元硬币。 本例中每个参与人的输赢 可用货币值表示。但也并 非都是如此
例2:接头博弈。 参与人:马大哈和太马虎 行动策略:两人分处两地不能沟通。两人被告知到某地 见面,但都忘记了接头地点。现各自作出决定去哪儿见 面,假设有两地供选择,但只能做一次决定和去一个地 万 结果:如他们相遇,则两人可共进午餐,否则只好怏怏 而归 报酬:见面共进午餐,每人得到的效用为100,扫兴而归 的效用是20。 本例中是把结果所带来的效用作为报酬,但没有 直接用数值表示。在这类结果不含数值的博弈中, 一般可通过指定效用值来规定报酬
3 例2:接头博弈。 参与人:马大哈和太马虎 行动策略:两人分处两地不能沟通。两人被告知到某地 见面,但都忘记了接头地点。现各自作出决定去哪儿见 面,假设有两地供选择,但只能做一次决定和去一个地 方。 结果:如他们相遇,则两人可共进午餐,否则只好怏怏 而归。 报酬:见面共进午餐,每人得到的效用为100,扫兴而归 的效用是-20。 本例中是把结果所带来的效用作为报酬,但没有 直接用数值表示。在这类结果不含数值的博弈中, 一般可通过指定效用值来规定报酬
例3:疑犯博弈 局中人:犯罪人邦德和詹尼; 行动策略:警局需要两人的口供作为证据,对 其隔离录供。每人面对两种选择,坦白或抵赖; 结果:一方坦白,另一方抵赖,则坦白方可获 释放,抵赖方则判刑10年;都坦白则各判8年; 都抵赖则各判1年。 报酬:以各自刑期的负数作为报酬。 本例中的博弈是一个非零和博弈,同时又是不 合作博弈,即两人为获释和不被判刑10年,都 将会出卖对方
4 例3:疑犯博弈。 局中人:犯罪人邦德和詹尼; 行动策略:警局需要两人的口供作为证据,对 其隔离录供。每人面对两种选择,坦白或抵赖; 结果:一方坦白,另一方抵赖,则坦白方可获 释放,抵赖方则判刑10年;都坦白则各判8年; 都抵赖则各判1年。 报酬:以各自刑期的负数作为报酬。 本例中的博弈是一个非零和博弈,同时又是不 合作博弈,即两人为获释和不被判刑10年,都 将会出卖对方
3.博弈的类型 零和博弈:博弈双方一人所得即另一人所失,博弈之和为0, 如例1; 非零和博弈:博弈双方一人所得与另一人所失之和不为0, 如例2和例3;是否为零和博弈要从结果看; 合作博弈:局中人都希望行动或策略保持一致; 不合作博弈:局中人至少有一方希望行动或策略不一致。 一般说来,零和博弈一定是不合作博弈,但非零和博弈不 定是合作博弈(如例3);是否为合作博弈要从愿望看。 静态博弈:局中人决策时彼此不知对方的决策的博弈,如 例2; 动态博弈:在信息交流畅通的情况下,决策时先后行动的 博弈,如例1; 序贯博弈:即动态博弈
5 3.博弈的类型 零和博弈:博弈双方一人所得即另一人所失,博弈之和为0, 如例1; 非零和博弈:博弈双方一人所得与另一人所失之和不为0, 如例2和例3 ;是否为零和博弈要从结果看; 合作博弈:局中人都希望行动或策略保持一致; 不合作博弈:局中人至少有一方希望行动或策略不一致。 一般说来,零和博弈一定是不合作博弈,但非零和博弈不 一定是合作博弈(如例3);是否为合作博弈要从愿望看。 静态博弈:局中人决策时彼此不知对方的决策的博弈,如 例2 ; 动态博弈:在信息交流畅通的情况下,决策时先后行动的 博弈,如例1; 序贯博弈:即动态博弈
4.博弈的描述方法 1)策略式描述:表述规定和定义,P276; 完全信息下的静态博弈的策略表述:用支付矩 阵形式直观表描述。 邦德 坦白 抵赖 詹/想白 8,-8 0,-10 尼抵额-10,0 -1,-1
6 4.博弈的描述方法 1)策略式描述:表述规定和定义,P276; 完全信息下的静态博弈的策略表述:用支付矩 阵形式直观表描述。 -8,-8 0,-10 -10,0 -1,-1 坦白 抵赖 坦白 抵赖 詹 尼 邦 德
2)扩展式表述。表述规定,P277。 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树 正 1,-1 乙 正 甲 反正 反 反
7 2)扩展式表述。表述规定,P277。 如例1,甲乙两个小孩往地上抛硬币,甲先乙后, 若硬币同面,则甲赢得乙一个硬币,若硬币异面 则甲输给乙一个硬币。由此可给出该博弈的博弈 树: 1,-1 -1,1 -1,1 1,-1 正 正 正 反 反 反 甲 乙 乙
第二节零和(常数和)博奕 A可能的收益表 BB1 B2 B3 、收益矩阵 1 3 设有厂商A、B为双头垄断, 各自的收益是彼此价格的 A211.53 函数,市场需求为单一弹 性,因此不管对手采取何 B可能的收益表 种价格策略,其收益总是 恒等于一个常数。即 A BB 1 B。B 2 3 RAf(P, PB) A342 Rg=fB(PB, Pu A254.53 R4+RB=K(常数) 8
8 第二节 零和(常数和)博奕 一、收益矩阵 设有厂商A、B为双头垄断, 各自的收益是彼此价格的 函数,市场需求为单一弹 性,因此不管对手采取何 种价格策略,其收益总是 恒等于一个常数。即 R R K R f P P R f P P A B B B B A A A A B + = = = ( , ) ( , ) (常数) A可能的收益表 A1 3 2 4 A2 1 1.5 3 A B B1 B2 B3 B1 B2 B3 A1 3 4 2 A2 5 4.5 3 A B B可能的收益表
上述两表改为矩阵形式即称收益矩阵: 324 A 1412413 153 210422023 13342 b21b b 54.53 22123 A+B a1+b1412+b2413+h13 a21+h2(2+b2a23+b23 6 66 6 6 即常数和矩阵
9 上述两表改为矩阵形式即称收益矩阵: + + + + + + + = = = = = 2 1 2 1 2 2 2 2 2 3 2 3 1 1 1 1 1 2 1 2 1 3 1 3 2 1 2 2 2 3 1 1 1 2 1 3 2 1 2 2 2 3 1 1 1 2 1 3 a b a b a b a b a b a b A B b b b b b b B a a a a a a A 3 2 4 1 1.5 3 3 4 2 5 4.5 3 = 6 6 6 6 6 6 = 6 1 1 1 1 1 1 即常数和矩阵
上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵: 3626463423-4-2342000 61563-65454-54545454000 当两人收益总和为零和矩阵时,叫两人零和对策如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。 、“最大—最小值定理”(“Min-Max定理”) 假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找岀自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略
10 上述常数和矩阵可变成零和矩阵,方法是从 任一收益矩阵中减去常数和加上另一矩阵: 3-6 2-6 4-6 1-6 1.5-6 3-6 + = 3 4 2 5 4.5 4 -3 - 4 -2 -5 -4.5 -4 + 3 4 2 5 4.5 4 = 0 0 0 0 0 0 当两人收益总和为零和矩阵时,叫两人零和对策.如果把A、B两 个厂商的收益看成是收益增量,则常数和对策就变成了零和对 策。因为既然市场需求为单一弹性,那么任一厂商收益的增加 就意味着竞争对方收益的减少,或A的收益矩阵即B的损失矩阵。 二、“最大—最小值定理”(“Min-Max定理”) 假定有A和B两个厂商,当他们互相不了解对方将采取何种策略 时,为避免风险,必须谨慎行事,作最坏的打算,A先找出自己 收益矩阵中各种策略所能获得的最小收益,然后选择其中最大 的收益作为自己的最优策略;B也如此行事,但A的所得即B的所 失,因此B将从最大损失中选出最小的一个作为其最优的策略