第二章完全信息静态博弈 一、博弈的标准式和纳什均衡 一、博弃的标准式和钠什均衡 、的标准式表 二、合略和纳什均衡的春在性 三、二人和博弃 四、应用单创 1、博弈的标准式表述 1、博弈的标准式表述 准式的三果索 学例:四徒田境州双交量是体末指笔) 实量短可由任意多的行和列成,“双实量 列行代来四钱2的枝,在河个字中后图。 一、博弃的标准式表述 1、博弈的标准式表述 举例:齐王田是赛马 博弃的致学表 假设一个有个博方,博弃方1的能集又称第 S表示博方1的第个策
1 第二章 完全信息静态博弈 一、博弈的标准式和纳什均衡 二、混合策略和纳什均衡的存在性 三、二人零和博弈 四、应用举例 一、博弈的标准式和纳什均衡 1、博弈的标准式表述 2、重复剔除严格劣战略 3、纳什均衡 标准式的三要素 (1) 参与人(或称为博弈方) (2) 每个参与人可选择的战略集 (3) 收益:针对所有参与人可选择的战略组合,每一 个参与人获得的收益 1、博弈的标准式表述 举例:囚徒困境(用双变量矩阵来描述) 双变量矩阵可由任意多的行和列组成,“双变量” 指的是在两个博弈方的博弈中,每一个单元格有两 个数字,分别表示两个参与者的收益。 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 囚徒2 囚 徒 1 1、博弈的标准式表述 横行代表囚徒1的收益,在两个数字中放在前面; 列行代表囚徒2的收益,在两个数字中放在后面。 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 -1, 1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1, 1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 一、博弈的标准式表述 举例:齐王田忌赛马 齐 王 上中下 上下中 中上下 中下上 下上中 下中上 上中下 上下中 中上下 中下上 下上中 下中上 田忌 注: ① 同时选择战略,不意味着行动必须是同时的; ②标准式不仅可用来描述静态博弈,也可以用来描述序 贯行动的动态博弈,只不过在分析问题时,扩展式博弈 更常用。 11:53:31 6 假设一个博弈有n个博弈方,博弈方i的策略集(又称策略空间) 为Si (i=1,2,…,n) ,用sij∈ Si表示博弈方i的第j个策略; 若si∈Si (i=1,2,…,n),称s=(s1 ,s2 , … ,sn )为一个策略组合; 若用s-i = (s1 ,s2 , … ,si-1, si+1, … ,sn ),则 s = (si ,s-i)。 博弈的数学表述 1、博弈的标准式表述
一、博弈的标准式表述 2、重复别除严格劣战略 用u()巴6.,,(1-L,2)表示方1在 策略食一(, ,及)的得差u,是策略燕 是该博 81×8X.X8上的多元最服, 稳史的结” (Dominant-strategy ,则该表示为 四许的视得路东中的(便白。员白)卖厚上就是 2、重复剔除严格劣战略 2、重复剔除严格劣战略 2) 重复别除产格战略 弃方 小 2、重复剔除严格劣战略 2、重复剔除严格劣战略 ,定义 地。果在 博弃中,不其他博 可变1 给他来的得益要小 相对于后一种
2 11:53:31 7 用ui (s)=ui (s1 ,s2 , … ,sn ) (i=1,2,…,n)表示博弈方i 在 策略组合s=(s1 ,s2 , … ,sn )的得益, ui是策略集 S1×S2×…×Sn上的多元函数。 定义:若一个N人博弈的策略空间为Si ,得益函数为: ui (s)=ui (s1 ,s2 , … ,sn )(i=1,2,…,n),则该博弈表示为: G={N,S1 ,S2 , … ,Sn;u1 ,u2 ,…,un } 。 一、博弈的标准式表述 (1)、占优均衡 如果一个博弈的某个策略组合中的所有策略都是 各个博弈方各自的上策,那么这个策略组合肯定 是所有博弈方都愿意选择的,必然是该博弈比较 稳定的结果。我们称这样的策略组合为该博弈的 一个“占优均衡” (Dominant-strategy Equilibrium)。 占优均衡是博弈分析中最基本的均衡概念之一, 占优均衡分析是最基本的博弈分析方法。 囚徒的困境博弈中的(坦白,坦白)实际上就是 一个占优均衡。 2、重复剔除严格劣战略 (2)、占优均衡分析的局限性 并非每个博弈方都有这种绝对偏好的上策,而且 常常是所有博弈方都没有上策,因为博弈方的最 优策略随其他博弈方的策略而变化正是博弈问题 的根本特征,是博弈关系相互依存性的主要表现 形式。 因此占优均衡不是普遍存在的。 例如赛马博弈就没有占优均衡,因为各个博弈方 的任何策略都不是绝对最优的,每个博弈方都没 有绝对偏好的上策。所以,占优均衡并不能解决 所有的博弈问题,最多只是在分析少数博弈时有 效。 2、重复剔除严格劣战略 (3)、重复剔除严格劣战略 ①、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。 2、重复剔除严格劣战略 定义 一般地,如果在一个博弈中,不管其他博 弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略 给他带来的得益要小,那么我们称前一种 策略为相对于后一种策略的一个“严格劣 策略”。 2、重复剔除严格劣战略 ②举例 为了说明重复剔除严格劣策略法与占优均衡 分析的区别,我们用一个例子来说明。首先 看下图中这个抽象掉现实问题内容的,两个 博弈方分别有三种和两种策略的不对称博弈 问题。 博 弈 方 1 博弈方2 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 博 弈 方 1 博弈方2 1, 0 1, 3 0, 4 0, 2 上 下 左 中 博 弈 方 1 博弈方2 上 1, 0 1, 3 左 中 博弈方2 上 1, 3 中 2、重复剔除严格劣战略
2、重复剔除严格战略 2、重复剔除严格劣战略 ③重夏剔除严格劣乘暗法的缺格 (4) 2、重复剔除严格劣战略 2、重复剔除严格劣战略 举例 ; 划线法分析囚徒国境 2、重复剔除严格劣战略 2、重复除严格劣战略 钢3、映裹霜体率 当器, 过外不意 阵表示的博
3 ③重复剔除严格劣策略法的缺陷 重复剔除严格劣策略也不能解决所有博弈的分析 问题。因为在许多博弈问题中,上述相对意义上 的严格劣策略往往不存在。如猜硬币、齐威王田 忌赛马、石头,剪子,布等赌胜博弈,没有任何 博弈方的任何策略是相对其他策略的严格劣策略。 此外,在策略数较多的博弈中,重复剔除严格劣 策略法只能消去其中的部分策略,不能消去的策 略组合并不惟一,因此仍然不能完全解决这些博 弈问题。 2、重复剔除严格劣战略 (4)、划线法 ①思想 在具有策略和利益相互依存性的博弈问题中,各个 博弈方的收益既取决于自己选择的策略,还与其他 博弈方选择的策略有关,因此博弈方在决策时必须 考虑其他博弈方的存在和策略选择。 根据这种思想,科学的决策思路应该是:先找出自 己针对其他博弈方每种策略的最佳对策,即自己的 可选策略中与其他博弈方的策略配合,给自己带来 最大收益的策略(这种相对最佳对策总是存在的, 不过不一定惟一),然后在此基础上,通过对其他 博弈方策略选择的判断,包括对其他博弈方对自已 策略判断的判断等,预测博弈的可能结果和确定自 己趵最优策略。 2、重复剔除严格劣战略 ②举例 博 弈 方 1 博弈方2 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 2、重复剔除严格劣战略 例1 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 囚徒2 囚 徒 1 划线法分析囚徒困境 2、重复剔除严格劣战略 例2 划线法是一种非常简便的博弈分析方法,由于它 以策略之间的相对优劣关系为基础,因此在分析 用收益矩阵表示的博弈问题时具有普遍适用性。 当然,这并不意味着每个用收益矩阵表示的博弈 都可以用划线法求出确定性的博弈结果。 事实上,许多博弈根本不存在确定性的结果,当 然也就无法用划线法找出这种结果。我们通过一 些例子来说明。 2、重复剔除严格劣战略 -1, 1 1, -1 1, -1 -1, 1 正面 反面 正面 反面 猜硬币方 盖 硬 币 方 例3、猜硬币博弈 2、重复剔除严格劣战略
2、重复剔除严格劣战略 3、纳什均衡 是叶真位清尖树精使提中肉 在两人博弃的情况下,就是给定你的演路:我的略 划线法分析夫妻之争 奔中的“ 3、纳什均衡 3、纳什均衡 ①、纳什均衡的定义 在博奔G一代中,如果由各个博奔方的各一个 策略组成的采个策略组合( )中,任一博弃方的策 46 对任意气S都成立,则称何,内G-代4 的一个纳什均商。 电麻之为纯兼暗销什均离(Pure-strategy Nash Equilibrin血,PNE] 3、纳什均衡 3、纳什均衡 ③、纳什均衡与 严格带泉电 ★表1:表十来方0因品一,3 ★克理2:在知个棒方的棒来G中。如果量复剩雕 头系 纳什地衡
4 2, 1 0,0 0, 0 1, 3 时装 足球 时装 足球 丈 夫 妻 子 划线法分析夫妻之争 2、重复剔除严格劣战略 例4、夫妻博弈 通过划线法找出的具有稳定性的策略组合,不管是否惟 一,都有一个共同的特性,即其中每个博弈方的策略都 是针对其他博弈方策略或策略组合的最佳对策。 在两人博弈的情况下,就是“给定你的策略,我的策略 是我最好的策略;给定我的策略,你的策略也是你最好 的策略”。事实上,具有这种性质的策略组合,正是非 合作博弈理论中最重要的一个解概念,即博弈中的“纳 什均衡”(Nash Equilibrium)。 3、纳什均衡 * i s 在博弈 中,如果由各个博弈方的各一个 策略组成的某个策略组合 中,任一博弈方i的策 略 ,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡。 ( , ) * * i n s s { , ; , } G S1 Sn u1 un ( , , , ,... ) ( , , , ,... ) * * 1 * 1 * 1 * * 1 * * 1 * i 1 i i i n i i ij i n u s s s s s u s s s s s ij i s S ( , ) * * i n s s { , ; , } G S1 Sn u1 un ( , , ,... ) * * 1 * 1 * 1 i i n s s s s 也称之为纯策略纳什均衡(Pure-strategy Nash Equilibrium, PNE) 3、纳什均衡 ①、 纳什均衡的定义 11:53:31 22 ②、纳什均衡的一致预测性 一致预测性是指这样一种性质:如果所有博弈方都预测一个 特定的博弈结果会出现,那么所有的博弈方都不会利用该预测 或者这种预测能力,选择与预测结果不一致的策略,即没有哪 个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终 真会成为博弈的结果。 即:如果所有博弈方都预测一个特定的纳什均衡会出现,那么, 没有人有兴趣作不同的选择。 一致预测性是纳什均衡的本质属性。 一致预测性使纳什均衡是稳定的和自我强制的。 3、纳什均衡 ③、纳什均衡与重复剔除严格劣策略 3、纳什均衡 占优均衡和纳什均衡之间的关系是:占优均衡是 包含在纳什均衡范围之内的,占优均衡肯定是纳 什均衡,但纳什均衡不一定是占优均衡。 划线法与纳什均衡的关系更清楚,前两者正是在 可以用得益矩阵表示的博弈中寻找纳什均衡的方 法。 纳什均衡和重复剔除严格劣策略法之间的关系要 复杂一些,关键是这两者之间是否存在相容性, 也即重复剔除严格劣策略法是否会消去纳什均衡? 对于纳什均衡和重复剔除严格劣策略法的关系, 下面的两个定理给出了答案。 24 定理1: 在n个博弈方的博弈G={S1 ,S2 , … ,Sn; u1 ,u2 ,…,un } 中,如果s * =(s1 * ,s2 * , … ,sn * )是G的一个纳什 均衡,那么重复剔除严格劣策略法一定不会将它消去。 3、纳什均衡 定理2:在n 个博弈方的博弈G中,如果重复剔除 严格劣策略法排除了除s * =(s1 * ,s2 * ,…,sn * )之外的所 有策略组合,那么s *一定是该博弈惟一的纳什均衡
二、合哈和纳什均衡的春在性 二、桌合草哈和纳什均衡的春在性 ,1、严格竟年博弃和混合策略的写引进 暗和格下策反复消去油 >4混合略反应 一5、纳什均衡的存在性 ·6、多重纳什均衡博弃的分析 1、严格变净博弃响痕合草嗜的引进 1、严格境摩博弃和视合限味的引城 的利益仍 行的。 在这两 力选择任 】、严格变李博来和杏菜哈的引 1、格弃和领合第哈的引 了2)合第略、合略博和混合策略纳什均南 (少清币 )”不存在前国定文 P+"◆P4
5 二、混合策略和纳什均衡的存在性 前面介绍的纳什均衡分析方法可以相当圆满地解决 许多博弈问题。但如果博弈中不存在纳什均衡或者 纳什均衡不惟一,如猜硬币、齐威王田忌赛马或夫 妻之争博弈那样、那么前述纳什均衡分析就无法对 博弈方的选择和博弈结果作明确的预测,无法给博 弈方提供明确的建议。 因此到目前为止介绍的纳什均衡分析方法,还不能 完全满足完全信息静态博弈分析的需要。 为此,本节将对不存在纳什均衡和存在多个纳什均 衡的博弈作一些讨论,关键是要引进在分析这两类 博弈时非常重要的“混合策略”和“混合策略纳什 均衡” (Mixsd-strategy Nash Equilibrium, MNE)概念。 二、混合策略和纳什均衡的存在性 1、严格竞争博弈和混合策略的引进 2、多重均衡博弈和混合策略 3、混合策略和严格下策反复消去法 4、混合策略反应函数 5、纳什均衡的存在性 6、多重纳什均衡博弈的分析 11:53:31 26 1、 严格竞争博弈和混合策略的引进 我们首先对各博弈方的利益和偏好始终不一致的,在 通常策略的基础上没有纳什均衡的博弈问题进行分析。 这类博弈也可以称为“严格竞争博弈"。 前面介绍猜硬币博弈和齐威王田忌赛马博弈时曾经说过, 如果这些傅弈只进行一次,那么我们无法明确预测博弈 的结果,不管是哪个博弈方,也不管他们选择的是哪个 策略,都不能保证得到较好的结果。 通过前面的分析我们进一步知道,之所以上述博弈没有 可预测的明确结果, 不能确定博弈方的策略,根本原因 在于这些博弈中没有纳什均衡策略组合。 那么这是否意味着在这样的博弈中,各个博弈方选择任 何策略都是一样的,因此可以随意选择呢? 1、 严格竞争博弈和混合策略的引进 这个问题的答案是否定的。事实上,在这些博 弈中,博弈方的选择仍然是很有讲究的,策略 选择的好坏对博弈方的利益仍然有很大的影响。 齐威王田忌赛马博弈和猜硬币博弈时,我们已 经简单讨论过这两个博弈中各个博弈方策略选 择的基本原则。当时得出的结论是,在这两个 博弈中,各博弈方必须保证自身策略选择的随 机性,以防止其他博弈方猜到自己的策略,或 利用自己对策略选择的偏好获利。 这里我们以猜硬帀博弈为例,进一步沿着这种 思路分析此类博弈中博弈方的策略选择和博弈 结果。 1、 严格竞争博弈和混合策略的引进 (1)猜硬币博弈 11:53:31 29 -1, 1 1, -1 1, -1 -1, 1 正 面 反 面 猜硬币方 盖 硬 币 方 正 面 反 面 (A)不存在前面定义的纳什均衡策略组合 (B)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念 (2)混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 中,博弈方i的策略 空间为 ,则博弈方i以概率分布 随机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中 对j=1,···,k都成立,且 11:53:31 30 ( , ) pi pi1 pik 0 pij 1 pi1 pik 1 G { , ; , } 1 n 1 n S S u u Si { , } i1 ik s s 1、 严格竞争博弈和混合策略的引进
1、严格来和合的引 释搜器酷贸 混合策路纳什均衡结果精:。 1、严格变净博弃和浅合草味的引镜 -i 齐王 0808021082482028 收矩阵 格博和合的引 1/+111+-D- A=A=A=月=A=月=% 4-+1+1-1+1+= 马
6 混合策略扩展博弈:当把博弈方在混合策略的策略 空间(概率分布空间)的选择看作一个博弈时,就是 原博弈的“混合策略扩展博弈”。 混合策略纳什均衡:包含混合策略的策略组合构成的 纳什均衡称为“混合策略纳什均衡”。 11:53:31 31 1、 严格竞争博弈和混合策略的引进 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析 首先,本博弈中两博弈方决策的第一个原则,同样也是 不能让对方猜到自己的选择,因而必须在决策时利用随 机性。 第二个原则是他们选择每种策略的概率一定要恰好使对 方无机可乘,即让对方无法通过针对性地倾向某一策略 而在博弈中占上风。 3 1 2 5 A B A B p p p p 2 5 3 1 C D C D p p p p 3 1 2 5 A B A B p p p p 2 5 3 1 C D C D p p p p 1、 严格竞争博弈和混合策略的引进 (3)一个例子 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 混合策略纳什均衡结果 1 1 2 5 3 1 3 1 2 5 C D A B C D C D A B A B p p p p p p p p p p p p 0.2 0.8 0.2 0.8 D C B A p p p p 0.8 0.8 3 0.8 0.2 1 0.2 0.8 2 0.2 0.2 5 2.6 0.8 0.8 2 0.8 0.2 5 0.2 0.8 3 0.2 0.2 1 2.6 2 1 e e u u 1、 严格竞争博弈和混合策略的引进 (4)齐威王田忌赛马 11:53:31 34 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下 上下中 中上下 中下上 上下中 下中上 上 中 下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上 田 忌 齐 威 王 收益矩阵 1、 严格竞争博弈和混合策略的引进 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下a 上中下b 上中下c 上中下d 上中下e 上中下f 上 中 下g 上 中 下h 上 中 下i 上 中 下j 上 中 下k 上 中 下l 田 忌 齐 威 王 得益矩阵 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下a 上中下b 上中下c 上中下d 上中下e 上中下f 上 中 下g 上 中 下h 上 中 下i 上 中 下j 上 中 下k 上 中 下l 田 忌 齐 威 王 得益矩阵 a b c d e f a b c d e f a b c d e f a b c d e f a b c d e f a b c d e f p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p 3 3 3 3 3 3 pa pb pc pd pe pf 1 6 1 6 g h i j k l p p p p p p ( 3 1 1 1 1 1) 1 6 1 (3 1 1 1 1 1) 1 6 1 e e u u 田忌 齐威王 该博弈中,齐威王和田忌都以1/6的相同概率随机选择 各自的六个纯策略,构成本博弈唯一的纯策略纳什均衡。 在上述混合策略下,齐威王的得益为: 1/6(3+1+1+1+1-1)=1 田忌的得益为: 1/6(1-3-1-1-1-1)=-1 即经过多次进行这样的赛马,齐威王平均每次能赢田忌 一千斤铜,这是因为齐威王三匹马的总体实力略胜田忌 的三匹马的缘故。 11:53:31 36 1、 严格竞争博弈和混合策略的引进
1、严格变博弃和观合草的3引 岛 2、多重均衡博弃和混合策略 一夫责之争的通合策毫纳什均衡 l-v 高 的 不是团 ②重表除严格 什均衡 在才牛 7
7 因为对博弈论的贡献而成为1994年经济学诺贝尔奖得 主之一的塞尔腾(Selten)教授,1996年3月在上海的 一次讲演中,举了一个小偷和守卫之间博弈的例子。 一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时 守卫在睡觉,则小偷就能得手,偷得价值为V的赃 物; 如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。 设小偷被抓住后要坐牢,负效用为-P,守卫睡觉而未 遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用 为-D。而如果小偷不偷,则他既无得也无失,守卫不 睡意味着出一份力挣一份钱,他也没有得失。 根据上述假设,小偷在该博弈中有“偷”和“不偷” 两种可选策略,守卫有“睡”和“不睡”两种可选策 略,双方的得益矩阵如下图所示。 (5)小偷和守卫的博弈 1、 严格竞争博弈和混合策略的引进 小偷和守卫的博弈的混合策略纳什均衡 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 0 - D - D’ 守卫 得益(睡) S Pt 小偷 1 偷的概率 0 - D - D’ 守卫 得益(睡) S Pt 小偷 1 偷的概率 * Pt *' Pt 0 - P - P’ 小偷 得益(偷) V Pg 守卫 1 睡的概略 0 - P - P’ 小偷 得益(偷) V Pg 守卫 1 睡的概略 * Pg * Pg 在小偷和守卫的博弈中,小偷分别以概率Pt*和1-Pt*随机选择 “偷”与“不偷”, 守卫分别以概率Pg*和1- Pg*随机选择“睡”与“不睡”时, 双方都不能通过改变策略 或概率改善自己的期望得益,因此构成混合策略纳什均衡,这也是该博弈惟一 的纳什均衡。 (小偷偷的概率应使守卫睡与不睡的收益相同,即为0;守卫睡觉的 概率应使小偷偷与不偷的收益相同,即期望收益为0) (1 ) ( ) 0 (1 ) 0 ( ) (1 ) 0 (1 ) 0 g g g g t t t t p V p P p p V,-D -P,0 p D p S p p 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 pt g p 1pt g 1p V P P p S D S p g t * * 激励的悖论: 1.加重对守卫的处罚(D),短期中的效果是使守卫尽职,在 长期中并不能使守卫更尽职,但会降低盗窃发生的概率; 2.加重对小偷的处罚(P),短期内能抑制盗窃发生率,长期 并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉。 p (C)1 p (F)0 p (C)0 p (F)3 w w w w p (C)2 p (F)0 p (C)0 p (F)1 h h h h 妻子的混合策略 丈夫的混合策略 夫妻之争博弈的混合策略纳什均衡 策略 得益 妻子 (0.75,0.25) 0.67 丈夫 (1/3,2/3) 0.75 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 不难发现,这个结果明显不如夫 妻双方能交流协商时,任何一方 迁就另一方时双方的得益好,因 为那时任何一方都至少得1。这是 因为双方缺乏沟通时很可能出现 最差结果而造成的。 夫妻之争的混合策略纳什均衡 2、多重均衡博弈和混合策略 3、 混合策略和重复剔除严格劣策略法 在包括混合策略的情况下,关于重复剔除严格劣 策略法的结论仍然是成立的。即: ①任何博弈方都不会采用任何严格劣策略,不管 它们是纯策略还是混合策略; ②重复剔除严格劣策略法不会消去任何纳什均衡, 包括纯策略纳什均衡和混合策略纳什均衡; ③如果经过重复剔除后留下的策略组合是惟一的, 那么一定是纳什均衡。 因此,在考虑混合策略的情况下,我们仍然可利 用重复剔除严格劣策略法进行分析,而且实际上 引进混合策略只有使重复剔除严格劣策略法的用 处更大。 一个数值例子 在这个博弈中,博弈方1有U、M和D三种可选策略, 博弈方2有L和R两种可选策略。 不难发现在纯策略的意义上,该博弈中不存在任何严 格下策。因此,如果我们只考虑纯策略,那么两个博 弈方都没有任何严格下策,因而严格下策反复消去法 就无从运用。 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3、 混合策略和重复剔除严格劣策略法
路然* 年05 4。湿合策略风应承教 女合的内,方的决泉 用 6-xgx3+×l-g)x0+xgx0+×0-qx3-生 4、混合策略反应函数 5、纳什均衡的存在性 ★夫妻之争博弃 妹 点 类中 0,01,3 R(q) 夫之争 方的 、多重纳什均衡博弈的分析 ()、帕托白均衡 外的 ()帕果托上策均南 (②)风险上策均 宁(3)最点均衡 广(4)相关均衡
8 但是,如果我们允许博弈方1采取混合策略, 情况就会有所不同。设博弈方1采取如下的混 合策略: 以概率分布(0.5, 0.5, 0) 随机选择U、M、D, 即各一半机会选U、M,不选D。 那么与这个混合策略相比,D一定是博弈方1的 严格下策。Why? 当博弈方2釆用纯策略L时,博弈方1用上述混 合策略的期望得益为: 2 3 2 1 2 1 1 3 0 0 1 e u 当博弈方2釆用纯策略R时,博弈方1用上述混合策略的期望得益为: 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 2 3 2 1 2 1 1 0 3 0 1 e u 即使博弈方2也采用混合策略(q, 1-q),博弈方1釆用上述混合策略的 期望得益还是: 2 3 2 1 2 1 2 1 2 1 1 u q3 (1q)0 q0 (1q)3 e 也就是说,不管博弈方2采用哪种策略,包括所有可能的纯策略和所有混合策 略(对应q的不同值),博弈方1采用上述混合策略的期望得益始终为3/2,都大 于采用D策略时能得到的确定性得益1。因此D策略相对于混合策略(0.5, 0.5, 0)是严格下策。 4、 混合策略反应函数 在混合策略的范畴内,博弈方的决策内容为选择概率 分布,反应函数就是一方对另一方的概率分布的反 应,同样也是一定的概率分布。 11:53:31 44 夫妻之争博弈 11:53:31 45 2, 1 0, 0 0, 0 1, 3 时装 足球 丈夫 时装 足球 妻 子 夫妻之争 r q 1 1/3 1 3/4 (r,1-r):妻子的混合策略概率分布 (q,1-q):丈夫的混合策略概率分布 ( ) 2 q R r ( ) r R1 q 4、 混合策略反应函数 5、 纳什均衡的存在性 纳什定理 纳什在他1950年的经典论文中,首先提出了他自己称为“均 衡点”的纳什均衡概念,并且同时证明了在相当广泛的博弈 类型中,混合策略意义上的纳什均衡是普遍存在的。这个经 典成果可以表述为下述定理: 纳什定理(Nash 1950):在一个有n个博弈方的博弈G = {S1,…Sn;u1,…un}中,如果n是有限的,且Si都是有限集 (对n = 1,…,n),则该博弈至少存在一个纳什均衡,但可能 包含混合策略。 用更通俗的语言,这个定理就是说“每一个有限博弈都至少 有一个混合策略纳什均衡”。 11:53:31 46 6、 多重纳什均衡博弈的分析 (1)帕累托上策均衡 (2)风险上策均衡 (3)聚点均衡 (4)相关均衡 11:53:31 47 事实上,并不是所有多重纳什均衡博弈都会导致分析的困难。 因为虽然有些博弈中存在多个纳什均衡,但很可能这些纳什 均衡有明显的优劣差异,所有博弈方都偏好其中同一个纳什 均銜。 换句话说,可能有这些纳什均衡中的某一个,给所有博弈方 带来的利益,都大于其他所有纳什均衡会带来的利益。这时 候博弈方的选择倾向性就会是一致的,各个博弈方不仅自己 会选择该纳什均衡的策略,而且可以预料其他博弈方也会选 择该纳什均衡的策略,因此不会有选择困难。事实上,本章 前面的讨论中已经用了这样的思想。 上述多重纳什均銜选择所依据的,实际上就是帕累托效率意 义上的 优劣关系,因此用这种方法选择出来的纳什均衡,也 称为“帕累托占优均衡”。 (1)、帕累托占优均衡
广(1)帕累托占优均衡 (2)、风险占比均街(Risk-dominan Equilibrium (鹰销博弈) 这个博痒中有个 均衡作 容易理解的 争与和平 此外更重要的是:其他某种同样是合理的选择逻据的 作用会超过帕聚托效率的速择适辑,因此即使是完全 理性的决策者也不一定会选帕累托上策均衡 。(2)风险占优均衡 (3)、点均衡 岛路精特物的装要出方十果点物 下厦就是两个子。 方2 人2 风上均(D,) (4)、相关均衡 :由 244 数 绘 9
9 11:53:31 49 (1)帕累托占优均衡 (鹰鸽博弈) 这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托占优均衡。 -5, -5 -10, 8 8, -10 10, 10 战争 和平 国家2 战争 和平 国 家 1 战争与和平 (2)、风险占优均衡(Risk-dominant Equilibrium) 在存在帕累托效率意义上优劣关系的情况下,帕累托 上策均衡作为均衡选择的基本法则是容易理解的。 不过帕累托上策均衡并不是有强制力的法则,这一点 根据上面对战争与和平博弈的讨论我们就可以感觉到。 此外更重要的是:其他某种同样是合理的选择逻辑的 作用会超过帕累托效率的选择逻辑,因此即使是完全 理性的决策者也不一定会选帕累托上策均衡。 11:53:31 51 (2)风险占优均衡 考虑、顾及其他博弈方可能发生错误等情况时,帕累托 上策均衡并不一定是最优选择,需要考虑:风险占优均衡。 下面就是两个例子。 9, 9 8, 0 0, 8 7, 7 L R 博弈方2 U D 博 弈 方 1 风险上策均衡(D,R) 5, 5 3, 0 0, 3 3, 3 鹿 兔子 猎人2 鹿 兔子 猎 人 1 猎鹿博弈 风险上策均衡(兔子,兔子) (3)、聚点均衡 在多重纳什均衡的博弈中,双方同时选择一个聚点构成 的纳什均衡称为“聚点均衡” (Focal Points Equilibrium)。 聚点均衡首先是纳什均衡,是多重纳什均銜中比较容易 被选择的纳什均衡。 这个点之所以成为“聚点”,是因为博弈各方的文化和 经验使他们相信这个点是大家都容易想到的、习惯选择 的点。聚点均衡利用博弈设定以外的信息和依据选择的 均衡文化、习惯或者其他各种特征都可能是聚点均衡的 依据 城市博弈(城市分组相同)、时间博弈(报出相同的时 间)是聚点均衡的典型例子。 聚点均衡确实反映了人们在多重纳什均衡选择中的某些 规律性,但因为它们涉及的方面众多,因此虽然对每个 具体的博弈问题可能可以找出聚点,但对一般的博弈却 很难总结普遍规律,只能具体问题具体分析。 (4)、相关均衡 实际上,人们在现实中遇到选择困难时,特别是在长期 中反复遇到相似的选择难题时,常会通过收集更多信息, 形成特定的机制和规则,也就是某种形式的制度安排等 主动寻找出路。 因此对于博弈中多重纳什均衡选择的难题,我们也应该 考虑博弈方主动寻求方法,设计某种形式的均衡选择机 制,以解决多重纳什均衡选择问题的可能性。 “相关均衡”(Correlated Equilibrium) 就是这样的 一种均衡选择机制。相关均衡的基本思想可以通过下列 2×2静态博弈来说明。 (U, L)和(D, R)是两个纯策略纳什均衡; 一个混合策略纳什均衡[(0.5, 0.5),(0.5, 0.5)], 即两博弈方都以0.5的概率在自己的两个纯策略中 随机选择。 虽然该博弈的两个纯策略纳什均衡,都能使两博弈 方得到6单位得益总和,但在这两个纳什均衡下双 方的利益相差很大,因此很难在两博弈方之间形成 自然的妥协。 如果采用混合策略纳什均衡,因为有1/4的可能性 遇到最不理想的(U, R) ,而且双方的期望得益都 只有2.5单位,显然也不理想。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子
:岛 中电 吉 三、二人单和博弃 1、二人有和弃的措进 1、二人有限零和博弃的指连 项币,田及赛马。石头-雾刀布 2、纯策哈义下的解 3、混合策哈意义下的解 1、二人有限平和博弃的指越 2、纯略义下的解 ()、小果大原 2及路 一个策略组合(也称
10 由于避免出现(U, R)结果符合双方的利益,因此双方有可能通 过协商约定采用如“拋一硬币,出现正面博弈方1釆用U,博弈 方2采用L;出现反面博弈方1采用D,博弈方2采用R”这样的选 择规则。 按照这样的规则选择,那么两个纯策略纳什均衡(U, L)和(D, R) 各有1/2出现的可能,且可以保证排除采用混合策略可能出现的 (U, R),双方的期望得益都是3,明显好于双方各自采用混合策 略的期望得益,也解决了双方在两个纯策略纳什均衡选择方面 的僵局。 同样的思想用到夫妻之争博弈中就是双方可能形成这样的约定: “如果天气好一起去看足球赛,天气不好则一起看时装表演"。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子 这种方法的关键是发出下列“相关信号”(Correlated Signals)的“相关 装置” :(1)该装置以相同的可能性(各1/3)发出A、B、C三种信号; (2) 博弈方1只能看到该信号是否A,博弈方2只能看到该信号是否C;(3)博弈方 1看到A采用U,否则采用D;博弈方2看到C采用R,否则采用L。 该机制有下列性质: (1)保证U和R不会同时出现,即排除掉了(U, R) ;(2)保证(U, L)、 (D, L) 和(D, R)各以1/3的概率出现,从而两博弈方的期望得益达到3 +1/3;(3) 上述策略组合是一个纳什均 衡;(4)上述相关装置并不影响双方各种策略 组合下的得益,因此并不影响原来的均衡。即如果一个博弈方忽视信号, 另一个博弈方也可以忽视信号,并不影响各博弈方原来可能实现的利益。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 U D 博 弈 方 1 相关均衡例子 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 U D 博 弈 方 1 相关均衡例子 其实该博弈还可能实现更好的结果。 该博弈 有一个总得益更高的策略组合(D, L) ,由于 它不是纳什均衡,因此除了混合策略纳什均 衡中包含采用它的可能性以外,在一次性博 弈中无法实现它。 如果我们将上述通过抛硬币排除(U, R)的方 法加以发展,就可以设计出一种能够包含进 这个策略组合,同时又能排除(U, R)的方法。 三、二人零和博弈 1、二人有限零和博弈的描述 2、纯策略意义下的解 3、混合策略意义下的解 • 零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立 —猜硬币,田忌赛马,石头-剪刀-布 1、二人有限零和博弈的描述 • 二人有限零和博弈是指参加博弈的参与人只有两个, 每个参与人都只有有限多个策略可供选择,而且在任何 一个局势中,两个参与人的收益之和总是等于零。 设两参与人分别为甲和乙,甲有 m个纯策略 可供选择, 乙有n个纯策略 可供选择,则甲乙的策略集分别为 m , , , 1 2 n , , , 1 2 { , , , } { , , , } 2 1 2 1 1 2 n m S S { , ; } G S1 S2 A 当甲选定 、乙选定 后,就形成了一个策略组合(也称局 势) ,对任一局势,记甲的赢得收益为 ,则甲的赢 得收益矩阵为 相应,乙的赢得为-A 通常,将二人有限零和博弈记成 ——矩阵 对策 i j ( , ) i j ij a m mn n a a a a A 1 11 1 1、二人有限零和博弈的描述 2、纯策略意义下的解 (1)、最小最大原理 由冯·诺依曼提出 基本思想: 作为局中人,对手将采取对他自己最有利的策略; 相应的,对手会选择使你获得尽可能差的支付的 策略。 由于零和博弈的特点和性质,以上思想即为:任 何使对手得到最好结果的策略,都会使你获得最 差的结果。双方都具有这样的理性!