当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

中国人民大学:《博弈论》课程教学资源(讲义)第二章 完全信息静态博弈

资源类别:文库,文档格式:PDF,文档页数:19,文件大小:1.3MB,团购合买
一、博弈的标准式和纳什均衡 二、混合策略和纳什均衡的存在性 三、二人零和博弈 四、应用举例
点击下载完整版文档(PDF)

第二章完全信息静态博弈 一、博弈的标准式和纳什均衡 一、博弃的标准式和钠什均衡 、的标准式表 二、合略和纳什均衡的春在性 三、二人和博弃 四、应用单创 1、博弈的标准式表述 1、博弈的标准式表述 准式的三果索 学例:四徒田境州双交量是体末指笔) 实量短可由任意多的行和列成,“双实量 列行代来四钱2的枝,在河个字中后图。 一、博弃的标准式表述 1、博弈的标准式表述 举例:齐王田是赛马 博弃的致学表 假设一个有个博方,博弃方1的能集又称第 S表示博方1的第个策

1 第二章 完全信息静态博弈 一、博弈的标准式和纳什均衡 二、混合策略和纳什均衡的存在性 三、二人零和博弈 四、应用举例 一、博弈的标准式和纳什均衡 1、博弈的标准式表述 2、重复剔除严格劣战略 3、纳什均衡 标准式的三要素 (1) 参与人(或称为博弈方) (2) 每个参与人可选择的战略集 (3) 收益:针对所有参与人可选择的战略组合,每一 个参与人获得的收益 1、博弈的标准式表述 举例:囚徒困境(用双变量矩阵来描述) 双变量矩阵可由任意多的行和列组成,“双变量” 指的是在两个博弈方的博弈中,每一个单元格有两 个数字,分别表示两个参与者的收益。 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 囚徒2 囚 徒 1 1、博弈的标准式表述 横行代表囚徒1的收益,在两个数字中放在前面; 列行代表囚徒2的收益,在两个数字中放在后面。 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 -1, 1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1, 1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 一、博弈的标准式表述 举例:齐王田忌赛马 齐 王 上中下 上下中 中上下 中下上 下上中 下中上 上中下 上下中 中上下 中下上 下上中 下中上 田忌 注: ① 同时选择战略,不意味着行动必须是同时的; ②标准式不仅可用来描述静态博弈,也可以用来描述序 贯行动的动态博弈,只不过在分析问题时,扩展式博弈 更常用。 11:53:31 6 假设一个博弈有n个博弈方,博弈方i的策略集(又称策略空间) 为Si (i=1,2,…,n) ,用sij∈ Si表示博弈方i的第j个策略; 若si∈Si (i=1,2,…,n),称s=(s1 ,s2 , … ,sn )为一个策略组合; 若用s-i = (s1 ,s2 , … ,si-1, si+1, … ,sn ),则 s = (si ,s-i)。 博弈的数学表述 1、博弈的标准式表述

一、博弈的标准式表述 2、重复别除严格劣战略 用u()巴6.,,(1-L,2)表示方1在 策略食一(, ,及)的得差u,是策略燕 是该博 81×8X.X8上的多元最服, 稳史的结” (Dominant-strategy ,则该表示为 四许的视得路东中的(便白。员白)卖厚上就是 2、重复剔除严格劣战略 2、重复剔除严格劣战略 2) 重复别除产格战略 弃方 小 2、重复剔除严格劣战略 2、重复剔除严格劣战略 ,定义 地。果在 博弃中,不其他博 可变1 给他来的得益要小 相对于后一种

2 11:53:31 7 用ui (s)=ui (s1 ,s2 , … ,sn ) (i=1,2,…,n)表示博弈方i 在 策略组合s=(s1 ,s2 , … ,sn )的得益, ui是策略集 S1×S2×…×Sn上的多元函数。 定义:若一个N人博弈的策略空间为Si ,得益函数为: ui (s)=ui (s1 ,s2 , … ,sn )(i=1,2,…,n),则该博弈表示为: G={N,S1 ,S2 , … ,Sn;u1 ,u2 ,…,un } 。 一、博弈的标准式表述 (1)、占优均衡 如果一个博弈的某个策略组合中的所有策略都是 各个博弈方各自的上策,那么这个策略组合肯定 是所有博弈方都愿意选择的,必然是该博弈比较 稳定的结果。我们称这样的策略组合为该博弈的 一个“占优均衡” (Dominant-strategy Equilibrium)。  占优均衡是博弈分析中最基本的均衡概念之一, 占优均衡分析是最基本的博弈分析方法。  囚徒的困境博弈中的(坦白,坦白)实际上就是 一个占优均衡。 2、重复剔除严格劣战略 (2)、占优均衡分析的局限性  并非每个博弈方都有这种绝对偏好的上策,而且 常常是所有博弈方都没有上策,因为博弈方的最 优策略随其他博弈方的策略而变化正是博弈问题 的根本特征,是博弈关系相互依存性的主要表现 形式。  因此占优均衡不是普遍存在的。  例如赛马博弈就没有占优均衡,因为各个博弈方 的任何策略都不是绝对最优的,每个博弈方都没 有绝对偏好的上策。所以,占优均衡并不能解决 所有的博弈问题,最多只是在分析少数博弈时有 效。 2、重复剔除严格劣战略 (3)、重复剔除严格劣战略  ①、思路和原理  反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。  剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。 2、重复剔除严格劣战略  定义 一般地,如果在一个博弈中,不管其他博 弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略 给他带来的得益要小,那么我们称前一种 策略为相对于后一种策略的一个“严格劣 策略”。 2、重复剔除严格劣战略  ②举例 为了说明重复剔除严格劣策略法与占优均衡 分析的区别,我们用一个例子来说明。首先 看下图中这个抽象掉现实问题内容的,两个 博弈方分别有三种和两种策略的不对称博弈 问题。 博 弈 方 1 博弈方2 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 博 弈 方 1 博弈方2 1, 0 1, 3 0, 4 0, 2 上 下 左 中 博 弈 方 1 博弈方2 上 1, 0 1, 3 左 中 博弈方2 上 1, 3 中 2、重复剔除严格劣战略

2、重复剔除严格战略 2、重复剔除严格劣战略 ③重夏剔除严格劣乘暗法的缺格 (4) 2、重复剔除严格劣战略 2、重复剔除严格劣战略 举例 ; 划线法分析囚徒国境 2、重复剔除严格劣战略 2、重复除严格劣战略 钢3、映裹霜体率 当器, 过外不意 阵表示的博

3 ③重复剔除严格劣策略法的缺陷  重复剔除严格劣策略也不能解决所有博弈的分析 问题。因为在许多博弈问题中,上述相对意义上 的严格劣策略往往不存在。如猜硬币、齐威王田 忌赛马、石头,剪子,布等赌胜博弈,没有任何 博弈方的任何策略是相对其他策略的严格劣策略。  此外,在策略数较多的博弈中,重复剔除严格劣 策略法只能消去其中的部分策略,不能消去的策 略组合并不惟一,因此仍然不能完全解决这些博 弈问题。 2、重复剔除严格劣战略 (4)、划线法 ①思想 在具有策略和利益相互依存性的博弈问题中,各个 博弈方的收益既取决于自己选择的策略,还与其他 博弈方选择的策略有关,因此博弈方在决策时必须 考虑其他博弈方的存在和策略选择。 根据这种思想,科学的决策思路应该是:先找出自 己针对其他博弈方每种策略的最佳对策,即自己的 可选策略中与其他博弈方的策略配合,给自己带来 最大收益的策略(这种相对最佳对策总是存在的, 不过不一定惟一),然后在此基础上,通过对其他 博弈方策略选择的判断,包括对其他博弈方对自已 策略判断的判断等,预测博弈的可能结果和确定自 己趵最优策略。 2、重复剔除严格劣战略 ②举例 博 弈 方 1 博弈方2 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 2、重复剔除严格劣战略 例1 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 囚徒2 囚 徒 1 划线法分析囚徒困境 2、重复剔除严格劣战略 例2  划线法是一种非常简便的博弈分析方法,由于它 以策略之间的相对优劣关系为基础,因此在分析 用收益矩阵表示的博弈问题时具有普遍适用性。  当然,这并不意味着每个用收益矩阵表示的博弈 都可以用划线法求出确定性的博弈结果。  事实上,许多博弈根本不存在确定性的结果,当 然也就无法用划线法找出这种结果。我们通过一 些例子来说明。 2、重复剔除严格劣战略 -1, 1 1, -1 1, -1 -1, 1 正面 反面 正面 反面 猜硬币方 盖 硬 币 方 例3、猜硬币博弈 2、重复剔除严格劣战略

2、重复剔除严格劣战略 3、纳什均衡 是叶真位清尖树精使提中肉 在两人博弃的情况下,就是给定你的演路:我的略 划线法分析夫妻之争 奔中的“ 3、纳什均衡 3、纳什均衡 ①、纳什均衡的定义 在博奔G一代中,如果由各个博奔方的各一个 策略组成的采个策略组合( )中,任一博弃方的策 46 对任意气S都成立,则称何,内G-代4 的一个纳什均商。 电麻之为纯兼暗销什均离(Pure-strategy Nash Equilibrin血,PNE] 3、纳什均衡 3、纳什均衡 ③、纳什均衡与 严格带泉电 ★表1:表十来方0因品一,3 ★克理2:在知个棒方的棒来G中。如果量复剩雕 头系 纳什地衡

4 2, 1 0,0 0, 0 1, 3 时装 足球 时装 足球 丈 夫 妻 子 划线法分析夫妻之争 2、重复剔除严格劣战略 例4、夫妻博弈  通过划线法找出的具有稳定性的策略组合,不管是否惟 一,都有一个共同的特性,即其中每个博弈方的策略都 是针对其他博弈方策略或策略组合的最佳对策。  在两人博弈的情况下,就是“给定你的策略,我的策略 是我最好的策略;给定我的策略,你的策略也是你最好 的策略”。事实上,具有这种性质的策略组合,正是非 合作博弈理论中最重要的一个解概念,即博弈中的“纳 什均衡”(Nash Equilibrium)。 3、纳什均衡 * i s 在博弈 中,如果由各个博弈方的各一个 策略组成的某个策略组合 中,任一博弈方i的策 略 ,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡。 ( , ) * * i n s s { , ; , } G S1 Sn u1 un ( , , , ,... ) ( , , , ,... ) * * 1 * 1 * 1 * * 1 * * 1 * i 1 i i i n i i ij i n u s s s s s u s s s s s        ij i s S ( , ) * * i n s s { , ; , } G S1 Sn u1 un ( , , ,... ) * * 1 * 1 * 1 i i n s s s s    也称之为纯策略纳什均衡(Pure-strategy Nash Equilibrium, PNE) 3、纳什均衡 ①、 纳什均衡的定义 11:53:31 22 ②、纳什均衡的一致预测性 一致预测性是指这样一种性质:如果所有博弈方都预测一个 特定的博弈结果会出现,那么所有的博弈方都不会利用该预测 或者这种预测能力,选择与预测结果不一致的策略,即没有哪 个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终 真会成为博弈的结果。 即:如果所有博弈方都预测一个特定的纳什均衡会出现,那么, 没有人有兴趣作不同的选择。 一致预测性是纳什均衡的本质属性。 一致预测性使纳什均衡是稳定的和自我强制的。 3、纳什均衡 ③、纳什均衡与重复剔除严格劣策略 3、纳什均衡  占优均衡和纳什均衡之间的关系是:占优均衡是 包含在纳什均衡范围之内的,占优均衡肯定是纳 什均衡,但纳什均衡不一定是占优均衡。  划线法与纳什均衡的关系更清楚,前两者正是在 可以用得益矩阵表示的博弈中寻找纳什均衡的方 法。  纳什均衡和重复剔除严格劣策略法之间的关系要 复杂一些,关键是这两者之间是否存在相容性, 也即重复剔除严格劣策略法是否会消去纳什均衡? 对于纳什均衡和重复剔除严格劣策略法的关系, 下面的两个定理给出了答案。 24 定理1: 在n个博弈方的博弈G={S1 ,S2 , … ,Sn; u1 ,u2 ,…,un } 中,如果s * =(s1 * ,s2 * , … ,sn * )是G的一个纳什 均衡,那么重复剔除严格劣策略法一定不会将它消去。 3、纳什均衡 定理2:在n 个博弈方的博弈G中,如果重复剔除 严格劣策略法排除了除s * =(s1 * ,s2 * ,…,sn * )之外的所 有策略组合,那么s *一定是该博弈惟一的纳什均衡

二、合哈和纳什均衡的春在性 二、桌合草哈和纳什均衡的春在性 ,1、严格竟年博弃和混合策略的写引进 暗和格下策反复消去油 >4混合略反应 一5、纳什均衡的存在性 ·6、多重纳什均衡博弃的分析 1、严格变净博弃响痕合草嗜的引进 1、严格境摩博弃和视合限味的引城 的利益仍 行的。 在这两 力选择任 】、严格变李博来和杏菜哈的引 1、格弃和领合第哈的引 了2)合第略、合略博和混合策略纳什均南 (少清币 )”不存在前国定文 P+"◆P4

5 二、混合策略和纳什均衡的存在性  前面介绍的纳什均衡分析方法可以相当圆满地解决 许多博弈问题。但如果博弈中不存在纳什均衡或者 纳什均衡不惟一,如猜硬币、齐威王田忌赛马或夫 妻之争博弈那样、那么前述纳什均衡分析就无法对 博弈方的选择和博弈结果作明确的预测,无法给博 弈方提供明确的建议。  因此到目前为止介绍的纳什均衡分析方法,还不能 完全满足完全信息静态博弈分析的需要。  为此,本节将对不存在纳什均衡和存在多个纳什均 衡的博弈作一些讨论,关键是要引进在分析这两类 博弈时非常重要的“混合策略”和“混合策略纳什 均衡” (Mixsd-strategy Nash Equilibrium, MNE)概念。 二、混合策略和纳什均衡的存在性 1、严格竞争博弈和混合策略的引进 2、多重均衡博弈和混合策略 3、混合策略和严格下策反复消去法 4、混合策略反应函数 5、纳什均衡的存在性 6、多重纳什均衡博弈的分析 11:53:31 26 1、 严格竞争博弈和混合策略的引进  我们首先对各博弈方的利益和偏好始终不一致的,在 通常策略的基础上没有纳什均衡的博弈问题进行分析。 这类博弈也可以称为“严格竞争博弈"。  前面介绍猜硬币博弈和齐威王田忌赛马博弈时曾经说过, 如果这些傅弈只进行一次,那么我们无法明确预测博弈 的结果,不管是哪个博弈方,也不管他们选择的是哪个 策略,都不能保证得到较好的结果。  通过前面的分析我们进一步知道,之所以上述博弈没有 可预测的明确结果, 不能确定博弈方的策略,根本原因 在于这些博弈中没有纳什均衡策略组合。  那么这是否意味着在这样的博弈中,各个博弈方选择任 何策略都是一样的,因此可以随意选择呢? 1、 严格竞争博弈和混合策略的引进  这个问题的答案是否定的。事实上,在这些博 弈中,博弈方的选择仍然是很有讲究的,策略 选择的好坏对博弈方的利益仍然有很大的影响。  齐威王田忌赛马博弈和猜硬币博弈时,我们已 经简单讨论过这两个博弈中各个博弈方策略选 择的基本原则。当时得出的结论是,在这两个 博弈中,各博弈方必须保证自身策略选择的随 机性,以防止其他博弈方猜到自己的策略,或 利用自己对策略选择的偏好获利。  这里我们以猜硬帀博弈为例,进一步沿着这种 思路分析此类博弈中博弈方的策略选择和博弈 结果。 1、 严格竞争博弈和混合策略的引进  (1)猜硬币博弈 11:53:31 29 -1, 1 1, -1 1, -1 -1, 1 正 面 反 面 猜硬币方 盖 硬 币 方 正 面 反 面 (A)不存在前面定义的纳什均衡策略组合 (B)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念  (2)混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 中,博弈方i的策略 空间为 ,则博弈方i以概率分布 随机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中 对j=1,···,k都成立,且 11:53:31 30 ( , ) pi  pi1 pik 0  pij  1 pi1    pik  1 G  { , ; , } 1 n 1 n S S u u Si { , } i1 ik s  s 1、 严格竞争博弈和混合策略的引进

1、严格来和合的引 释搜器酷贸 混合策路纳什均衡结果精:。 1、严格变净博弃和浅合草味的引镜 -i 齐王 0808021082482028 收矩阵 格博和合的引 1/+111+-D- A=A=A=月=A=月=% 4-+1+1-1+1+= 马

6 混合策略扩展博弈:当把博弈方在混合策略的策略 空间(概率分布空间)的选择看作一个博弈时,就是 原博弈的“混合策略扩展博弈”。 混合策略纳什均衡:包含混合策略的策略组合构成的 纳什均衡称为“混合策略纳什均衡”。 11:53:31 31 1、 严格竞争博弈和混合策略的引进 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1  该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析  首先,本博弈中两博弈方决策的第一个原则,同样也是 不能让对方猜到自己的选择,因而必须在决策时利用随 机性。  第二个原则是他们选择每种策略的概率一定要恰好使对 方无机可乘,即让对方无法通过针对性地倾向某一策略 而在博弈中占上风。 3 1  2  5 A B A B p p p p  2  5  3 1 C D C D p p p p 3 1  2  5 A B A B p p p p  2  5  3 1 C D C D p p p p 1、 严格竞争博弈和混合策略的引进 (3)一个例子 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 混合策略纳什均衡结果                          1 1 2 5 3 1 3 1 2 5 C D A B C D C D A B A B p p p p p p p p p p p p            0.2 0.8 0.2 0.8 D C B A p p p p                              0.8 0.8 3 0.8 0.2 1 0.2 0.8 2 0.2 0.2 5 2.6 0.8 0.8 2 0.8 0.2 5 0.2 0.8 3 0.2 0.2 1 2.6 2 1 e e u u 1、 严格竞争博弈和混合策略的引进 (4)齐威王田忌赛马 11:53:31 34 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下 上下中 中上下 中下上 上下中 下中上 上 中 下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上 田 忌 齐 威 王 收益矩阵 1、 严格竞争博弈和混合策略的引进 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下a 上中下b 上中下c 上中下d 上中下e 上中下f 上 中 下g 上 中 下h 上 中 下i 上 中 下j 上 中 下k 上 中 下l 田 忌 齐 威 王 得益矩阵 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下a 上中下b 上中下c 上中下d 上中下e 上中下f 上 中 下g 上 中 下h 上 中 下i 上 中 下j 上 中 下k 上 中 下l 田 忌 齐 威 王 得益矩阵 a b c d e f a b c d e f a b c d e f a b c d e f a b c d e f a b c d e f p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p 3 3 3 3 3 3                                         pa  pb  pc  pd  pe  pf 1 6      1 6 g h i j k l p p p p p p                      ( 3 1 1 1 1 1) 1 6 1 (3 1 1 1 1 1) 1 6 1 e e u u 田忌 齐威王 该博弈中,齐威王和田忌都以1/6的相同概率随机选择 各自的六个纯策略,构成本博弈唯一的纯策略纳什均衡。 在上述混合策略下,齐威王的得益为: 1/6(3+1+1+1+1-1)=1 田忌的得益为: 1/6(1-3-1-1-1-1)=-1 即经过多次进行这样的赛马,齐威王平均每次能赢田忌 一千斤铜,这是因为齐威王三匹马的总体实力略胜田忌 的三匹马的缘故。 11:53:31 36 1、 严格竞争博弈和混合策略的引进

1、严格变博弃和观合草的3引 岛 2、多重均衡博弃和混合策略 一夫责之争的通合策毫纳什均衡 l-v 高 的 不是团 ②重表除严格 什均衡 在才牛 7

7  因为对博弈论的贡献而成为1994年经济学诺贝尔奖得 主之一的塞尔腾(Selten)教授,1996年3月在上海的 一次讲演中,举了一个小偷和守卫之间博弈的例子。  一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时 守卫在睡觉,则小偷就能得手,偷得价值为V的赃 物; 如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。 设小偷被抓住后要坐牢,负效用为-P,守卫睡觉而未 遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用 为-D。而如果小偷不偷,则他既无得也无失,守卫不 睡意味着出一份力挣一份钱,他也没有得失。  根据上述假设,小偷在该博弈中有“偷”和“不偷” 两种可选策略,守卫有“睡”和“不睡”两种可选策 略,双方的得益矩阵如下图所示。 (5)小偷和守卫的博弈 1、 严格竞争博弈和混合策略的引进 小偷和守卫的博弈的混合策略纳什均衡 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 0 - D - D’ 守卫 得益(睡) S Pt 小偷 1 偷的概率 0 - D - D’ 守卫 得益(睡) S Pt 小偷 1 偷的概率 * Pt *' Pt 0 - P - P’ 小偷 得益(偷) V Pg 守卫 1 睡的概略 0 - P - P’ 小偷 得益(偷) V Pg 守卫 1 睡的概略 * Pg * Pg 在小偷和守卫的博弈中,小偷分别以概率Pt*和1-Pt*随机选择 “偷”与“不偷”, 守卫分别以概率Pg*和1- Pg*随机选择“睡”与“不睡”时, 双方都不能通过改变策略 或概率改善自己的期望得益,因此构成混合策略纳什均衡,这也是该博弈惟一 的纳什均衡。 (小偷偷的概率应使守卫睡与不睡的收益相同,即为0;守卫睡觉的 概率应使小偷偷与不偷的收益相同,即期望收益为0)                        (1 ) ( ) 0 (1 ) 0 ( ) (1 ) 0 (1 ) 0 g g g g t t t t p V p P p p V,-D -P,0 p D p S p p 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 pt g p 1pt g 1p          V P P p S D S p g t * * 激励的悖论: 1.加重对守卫的处罚(D),短期中的效果是使守卫尽职,在 长期中并不能使守卫更尽职,但会降低盗窃发生的概率; 2.加重对小偷的处罚(P),短期内能抑制盗窃发生率,长期 并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉。 p (C)1 p (F)0  p (C)0 p (F)3 w w w w p (C)2 p (F)0  p (C)0 p (F)1 h h h h 妻子的混合策略 丈夫的混合策略 夫妻之争博弈的混合策略纳什均衡 策略 得益 妻子 (0.75,0.25) 0.67 丈夫 (1/3,2/3) 0.75 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 不难发现,这个结果明显不如夫 妻双方能交流协商时,任何一方 迁就另一方时双方的得益好,因 为那时任何一方都至少得1。这是 因为双方缺乏沟通时很可能出现 最差结果而造成的。  夫妻之争的混合策略纳什均衡 2、多重均衡博弈和混合策略 3、 混合策略和重复剔除严格劣策略法  在包括混合策略的情况下,关于重复剔除严格劣 策略法的结论仍然是成立的。即:  ①任何博弈方都不会采用任何严格劣策略,不管 它们是纯策略还是混合策略;  ②重复剔除严格劣策略法不会消去任何纳什均衡, 包括纯策略纳什均衡和混合策略纳什均衡;  ③如果经过重复剔除后留下的策略组合是惟一的, 那么一定是纳什均衡。  因此,在考虑混合策略的情况下,我们仍然可利 用重复剔除严格劣策略法进行分析,而且实际上 引进混合策略只有使重复剔除严格劣策略法的用 处更大。 一个数值例子  在这个博弈中,博弈方1有U、M和D三种可选策略, 博弈方2有L和R两种可选策略。  不难发现在纯策略的意义上,该博弈中不存在任何严 格下策。因此,如果我们只考虑纯策略,那么两个博 弈方都没有任何严格下策,因而严格下策反复消去法 就无从运用。 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3、 混合策略和重复剔除严格劣策略法

路然* 年05 4。湿合策略风应承教 女合的内,方的决泉 用 6-xgx3+×l-g)x0+xgx0+×0-qx3-生 4、混合策略反应函数 5、纳什均衡的存在性 ★夫妻之争博弃 妹 点 类中 0,01,3 R(q) 夫之争 方的 、多重纳什均衡博弈的分析 ()、帕托白均衡 外的 ()帕果托上策均南 (②)风险上策均 宁(3)最点均衡 广(4)相关均衡

8  但是,如果我们允许博弈方1采取混合策略, 情况就会有所不同。设博弈方1采取如下的混 合策略:  以概率分布(0.5, 0.5, 0) 随机选择U、M、D, 即各一半机会选U、M,不选D。  那么与这个混合策略相比,D一定是博弈方1的 严格下策。Why?  当博弈方2釆用纯策略L时,博弈方1用上述混 合策略的期望得益为: 2 3 2 1 2 1 1   3   0  0  1  e u  当博弈方2釆用纯策略R时,博弈方1用上述混合策略的期望得益为: 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 2 3 2 1 2 1 1   0   3  0  1  e u  即使博弈方2也采用混合策略(q, 1-q),博弈方1釆用上述混合策略的 期望得益还是: 2 3 2 1 2 1 2 1 2 1 1 u  q3 (1q)0 q0 (1q)3  e  也就是说,不管博弈方2采用哪种策略,包括所有可能的纯策略和所有混合策 略(对应q的不同值),博弈方1采用上述混合策略的期望得益始终为3/2,都大 于采用D策略时能得到的确定性得益1。因此D策略相对于混合策略(0.5, 0.5, 0)是严格下策。 4、 混合策略反应函数 在混合策略的范畴内,博弈方的决策内容为选择概率 分布,反应函数就是一方对另一方的概率分布的反 应,同样也是一定的概率分布。 11:53:31 44 夫妻之争博弈 11:53:31 45 2, 1 0, 0 0, 0 1, 3 时装 足球 丈夫 时装 足球 妻 子 夫妻之争 r q 1 1/3 1 3/4 (r,1-r):妻子的混合策略概率分布 (q,1-q):丈夫的混合策略概率分布 ( ) 2 q  R r ( ) r  R1 q 4、 混合策略反应函数 5、 纳什均衡的存在性  纳什定理 纳什在他1950年的经典论文中,首先提出了他自己称为“均 衡点”的纳什均衡概念,并且同时证明了在相当广泛的博弈 类型中,混合策略意义上的纳什均衡是普遍存在的。这个经 典成果可以表述为下述定理: 纳什定理(Nash 1950):在一个有n个博弈方的博弈G = {S1,…Sn;u1,…un}中,如果n是有限的,且Si都是有限集 (对n = 1,…,n),则该博弈至少存在一个纳什均衡,但可能 包含混合策略。 用更通俗的语言,这个定理就是说“每一个有限博弈都至少 有一个混合策略纳什均衡”。 11:53:31 46 6、 多重纳什均衡博弈的分析 (1)帕累托上策均衡 (2)风险上策均衡 (3)聚点均衡 (4)相关均衡 11:53:31 47  事实上,并不是所有多重纳什均衡博弈都会导致分析的困难。 因为虽然有些博弈中存在多个纳什均衡,但很可能这些纳什 均衡有明显的优劣差异,所有博弈方都偏好其中同一个纳什 均銜。  换句话说,可能有这些纳什均衡中的某一个,给所有博弈方 带来的利益,都大于其他所有纳什均衡会带来的利益。这时 候博弈方的选择倾向性就会是一致的,各个博弈方不仅自己 会选择该纳什均衡的策略,而且可以预料其他博弈方也会选 择该纳什均衡的策略,因此不会有选择困难。事实上,本章 前面的讨论中已经用了这样的思想。  上述多重纳什均銜选择所依据的,实际上就是帕累托效率意 义上的 优劣关系,因此用这种方法选择出来的纳什均衡,也 称为“帕累托占优均衡”。 (1)、帕累托占优均衡

广(1)帕累托占优均衡 (2)、风险占比均街(Risk-dominan Equilibrium (鹰销博弈) 这个博痒中有个 均衡作 容易理解的 争与和平 此外更重要的是:其他某种同样是合理的选择逻据的 作用会超过帕聚托效率的速择适辑,因此即使是完全 理性的决策者也不一定会选帕累托上策均衡 。(2)风险占优均衡 (3)、点均衡 岛路精特物的装要出方十果点物 下厦就是两个子。 方2 人2 风上均(D,) (4)、相关均衡 :由 244 数 绘 9

9 11:53:31 49 (1)帕累托占优均衡 (鹰鸽博弈) 这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托占优均衡。 -5, -5 -10, 8 8, -10 10, 10 战争 和平 国家2 战争 和平 国 家 1 战争与和平 (2)、风险占优均衡(Risk-dominant Equilibrium)  在存在帕累托效率意义上优劣关系的情况下,帕累托 上策均衡作为均衡选择的基本法则是容易理解的。  不过帕累托上策均衡并不是有强制力的法则,这一点 根据上面对战争与和平博弈的讨论我们就可以感觉到。  此外更重要的是:其他某种同样是合理的选择逻辑的 作用会超过帕累托效率的选择逻辑,因此即使是完全 理性的决策者也不一定会选帕累托上策均衡。 11:53:31 51 (2)风险占优均衡 考虑、顾及其他博弈方可能发生错误等情况时,帕累托 上策均衡并不一定是最优选择,需要考虑:风险占优均衡。 下面就是两个例子。 9, 9 8, 0 0, 8 7, 7 L R 博弈方2 U D 博 弈 方 1 风险上策均衡(D,R) 5, 5 3, 0 0, 3 3, 3 鹿 兔子 猎人2 鹿 兔子 猎 人 1 猎鹿博弈 风险上策均衡(兔子,兔子) (3)、聚点均衡  在多重纳什均衡的博弈中,双方同时选择一个聚点构成 的纳什均衡称为“聚点均衡” (Focal Points Equilibrium)。  聚点均衡首先是纳什均衡,是多重纳什均銜中比较容易 被选择的纳什均衡。  这个点之所以成为“聚点”,是因为博弈各方的文化和 经验使他们相信这个点是大家都容易想到的、习惯选择 的点。聚点均衡利用博弈设定以外的信息和依据选择的 均衡文化、习惯或者其他各种特征都可能是聚点均衡的 依据  城市博弈(城市分组相同)、时间博弈(报出相同的时 间)是聚点均衡的典型例子。  聚点均衡确实反映了人们在多重纳什均衡选择中的某些 规律性,但因为它们涉及的方面众多,因此虽然对每个 具体的博弈问题可能可以找出聚点,但对一般的博弈却 很难总结普遍规律,只能具体问题具体分析。 (4)、相关均衡  实际上,人们在现实中遇到选择困难时,特别是在长期 中反复遇到相似的选择难题时,常会通过收集更多信息, 形成特定的机制和规则,也就是某种形式的制度安排等 主动寻找出路。  因此对于博弈中多重纳什均衡选择的难题,我们也应该 考虑博弈方主动寻求方法,设计某种形式的均衡选择机 制,以解决多重纳什均衡选择问题的可能性。  “相关均衡”(Correlated Equilibrium) 就是这样的 一种均衡选择机制。相关均衡的基本思想可以通过下列 2×2静态博弈来说明。  (U, L)和(D, R)是两个纯策略纳什均衡;  一个混合策略纳什均衡[(0.5, 0.5),(0.5, 0.5)], 即两博弈方都以0.5的概率在自己的两个纯策略中 随机选择。  虽然该博弈的两个纯策略纳什均衡,都能使两博弈 方得到6单位得益总和,但在这两个纳什均衡下双 方的利益相差很大,因此很难在两博弈方之间形成 自然的妥协。  如果采用混合策略纳什均衡,因为有1/4的可能性 遇到最不理想的(U, R) ,而且双方的期望得益都 只有2.5单位,显然也不理想。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子

:岛 中电 吉 三、二人单和博弃 1、二人有和弃的措进 1、二人有限零和博弃的指连 项币,田及赛马。石头-雾刀布 2、纯策哈义下的解 3、混合策哈意义下的解 1、二人有限平和博弃的指越 2、纯略义下的解 ()、小果大原 2及路 一个策略组合(也称

10  由于避免出现(U, R)结果符合双方的利益,因此双方有可能通 过协商约定采用如“拋一硬币,出现正面博弈方1釆用U,博弈 方2采用L;出现反面博弈方1采用D,博弈方2采用R”这样的选 择规则。  按照这样的规则选择,那么两个纯策略纳什均衡(U, L)和(D, R) 各有1/2出现的可能,且可以保证排除采用混合策略可能出现的 (U, R),双方的期望得益都是3,明显好于双方各自采用混合策 略的期望得益,也解决了双方在两个纯策略纳什均衡选择方面 的僵局。  同样的思想用到夫妻之争博弈中就是双方可能形成这样的约定: “如果天气好一起去看足球赛,天气不好则一起看时装表演"。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 UD 博 弈 方1 相关均衡例子  这种方法的关键是发出下列“相关信号”(Correlated Signals)的“相关 装置” :(1)该装置以相同的可能性(各1/3)发出A、B、C三种信号; (2) 博弈方1只能看到该信号是否A,博弈方2只能看到该信号是否C;(3)博弈方 1看到A采用U,否则采用D;博弈方2看到C采用R,否则采用L。  该机制有下列性质:  (1)保证U和R不会同时出现,即排除掉了(U, R) ;(2)保证(U, L)、 (D, L) 和(D, R)各以1/3的概率出现,从而两博弈方的期望得益达到3 +1/3;(3) 上述策略组合是一个纳什均 衡;(4)上述相关装置并不影响双方各种策略 组合下的得益,因此并不影响原来的均衡。即如果一个博弈方忽视信号, 另一个博弈方也可以忽视信号,并不影响各博弈方原来可能实现的利益。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 U D 博 弈 方 1 相关均衡例子 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 U D 博 弈 方 1 相关均衡例子  其实该博弈还可能实现更好的结果。 该博弈 有一个总得益更高的策略组合(D, L) ,由于 它不是纳什均衡,因此除了混合策略纳什均 衡中包含采用它的可能性以外,在一次性博 弈中无法实现它。  如果我们将上述通过抛硬币排除(U, R)的方 法加以发展,就可以设计出一种能够包含进 这个策略组合,同时又能排除(U, R)的方法。 三、二人零和博弈 1、二人有限零和博弈的描述 2、纯策略意义下的解 3、混合策略意义下的解 • 零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立 —猜硬币,田忌赛马,石头-剪刀-布 1、二人有限零和博弈的描述 • 二人有限零和博弈是指参加博弈的参与人只有两个, 每个参与人都只有有限多个策略可供选择,而且在任何 一个局势中,两个参与人的收益之和总是等于零。 设两参与人分别为甲和乙,甲有 m个纯策略 可供选择, 乙有n个纯策略 可供选择,则甲乙的策略集分别为    m , , , 1 2     n , , , 1 2  { , , , } { , , , } 2 1 2 1 1 2 n m S S           { , ; } G  S1 S2 A 当甲选定 、乙选定 后,就形成了一个策略组合(也称局 势) ,对任一局势,记甲的赢得收益为 ,则甲的赢 得收益矩阵为 相应,乙的赢得为-A 通常,将二人有限零和博弈记成 ——矩阵 对策 i  j ( , ) i  j ij a            m mn n a a a a A      1 11 1 1、二人有限零和博弈的描述 2、纯策略意义下的解 (1)、最小最大原理  由冯·诺依曼提出  基本思想: 作为局中人,对手将采取对他自己最有利的策略; 相应的,对手会选择使你获得尽可能差的支付的 策略。 由于零和博弈的特点和性质,以上思想即为:任 何使对手得到最好结果的策略,都会使你获得最 差的结果。双方都具有这样的理性!

点击下载完整版文档(PDF)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共19页,试读已结束,阅读完整版请下载
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有