博弈论前沿专题 Advances in game Theory 东北财经大学数量经济系 刘德海Mi00163com 2006-3-7
2006-3-7 1 东北财经大学 数量经济系 刘德海 ldhai2001@163.com 博弈论前沿专题 (Advances in Game Theory)
第三章传统博弈理论的简介 复习 第一章:第一节博弈论学科的产生、发展和演变过程 第二节博弈论与“理性”概念; 第二章:第一节博弈论的一些重要概念:经验主义,均衡,合作,信息 第二节博弈的基本要素:参与者行动,策略,支付,规则环境 第三节博弈模型的三种正规表述:策略式扩展式,联盟式 本章《传统博弈理论的简介》主要内容: 第一节传统博弈理论的研究范式; 第二节纳什均衡的定义和几种实现途径; 第三节纳什均衡的无效率问题:重复博弈和无名氏定理; 第四节纳什均衡的无效率问题:相关均衡和信号装置; 第五节纳什均衡的多重性问题:静态博弈和焦点均衡; 第六节纳什均衡的多重性问题∶动态博弈和子博弈完美均衡 第七节不完全不完美信息下的纳什均衡存在性:贝叶斯均衡
2006-3-7 2 第三章 传统博弈理论的简介 复习: ◼ 第一章:第一节 博弈论学科的产生、发展和演变过程 第二节 博弈论与“理性”概念; ◼ 第二章:第一节 博弈论的一些重要概念:经验主义,均衡,合作,信息 第二节 博弈的基本要素:参与者,行动,策略,支付,规则,环境 第三节 博弈模型的三种正规表述:策略式,扩展式,联盟式 本章《传统博弈理论的简介》主要内容: ◼ 第一节 传统博弈理论的研究范式; ◼ 第二节 纳什均衡的定义和几种实现途径; ◼ 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理; ◼ 第四节 纳什均衡的无效率问题:相关均衡和信号装置; ◼ 第五节 纳什均衡的多重性问题:静态博弈和焦点均衡; ◼ 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡; ◼ 第七节 不完全不完美信息下的纳什均衡存在性:贝叶斯均衡;
第三章传统博弈理论的简介 第一节传统博弈理论的研究范式 博弈理论的研究对象:参与者互动过程中冲突与合作问题; 分析思路: 为了对人们的互动行为 大量情绪、直觉、性格、感觉 加以模型化分析, 等非理性的主观心理行为 必须进行合理的理论抽象 实际行 为方式 生了博弈论的 知识的未知状态、 的无序 “完全理性”概念 不可预测性和多样性 化 等造成不同层次的有限理性 2006-3-7 3
2006-3-7 3 ◼ 博弈理论的研究对象:参与者互动过程中冲突与合作问题; ◼ 分析思路: 第三章 传统博弈理论的简介 第一节 传统博弈理论的研究范式 大量情绪、直觉、性格、感觉 等非理性的主观心理行为 知识的未知状态、 不可预测性和多样性 等造成不同层次的有限理性 实际行 为方式 的无序 化 为了对人们的互动行为 加以模型化分析, 必须进行合理的理论抽象 产生了博弈论的 “完全理性”概念
第三章传统博弈理论的简介 第一节传统博弈理论的研究范式 传统博弈理论的硏究思路:参与者“完全理性″假设下,通过推 理演绎达到均衡化过程。均衡是瞬间实现的 人们行为在完全理性假设下,其行为类比于按照既定程序运行的 计算机(即给定博弈的环境和规则,人们的行为严格执行几种可 行的策略方案),没有冲动、情绪、直觉等非理性的因素,也 不会犯错误(有限理性)。 ■完全理性的内涵 工具理性 相关环境 认知理性信念 采取相应策略目标理性 最大化目标 2006-3-7
2006-3-7 4 第三章 传统博弈理论的简介 第一节 传统博弈理论的研究范式 ◼ 传统博弈理论的研究思路:参与者“完全理性”假设下,通过推 理演绎达到均衡化过程。均衡是瞬间实现的。 ◼ 人们行为在完全理性假设下,其行为类比于按照既定程序运行的 计算机(即给定博弈的环境和规则,人们的行为严格执行几种可 行的策略方案) ,没有冲动、情绪、直觉等非理性的因素,也 不会犯错误(有限理性)。 ◼ 完全理性的内涵: 相关环境 信念 采取相应策略 最大化目标 认知理性 工具理性 目标理性
第三章传统博弈理论的简介 第一节传统博弈理论的研究范式 传统博弈理论的研究内容 ■纳什均衡的存在性(Nash,1950) 纳什均衡的无效率及其解决途径: 无名氏定理, Friedman,1971 相关均衡, Aumann1974 纳什均衡的多重性及其解决途径 焦点均衡, Schelling,1960; 子博弈完美均衡, Selten,1965; 在不完全(或不完美)信息下,纳什均衡的存在性 贝叶斯纳什均衡, Harsanyi,1967 2006-3-7 5
2006-3-7 5 第三章 传统博弈理论的简介 第一节 传统博弈理论的研究范式 传统博弈理论的研究内容: ◼ 纳什均衡的存在性(Nash,1950) ◼ 纳什均衡的无效率及其解决途径: 无名氏定理,Friedman,1971 ; 相关均衡,Aumann1974; ◼ 纳什均衡的多重性及其解决途径: 焦点均衡, Schelling,1960; 子博弈完美均衡,Selten, 1965; ◼ 在不完全(或不完美)信息下,纳什均衡的存在性; 贝叶斯纳什均衡, Harsanyi,1967
第三章传统博弈理论的简介第二节纳什均衡的定义和几种实现途径 1。纳什均衡(NE)的定义 ■纳什均衡( Nash equilibrium,简记NE)的理解:参与者可以直接 交换信息并—致同意选择某一策略,虽然这些口头协议无法强制 实施,但是每个参与者单独偏离却不会带来更大收益。 双人策略式博弈的纳什均衡描述:策略组合(x*,x)是一个NE 当且仅当x是x2的最佳应对策略,x2也是x1的最佳应对策略, 双方都没有兴趣偏离此最佳应对的预期,则该策略组合是自动实 施的( self-enforcing) ■举例:囚徒困境博弈中,策略组合(P,P)为-一个NE。 坦白囚徒4 抵赖NP 坦白P8,-80,-10 囚徒B 10,0 2006-3-7 抵赖NP 6
2006-3-7 6 第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径 1。 纳什均衡(NE)的定义 ◼ 纳什均衡(Nash Equilibrium,简记NE)的理解:参与者可以直接 交换信息并一致同意选择某一策略,虽然这些口头协议无法强制 实施,但是每个参与者单独偏离却不会带来更大收益。 ◼ 双人策略式博弈的纳什均衡描述:策略组合( x1 * , x2 * ) 是一个NE, 当且仅当x1 *是x2 *的最佳应对策略, x2 *也是x1 *的最佳应对策略, 双方都没有兴趣偏离此最佳应对的预期,则该策略组合是自动实 施的(self-enforcing)。 ◼ 举例:囚徒困境博弈中,策略组合(P,P)为一个NE。 -8,-8 0,-10 -10,0 -1,-1 坦白P 抵赖NP 坦白P 抵赖NP 囚徒A 囚徒 B
第三章传统博弈理论的简介第二节纳什均衡的定义和几种实现途径 1。纳什均衡(NE)的定义 一般的定义∶策略式博弈(X1,Xn;u1,…,un)的一个策略组合 (x1*,…,xn3)是纳什均衡,如果使得下式成立 u(x;,x*)≥u(x1,x-1*)对所有x∈X都成立 如果上式取严格不等号,则为强NE。 解释:策略是参与者面向对方选择策略的_个最佳反应,这一点对所有参 与者都是如此。 分析方法:划线法分别列出对方选择某一策略时,自己的最佳应对 策略;然后找出双方都是最近应对策略的组合,即为NE 例如囚徒困境中,NE为(P,P) 囚徒A 坦白P抵赖NP 坦白P 囚徒B 8,80,-10 2006-3-7 抵赖NPL-10,Q
2006-3-7 7 第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径 1。 纳什均衡(NE)的定义 ◼ 一般的定义:策略式博弈(X1 ,…,X n;u1 ,…,u n)的一个策略组合 ( x1 * ,…, x n * )是纳什均衡,如果使得下式成立: u ( xi * , x-i* )≥ u ( xi, x-i* ) 对所有 xi∈ Xi都成立 如果上式取严格不等号,则为强NE。 解释:策略是参与者面向对方选择策略的一个最佳反应,这一点对所有参 与者都是如此。 ◼ 分析方法:划线法—分别列出对方选择某一策略时,自己的最佳应对 策略;然后找出双方都是最近应对策略的组合,即为NE。 例如囚徒困境中,NE为(P,P) 坦白P 抵赖NP 坦白P 抵赖NP 囚徒A 囚徒 B -8,-8 0,-10 -10,0 -1,-1
第三章传统博弈理论的简介第二节纳什均衡的定义和几种实现途径 1。纳什均衡(NE)的定义 混合策略( mixed strategy)的定义: 策略式博弈(Ⅺ1灬Xn;l灬,n)中,参与者的有K个纯策略, x1=(x1,…,x1K),则概率分布p=(p1,…,p1k)成为参与 者的一个混合策略,其中0≤p1k≤1,∑k=1p1k=1,P1k表示参与者 选择纯策略κk的概率,k=1,…K。此时参与者获得期望支付 ( expected payo),定义为以概率为权重的所有取值加权平均, E(1)=p11+…+pnXn ■举例:猜硬市游戏双方同时亮出硬币,当同一面时参与者1嬴, 否则嬴。该博弈无纯策略NE,混合策略均衡(l/2,1/2) 2006-3-7
2006-3-7 8 混合策略(mixed strategy)的定义: ◼ 策略式博弈(X1 ,…,X n;u1 ,…,u n)中,参与者i的有K个纯策略, Xi=( xi1 ,…, xi K ), 则概率分布 pi=( pi1 ,…, pi K )成为参与 者i的一个混合策略,其中0≤ pi k ≤1,∑ K k=1 pi k =1,pi k表示参与者 i选择纯策略x i k 的概率, k=1, … ,K 。此时参与者获得期望支付 (expected payoff),定义为以概率为权重的所有取值加权平均, E(X)= p1 X1+…+ p n X n 。 ◼ 举例:猜硬币游戏——双方同时亮出硬币,当同一面时参与者1赢, 否则2赢。该博弈无纯策略NE,混合策略均衡(1/2,1/2) 第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径 1。 纳什均衡(NE)的定义 c1 c2 -1,1 1,-1 r1 1,-1 -1,1 r2 2 1
第三章传统博弈理论的简介第二节纳什均衡的定义和几种实现途径 2。纳什均衡(NE)的几种实现途径 纳什均衡的存在性定理(Nash,1950):每一个有限博弈都至少 有一个NE,其中包括混合策略纳什均衡。 注:作为纯策略NE存在性的一个推论,仍采用不动点定理证明。 实现途径分析 (1)通过改变博弈规则,采取事前的沟通,或者外部力量的协调。 (2)在既有博弈规则内,理性主义和演化主义的均衡化过程分别提 供了两种不同的NE均衡形成途径。 2006-3-7
2006-3-7 9 第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径 2。 纳什均衡(NE)的几种实现途径 ◼ 纳什均衡的存在性定理(Nash,1950):每一个有限博弈都至少 有一个NE,其中包括混合策略纳什均衡。 注:作为纯策略NE存在性的一个推论,仍采用不动点定理证明。 ◼ 实现途径分析: (1)通过改变博弈规则,采取事前的沟通,或者外部力量的协调。 (2)在既有博弈规则内,理性主义和演化主义的均衡化过程分别提 供了两种不同的NE均衡形成途径
第三章传统博弈理论的简介第二节纳什均衡的定义和几种实现途径 2。纳什均衡(NE)的几种实现途径 第一种实现途径:博弈前的串谋 过程:参与者在博弈前直接的沟通,达成一个没有约束力的协议 然后开始单独行动如果一致同意达到某个结果,那么可以预 期这个结果是可以自我实施的( self-enforcing),即NE 举例:参加齐心协力跑比赛 ■问题:现实条件可能不允许参与者事前进行直接沟通,怎么办? (1)物质条件不允许直接沟通(参与者人数众多 (2)双方进行对话的基本互信不足(朝鲜孩问题六方会谈) (3)博弈规则不允许参与者会面(司马相如和卓文君私奔)《邮 通过外部力量进行协调。 注:通过事前的串谋实现纳什均衡,改变了原博弈的信息集合 2006-3-7
2006-3-7 10 第一种实现途径: 博弈前的串谋 ◼ 过程:参与者在博弈前直接的沟通,达成一个没有约束力的协议, 然后开始单独行动——如果一致同意达到某个结果,那么可以预 期这个结果是可以自我实施的(self-enforcing),即NE。 ◼ 举例:参加齐心协力跑比赛 ◼ 问题:现实条件可能不允许参与者事前进行直接沟通,怎么办? (1) 物质条件不允许直接沟通(参与者人数众多); (2) 双方进行对话的基本互信不足(朝鲜核问题六方会谈); (3) 博弈规则不允许参与者会面(司马相如和卓文君私奔)。 ——通过外部力量进行协调。 注:通过事前的串谋实现纳什均衡,改变了原博弈的信息集合。 第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径 2。 纳什均衡(NE)的几种实现途径