理系统工程精要 Management Systems Engineering) 第十一章管理系统博弈I Copyright◎2015-2019蒋忠中, All Rights Reserved Emailzijiang@mail.neu.edu.cn SHomepage:http://faculty.neu.edu.cn/zzjiang 蒋忠中
管理系统工程精要 (Management Systems Engineering) 第十一章 管理系统博弈 III Copyright © 2015-2019 蒋忠中, All Rights Reserved Email: zzjiang@mail.neu.edu.cn Homepage: http://faculty.neu.edu.cn/zzjiang © 蒋忠中
第三章完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过 程和得益完全了解的完全且完美信息动态博弈。 这类博弈也是现实中常见的基本博弈类型。由于 动态博弈中博弈方的选择、行为有先后次序,因 此在表示方法、利益关系、分析方法和均衡概念 等方面,都与静态博弈有很大区别 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介绍 各种经典的动态博弈模型
第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过 程和得益完全了解的完全且完美信息动态博弈。 这类博弈也是现实中常见的基本博弈类型。由于 动态博弈中博弈方的选择、行为有先后次序,因 此在表示方法、利益关系、分析方法和均衡概念 等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介绍 各种经典的动态博弈模型
本章分六节 31动态博弈的表示法和特点 32可信性和纳什均衡的问题 33子博弈和子博弈完美纳什均衡 34几个经典动态博弈模型 35有同时选择的动态博弈模型 36动态博弈分析的问题和扩展讨论
本章分六节 3.1 动态博弈的表示法和特点 3.2 可信性和纳什均衡的问题 3.3 子博弈和子博弈完美纳什均衡 3.4 几个经典动态博弈模型 3.5 有同时选择的动态博弈模型 3.6 动态博弈分析的问题和扩展讨论
31动态博弈的表示法和特点 311阶段和扩展性表示 31.2动态博弈的基本特点
3.1 动态博弈的表示法和特点 3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
311阶段和扩展形表示 阶段:动态博弈中一个博弈方的一次选择行为 ■概念:多阶段(序列)博弈、扩展形(博弈树) 例子:仿冒和反仿冒博弈 A 仿冒 不仿冒 制止 不制止(0,10) 仿冒 不仿冒 (-2,5) 制止 不制止(5,5) (2,2) (10,4)
3.1.1 阶段和扩展形表示 ◼ 阶段:动态博弈中一个博弈方的一次选择行为 ◼ 概念:多阶段(序列)博弈、扩展形(博弈树) ◼ 例子:仿冒和反仿冒博弈 A B B A 制止 不制止 (-2,5) (2,2) (10,4) (5,5) 不仿冒 (0,10) 仿冒 不制止 制止 仿冒 不仿冒
312动态博弈的基本特点 策略是在整个博弈中所有选择、行为的计划 ■结果是上述“计划型”策略的策略组合,构成 条路径 得益对应每条路径,而不是对应每步选择、行为 动态博弈的非对称性——先后次序决定动态博弈 必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优 势
3.1.2 动态博弈的基本特点 ◼ 策略是在整个博弈中所有选择、行为的计划 ◼ 结果是上述“计划型”策略的策略组合,构成一 条路径 ◼ 得益对应每条路径,而不是对应每步选择、行为 ◼ 动态博弈的非对称性——先后次序决定动态博弈 必然是非对称的。 ◼ 先选择、行为的博弈方常常更有利,有“先行优 势”
32可信性和纳什均衡的问题 32.1相机选择和策略中的可信性问题 322纳什均衡的问题 323逆推归纳法
3.2 可信性和纳什均衡的问题 3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
321相机选择和策略中的可信性问题 相机选择:博弈策略实施中,博弈方可能依据自己的利益 改变策略计划! 不同版本的开金矿博弈——分钱和打官司的可信性 借 不借 借 不借 借 不借 不分(1,0) (1,0) (1,0) 分 分 不分 分 不分 (2,2)(0,4) (2,2) (2,2) 打 不打 打 不打 (0,4) (-1,0) (0,4) 开金矿博弈 (1,0) 有法律保障的开金矿博弈法律保障不足的开金矿博弈 分钱打官司都可信 分钱打官司都不可信
3.2.1 相机选择和策略中的可信性问题 相机选择:博弈策略实施中,博弈方可能依据自己的利益 改变策略计划! 不同版本的开金矿博弈——分钱和打官司的可信性 乙 甲 (2,2) (0,4) (1,0) 借 不借 分 不分 开金矿博弈 不借 乙 甲 乙 借 分 不分 (1,0) 打 不打 (1,0) (0,4) (2,2) 有法律保障的开金矿博弈 ——分钱打官司都可信 乙 甲 乙 打 (2,2) 分 不分 借 不借 (-1,0) (0,4) 不打 (1,0) 法律保障不足的开金矿博弈 ——分钱打官司都不可信
3.2,2纳什均衡的问题 第三种开金矿博弈中,(不借-不打,不分)和(借-打, 分)都是纳什均衡。但后者不可信,不可能实现或稳定。 结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在 完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是 不稳定的,不能作为预测的基础。 ■根源:纳什均衡本身不能排除博弈方策略中包含的不可信的 行为设定,不能解决动态博弈的相机选择引起的可信性问题
3.2.2 纳什均衡的问题 第三种开金矿博弈中,(不借-不打,不分)和(借-打, 分)都是纳什均衡。但后者不可信,不可能实现或稳定。 ◼ 结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在 完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是 不稳定的,不能作为预测的基础。 ◼ 根源:纳什均衡本身不能排除博弈方策略中包含的不可信的 行为设定,不能解决动态博弈的相机选择引起的可信性问题
323逆推归纳法 定义:从动态博弈的最后 个阶段博弈方的行为 开始分析,逐步倒推回 前一个阶段相应博弈方 的行为选择,一直到第 一个阶段的分析方法, 借 不借 称为“逆推归纳法 甲 分 不分 (1,0) 逆推归纳法是动态博弈 分析最重要、基本的方 (2,2) (0,4) 法
3.2.3 逆推归纳法 定义:从动态博弈的最后 一个阶段博弈方的行为 开始分析,逐步倒推回 前一个阶段相应博弈方 的行为选择,一直到第 一个阶段的分析方法, 称为“逆推归纳法” 。 ◼ 逆推归纳法是动态博弈 分析最重要、基本的方 法。 乙 借 不借 (1,0) 甲 分 不分 (2,2) (0,4)