正在加载图片...
§1完第信息的动态博弃 §1完第信息的动态博弈 不 S1完美信息的动态博恋 §1完第信息的动态博弈 不包含不可置信的行功的策略 齐方的为也就客易确了。 S1完美信息的动态博弈 S1完养信息的动态博弈 海盗分赃 海盗分赃 的网:拾白已9 5是(90.10.1)4  定义:如果一个完美信息的动态博弈中,各博 弈方的策略构成的一个策略组合满足,在整个 动态博弈及它的所有子博弈中都构成纳什均衡, 那么这个策略组合称为该动态博弈的一个“子 博弈精炼纳什均衡”。  子博弈精炼纳什均衡能够排除均衡策略中不可信的威胁和 承诺,因此是真正稳定的。  子博弈精炼纳什均衡必须对博弈方在所有选择节点处的选 择做出规定,包括最终不在均衡路径上的节点。  逆推归纳法是求完美信息动态博弈子博弈精炼纳什均衡的 基本方法。 § 1 完美信息的动态博弈  定义:由一个动态博弈第一阶段以外的某阶段开始的 后续博弈阶段构成的,有初始信息集和进行博弈所需 要的全部信息,能够自成一个博弈的原博弈的一部分, 称为原动态博弈的一个“子博弈”。 乙 甲 不借 借 分 不分 (1,0) (0,4) (2,2) 乙 (-1,0) 注: (1)从一个单点决 策节开始,之后的所 有枝节包含其中 (2)子博弈不能分 割信息集 § 1 完美信息的动态博弈  NE:(不画,{割,默认})(不是子博 弈I的均衡)  NE:(画, {默认,割} )(不是子博 弈II的均衡)  NE:(画, {默认,默认} ) 不包含不可置信的行动的策略——子博弈精炼纳什均衡(能够 排除保证实际发生的动态行为与事前规定的策略是一致的,因 此是真正稳定的)。 子博弈Ⅱ (-3,-3) (1,-2) 子博弈Ⅰ 小孩 父 亲 默认 (-4,-3) (0,0) 威胁博弈 § 1 完美信息的动态博弈  定义:从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应博弈 方的行为选择,一直到第一个阶段的分析方法, 称为“逆推归纳法”。  逻辑基础:动态博弈中先行动的理性的博弈方, 在前面阶段选择行为时必然会先考虑后行为博 弈方在后面阶段中将会怎样选择行为,只有在 博弈的最后一个阶段选择的,不再有后续阶段 牵制的博弈方,才能直接作出明确选择。而当 后面阶段博弈方的选择确定以后,前一阶段博 弈方的行为也就容易确定了。 § 1 完美信息的动态博弈 § 1 完美信息的动态博弈  5个海盗抢到了100颗宝石,每一颗都有一样的大小和一 样贵重的价值,经过商议,他们决定将宝石这样分配: a 抽签决定自己的号码1,2,3,4,5。 b 首先,由1号提出分配方案,然后5人进行表决, 如果同意这种方案的人达到半数,就按照1号的提案进行 分配,否则,他将被扔入大海喂鲨鱼,然后由接下来的 人继续重复提议。  假设每个海盗都是绝顶聪明,也不互相合作,而且每个 都追求最大限度得到金币宝石  1号海盗如何提议? 海盗分赃 § 1 完美信息的动态博弈  5号海盗:分给自己100枚宝石  4号海盗:分给自己100枚宝石并赞成自己;5号海盗被 分得0枚,反对无用  3号海盗:分给5号海盗1枚并得到5号的同意;分给自己 99枚,自己同意;分给4号海盗0枚,4号反对也无用  2号海盗:分给4号1枚得到4号的同意;分给自己99枚, 自己也同意;3、5号反对无用。  1号海盗:分给3、5号海盗各1枚,获得3、5号的同意; 分给自己98枚,自己同意;分给2、4号海盗0枚,他们 会反对但不起作用。  均衡结果是(98,0,1,0,1) 海盗分赃
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有