4  定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略

正在加载图片...

§1完第信息的动态博弃 §1完第信息的动态博弈不 S1完美信息的动态博恋 §1完第信息的动态博弈不包含不可置信的行功的策略齐方的为也就客易确了。 S1完美信息的动态博弈 S1完养信息的动态博弈海盗分赃海盗分赃的网：拾白已9 5是(90.10.1)4  定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈精炼纳什均衡”。  子博弈精炼纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。  子博弈精炼纳什均衡必须对博弈方在所有选择节点处的选择做出规定，包括最终不在均衡路径上的节点。  逆推归纳法是求完美信息动态博弈子博弈精炼纳什均衡的基本方法。 § 1 完美信息的动态博弈  定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。乙甲不借借分不分（1，0）（0，4）（2，2）乙（-1，0）注：（1）从一个单点决策节开始，之后的所有枝节包含其中（2）子博弈不能分割信息集 § 1 完美信息的动态博弈  NE：（不画，{割，默认}）(不是子博弈I的均衡)  NE：（画， {默认，割} ）（不是子博弈II的均衡）  NE：（画， {默认，默认} ）不包含不可置信的行动的策略——子博弈精炼纳什均衡（能够排除保证实际发生的动态行为与事前规定的策略是一致的，因此是真正稳定的）。子博弈Ⅱ (-3,-3) (1,-2) 子博弈Ⅰ 小孩父亲默认 (-4,-3) (0,0) 威胁博弈 § 1 完美信息的动态博弈  定义：从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。  逻辑基础：动态博弈中先行动的理性的博弈方，在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为，只有在博弈的最后一个阶段选择的，不再有后续阶段牵制的博弈方，才能直接作出明确选择。而当后面阶段博弈方的选择确定以后，前一阶段博弈方的行为也就容易确定了。 § 1 完美信息的动态博弈 § 1 完美信息的动态博弈  5个海盗抢到了100颗宝石，每一颗都有一样的大小和一样贵重的价值，经过商议，他们决定将宝石这样分配： a 抽签决定自己的号码1，2，3，4，5。 b 首先，由1号提出分配方案，然后5人进行表决，如果同意这种方案的人达到半数，就按照1号的提案进行分配，否则，他将被扔入大海喂鲨鱼，然后由接下来的人继续重复提议。  假设每个海盗都是绝顶聪明，也不互相合作，而且每个都追求最大限度得到金币宝石  1号海盗如何提议？海盗分赃 § 1 完美信息的动态博弈  5号海盗：分给自己100枚宝石  4号海盗：分给自己100枚宝石并赞成自己；5号海盗被分得0枚，反对无用  3号海盗：分给5号海盗1枚并得到5号的同意；分给自己 99枚，自己同意；分给4号海盗0枚，4号反对也无用  2号海盗：分给4号1枚得到4号的同意；分给自己99枚，自己也同意；3、5号反对无用。  1号海盗：分给3、5号海盗各1枚，获得3、5号的同意；分给自己98枚，自己同意；分给2、4号海盗0枚，他们会反对但不起作用。  均衡结果是（98，0，1，0，1）海盗分赃

<<向上翻页向下翻页>>

点击下载：中国人民大学：《博弈论》课程教学资源（讲义）第三章完全信息动态博弈