正在加载图片...
不可置信的威胁( noncredible threat) 精炼纳什均衡( Perfect NE) 在(及格;A,F)和(不及格:F,A)中, 不可置信的行动的战略所组成的纳 学生“报复(F)”的威胁是不可信的:无论老 衡被称为“精炼纳什均衡”;也就是说,不 师判“及格”还是“不及格”,“报复”不是学生的 去发生了什么,构成精炼纳什均衡的战略,其 最优选择 所规定的行动在每一个决策点上都是最优的 事前( ex ante)和事后(expo 种战略所规 所以,又称为“序惯均衡” ( sequential 定的行动在事前看来是最优的,但事后看并不 equilibrium) 是当事人的最优选择,这种行动就不可置信, 首先必须是“纳什均衡”,但并非所有纳什均衡 该战略就不是一个合理的战略。 都是合理的;只有其战略不包含不可置信行动 的纳什均衡才是合理的。 子博弈( subgame) 子博弈精炼纳什均衡 ·由原博弈中某个决策点(信息集)开始 ·精炼纳什均衡:(1)在原博弈是一个纳 的部分构成一个子博弈 什均衡;(2)在每一个子博弈上都是纳 什均衡 ·考试博弈: (及格:A,F)在第二个子博弈上不构成纳什均 原博弈 子博弈1 (不及格:F,A)在第一个子博弈不构成纳什均 (不及格:A,A)在所有子博弈上都构成纳什均 考试博弈 逆向归纳法( backward induction) (-10,-10) ·在有限博弈中,我们可以用逆向归纳法 求解精炼纳什均衡:从最后一个决策点 开始,找出该子博弈的纳什均衡;然后 再倒回到倒数第二个决策点,找出决策 不及格学生报复一(10.-10) 者的最优决策(假定最后一个决策者的 决策是最优的);如此一直到初始决策 点,所有子博弈上的最优选择就是精炼 纳什均衡。又称“ rollback不可置信的威胁(noncredible threat) • 在(及格;A,F)和(不及格;F,A)中, 学生“报复(F)”的威胁是不可信的:无论老 师判“及格”还是“不及格”,“报复”不是学生的 最优选择; • 事前(ex ante)和事后(ex post):一种战略所规 定的行动在事前看来是最优的,但事后看并不 是当事人的最优选择,这种行动就不可置信, 该战略就不是一个合理的战略。 精炼纳什均衡(Perfect NE) • 不包含不可置信的行动的战略所组成的纳什均 衡被称为“精炼纳什均衡”;也就是说,不论过 去发生了什么,构成精炼纳什均衡的战略,其 所规定的行动在每一个决策点上都是最优的。 所以,又称为“序惯均衡”(sequential equilibrium); • 首先必须是“纳什均衡”,但并非所有纳什均衡 都是合理的;只有其战略不包含不可置信行动 的纳什均衡才是合理的。 子博弈(subgame) • 由原博弈中某个决策点(信息集)开始 的部分构成一个子博弈。 1 2 3 2 3 原博弈 子博弈I 子博弈II 子博弈精炼纳什均衡 • 精炼纳什均衡:(1)在原博弈是一个纳 什均衡;(2)在每一个子博弈上都是纳 什均衡。 • 考试博弈: – (及格;A,F)在第二个子博弈上不构成纳什均 衡; – (不及格;F,A)在第一个子博弈不构成纳什均 衡; – (不及格;A,A)在所有子博弈上都构成纳什均 衡。 老师 学生 学生 及格 不及格 报复 接受 报复 接受 (-10,-10) (-1, 1) (-10, -10) (1, -1) 考试博弈 逆向归纳法(backward induction) • 在有限博弈中,我们可以用逆向归纳法 求解精炼纳什均衡:从最后一个决策点 开始,找出该子博弈的纳什均衡;然后 再倒回到倒数第二个决策点,找出决策 者的最优决策(假定最后一个决策者的 决策是最优的);如此一直到初始决策 点,所有子博弈上的最优选择就是精炼 纳什均衡。又称“rollback
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有