动态博弈 行动有先后顺序,不同的参与人在不同时点行 动,先行动者的选择影响后行动者的选择空间, 后行动者可以观察到先行动者做了什么选择, 因此,为了做出最优的行动选择,每个参与人 都必须这样思考问题:如果我如此选择,对方 将如何应对?如果我是他,我将会如何行动? 给定他的应对,什么是我的最优选择? 如下棋
动态博弈 • 行动有先后顺序,不同的参与人在不同时点行 动,先行动者的选择影响后行动者的选择空间, 后行动者可以观察到先行动者做了什么选择, 因此,为了做出最优的行动选择,每个参与人 都必须这样思考问题:如果我如此选择,对方 将如何应对?如果我是他,我将会如何行动? 给定他的应对,什么是我的最优选择? • 如下棋
博弈树( game tree) 进入 B 进入 A 不进入 不进入、B进入(0,1) 不进
博弈树(game tree) A B B 进入 不进入 进入 不进入 进入 不进入 (-1,-1) (1, 0) (0, 1) (0, 0)
动态博弈中的战略 战略是一个完备的行动计划:在博弈开 始之前就规定出每一个决策点上的选择, 即使这个决策点实际上不会出现 考虑老师与学生之间考试之后的一个博 弈:老师先行动(判分),学生后行动 (在不同分数下如何应对)。假定学生 的实际成绩是不及格
动态博弈中的战略 • 战略是一个完备的行动计划:在博弈开 始之前就规定出每一个决策点上的选择, 即使这个决策点实际上不会出现。 • 考虑老师与学生之间考试之后的一个博 弈:老师先行动(判分),学生后行动 (在不同分数下如何应对)。假定学生 的实际成绩是不及格
战略表式下的纳什均衡 学生 A, F F, A A, A F,F -1,1|-10,-10-1 10,-10 老师 及格不及格 10,-10 -10,-10
战略表式下的纳什均衡 及 格 不 及 格 老 师 学生 A,F F,A A,A F,F -1,1 -10,-10 -1,1 -10,-10 -10,-10 1,-1 1,-1 -10,-10
不可置信的威胁( noncredible threat 在(及格;A,F)和(不及格;F,A)中 学生“报复(F)”的威胁是不可信的:无论 老师判“及格”还是“不及格”,“报复”不 是学生的最优选择; 事前( ex ante)和事后( ex post:一种战略所规 定的行动在事前看来是最优的,但事后看并不 是当事人的最优选择,这种行动就不可置信, 该战略就不是一个合理的战略
不可置信的威胁(noncredible threat) • 在(及格;A,F)和(不及格;F,A)中, 学生“报复(F)”的威胁是不可信的:无论 老师判“及格”还是“不及格”,“报复”不 是学生的最优选择; • 事前(ex ante)和事后(ex post):一种战略所规 定的行动在事前看来是最优的,但事后看并不 是当事人的最优选择,这种行动就不可置信, 该战略就不是一个合理的战略
精炼纳什均衡( perfect Ne) 不包含不可置信的行动的战略所组成的纳什均 衡被称为“精炼纳什均衡”;也就是说,不论 过去发生了什么,构成精炼纳什均衡的战略, 其所规定的行动在每一个决策点上都是最优的。 所以,又称为“序惯均衡”( sequential equilibrium) 首先必须是“纳什均衡”,但并非所有纳什均 衡都是合理的;只有其战略不包含不可置信行 动的纳什均衡才是合理的
精炼纳什均衡(perfect NE) • 不包含不可置信的行动的战略所组成的纳什均 衡被称为“精炼纳什均衡”;也就是说,不论 过去发生了什么,构成精炼纳什均衡的战略, 其所规定的行动在每一个决策点上都是最优的。 所以,又称为“序惯均衡”(sequential equilibrium); • 首先必须是“纳什均衡”,但并非所有纳什均 衡都是合理的;只有其战略不包含不可置信行 动的纳什均衡才是合理的