第6章 重复博弈与合作行为 张维迎教授 北京大学光华管理学院
第6章 重复博弈与合作行为 张维迎 教授 北京大学光华管理学院
序惯博弈与重复博弈 ·序惯博弈( sequential game):参与人在前一个决 策点的选择决定随后的子博弈的结构,因此, 从后一个决策点开始的子博弈不同于从前一个 决策点开始的子博弈,或者说,同样结构的子 博弈只出现一次; 重复博弈( repeated game):同样结构的博弈重 复多次,其中的每次博弈被称为“阶段博弈” stage game
序惯博弈与重复博弈 • 序惯博弈(sequential game):参与人在前一个决 策点的选择决定随后的子博弈的结构,因此, 从后一个决策点开始的子博弈不同于从前一个 决策点开始的子博弈,或者说,同样结构的子 博弈只出现一次; • 重复博弈(repeated game):同样结构的博弈重 复多次,其中的每次博弈被称为“阶段博弈” (stage game)
重复博弈的三个特征 阶段博弈之间没有物质上的联系,也就 是说,前一阶段的博弈不改变后一阶段 的结构 士口 所有参与人观察到博弈过去的历史; 参与人的总支付(报酬)是所有阶段博 弈支付的贴现值之和;
重复博弈的三个特征 • 阶段博弈之间没有物质上的联系,也就 是说,前一阶段的博弈不改变后一阶段 的结构; • 所有参与人观察到博弈过去的历史; • 参与人的总支付(报酬)是所有阶段博 弈支付的贴现值之和;
重复博弈和信誉问题 如果博弈不是一次的,而是重复进行的,参与 人过去行动的历史是可以观察到的,参与人就 可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能 与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作 行为提供了理性解释;在囚徒困境中,一次博 弈的唯一均衡是不合作(即坦白)。但如果博 弈无限重复,合作就可能出现
重复博弈和信誉问题 • 如果博弈不是一次的,而是重复进行的,参与 人过去行动的历史是可以观察到的,参与人就 可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能 与一次博弈大不相同。 • 重复博弈理论的最大贡献是对人们之间的合作 行为提供了理性解释;在囚徒困境中,一次博 弈的唯一均衡是不合作(即坦白)。但如果博 弈无限重复,合作就可能出现
囚徒困境博弈 B 合作 不合作 A 合作不合作 4
囚徒困境博弈 合作 不合作 合 作 不 合 作 3,3 -1,4 4,-1 0,0 A B
重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人 有多个可以选择的战略:仅举几例 AlD:不论过去什么发生,总是选择不合作; AC:不论过去什么发生,总是选择合作; 合作不合作交替进行; ·tit- for-tat:从合作开始,之后每次选择对方前一阶段的 行动; trigger strategies:从合作开始,一直到有一方不合作, 然后永远选择不合作
重复博弈与战略空间的扩展 • 假定上属博弈重复多次或无限次;那么,每个参与人 有多个可以选择的战略:仅举几例: • All-D: 不论过去什么发生,总是选择不合作; • All-C: 不论过去什么发生,总是选择合作; • 合作-不合作交替进行; • tit-for-tat: 从合作开始,之后每次选择对方前一阶段的 行动; • trigger strategies: 从合作开始,一直到有一方不合作, 然后永远选择不合作
“囚徒困境”的一般表示 合作 不合作 作 S, R 不合作 R, S 满足:R>T>P>S;(S+RT+T
“囚徒困境”的一般表示 合作 不合作 合作 不合作 T,T S,R R,S P,P 满足:R>T>P>S; (S+R)<T+T
支付函数 双方都不合作 丿(al-d,ll-d)=P+8P+82P+δ3P+…=P 1-δ 对δ的解释: 贴现率; 博弈继续的概率; 者的结合; 般化:未来收益的重要程度
支付函数 • 双方都不合作: • 对 的解释: – 贴现率; – 博弈继续的概率; – 二者的结合; – 一般化:未来收益的重要程度 − = + + + + = 1 1 (all - d,all - d) ... 2 3 V P P P P P
无名氏定理( Folk theorem) 在无限次重复博弈中,如果参与人对未 来足够重视(δ足够大),那么,任何 程度的合作都可以通过一个特定的子博 弈精炼纳什均衡得到。 这里“合作程度”定义为整个博弈中合 作出现的频率。 50年代就人所共知,但无人有发明权;
无名氏定理(Folk Theorem) • 在无限次重复博弈中,如果参与人对未 来足够重视( 足够大),那么,任何 程度的合作都可以通过一个特定的子博 弈精炼纳什均衡得到。 • 这里“合作程度”定义为整个博弈中合 作出现的频率。 • 50年代就人所共知,但无人有发明权;
Tit-for -tat 纳什均衡,但不是精炼纳什均衡: (TFT,TFT)=T+8+827+637+…=7 1-δ (A-D,TFT)=T+8P+82P+δ3P+…=T+P
Tit-for-tat • 纳什均衡,但不是精炼纳什均衡: − = + + + + = 1 1 (TFT, TFT) ... 2 3 V T T T T T − = + + + + = + 1 (All - D,TFT) ... 2 3 V T P P P T P