北京大学：《博弈与社会》第6章重复博弈与信誉

一、序惯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次; 二、重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game).

团购合买资源类别：文库，文档格式：PPT，文档页数：43，文件大小：173KB

第6章重复博弈与合作行为张维迎教授北京大学光华管理学院

序惯博弈与重复博弈 ·序惯博弈( sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此, 从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次; 重复博弈( repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” stage game

序惯博弈与重复博弈 • 序惯博弈(sequential game)：参与人在前一个决策点的选择决定随后的子博弈的结构，因此，从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈，或者说，同样结构的子博弈只出现一次； • 重复博弈(repeated game)：同样结构的博弈重复多次，其中的每次博弈被称为“阶段博弈” (stage game)

重复博弈的三个特征阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构士口所有参与人观察到博弈过去的历史; 参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;

重复博弈的三个特征 • 阶段博弈之间没有物质上的联系，也就是说，前一阶段的博弈不改变后一阶段的结构； • 所有参与人观察到博弈过去的历史； • 参与人的总支付（报酬）是所有阶段博弈支付的贴现值之和；

重复博弈和信誉问题如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现

重复博弈和信誉问题 • 如果博弈不是一次的，而是重复进行的，参与人过去行动的历史是可以观察到的，参与人就可以将自己的选择依赖于其他人之前的行动，因而有了更多的战略可以选择，均衡结果可能与一次博弈大不相同。 • 重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释；在囚徒困境中，一次博弈的唯一均衡是不合作（即坦白）。但如果博弈无限重复，合作就可能出现

囚徒困境博弈 B 合作不合作 A 合作不合作 4

囚徒困境博弈合作不合作合作不合作 3，3 -1，4 4，-1 0，0 A B

重复博弈与战略空间的扩展假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例 AlD:不论过去什么发生,总是选择不合作; AC:不论过去什么发生,总是选择合作; 合作不合作交替进行; ·tit- for-tat:从合作开始,之后每次选择对方前一阶段的行动; trigger strategies:从合作开始,一直到有一方不合作, 然后永远选择不合作

重复博弈与战略空间的扩展 • 假定上属博弈重复多次或无限次；那么，每个参与人有多个可以选择的战略：仅举几例： • All-D: 不论过去什么发生，总是选择不合作； • All-C: 不论过去什么发生，总是选择合作； • 合作-不合作交替进行； • tit-for-tat: 从合作开始，之后每次选择对方前一阶段的行动； • trigger strategies: 从合作开始，一直到有一方不合作，然后永远选择不合作

“囚徒困境”的一般表示合作不合作作 S, R 不合作 R, S 满足:R>T>P>S;(S+RT+T

“囚徒困境”的一般表示合作不合作合作不合作 T，T S，R R，S P，P 满足：R>T>P>S; (S+R)<T+T

支付函数双方都不合作丿(al-d,ll-d)=P+8P+82P+δ3P+…=P 1-δ 对δ的解释: 贴现率; 博弈继续的概率; 者的结合; 般化:未来收益的重要程度

支付函数 • 双方都不合作： • 对的解释： – 贴现率； – 博弈继续的概率； – 二者的结合； – 一般化：未来收益的重要程度     − = + + + + = 1 1 (all - d,all - d) ... 2 3 V P P P P P 

无名氏定理( Folk theorem) 在无限次重复博弈中,如果参与人对未来足够重视(δ足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。这里“合作程度”定义为整个博弈中合作出现的频率。 50年代就人所共知,但无人有发明权;

无名氏定理(Folk Theorem) • 在无限次重复博弈中，如果参与人对未来足够重视（足够大），那么，任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到。 • 这里“合作程度”定义为整个博弈中合作出现的频率。 • 50年代就人所共知，但无人有发明权； 

Tit-for -tat 纳什均衡,但不是精炼纳什均衡: (TFT,TFT)=T+8+827+637+…=7 1-δ (A-D,TFT)=T+8P+82P+δ3P+…=T+P

Tit-for-tat • 纳什均衡，但不是精炼纳什均衡：     − = + + + + = 1 1 (TFT, TFT) ... 2 3 V T T T T T      − = + + + + = + 1 (All - D,TFT) ... 2 3 V T P P P T P

点击下载完整版文档（PPT格式）

共43页，可试读15页，点击继续阅读 ↓↓

点击下载（PPT格式）

浏览记录