序惯博弈与重复博弈 ·序惯博弈( sequential game):参与人在前一个决 策点的选择决定随后的子博弈的结构,因此, 从后一个决策点开始的子博弈不同于从前一个 决策点开始的子博弈,或者说,同样结构的子 博弈只出现一次; 重复博弈( repeated game):同样结构的博弈重 复多次,其中的每次博弈被称为“阶段博弈” stage game
序惯博弈与重复博弈 • 序惯博弈(sequential game):参与人在前一个决 策点的选择决定随后的子博弈的结构,因此, 从后一个决策点开始的子博弈不同于从前一个 决策点开始的子博弈,或者说,同样结构的子 博弈只出现一次; • 重复博弈(repeated game):同样结构的博弈重 复多次,其中的每次博弈被称为“阶段博弈” (stage game)
重复博弈的三个特征 阶段博弈之间没有物质上的联系,也就 是说,前一阶段的博弈不改变后一阶段 的结构 士口 所有参与人观察到博弈过去的历史; 参与人的总支付(报酬)是所有阶段博 弈支付的贴现值之和;
重复博弈的三个特征 • 阶段博弈之间没有物质上的联系,也就 是说,前一阶段的博弈不改变后一阶段 的结构; • 所有参与人观察到博弈过去的历史; • 参与人的总支付(报酬)是所有阶段博 弈支付的贴现值之和;
重复博弈和信誉问题 如果博弈不是一次的,而是重复进行的,参与 人过去行动的历史是可以观察到的,参与人就 可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能 与一次博弈大不相同。 重复博弈理论的最大贡献是对人们之间的合作 行为提供了理性解释;在囚徒困境中,一次博 弈的唯一均衡是不合作(即坦白)。但如果博 弈无限重复,合作就可能出现
重复博弈和信誉问题 • 如果博弈不是一次的,而是重复进行的,参与 人过去行动的历史是可以观察到的,参与人就 可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能 与一次博弈大不相同。 • 重复博弈理论的最大贡献是对人们之间的合作 行为提供了理性解释;在囚徒困境中,一次博 弈的唯一均衡是不合作(即坦白)。但如果博 弈无限重复,合作就可能出现
重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人 有多个可以选择的战略:仅举几例 AlD:不论过去什么发生,总是选择不合作; AC:不论过去什么发生,总是选择合作; 合作不合作交替进行; ·tit- for-tat:从合作开始,之后每次选择对方前一阶段的 行动; trigger strategies:从合作开始,一直到有一方不合作, 然后永远选择不合作
重复博弈与战略空间的扩展 • 假定上属博弈重复多次或无限次;那么,每个参与人 有多个可以选择的战略:仅举几例: • All-D: 不论过去什么发生,总是选择不合作; • All-C: 不论过去什么发生,总是选择合作; • 合作-不合作交替进行; • tit-for-tat: 从合作开始,之后每次选择对方前一阶段的 行动; • trigger strategies: 从合作开始,一直到有一方不合作, 然后永远选择不合作
“囚徒困境”的一般表示 合作 不合作 作 S, R 不合作 R, S 满足:R>T>P>S;(S+RT+T
“囚徒困境”的一般表示 合作 不合作 合作 不合作 T,T S,R R,S P,P 满足:R>T>P>S; (S+R)<T+T
支付函数 双方都不合作 丿(al-d,ll-d)=P+8P+82P+δ3P+…=P 1-δ 对δ的解释: 贴现率; 博弈继续的概率; 者的结合; 般化:未来收益的重要程度
支付函数 • 双方都不合作: • 对 的解释: – 贴现率; – 博弈继续的概率; – 二者的结合; – 一般化:未来收益的重要程度 − = + + + + = 1 1 (all - d,all - d) ... 2 3 V P P P P P