第7章 不完全信息与声誉 张维迎教授 北京大学光华管理学院
第7章 不完全信息与声誉 张维迎 教授 北京大学光华管理学院
有限次博弈 第6章证明,只要未来足够重要,合作 为可以是无限次重复博弈的精炼纳什均 衡 但是,现实中许多博弈是有限次的,不 是无限次的 ·如果博弈重复的次数是有限的,无论重 复多少次,合作都不会出现
有限次博弈 • 第6章证明,只要未来足够重要,合作行 为可以是无限次重复博弈的精炼纳什均 衡。 • 但是,现实中许多博弈是有限次的,不 是无限次的。 • 如果博弈重复的次数是有限的,无论重 复多少次,合作都不会出现
“连锁店悖论”( ( chain- store paradox) Selten(1978) (40,50) 默许 在位者 进入 斗争 进入者 (-10,0) 不进入 (0,100)
“连锁店悖论”(chain-store paradox) • Selten (1978); 进入者 在位者 进入 不进入 默许 斗争 (40,50) (-10,0) (0,100)
逆向归纳 假定在位者有20个市场。直观告诉我们, 如果进入者在第一个市场进入,在位者 应该选择斗争,因为尽管从一个市场看, 斗争是不值得的,但这样做可以遏止进 入者在其他市场上的进入。 唯一的精炼纳什均衡是:进入者总是进 入;在位者总是默许
逆向归纳 • 假定在位者有20个市场。直观告诉我们, 如果进入者在第一个市场进入,在位者 应该选择斗争,因为尽管从一个市场看, 斗争是不值得的,但这样做可以遏止进 入者在其他市场上的进入。 • 唯一的精炼纳什均衡是:进入者总是进 入;在位者总是默许
Axelrod实验 Axelrod(1981)实验表明:即使在有限 次博弈中,合作行为也频繁出现
Axelrod 实验 • Axelrod(1981)实验表明:即使在有限 次博弈中,合作行为也频繁出现
问题在哪里? 一个可能的原因在于:我们前面假定不仅参与 人的理性是共同知识,而且每个参与人可以选 择的战略和效用函数都是共同知识。但现实不 是这样。 ·可能性:逆向归纳方法的问题(理性共识); 信息不完全 正如我们前面讨论的谈判情况:如果信息是完 全的,谈判一开始就达成协议,但现实中的谈 判不是这样,原因在于信息不对称
问题在哪里? • 一个可能的原因在于:我们前面假定不仅参与 人的理性是共同知识,而且每个参与人可以选 择的战略和效用函数都是共同知识。但现实不 是这样。 • 可能性:逆向归纳方法的问题(理性共识); 信息不完全; • 正如我们前面讨论的谈判情况:如果信息是完 全的,谈判一开始就达成协议,但现实中的谈 判不是这样,原因在于信息不对称
不完全信息 KMRW模型(1982); 如果参与人对其他参与人的效用函数和 战略空间的信息不完全,即使博弈重复 的次数是有限的,人们也有积极性建立 个合作的声誉( reputation),合作会出现
不完全信息 • KMRW模型(1982); • 如果参与人对其他参与人的效用函数和 战略空间的信息不完全,即使博弈重复 的次数是有限的,人们也有积极性建立 一个合作的声誉(reputation),合作会出现
单方不完全信息 假定有两个参与人,A和B,进行囚徒困 境博弈。如下图。 参与人A有两中可能的类型:“非理性” 型:只有一种战略, tit-for-tat(TFT),或 者 grim strategy.,概率为p“理性”型:可 以选择任何战略,概率为(1-p); ·参与人B有一种类型:理性型
单方不完全信息 • 假定有两个参与人,A和B,进行囚徒困 境博弈。如下图。 • 参与人A有两中可能的类型:“非理性” 型:只有一种战略,tit-for-tat (TFT),或 者grim strategy, 概率为p; “理性”型:可 以选择任何战略,概率为(1-p); • 参与人B有一种类型:理性型
对“非理性”的解释 特殊的成本函数或效用函数; 讲义气、重情谊的人;内在化了 reciprocity社会规范的人: 认知问题;
对“非理性”的解释 • 特殊的成本函数或效用函数; • 讲义气、重情谊的人;内在化了 reciprocity 社会规范的人; • 认知问题;
囚徒困境博弈 B 合作 背叛 A 合作背叛 4
囚徒困境博弈 合作 背叛 合 作 背 叛 3,3 -1,4 4,-1 0,0 A B