不完全信息 单方不完全信息 ·KMRW模型(1982) ·假定有两个参与人,A和B,进行囚徒困 如果参与人对其他参与人的效用函数和 境博弈。如下图 战略空间的信息不完全,即使博弈重复 ·参与人A有两种可能的类型:“非理性” 的次数是有限的,人们也有积极性建立 型:只有一种战略,tit- for -tat(TFT),或 一个合作的声誉( (reputation),合作会出 者 grim strategy,概率为p;“理性”型:可 以选择任何战略,概率为(1-p) 参与人B有一种类型:理性型。 对“非理性”的解释 囚徒困境博弈 ·特殊的成本函数或效用函数 ·讲义气、重情谊的人;内在化了 背叛 reciprocity社会规范的人 认知问题 1,4 博弈重复两次 第2阶段 ·参与人A:如果是理性的,选择“背叛”; 如果是非理性的,选择B在第1阶段的行 动 性型1)背叛 参与人B:选择“背叛 B(理性型)X不完全信息 • KMRW模型(1982); • 如果参与人对其他参与人的效用函数和 战略空间的信息不完全,即使博弈重复 的次数是有限的,人们也有积极性建立 一个合作的声誉(reputation),合作会出 现。 单方不完全信息 • 假定有两个参与人,A和B,进行囚徒困 境博弈。如下图。 • 参与人A有两种可能的类型:“非理性” 型:只有一种战略,tit-for-tat (TFT),或 者grim strategy, 概率为p;“理性”型:可 以选择任何战略,概率为(1-p); • 参与人B有一种类型:理性型。 对“非理性”的解释 • 特殊的成本函数或效用函数; • 讲义气、重情谊的人;内在化了 reciprocity 社会规范的人; • 认知问题; 囚徒困境博弈 合作 背叛 合作背叛 3,3 -1,4 4,-1 0,0 A B 博弈重复两次 t=1 t=2 A 非理性(p) 理性型(1-p) B (理性型) 合作 X 背叛 背叛 X 背叛 第2阶段 • 参与人A:如果是理性的,选择“背叛”; 如果是非理性的,选择B在第1阶段的行 动(X); • 参与人B:选择“背叛