正在加载图片...
囚徒困境”的一般表示 支付函数 ·双方都不合作: 合作 合作 ,TS,R 不合作 贴现率 博弈继续的概率 满足:R>D>P>S;(S+R)T+T 一般化:未来收益的重要程度 无名氏定理( Folk Theorem) Tit-for-tat ·在无限次重复博弈中,如果参与人对未 ·纳什均衡,但不是精炼纳什均衡: 来足够重视(δ足够大),那么,任何 程度的合作都可以通过一个特定的子博 (TFT,TFT=7++827+8T+…=T 弈精炼纳什均衡得到。 ·这里“合作程度”定义为整个博弈中合作 V(All-D, TFT)=T+8P+8P+8P+=T+P 出现的频率 ·50年代就人所共知,但无人有发明权; Why Not a perfect NE Axelrod (1984) 假定A在t5的时候,没有合作。根据TFT战 ·Tit-for-tat是成功率最高的战略 略,在t=6, 选择惩罚(不合作)。B会 这样吗? 如果B相信A采取的是TFT战略,那么:如果B 对A实施惩罚,预期的收入流为 R.S.R.S.R ·反之,如果B原谅A, TTTT.T“囚徒困境”的一般表示 合作 不合作 合作 不合作 T,T S,R R,S P,P 满足:R>T>P>S; (S+R)<T+T 支付函数 • 双方都不合作: • 对 的解释: – 贴现率; – 博弈继续的概率; – 二者的结合; – 一般化:未来收益的重要程度 δ δ δ δ − = + + + + = 1 1 (all-d,all-d) ... 2 3 V P P P P P δ 无名氏定理(Folk Theorem) • 在无限次重复博弈中,如果参与人对未 来足够重视( 足够大),那么,任何 程度的合作都可以通过一个特定的子博 弈精炼纳什均衡得到。 • 这里“合作程度”定义为整个博弈中合作 出现的频率。 • 50年代就人所共知,但无人有发明权; δ Tit-for-tat • 纳什均衡,但不是精炼纳什均衡: δ δ δ δ − = + + + + = 1 1 (TFT,TFT) ... 2 3 V T T T T T δ δ δ δ δ − = + + + + = + 1 (All-D,TFT) ... 2 3 V T P P P T P Why Not A Perfect NE • 假定A在t=5的时候,没有合作。根据TFT战 略,在t=6,B应该选择惩罚(不合作)。B会 这样吗? • 如果B相信A采取的是TFT战略,那么:如果B 对A实施惩罚,预期的收入流为: • 反之,如果B原谅A, R, S, R, S, R,... T,T,T,T,T,... Axelrod (1984) • Tit-for-tat 是成功率最高的战略
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有