正在加载图片...
令月叶事法 更的件用 这是 个三个人 与 如与人行 分别 种情成中的一种成发这眼于对参与人过 参与人2说 1拾练贝十斯纳什均豫 §1精练贝叶斯纳什均衡 小有一个推断 参与人的是银的 他与人的这择。每个 ac 条3:在处于均衡路之上的信中,由贝叶 件:对处于均衡路径之外的信事,推斯由贝叶新 法别以及可能情况下的与者的均衡战略定。 3 h a k      h k h k k k h h Pr ob(a , )  p(a  ) p( )  Pr ob  a Pr ob a   k h Pr ob  a h a k             K j h j j h k k h h k k k h p a p p a p ob a p a p ob a 1 ( | ) ( ) ( | ) ( ) Pr { } ( | ) ( ) Pr { | } Pr { | } 代表这个后验概率,即给定 的 情况下, i 属于 类型 的概率 k h ob  a h a k  (贝叶斯法则)  贝叶斯法则  精炼贝叶斯纳什均衡四条要求 要求4: 对处于均衡路径之外的信息集,推断由贝叶斯法则以及可 能情况下的参与者的均衡战略决定。(对精炼贝叶斯均衡再精炼) 分析要求4的作用 这是一个由三个参与人各行动一次 构成的三阶段不完美信息动态博弈。 参与人1在第一阶段从A和B中作出 选择,如果他选择A,则博弈结束,如 果他选择B,则轮到参与人2在第二阶 段在C和D之间作出选择,在第三阶段 由参与人3在E和F之间进行选择。 其中参与人1的行动能被参与人2和3 观测到,但参与人2的行动却不能被参 与入3观测到。 分别用P和(1一P)表示参与人3推断参 与人2选择C和D的概率,那么参与人3 选E的期望支付: P×1十(1一P)×2= 2一P 选F的期望支付:P×3十(1一 P)×1=1十2P因此,当P<1/3时,他会 选择E,当P>1/3时,他会选择F,当P =1/3时,他可选择E或F或混合策略。 那么,他所推断的P究竟是这三种情况中的哪一种情况呢?这取决于他对参与人2的 最优选择的判断。 对参与人2来说,D是相对于C的严格下策,所以参与人2的合理选择必定是C,因 此P=1>1/3,所以参与人3的选择是F。参与人1在第一阶段对第二阶段和第三阶段参 与人2和3的决策思路是清楚的,所以他知道如果自己选择B的话,支付将是3,比选择 A的支付2大,因此,他会选择B。 这样,我们就得到一个策略组合 (B,C,F)与参与人3的推断P=1.从上面的 分析可知,(B,C,F;P=1)是完全符合要 求1到要求3的,并且,由于该策略组合下 不存在均衡路径之外的信息集,因此要求 4也就自动满足,从而我们说(B,C,F;P= 1)是该博弈的完美贝叶斯纳什均衡。 下面考虑策略组合(A,C,E)及相应的推断P=0. 首先,(A,C,E;P=0)是一个纳什均衡,因为任何一个参与人都不可能 通过单独改变自己的策略使自己的支付得到改善; 其次,用要求1到要求3来衡量它也是满足的。但是,它却不是子博弈完美 的,因为该博弈只有惟一的子博弈,并且根据上面的分析,它的惟一的纳什均 衡是(C,F),而不是(C,E)。 产生这—现象的原因就在于要求4没 有满足。在(A,C,E;P=0)下,均衡路径 就是第一阶段参与人1选择A,博弈结束, 参与人2和3的策略C和E及推断P=0都不在 均衡路径上,即存在均衡路径之外的信息 集,对于参与人3在该信息集上的推断P=0, 要求1到要求3没有任何的限制,而根据要 求4,参与人3的推断决定于参与人2的合理 选择:如果参与人2选择C,则参与人3的推 断必须是P=1,如果参与人2选择D,则参 与人3的推断必须是P=0。 纳什均衡(A,C,E;P=0)中,恰恰就是参与人3的推断P=0与参与人2的选 择C不相符合。因此,以要求4来衡量,纳什均衡(A,C,E;P=0)是不合理的 均衡(主要是推断不合理),应该予以剔除。 §1精练贝叶斯纳什均衡 条件1:在每一个信息集上,轮到行动的参与人必须对 博弈进行到该信息集中各个决策节点的可能性大 小有一个推断。 条件2:给定参与人的推断和其他参与人的选择,每个 参与人的战略是最优的 条件3:在处于均衡路径之上的信息集中,推断由贝叶 斯法则及参与人的均衡战略给出 条件4:对处于均衡路径之外的信息集,推断由贝叶斯 法则以及可能倩况下的参与者的均衡战略决定。 §1精练贝叶斯纳什均衡
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有