第五章不完全信息动施博弃 81精练贝十斯纳什均衔 在不全信息弈中,少有一个博弃参 1精练贝叶新纳什均街 者对博痒的、博参与者赛型、博罪状 信息不完全了解。 §2信号博弃 。博环参与者的行存在先后顺序。 。与不突会信息静恋博痱侧似,可以通过海严尼转 热将不金信息博廉转化为光金但不美信 息时友博弃。 §1精练贝叶斯纳什均衡 §1精练贝叶斯纳什均衡 人不 “自”首无选参 香,个参与人的行 利用 。 §1粉练贝叶斯纳什均衡 §1粉练贝叶撕纳什均衡 不不 7入:
1 第五章 不完全信息动态博弈 §1精练贝叶斯纳什均衡 §2信号博弈 在不完全信息动态博弈中,至少有一个博弈参与 者对博弈的结构、博弈参与者类型、博弈收益等 信息不完全了解。 博弈参与者的行动存在先后顺序。 与不完全信息静态博弈类似,可以通过海萨尼转 换将不完全信息动态博弈转化为完全但不完美信 息动态博弈。 §1精练贝叶斯纳什均衡 §1精练贝叶斯纳什均衡 用博弈树表示完全且完美信息的动态博弈,其中博弈树上 的每个节点就是一个独立的决策节,表示参与人在该时点对此 前的博弈过程有完全的了解。 而在不完全信息动态博弈中,“自然”首先选择参与人的 类型,相应的参与人知道自己的类型,其他参与人不知道;在 自然的选择之后,参与人开始序贯行动,后行为者能观测到先 行为者的行动,但无法观测到先行为者的类型,从而产生不完 美信息,对此,我们在博弈树上用多节点的信息集来反映。 (一)多节点信息集和不完美信息动态博弈的表示 不完全信息动态博弈的基本思路: 1、“自然”首先选择参与人的类型,参与人自己知道,其他参与人不知道, 但参与人类型的概率分布(也称为“先验信念”)是公共知识; 2、在自然行动以后,参与人开始行动,参与人的行动有先有后,后行动者 能观测到先行动者的行动,但不能观测到先行动者的类型。 3、后行动者可以通过观察先行动者所选择的行动来推断或修正对其类型的 先验信念(这是由于:参与人的行动是类型依存的,每个参与人的行动 都传递着有关自己类型的某种信息。但是,先行动者预测到自己的行动 将被后行动者所利用,也会设法选择传递对自己最有利的信息,避免传 递对自己不利的信息),从而形成后行动者的后验信念。 4、因此,博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正 信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精炼纳什均衡 和不完全信息静态博弈贝叶斯纳什均衡的结合。 §1精练贝叶斯纳什均衡 参与者1在3个行动中进行选择——L、M及R。如果参与者1选择R,则博弈 结束。如果参与者1选择了L或M,则参与者2就会知道1没有选择R(但不清楚 1是选择了L还是M),并在或L' 或R' 两个行动中进行选挥,博弈随之结束。 考虑如下完全不完美信息动态博弈 纳什均衡(L,L’)、和(R,R’),也是子博弈精炼纳什均衡(因为没有子博弈)。 然而, (R,R’)却明显要依赖于一个不可信的威胁:如果博弈进入参与者2的信息 集,L’严格优于R‘,选择R’不是序贯理性的;因此参与者1不会由于2威胁他将在其 后的行动中选择R' ,而去选择R。 §1精练贝叶斯纳什均衡 对于不完全信息动态博弈,由于子博弈精炼均衡同样未能 排除不可信的威胁和许诺,我们需要对其进一步强化(即加强 对条件的要求),并把强化后的子博弈精炼纳什均衡称为精炼 贝叶斯纳什均衡,简称为精炼(完美)贝叶斯均衡。 因此,用更为广义的后续博弈的概念来代替子博弈的概念。 前面我们已经定义过的子博弈必须开始于单节点信息集,并且 不能分割信息集,与之不同的是“后续博弈”是指从任何信息 集(不论是单节点的还是包含多节点的)开始的动态博弈的后 续部分。 对动态博弈进行分析,可信性问题始终是一个中心问题, 一个理想的均衡必须是排除了所有不可信的威胁和许诺的。 §1精练贝叶斯纳什均衡
§1精练贝叶斯纳什均衡 g房是,一 §1精练贝叶斯纳什均衡 §1精练贝叶斯纳什均衡 精贝叶新什均衡另外两条 行商 。贝叶斯法则 计 者色霸是人设商 (prior pr §1精练贝十斯纳什均衡附 贝叶斯法测 民2a分装 7arin西 本是≥0.之p)-1:哈定:限子f选择士n条行 e中之心中事么是aa I-PA -+pla"l 叶紧法周,1认为属于高本型约瓶车变为
2 为使均衡概念得到进一步强化,以排除上例中像(R,R’)的子博弈纳 什均衡,要附加以下两个要求。 要求1:在每一个信息集上,轮到行动的参与人必须对博弈进行到该 信息集中各个决策节点的可能性大小有一个推断(belief)。对于非单节 点信息集,推断就是在信息集中关于不同决策节点的一个概率分布;对 于单节点的信息集,参与者的推断就是博弈到达此单一决策节点的概率 等于1。(每一个参与人的信息集上有一个概率分布) 要求2:给定参与人的推断,参与人的策略必须满足序贯理性 (sequentially rationally)的。即在每一信息集中,给定轮到行动的参 与人在此信息集中的推断,以及其他参与人的后续策略(指从给定信息集 开始的参与人在后续博弈中的完备的行动计划),该参与人的行动必须是 最优的。(给定概率分布和其他参与人的选择,每个参与人的战略是最优 的) 精炼贝叶斯纳什均衡四条要求 §1精练贝叶斯纳什均衡 要求1意味着如果博弈的进行达到参与者2 的非单节信息集,则参与者2必须对具体到达 哪一个节(也就是参与者1选择了L还是R)有一个 推断。这样的推断就表示为到达两个节的概率 p和1-p 用精炼贝叶斯均衡剔除不可置信威胁(R,R’) 要求1 :每一个参与人的信息集上各节点有 一个推断(概率分布); 要求2:给定参与人的推断,参与人的策略必 须满足序贯理性。 p 0 (1 p)1 1 p 因此,这个博弈的唯一的精炼贝叶斯均衡是((L,L’;p=1) 精炼贝叶斯纳什均衡另外两条要求 要求3: 在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与人的均衡 战略给出。(概率分布是使用贝叶斯法则从最优战略和观测到的行动得到的(在 可能的情况下) §1精练贝叶斯纳什均衡 贝叶斯法则 贝叶斯法则:是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即 先验概率)进行修正的标准方法。 在日常生活中,当面临不确定性时,在任何一个时点上,我 们对某件事情的可能性有一个判断。然后,我们会根据新的 信息来修正这个判断。统计学上,修正之前的判断称为“先 验概率”(prior probability),修正之后的判断称为“后验概 率”(posterior probability)。贝叶斯法则正是人们根据新的 信息从先验概率到后验概率的基本方法。 §1精练贝叶斯纳什均衡 现就市场进入一例进行分析,假设Ⅰ在打算进入之前对II的类型及分布概率一无所知,但Ⅰ知道,如果是高 成本型A则阻挠(B)概率是20%,如果是低成本型则阻挠概率是100%,那么他将采取怎样的战略呢 高成本 A 低成本 默许 B阻挠20% 默许 阻挠100% Ⅰ 进入 40,50 -10,0 30,100 -10,140 不进入 0,300 0,300 0,400 0,400 例:市场进入博弈 博弈开始时,Ⅰ认为Ⅱ属于高成本型A的概率是70%。 因此,Ⅰ认为自己在进入市场时受到阻挠的概率是: 0.7×0.2+0.3×1=0.44 当Ⅰ进入市场时,确实是A阻挠,根据贝叶斯法则,Ⅰ认为Ⅱ为高成本型A的概率变为: (0.7×0.2)/0.44=0.32 根据这一新概率, Ⅰ估计自己再进入市场时受到阻挠的概率变为: 0.32×0.2+0.68×1=0.744 如果Ⅰ再次试探, Ⅱ又进行了阻挠,根据贝叶斯法则,Ⅰ认为II属于高成本型的概率变为: (0.32×0.2)/0.744=0.086 这样,随着一次次试探及阻挠, 对A的判断逐渐变化,越来越倾向将Ⅱ判断为低成本 型企业。 Ⅱ P(B / A) 0.2 P(B / A) 1 P(A) 0.7 P(B) P(B / A)P(A) P(B / A)P(A) P(A/B) P(AB)/P(B) P(B / A)P(A)/P(B) 贝叶斯法则 k h a h a k ( ) h k p a ( ) 1 h h k p a h a K k h h h K K h k k ob a p a p p a p p a p 1 1 1 Pr { } ( | ) ( ) ( | ) ( ) ( | ) ( ) h a h a ( ) k P ( ) h k p a §1精练贝叶斯纳什均衡
令月叶事法 更的件用 这是 个三个人 与 如与人行 分别 种情成中的一种成发这眼于对参与人过 参与人2说 1拾练贝十斯纳什均豫 §1精练贝叶斯纳什均衡 小有一个推断 参与人的是银的 他与人的这择。每个 ac 条3:在处于均衡路之上的信中,由贝叶 件:对处于均衡路径之外的信事,推斯由贝叶新 法别以及可能情况下的与者的均衡战略定
3 h a k h k h k k k h h Pr ob(a , ) p(a ) p( ) Pr ob a Pr ob a k h Pr ob a h a k K j h j j h k k h h k k k h p a p p a p ob a p a p ob a 1 ( | ) ( ) ( | ) ( ) Pr { } ( | ) ( ) Pr { | } Pr { | } 代表这个后验概率,即给定 的 情况下, i 属于 类型 的概率 k h ob a h a k (贝叶斯法则) 贝叶斯法则 精炼贝叶斯纳什均衡四条要求 要求4: 对处于均衡路径之外的信息集,推断由贝叶斯法则以及可 能情况下的参与者的均衡战略决定。(对精炼贝叶斯均衡再精炼) 分析要求4的作用 这是一个由三个参与人各行动一次 构成的三阶段不完美信息动态博弈。 参与人1在第一阶段从A和B中作出 选择,如果他选择A,则博弈结束,如 果他选择B,则轮到参与人2在第二阶 段在C和D之间作出选择,在第三阶段 由参与人3在E和F之间进行选择。 其中参与人1的行动能被参与人2和3 观测到,但参与人2的行动却不能被参 与入3观测到。 分别用P和(1一P)表示参与人3推断参 与人2选择C和D的概率,那么参与人3 选E的期望支付: P×1十(1一P)×2= 2一P 选F的期望支付:P×3十(1一 P)×1=1十2P因此,当P<1/3时,他会 选择E,当P>1/3时,他会选择F,当P =1/3时,他可选择E或F或混合策略。 那么,他所推断的P究竟是这三种情况中的哪一种情况呢?这取决于他对参与人2的 最优选择的判断。 对参与人2来说,D是相对于C的严格下策,所以参与人2的合理选择必定是C,因 此P=1>1/3,所以参与人3的选择是F。参与人1在第一阶段对第二阶段和第三阶段参 与人2和3的决策思路是清楚的,所以他知道如果自己选择B的话,支付将是3,比选择 A的支付2大,因此,他会选择B。 这样,我们就得到一个策略组合 (B,C,F)与参与人3的推断P=1.从上面的 分析可知,(B,C,F;P=1)是完全符合要 求1到要求3的,并且,由于该策略组合下 不存在均衡路径之外的信息集,因此要求 4也就自动满足,从而我们说(B,C,F;P= 1)是该博弈的完美贝叶斯纳什均衡。 下面考虑策略组合(A,C,E)及相应的推断P=0. 首先,(A,C,E;P=0)是一个纳什均衡,因为任何一个参与人都不可能 通过单独改变自己的策略使自己的支付得到改善; 其次,用要求1到要求3来衡量它也是满足的。但是,它却不是子博弈完美 的,因为该博弈只有惟一的子博弈,并且根据上面的分析,它的惟一的纳什均 衡是(C,F),而不是(C,E)。 产生这—现象的原因就在于要求4没 有满足。在(A,C,E;P=0)下,均衡路径 就是第一阶段参与人1选择A,博弈结束, 参与人2和3的策略C和E及推断P=0都不在 均衡路径上,即存在均衡路径之外的信息 集,对于参与人3在该信息集上的推断P=0, 要求1到要求3没有任何的限制,而根据要 求4,参与人3的推断决定于参与人2的合理 选择:如果参与人2选择C,则参与人3的推 断必须是P=1,如果参与人2选择D,则参 与人3的推断必须是P=0。 纳什均衡(A,C,E;P=0)中,恰恰就是参与人3的推断P=0与参与人2的选 择C不相符合。因此,以要求4来衡量,纳什均衡(A,C,E;P=0)是不合理的 均衡(主要是推断不合理),应该予以剔除。 §1精练贝叶斯纳什均衡 条件1:在每一个信息集上,轮到行动的参与人必须对 博弈进行到该信息集中各个决策节点的可能性大 小有一个推断。 条件2:给定参与人的推断和其他参与人的选择,每个 参与人的战略是最优的 条件3:在处于均衡路径之上的信息集中,推断由贝叶 斯法则及参与人的均衡战略给出 条件4:对处于均衡路径之外的信息集,推断由贝叶斯 法则以及可能倩况下的参与者的均衡战略决定。 §1精练贝叶斯纳什均衡
§1精练贝叶斯纳什均衡 §1精练贝叶斯纳什均衡 于与人 情林贝对赛均南是一个策略组合物-心心形和一个后 与人,在每一个售惠集 奥上,来件1到件为共门我供了发精 S2信号博弈 §2信号博弃 4 4 金套 §2信号博弃 Z. 新,再带还然收者的最化行为便十分简年 2a.2"《m.n -...( EU,(m,-∑,n门如》
4 上述四个要求中,条件2要求参与人在一个特定信息集上的 行动依赖于参与人在该信息集的推断,而条件3或条件4又要求 参与人的推断依赖于博弈树更上端的参与人的行动,但条件2又 要求这些在博弈树上更上端的参与人的行动部分地依赖于随后 参与人的行动。 这样的循环依赖意味着通过博弈树进行逆推归纳求解,精炼 贝叶斯纳什均衡将不像在完全且完美信息动态博弈中确定子博 弈精炼纳什均衡那样顺利(—般情况而言)。 事实上,条件1到条件4为我们提供了确定精炼叶斯纳什均衡 的思路和方法,我们以这四个条件为依据和标准并结合具体的 特点来分析确定精炼贝叶斯纳什均衡。 §1精练贝叶斯纳什均衡 精炼贝叶斯均衡是一个策略组合 * * * 1 1 ( ) ( ( ), , ( )) n n s s s 和一个后 验概率组合 1 ( , , ) n p p p ,满足: 1、精炼条件:对于所有的参与人 i,在每一个信息集 h, * ( , ) arg max ( | ) ( , , ) i h i i i i i i i i i i s s s p a u s s 2、贝叶斯法则: ( | ) h i i i p a 是使用贝叶斯法则从先验概率 ( | ) i i i p 观测到的 h i a 和最优策略 * i s 得到的。 精炼贝叶斯均衡定义为: §1精练贝叶斯纳什均衡 §2信号博弈 信号博弈(signaling games) 接收者战略 1.如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a1; 2.如果发送者选择信号m1,选择行动a1;如果发送者选择信号m2,选择行动a2; 3.如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a1; 4.如果发送者选择信号m1,选择行动a2;如果发送者选择信号m2,选择行动a2; 发送者战略 1.如果自然赋予类型t1 ,选择信号m1; 如果自然赋予类型t2,选择信号m1; 2.如果自然赋予类型t1 ,选择信号m1; 如果自然赋予类型t2,选择信号m2; 3.如果自然赋予类型t1 ,选择信号m2; 如果自然赋予类型t2,选择信号m1; 4.如果自然赋予类型t1 ,选择信号m2; 如果自然赋予类型t2,选择信号m2; §2信号博弈 (1)混同(pooling)战略:指信号发送者在不同类型下部发出 相同的信号。因而,信号接收者无法从观测到的信号中得到新 的信息,也就无法对先验概率进行修正。 信号博弈战略可以划分为三类 (3)分离(separating)战略:指信号发送者针对不同的类型 完全选择不同的信号。这类策略中,信号准确地表现类型,接 收者可以通过所观测到的信号准确地判断出发送者的类型。 (2)准分离(semi-separating)战略:指信号发送者对某些 类型选择特定的信号,而对另—些类型则随机地选择信号。 这时,信号接收者观测到某些信号能够准确地判断出发送者 的类型,而观测到另外某些信号时尽管不能完全判断出发送 者的类型,但是能够据以修正自己的先验概率。 §2信号博弈 信号传递博弈精练贝叶斯均衡 * ( ) a r g m a x [ , , ( ) ] [ , , ( ) ] [ , , ( ) ] ( ) k i j R i j K j a R i j K j R i j k j i j t T a m E U t m a m E U t m a m u t m a m t m §2信号博弈
S2信号博弃 §2信号博弃 m3-) p6k,- p--言p=,kmu) 5o 索异奇和的资】 §2信号博弈 82信号博弈 的 不的 §2信号博弃 §2信号博弈 强分离均《 一光卷型的 W)->
5 §2信号博弈 对于信号发送者,如果发送者的战略是混同的或准分离的、 分离的,我们就称均衡分别为混同的或准分离的、分离的均衡。 1 ( ) ( ) ( ) ( ) ( ) ( ) ( ) j i i i j j m j j i i i p m t p t p t m p m p m p m t p t §2信号博弈 注:θ表示类型,m (θ) 是 参与人1的类型依存 信号战略, a(m) 是参 与人2的行动战略 §2信号博弈 §2信号博弈 §2信号博弈 §2信号博弈 这说明,在接收者观察到m2时将加大对发送者为类型θ2的推断,而减小发送 者为类型θ1的推断
§2信号博弈 §2信号博弈 处子 发速社月的》2业 (4.0)g 4(o,o 05 “/1.0 §2信号博弈 §2信号博弃 其中 .V.t.o.( ()。g max EU,月 £2信号博东 令2信号博弈 南化可以得为 因为 masw.6.t.v.c..8.. maxl.21-2.g22 max1,0:=1,g≤三 由此可以得到 (hbe arimaxU.hh.m.m 6
6 发送者t1 发送者t2 0.5 自然 0.5 接 收 者 接 收 者 [q] [1-q] [P] [1-p] (1,3) (4,0) (0,1) (2,4) (1,2) (1,0) (0,0) u (2,1) d u d u d u d L R R L §2信号博弈 具体例子 发送者有两个类型t1和t2,其信号集为(L,R)。因此,发送 者有四个纯策略集合(L,L),(L,R), (R,L), (R,R).。第 一个和第四个策略是混同策略,而2和3策略是分离策略。 接收者的行动空间为(u,d),因此,接收者也有四个纯策略, 分别为(u,u),(u,d),(d,u),(d,d),第1和4是混同策略, 2和3是分离策略。 在该信号博弈中,自然赋予每个类型的可能性是相同的, 接收者在收到L信号后的信息集h(L)有两个结点,接收者的信 念分别是p和1-p;在接受到R信号后的信息集h(R)也有两个结 点,接收者的信念分别是q和1-q。 §2信号博弈 1 2 1 2 1 2 1 2 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), 1 ( ) , ( ), 1 ( ) i i i i i i i i p L t p t p L t t L p L p L t p L t p R t p t p R t t R p R p R t p R t p t L P t L q t R q t R 其 中 假设先给定各信息集中结点的概率p和q,我们先分析发送 者和接收者的行为以及对这种后验信念的要求。 1)对于接收者 当他接收到信号L后,他的行动 a*(L)必须使得他的期望效 用最大化。即a*(L)为下式的解: * ( ) a rg m a x [ , , ( )] k R i k a a L E U t L a L §2信号博弈 因为 m a x [ , , ( )] m a x { 3 (1 ) 4 , 0 (1 ) 1} m a x { 4 ,1 } 4 k R i k a E U t L a L p p p p p p p 其中{4-p,1-p}中前一个元素表示采用行动u的期望收益,后一个 表示采用行动d的收益。因此, a*(L)=u,对0到1之间的任意p均 成立。 当他接收到信号R后,他的行动 a*(R)必须使得他的期望效 用最大化。即a*(R)为下式的解: * ( ) a rg m a x [ , , ( )] k R i k a a R E U t L a R 因为 m a x [ , , ( ) ] m a x { (1 ) 0 , 0 (1 ) 2 } 2 , 3 m a x { , 2 2 } 2 2 2 , 3 k R i k a E U t L a R q q q q q q q q q q §2信号博弈 由此可以得到 * 2 , 3 ( ) 2 , 3 u q a R d q 2)对于发送者 当自然赋予他类型为t1,在给定接收者的最优行动a*(mj)的 条件下,发送者选择的信号m*(t1),是其自身的效用最大化。 即m*(t1)为下式的解: * * 1 1 ( ) a rg m a x [ , , ( )] j S j j m m t U t m a m §2信号博弈 1 1 * 1 1 1 2 m a x { ( , , ), ( , , )} , 3 m a x [ , , ( )] 2 m a x { ( , , ), ( , , )} , 3 2 m a x {1, 2} 2 , 3 2 m a x {1, 0} 1, 3 j s s S j j m s s U t L u U t R u q U t m a m U t L u U t R d q q q 因为 由此可以得到 * 1 2 , 3 ( ) 2 , 3 R q m t L q §2信号博弈
§2信号博弈 §2信号博弃 当白然肤予他类型为t2,在给定接收者的最优行动*(mj)的 条件下,发送者选择的信号m*(t2),是其白身的效用最大化。 综合上述分析,有 即m*(t2)为下式的解: a'(L)= m',)e arg maxU,m,a'(m刃 因为 信号接收者 ,号 =U,化山.U,化R,g2号 a'(R)= m3x0,ma^m月= =aU,6,.UR,d,9=2/3.与信 即当局中人采用银合策略(L,),刷中人2天任何有用信念, 念p天关。 仍保留了白然给予的信念。该结果满风前面对精炼的要求】 信号R后的信来达到。服要求4,信念可以取任意值, 其次,对以上可能的均衡按服要求3和要求4进行分析。 但应满足可能情况下局中人的均衡束略。根据前面对均衡中 ()对于第一个策略组合((L,L),(u,d)),有 的信念分析,q<=2/3和p是任意的,则有 p(Lk)=1,p(R)=0,p(Lk2)=1,p(R:)=0 g=u6R)s子1-g=u6k)≥写 缘合以上分析,可以得到第一个精炼贝叶斯纳什均衡为 这时,发出L后的信息柔达到,扶照要求3应有 策略组合(L,L)(u,d))和信念p1/2,92/3 §2信号博弈 (2)对于第二个策略组合((RL),(山,d)),有 pLk)=0,p(Rk)=1,p(L)=1,pR)=0 这时。两个信念来均达到,抉服要求3应有 p(Lk)加p(4) L)=pkp+Pp=0 42R)= p(Lhap(山) ()Dp()+P(p()=1 理有 4:L=1,(62R)=0 可以得到第二个精炼贝叶斯纳什均衡为:策略组合((代,L) (u,d))和信念p=0,qF1. 7
7 当自然赋予他类型为t2,在给定接收者的最优行动a*(mj)的 条件下,发送者选择的信号m*(t2),是其自身的效用最大化。 即m*(t2)为下式的解: * * 2 2 ( ) a rg m a x [ , , ( )] j S j j m m t U t m a m 2 2 * 2 2 2 2 m a x { ( , , ) , ( , , ) } , 3 m a x [ , , ( )] 2 m a x { ( , , ) , ( , , )} , 3 2 m a x {2 ,1} 2 , 3 2 m a x {2 ,1} 2 , 3 j s s S j j m s s U t L u U t R u q U t m a m U t L u U t R d q q q 因为 由此可以得到 * 2 m t L ( ) §2信号博弈 综合上述分析,有 * * ( ) 2 , 3 ( ) 2 , 3 a L u u q a R d q 信 号 接 收 者 * 1 * 2 2 , 3 ( ) 2 , 3 ( ) R q m t L q m t L 信 号 发 送 者 §2信号博弈 于是,我们得到均衡的初步精炼分析结果: (1)策略组合((L,L),(u,d))和信念q=2/3,与信 念p无关。 其次,对以上可能的均衡按照要求3和要求4进行分析。 (1)对于第一个策略组合((L,L),(u,d)),有 1 1 2 2 p L t p R t p L t p R t ( ) 1, ( ) 0 , ( ) 1, ( ) 0 这时,发出L后的信息集达到,按照要求3应有 §2信号博弈 1 1 1 1 1 2 2 2 2 2 1 1 2 2 ( ) ( ) 1 0 .5 1 ( ) ( ) ( ) ( ) ( ) 1 0 .5 1 0 .5 2 ( ) ( ) 1 0 .5 1 ( ) ( ) ( ) ( ) ( ) 1 0 .5 1 0 .5 2 p L t p t t L p L t p t p L t p t p L t p t t L p L t p t p L t p t 即当局中人采用混合策略(L,L),剧中人2无任何有用信念, 仍保留了自然给予的信念。该结果满足前面对精炼的要求, 信号R后的信息集未达到。按照要求4,信念可以取任意值, 但应满足可能情况下局中人的均衡策略。根据前面对均衡中 的信念分析,q<=2/3和p是任意的,则有 1 2 2 1 ( ) , 1 ( ) 3 3 q t R q t R 综合以上分析,可以得到第一个精炼贝叶斯纳什均衡为: 策略组合((L,L)(u,d))和信念p=1/2,q<=2/3 §2信号博弈 (2)对于第二个策略组合((R,L),(u,d)),有 1 1 2 2 p L t p R t p L t p R t ( ) 0 , ( ) 1, ( ) 1, ( ) 0 这时,两个信念集均达到,按照要求3应有 1 1 1 1 1 2 2 1 1 2 1 1 2 2 ( ) ( ) ( ) 0 ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1 ( ) ( ) ( ) ( ) p L t p t t L p L t p t p L t p t p L t p t t R p R t p t p R t p t 2 2 ( ) 1, ( ) 0 t L t R 同理有 可以得到第二个精炼贝叶斯纳什均衡为:策略组合((R,L) (u,d))和信念p=0,q=1. §2信号博弈