历安毛子代枚大学 逆向归纳法 XIDIAN UNIVERSITY *从博弈的最后一个阶段开始分析,若B选择L获利 1,选择R获利0,因此B选L。 倒退到第一阶段,A选U获利2,选D获利取决于B 的选择。 *但A知道B是理性的,一旦 到达第二阶段,B肯定选择 D L,从而,A获利3。因此, A应该选择D。 B (2,2) A2 因此,D,L)是纯策略 R 纳什均衡。 (3.1) (0,0) 从博弈的最后一个阶段开始分析,若B选择L获利 1, 选择R获利0,因此B选L。 倒退到第一阶段,A选U获利2,选D获利取决于B 的选择 。 但A知道B是 理性的,一旦 到达第二阶段,B肯定选择 L,从而,A获利3。因此, A应该选择D。 因此,(D, L)是纯策略 纳什均衡。 逆向归纳法