 从博弈的最后一个阶段开始分析，若B选择L获利 1, 选择R获利0，因此

点击下载：西安电子科技大学：《智能控制导论》课程教学课件（博弈控制）第七讲动态博弈分析（下）

正在加载图片...

历安毛子代枚大学逆向归纳法 XIDIAN UNIVERSITY *从博弈的最后一个阶段开始分析，若B选择L获利 1,选择R获利0，因此B选L。倒退到第一阶段，A选U获利2，选D获利取决于B 的选择。 *但A知道B是理性的，一旦到达第二阶段，B肯定选择 D L,从而，A获利3。因此， A应该选择D。 B (2,2) A2 因此，D,L)是纯策略 R 纳什均衡。 (3.1) (0,0)  从博弈的最后一个阶段开始分析，若B选择L获利 1, 选择R获利0，因此B选L。  倒退到第一阶段，A选U获利2，选D获利取决于B 的选择。  但A知道B是理性的，一旦到达第二阶段，B肯定选择 L，从而，A获利3。因此， A应该选择D。  因此，(D, L)是纯策略纳什均衡。逆向归纳法

<<向上翻页向下翻页>>

点击下载：西安电子科技大学：《智能控制导论》课程教学课件（博弈控制）第七讲动态博弈分析（下）