第5讲:完全信息动态博弈 非完美信息动态博弈 李婷,ling@fudan.edu.cn 复旦大学
第5讲:完全信息动态博弈 非完美信息动态博弈 李婷, liting@fudan edu cn liting@fudan.edu.cn 复旦大学
非完美信息 ■两个参与者中每个人都有 Player 1 个硬币 ■参与者1首先选择正面或反面 H 之后参与者2在不知道参与者 勺选择的情况下,选择正面 或反面 Player 2 Player 2 两个参与者都知道以下的规 则 T H T 如果两个硬币都正面或反 面,那么参与者2赢走参 与者1的硬币。 1,1 1,1 反之,参与者1赢走参与 者2的硬币。 2
非完美信息 两个参与者中每个人都有一 个硬币 参与者1 首先选择正面或反面 Player 1 参与者1 首先选择正面或反面 H T 之后参与者2 在不知道参与者 1的选择的情况下,选择正面 或反面 Player 2 Player 2 H T 两个参与者都知道以下的规 则: Player 2 Player 2 H T H T 如果两个硬币都正面或反 面,那么参与者2赢走参 与者1的硬币。 -1, 1 1, -1 1, -1 -1, 1 反之,参与者1赢走参与 者2的硬币。 2
信息集 ■定义:信息集是参与者的一系列节点的集合,它满足以 下条件: 参与者在信息集中的每个节点行动 当博弈到达信息集中的节点时,能够行动的参与者不知 道不知道自己达到信息 ■信息集中的所有节点都属于同一个参与者 ■玩家必须在信息集中的每个节点上具有相同的策略集
信息集 定义:信息集是参与者的一系列节点的集合,它满足以 下条件: 参与者在信息集中的每个节点行动 当博弈到达信息集中的节点时,能够行动的参与者不知 道不知道自己达到信息 信息集中的所有节点都属于同一个参与者 玩家必须在信息集中的每个节点上具有相同的策略集 3
信息集:分析 Player 1 two information sets for R player 2 each containing a gle node Player2A Player 2 R R R R 22,31,2,03,1,22,2,12,2,10,1,11,1,21,1,1 an information set for player 3 an information set for player 3 containing three nodes containing a single node
信息集: 分析 Player 1 L R two information sets for player 2 each containing a single node Player 2 L’ ’ Player 2 single node L’ R’ L’ R’ 3 3 3 3 L” R” L” R” L” R” L” R” 2, 2, 3 1, 2, 0 3, 1, 2 2, 2, 1 2, 2, 1 0, 1, 1 1, 1, 2 1, 1, 1 an information set for player 3 containing three nodes an information set for player 3 containing a single node 4 g g g
信息集:分析 ■在一个信息集里的所有节点都属于同一个参与 者 Player 1 这不是一个正确的信 D 息集 Player 2 Player 3 E H 2,1,3 3,0,2 0,2,2 1,3
信息集:分析 在一个信息集里的所有节点都属于同一个参与 者 Player 1 C D 这不是一个正确的信 息集 Player 2 Player 3 E F G H 2, 1, 3 3, 0, 2 0, 2, 2 1, 3, 1 5
信息集:分析 ■参与者必须在信息集中的每个节点上具有相同的可行 动集 不可能出现这种情况 Player 1 D Player 2 Player 2 E G K 0 21,11,3
信息集:分析 参与者必须在信息集中的每个节点上具有相同的可行 动集。 不可能出现这种情况 Player 1 C D Player 2 Player 2 E F G H K 2, 1 3, 0 0, 2 1, 1 1, 3 6
使用博弈树表达一个静态博弈 囚徒困境作为一个不完美信息博弈 Prisoner 2 Fink Prisoner 1 Prisoner 1 Mum Fink Mum Fink 5,0 1,1
使用博弈树表达 个静态博弈 使用博弈树表达 一个静态博弈 囚徒困境作为一个不完美信息博弈 Prisoner 2 M Fi k Prisoner 1 Prisoner 1 um Fi n k Prisoner 1 Prisoner 1 Mum Fink Mum Fink 4, 4 5, 0 0, 5 1, 1 7 , , ,
例子 两个超级大国,1和2,参与了一个挑衅事件,设定如下 博弈以超级大国1的选择开始:要么忽略事件(/),收益为(0,0): 要么升级情况(E) 在超级大国1升级后,超级大国2可以退让(B),导致它失去面子 并导致收益(1,-1),或者他可以选择参与原子对抗情况(A)。根据 这个选择,两个超级大国进行接下来的同步行动游戏 ■他们可以选择撤退(R)或者选择毁灭世界的世界末日(D)。如果 两者都选择撤退,那么他们会遭受一点损失,收益是(-0.5,-0.5)。 如果选择世界末日,那么世界将被摧毁,收益为(-K,-K),其中K 是非常大的数字
例子 两个超级大国,1和2,参与了一个挑衅事件,设定如下: 博弈以超级大国1 的选择开始:要么忽略事件( I ), 收益为 (0, 0); 要么升级情况 ( E )。 在超级大国1升级后,超级大国2可以退让( B ), 导致它失去面子 并导致收益(1, -1), 或者他可以选择参与原子对抗情况 或者他可以选择参与原子对抗情况( A )。根据 这个选择,两个超级大国进行接下来的同步行动游戏。 他们可以选择撤退( R ) 或者选择毁灭世界的世界末日( D ) 。如果 两者都选择撤退 两者都选择撤退,那么他们会遭受 点损失 那么他们会遭受一点损失,收益是(-0 5. , -0 5) . 。 如果选择世界末日,那么世界将被摧毁,收益为 (-K, -K),其中K 是非常大的数字。 8
例子 E 2 A R D 0.5,-0.5K,-K-K,-K-K,-K
例子 1 I E 0, 0 2 B A 1 -1 1 , -1 2 R D 2 R D R D 2 -0 5 -0 5 -K -K -K -K -K -K 9 0.5, 0.5 -K, -K -K, -K K, K
完美信息和非完美信息 ■每个信息集只包含一个节点的动态博弈成为完 美信息博弈 些信息集包含多个信息节点的动态博弈为非 完美信息博弈
完美信息和非完美信息 每个信息集只包含一个节点的动态博弈成为完 美信息博弈 。 一些信息集包含多个信息节点的动态博弈为非 完美信息博弈 。 10