第2讲完全信息静态博弈 纳什均衡-纯策略 李婷,ltng@fudan.edu.cn 复旦大学
第2讲 完全信息静态博弈 纳什均衡-纯策略 李婷, liting@fudan edu cn liting@fudan.edu.cn 复旦大学
新的观点:纳什均衡 Player 2 C R 0 4 4 0 5 Player 1 M4 0 4 5 3 3 6 6 策略组合(B,R)有如下性质: 参与者1在参与者2选择R时,除了选择B之外不可能获得更 好的收益。 ≯参与者2在参与者1选择B时,除了选择R之外不可能获得 更好的收益
新的观点: 纳什均衡 Player 2 L CR Player 1 T 0 , 4 4 , 0 5 , 3 y M 4 , 0 0 , 4 5 , 3 B 3 , 5 3 , 5 6 , 6 策略组合(B, R) 有如下性质: 参与者1在参与者2选择R时,除了选择B之外不可能获得更 好的收益。 参与者2 在参与者1 选择 B时,除了选择R之外不可能获得 更好的收益。 2
新的观点:纳什均衡 Player 2 R 3 3 Player 1 TMB 043 403 043 3 33 3.6 策略组合(B',R)有如下性质: ≯参与者1在参与者2选择R时,除了选择B’之外不可能获得 更好的收益 ≯参与者2在参与者1选择B'时,除了选择R之外不可能获 得更好的收益
新的观点: 纳什均衡 Player 2 L’ C’ R’ Player 1 T’ 0 , 4 4 , 0 3 , 3 Player 1 M’ 4 , 0 0 , 4 3 , 3 B’ 3 , 3 3 , 3 3.5 , 3.6 策略组合(B’, R’)有如下性质: 参与者1在参与者2选择R’时,除了选择B’之外不可能获得 更好的收益。 参与者2 在参与者1 选择 B’时,除了选择R’之外不可能获 得更好的收益。 3
定义:纳什均衡 在一个标准式的博弈{S1,S2,…Sn,Ⅲ1,l2,…,ln 中,一个策略组合(S1,,Sn)是纳什均衡,如果对 于每一个参与者i, 已知其他人的选择, (S1…,S1-1,s1,S}+1…,Sm) 参与者不可能有 比s*更好的选择了 ≥l1(S1,…,S-1,Si,S1+1,3n 对于所有的s∈S,那么,s使得 Maximize;(S1,…,S1-1,S12S1+12…,n) Subject to s;∈S Prisoner 2 Mum Confess Prisoner 1 9 0 Confess 0 9 6 6
定义: 纳什均衡 在一个标准式的博弈{S1 , S2 , ..., Sn , u1 , u2 , ..., un 中, 一个策略组合 ( ,..., ) * * 1 n 中, 个策略组合 (s1 ,...,sn ) 是纳什均衡,如果 对 于每一个参与者 i, ( ) * * * * * u s s s s s 已知其他人的选择, 参与者i 不可能有 ( ,..., , , ,..., ) ( ,..., , , ,..., ) * * 1 * 1 * 1 1 1 1 i i i i n i i i i n u s s s s s u s s s s s 参与者i 不可能有 比si* 更好的选择了。 ( , , , , , , ) i 1 i 1 i i1 n 对于所有的 i Si s . 那么, *is 使得 M i i ( ) M * * * * aximize ( ,..., , , ,..., ) i 1 i 1 i i 1 n u s s s s s Subject to i Si s Prisoner 2 Mum Confess Prisoner 1 Mum -1 , -1 -9 , 0 4 1 Confess 0 , -9 -6 , -6
有限策略的两人博弈 S1={s11,s12rS13}S2=s21,S22} (s11s2)是一个纳什均衡,如果 1121 11(s 1221r 11(S 1 11 21)≥1(s13,s21)并且 11/=21 1122 Player 2 s1a1(s1821),v2(s1,s2)u1(s1,s2),a2(s1182) Player1s12u2(s12,s21),u(s12,2) u(s1222), 2(s12S22) 13 u1(s13,S21),u2( S13r521 )a1(s13,s2),v2(s13,52)
有限策略的两人博弈 S 1={ s11, s12, s13} S 2={ s21, s22 } ( s 1 1 , s21 ) 是 个纳什均衡 一 ,如果 u 1 ( s11 , s21) u 1 ( s12 , s21), u 1 ( s11 , s21 ) u 1 ( s13 , s21 ) 并且 u 2 ( s11 , s21) u 2 ( s11 , s22 ). Player 2 s21 s22 Pl 1 s11 u 1(s11,s21), u 2(s11,s21) u 1(s11,s22), u 2(s11,s22) Player 1 s u (s s ) u (s s ) u (s s ) u (s s ) 12 u 1(s 1 2,s 2 1), u 2(s 1 2,s 2 1) u 1(s 1 2,s 2 2), u 2(s 1 2,s 2 2) s13 u 1(s13,s21), u 2(s13,s21) u 1(s13,s22), u 2(s13,s22) 5
寻找纳什均衡 Player 2 Left Middle Riaht U 1 01 20 1 Player 1 0 3|0 1 2 Middle p 1 1 Player 1
寻找纳什均衡 Player 2 Left Middle Ri ght 1 , 0 1 , 2 0 , 1 0 , 3 0 , 1 2 , 0 Player 1 Up Down g Down 0 , 3 0 , 1 2 , 0 Player 2 Left Middle 1 , 0 1 , 2 0 3 0 1 Player 1 Middle Up Down 0 , 3 0 , 1 6
例子:游客&木地人 Bar 2 4 $5 Bar 1 4 1214 20,20 28 15 $5 15‖14 15,28 25,25 Payoffs are in thousands of dollars Bar 2 $4 s420,20 28 15 Bar 1
例子: 游客 & 本地人 Bar 2 $2 $4 $5 Bar 1 $2 10 , 10 14 , 12 14 , 15 Bar 1 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25 Payoffs are in thousands of dollars Payoffs are in thousands of dollars Bar 2 $4 $5 1 $4 20 , 20 28 , 15 Bar 1 $ , , $5 15 , 28 25 , 25 7
另一个例子 标准式表述 参与者:{参与者1,参与者2,…,参与者n} 策略:S=[0,100],i=1,2,…,n. 收益函数 )=x-3/5 ■纳什均衡?
另 个例子 一 标准式表述: 参与者: {参与者1, 参与者2, ..., 参与者n} 策略: Si =[0, 100], i = 1, 2, ..., n. 收益函数: ui(x1, x2, ..., xn) = xi – 3y/5 纳什均衡? 8
最优反应函数:例子 Player 2 C R T 3 Player 1 M 043 403 402 043 3 33 B 3.5 如果参与者2选择凵’,那么参与者1的最优策略是M ■如果参与者2选择C’,那么参与者1的最优策略是T 如果参与者2选择R’,那么参与者1的最优策略是B 如果参与者1选择B’,那么参与者2的最优策略是R 最优反应:如果已知其他参与者的决策,该参与者的最佳策略。 9
最优反应函数: 例子 Player 2 L’ C’ R’ Player 1 T’ 0 , 4 4 , 0 3 , 3 Player 1 M’ 4 , 0 0 , 4 3 , 3 B’ 3 , 3 3 , 3 3.5 , 3.6 如果 参与者2 选择 L’ ,那么参与者 1 的最优策略是 M’ 如果参与者2 选择 C’ ,那么参与者 1 的最优策略是 T’ 如果参与者 2 选择 R’ ,那么参与者 1 的最优策略是 B’ 如果参与者1 选择 B’ ,那么参与者 2 的最优策略是R’ 最优反应:如果已知其他参与者的决策,该参与者的最佳策略。 9
例子:游客&木地人 Bar 2 $2 4 $5 $2 10 10 14 12 14 15 Bar 1 4 12,14 20,20 28 15 $5 15,14 15,28 25,25 Payoffs are in thousands of dollars ■当Bar2的策略式$2,$4or$5,Bar1的最佳反 应是什么? ■当Bar1的策略式$2,$4or$5,Bar2的最佳反 应是什么?
例子: 游客 & 本地人 Bar 2 $2 $4 $5 Bar 1 $2 10 , 10 14 , 12 14 , 15 Bar 1 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25 Payoffs are in thousands of dollars 当Bar 2的策略式$2, $4 or $5,Bar 1的最佳反 Payoffs are in thousands of dollars 应是什么? 当Bar 1的策略式$2 $4 or $5 $2, $4 or $5,Bar 2的最佳反 应是什么? 10