复旦大学：《博弈论 Game Theory》课程教学资源（讲义）第2讲完全信息静态博弈——纯策略纳什均衡

团购合买资源类别：文库，文档格式：PDF，文档页数：59，文件大小：280.8KB

第2讲完全信息静态博弈纳什均衡-纯策略李婷,ltng@fudan.edu.cn 复旦大学

第2讲完全信息静态博弈纳什均衡-纯策略李婷, liting@fudan edu cn liting@fudan.edu.cn 复旦大学

新的观点:纳什均衡 Player 2 C R 0 4 4 0 5 Player 1 M4 0 4 5 3 3 6 6 策略组合(B,R)有如下性质: 参与者1在参与者2选择R时,除了选择B之外不可能获得更好的收益。 ≯参与者2在参与者1选择B时,除了选择R之外不可能获得更好的收益

新的观点: 纳什均衡 Player 2 L CR Player 1 T 0 , 4 4 , 0 5 , 3 y M 4 , 0 0 , 4 5 , 3 B 3 , 5 3 , 5 6 , 6 策略组合(B, R) 有如下性质: 参与者1在参与者2选择R时，除了选择B之外不可能获得更好的收益。 参与者2 在参与者1 选择 B时，除了选择R之外不可能获得更好的收益。 2

新的观点:纳什均衡 Player 2 R 3 3 Player 1 TMB 043 403 043 3 33 3.6 策略组合(B',R)有如下性质: ≯参与者1在参与者2选择R时,除了选择B’之外不可能获得更好的收益 ≯参与者2在参与者1选择B'时,除了选择R之外不可能获得更好的收益

新的观点: 纳什均衡 Player 2 L’ C’ R’ Player 1 T’ 0 , 4 4 , 0 3 , 3 Player 1 M’ 4 , 0 0 , 4 3 , 3 B’ 3 , 3 3 , 3 3.5 , 3.6 策略组合(B’, R’)有如下性质: 参与者1在参与者2选择R’时，除了选择B’之外不可能获得更好的收益。 参与者2 在参与者1 选择 B’时，除了选择R’之外不可能获得更好的收益。 3

定义:纳什均衡在一个标准式的博弈{S1,S2,…Sn,Ⅲ1,l2,…,ln 中,一个策略组合(S1,,Sn)是纳什均衡,如果对于每一个参与者i, 已知其他人的选择, (S1…,S1-1,s1,S}+1…,Sm) 参与者不可能有比s*更好的选择了 ≥l1(S1,…,S-1,Si,S1+1,3n 对于所有的s∈S,那么,s使得 Maximize;(S1,…,S1-1,S12S1+12…,n) Subject to s;∈S Prisoner 2 Mum Confess Prisoner 1 9 0 Confess 0 9 6 6

定义: 纳什均衡在一个标准式的博弈{S1 , S2 , ..., Sn , u1 , u2 , ..., un 中, 一个策略组合 ( ,..., ) * * 1 n 中, 个策略组合 (s1 ,...,sn ) 是纳什均衡，如果对于每一个参与者 i, ( ) * * * * * u s s s s s 已知其他人的选择，参与者i 不可能有 ( ,..., , , ,..., ) ( ,..., , , ,..., ) * * 1 * 1 * 1 1 1 1 i i i i n i i i i n u s s s s s u s s s s s      参与者i 不可能有比si* 更好的选择了。 ( , , , , , , ) i 1 i 1 i i1 n 对于所有的 i Si s  . 那么, *is 使得 M i i ( ) M * * * * aximize ( ,..., , , ,..., ) i 1 i 1 i i 1 n u s s s s s   Subject to i Si s  Prisoner 2 Mum Confess Prisoner 1 Mum -1 , -1 -9 , 0 4 1 Confess 0 , -9 -6 , -6

有限策略的两人博弈 S1={s11,s12rS13}S2=s21,S22} (s11s2)是一个纳什均衡,如果 1121 11(s 1221r 11(S 1 11 21)≥1(s13,s21)并且 11/=21 1122 Player 2 s1a1(s1821),v2(s1,s2)u1(s1,s2),a2(s1182) Player1s12u2(s12,s21),u(s12,2) u(s1222), 2(s12S22) 13 u1(s13,S21),u2( S13r521 )a1(s13,s2),v2(s13,52)

有限策略的两人博弈  S 1={ s11, s12, s13} S 2={ s21, s22 }  ( s 1 1 , s21 ) 是个纳什均衡一，如果 u 1 ( s11 , s21)  u 1 ( s12 , s21), u 1 ( s11 , s21 )  u 1 ( s13 , s21 ) 并且 u 2 ( s11 , s21)  u 2 ( s11 , s22 ). Player 2 s21 s22 Pl 1 s11 u 1(s11,s21), u 2(s11,s21) u 1(s11,s22), u 2(s11,s22) Player 1 s u (s s ) u (s s ) u (s s ) u (s s ) 12 u 1(s 1 2,s 2 1), u 2(s 1 2,s 2 1) u 1(s 1 2,s 2 2), u 2(s 1 2,s 2 2) s13 u 1(s13,s21), u 2(s13,s21) u 1(s13,s22), u 2(s13,s22) 5

寻找纳什均衡 Player 2 Left Middle Riaht U 1 01 20 1 Player 1 0 3|0 1 2 Middle p 1 1 Player 1

寻找纳什均衡 Player 2 Left Middle Ri ght 1 , 0 1 , 2 0 , 1 0 , 3 0 , 1 2 , 0 Player 1 Up Down g Down 0 , 3 0 , 1 2 , 0 Player 2 Left Middle 1 , 0 1 , 2 0 3 0 1 Player 1 Middle Up Down 0 , 3 0 , 1 6

例子:游客&木地人 Bar 2 4 $5 Bar 1 4 1214 20,20 28 15 $5 15‖14 15,28 25,25 Payoffs are in thousands of dollars Bar 2 $4 s420,20 28 15 Bar 1

例子: 游客 & 本地人 Bar 2 $2 $4 $5 Bar 1 $2 10 , 10 14 , 12 14 , 15 Bar 1 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25 Payoffs are in thousands of dollars Payoffs are in thousands of dollars Bar 2 $4 $5 1 $4 20 , 20 28 , 15 Bar 1 $ , , $5 15 , 28 25 , 25 7

另一个例子标准式表述参与者:{参与者1,参与者2,…,参与者n} 策略:S=[0,100],i=1,2,…,n. 收益函数 )=x-3/5 ■纳什均衡?

另个例子一  标准式表述:  参与者: {参与者1, 参与者2, ..., 参与者n}  策略: Si =[0, 100], i = 1, 2, ..., n.  收益函数: ui(x1, x2, ..., xn) = xi – 3y/5  纳什均衡? 8

最优反应函数:例子 Player 2 C R T 3 Player 1 M 043 403 402 043 3 33 B 3.5 如果参与者2选择凵’,那么参与者1的最优策略是M ■如果参与者2选择C’,那么参与者1的最优策略是T 如果参与者2选择R’,那么参与者1的最优策略是B 如果参与者1选择B’,那么参与者2的最优策略是R 最优反应:如果已知其他参与者的决策,该参与者的最佳策略。 9

最优反应函数: 例子 Player 2 L’ C’ R’ Player 1 T’ 0 , 4 4 , 0 3 , 3 Player 1 M’ 4 , 0 0 , 4 3 , 3 B’ 3 , 3 3 , 3 3.5 , 3.6  如果参与者2 选择 L’ ，那么参与者 1 的最优策略是 M’  如果参与者2 选择 C’ ，那么参与者 1 的最优策略是 T’  如果参与者 2 选择 R’ ，那么参与者 1 的最优策略是 B’  如果参与者1 选择 B’ ，那么参与者 2 的最优策略是R’  最优反应：如果已知其他参与者的决策，该参与者的最佳策略。 9

例子:游客&木地人 Bar 2 $2 4 $5 $2 10 10 14 12 14 15 Bar 1 4 12,14 20,20 28 15 $5 15,14 15,28 25,25 Payoffs are in thousands of dollars ■当Bar2的策略式$2,$4or$5,Bar1的最佳反应是什么? ■当Bar1的策略式$2,$4or$5,Bar2的最佳反应是什么?

例子: 游客 & 本地人 Bar 2 $2 $4 $5 Bar 1 $2 10 , 10 14 , 12 14 , 15 Bar 1 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25 Payoffs are in thousands of dollars  当Bar 2的策略式$2, $4 or $5，Bar 1的最佳反 Payoffs are in thousands of dollars 应是什么?  当Bar 1的策略式$2 $4 or $5 $2, $4 or $5，Bar 2的最佳反应是什么? 10

点击进入文档下载页（PDF格式）

共59页，可试读20页，点击继续阅读 ↓↓

点击下载（PDF格式）

浏览记录