西安电子科技大学：《智能控制导论》课程教学课件（博弈控制）第五讲博弈的基本分析方法（下）

团购合买资源类别：文库，文档格式：PDF，文档页数：15，文件大小：502KB

3、混合策略反应函数猜硬币方正面反面盖硬币方反应函数：盖 -1,1 1,-1 r Ri(g) 正面方反面 1,-1 -1,1 1 猜硬币博弈 1/2 【:盖硬币方选择正面的概率 q：猜硬币方选择正面的概率 1/2 1 q (化1-)：盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布

3、混合策略反应函数盖硬币方反应函数： -1， 1 1， -1 1， -1 -1， 1 正面反面猜硬币方正面反面猜硬币博弈盖硬币方 r q 1 1/2 1 1/2 (r, 1-r)：盖硬币方选择正反面的混合策略概率分布 (q, 1-q)：猜硬币方选择正反面的混合策略概率分布 r  R1(q) r ：盖硬币方选择正面的概率 q ：猜硬币方选择正面的概率

3、混合策略反应函数猜硬币方反应函数：猜硬币方正面反面 g=R2(r) 1 硬正面 -1,1 1,-1 方反面 1,-1 -1,1 猜硬币博弈 1/2 「：盖硬币方选择正反面的概率 q:猜硬币方选择正反面的概率 1/2 1 q (化，1-)：盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布

3、混合策略反应函数猜硬币方反应函数： -1， 1 1， -1 1， -1 -1， 1 正面反面猜硬币方正面反面猜硬币博弈盖硬币方 r q 1 1/2 1 1/2 (r, 1-r)：盖硬币方选择正反面的混合策略概率分布 (q, 1-q)：猜硬币方选择正反面的混合策略概率分布 q  R2(r) r ：盖硬币方选择正反面的概率 q ：猜硬币方选择正反面的概率

3、混合策略反应函数两个函数合在一张图猜硬币方 r=Ri(g) 正面反面 1 硬正面 -1,1 1,-1 反面 1,-1 -1,1 方猜硬币博弈 1/2 q=R2(r) :盖硬币方选择正反面的概率 q：猜硬币方选择正反面的概率 1/2 1 q (化，1-)：盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布

3、混合策略反应函数两个函数合在一张图 -1， 1 1， -1 1， -1 -1， 1 正面反面猜硬币方正面反面猜硬币博弈盖硬币方 r q 1 1/2 1 1/2 (r, 1-r)：盖硬币方选择正反面的混合策略概率分布 (q, 1-q)：猜硬币方选择正反面的混合策略概率分布 q  R2(r) r  R1(q) r ：盖硬币方选择正反面的概率 q ：猜硬币方选择正反面的概率

夫妻之争博弈丈夫时装足球 r 1 妻时装 2,1 0,0 q=R(r）子足球 0,0 1,3 3/4 夫妻之争 r=R(r) 为丈夫选择足球的概率 q为妻子选择足球的概率 1/3 1 (,1-):丈夫的混合策略概率分布 (q,1-q):妻子的混合策略概率分布

夫妻之争博弈 2， 1 0， 0 0， 0 1， 3 时装足球丈夫时装足球妻子夫妻之争 r q 1 1/3 1 3/4 (r,1-r)：丈夫的混合策略概率分布 (q,1-q)：妻子的混合策略概率分布 ( ) 2 q  R r ( ) 1 r  R r r 为丈夫选择足球的概率 q为妻子选择足球的概率

4、纳什均衡的存在性纳什定理：在一个由n个博弈方的博弈G={S,…Sn,4,un}中，如果n是有限的，且S都是有限集时(i=1,n),则该博弈至少存在一个纳什均衡，但可能包含混合策略。 ·主要根据是布鲁威尔和角谷的不动点定理。 ·纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一

4、纳什均衡的存在性纳什定理：在一个由n个博弈方的博弈中，如果n是有限的，且都是有限集时( )，则该博弈至少存在一个纳什均衡，但可能包含混合策略。 • 主要根据是布鲁威尔和角谷的不动点定理。 • 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。 { , ; , } G  S1 Sn u1 un i S i 1, n

5、纳什均衡的选择和分析方法扩展一、多重纳什均衡博弈的分析二、共谋和防共谋均衡

一、多重纳什均衡博弈的分析 ·帕累托上策均衡 ·风险上策均衡 ·聚点均衡。相关均衡

一、多重纳什均衡博弈的分析 • 帕累托上策均衡 • 风险上策均衡 • 聚点均衡 • 相关均衡

帕累托上策均衡这个博弈中有两个纯策略国家2 纳什均衡，（战争，战争) 战争和平和（和平，和平），显然景极争 5,-5 8,-10 后者帕累托优于前者，所 1和平 -10,8 10,10 以，（和平，和平）是本战争与和平博弈的一个帕累托上策均衡

帕累托上策均衡这个博弈中有两个纯策略纳什均衡，（战争，战争）和（和平，和平），显然后者帕累托优于前者，所以，（和平，和平）是本博弈的一个帕累托上策均衡。 -5， -5 -10， 8 8， -10 10， 10 战争和平国家2 战争和平国家 1 战争与和平

风险上策均衡考虑、顾忌博弈方、其他博弈方可能发生错误等时，帕累托上策均衡并不一定是最优选择，需要考虑：风险上策均衡。下面就是两个例子。博弈方2 猎人2 L R 鹿兔子博方 U 9,9 0,8 人鹿 5,5 0,3 1 D 8,0 7,7 兔子 3,0 3,3 风险上策均衡(D,R) 猎鹿博弈风险上策均衡（兔子，兔子）

风险上策均衡考虑、顾忌博弈方、其他博弈方可能发生错误等时，帕累托上策均衡并不一定是最优选择，需要考虑：风险上策均衡。下面就是两个例子。 9， 9 8， 0 0， 8 7， 7 L R 博弈方2 U D 博弈方 1 风险上策均衡（D，R） 5， 5 3， 0 0， 3 3， 3 鹿兔子猎人2 鹿兔子猎人 1 猎鹿博弈风险上策均衡（兔子，兔子）

博弈方2 相关均衡 A B 博 A a,b 0,0 方 B 0,0 C, a (A,A)和(B,B)为该博弈的两个纳什均衡， 1 但是两人的收益不同。若双方采用混合策略， a>b>0,d>c>0 就有1/2的概率遇到(A,B)和(B,A)的情形，双方的收益将低于任何一个纯策略纳什均衡。丈夫时装C 足球F 0,0 妻时装C 2,1 夫妻之争博弈的混合策略纳什均衡策略得益足球F 0,0 1,3 妻子 (0.75,0.25) 0.67 丈夫 (1/3,2/3) 0.75 夫妻之争

相关均衡 (A,A)和(B,B)为该博弈的两个纳什均衡，但是两人的收益不同。若双方采用混合策略，就有1/2的概率遇到(A,B)和(B,A)的情形，双方的收益将低于任何一个纯策略纳什均衡。 a， b 0， 0 0， 0 c， d A B 博弈方2 A B 博弈方 1 a>b>0, d>c>0 2， 1 0， 0 0， 0 1， 3 时装 C 足球 F 时装 C 足球 F 丈夫妻子夫妻之争夫妻之争博弈的混合策略纳什均衡策略得益妻子（0.75，0.25） 0.67 丈夫（1/3，2/3） 0.75

点击下载完整版文档（PDF格式）

共15页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录