天津大学管理学院：《管理科学基础》课程PPT教学课件（运筹学）第十一章二人有限零和对策

二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博弈论专家：纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。

团购合买资源类别：文库，文档格式：PPT，文档页数：26，文件大小：494.5KB

第十一章二人有限零和对策二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石

第十一章二人有限零和对策二人有限零和对策是对策论(Game Theory)最基本的内容。 Game Theory也可译为博弈论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博弈论专家：纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石

第基本概、对策现象与对策论 1.对策现象 ①下棋:围棋源于我国殷代 ②齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下--上,上--中,中--下结果田忌胜出。顾石头剪子布 ③猜手小孩A与B猜手若规定赢01-1 得1分,平得0分,输得-1分,剪子-101 则A的赢得可用右表来表示布 10

第一节基本概念一、对策现象与对策论 1. 对策现象 ①下棋:围棋源于我国殷代。 1 -1 0 -1 0 1 0 1 -1 A 石头剪子石头剪子布赢 B 布猜手:小孩A与B猜手,若规定赢得1分，平得0分，输得 -1分，则 A的赢得可用右表来表示。 ③ 齐王赛马：齐王与大将田忌赛马，各自的马都分为三等，但齐王的同等马均强于田忌。孙膑给田忌出主意，用下----上，上----中，中----下，结果田忌胜出。 ②

2.对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事需要,抽象成数学模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时 ,非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了“囚徒困境”问题 60年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究

2 . 对策论的产生 1944年，纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后，由于军事需要，抽象成数学模型。 50年代是对策论发展的鼎盛时期，纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时，非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章，图克于1950年定义了“囚徒困境”问题。 60年代，泽尔腾（1965）引入动态分析，提出“精练纳什均衡”概念。海萨尼（1967-1968）则把不完全信息引入对策论的研究

对策问题的组成局中人(参加者):一局对策的参加者。 2策略:局中人在一局对策中对付对手的一个完整的方案策略集:局中人在一局对策中所有策略的全体。记为S (分为有限和无限)问:田忌和齐王的S 3.局势:在一局对策中,每个局中人都选定一策略后的各策略总和如在二人对策中,设S1={a1…,an},S2={A,…,Bn} 则局势为(a,B)i=1…,m,j=l…,n 4.支付:局势给定后,局中人的得失(是局势的函数)。分为零和:各局中人的得失之和为0 非零和:各局中人的得失之和非0

二、对策问题的组成 1.局中人（参加者）：一局对策的参加者。 2.策略：局中人在一局对策中对付对手的一个完整的方案。策略集：局中人在一局对策中所有策略的全体。记为S （分为有限和无限）问:田忌和齐王的S=? 3. 局势：在一局对策中，每个局中人都选定一策略后的各策略总和。 0 0    零和：各局中人的得失之和为分为非零和：各局中人的得失之和非 4. 支付：局势给定后，局中人的得失（是局势的函数）。如在二人对策中 , , , , , , ,设 1 1 2 1     , 1, , , 1, , m n i j S S i m j n       = = 则局势为（ , ） = =

第二节矩阵对策的最优纯策略矩阵对策设二人有限零和对策问题的局中人为I,∏ 策略集为S1={a,a2 },S2={B1,B2 Bi 则支付可以用矩阵A :表示其中an为的得(也是∏的失),∏的得即为an0 故又称二人有限零和对策为矩阵对策,记为G=(S1,S2A

M 第二节矩阵对策的最优纯策略 1 2 11 1 1 1 2 S { },S { } A , , m n n m mn ij ij a a a a a a G S S A         = =              = 1 2 1 2 设二人有限零和对策问题的局中人为，策略集为，， , ，， , 则支付可以用矩阵＝表示，其中为的得（也是的失），的得即为- 。故又称二人有限零和对策为矩阵对策,记为（）一、矩阵对策  mn1

、理智局中人的选择在矩阵对策中,局中人将如何选取自己的策略呢? B B2 B 13 举例说明,若A ,∏都想谋取最大的赢得,I当然想出α3,但∏估计到I 的心理,便出β,使I而输掉8。于是为了保险起见I出a2 因为肯定不会输。即I若不存在侥幸心理(理智的),必出a2, 而∏此时必出,否则输得更多。结果,在局势(a2,B3)下, 的得是a23=2,这时双方都无意见,分析a2的特点,是行中最小的最大,列中最大的最小。 I选 max min 即理智局中人的选择 ∏选 min max a→>B

二、理智局中人的选择在矩阵对策中，局中人将如何选取自己的策略呢？ * * max min min max ij i i j ij j j i a a    →     →  选即理智局中人的选择选 3 3 2 2 3 2 3 23 23 1 3 2 A 4 3 2 6 1 8 a a          − −         −           举例说明，若＝，都想谋取最大的赢得，当然想出，但估计到的心理，便出，使反而输掉8。于是为了保险起见出，因为肯定不会输。即若不存在侥幸心理（理智的），必出，而此时必出，否则输得更多。结果，在局势（，）下，的得是 =2，这时双方都无意见，分析的特点，是行中最小的最大，列中最大的最小。 1 2  3 1  2  3

、最优纯策略与鞍点 1.对策G的解和值:使得a,≤a,≤a,的(a,B.)称为 G的解,a1与B,分别是1,∏的最优纯策略,a; 称为G的值,记为V。。 2.鞍点:若局势(a,B.)对应的 a,.-maxmina-min max a 则称(a,B,)为鞍点分析上例中的a23它就满足a23≤a2≤a

三、最优纯策略与鞍点 * * * * * * * * * * G 1. G , G G V ij i j i j i j i j i j a a a a         对策的解和值：使得的( )称为的解，与分别是 , 的最优纯策略，称为的值，记为。 * * * * * * 2. max min min max i j ij ij i j i i j j i j a a a     鞍点：若局势（，）对应的＝＝则称（，）为鞍点。 23 3 23 2 i j 分析上例中的，它就满足 a a a a  

定理1: G在纯策略中有解(a,B,)◇(α,B.)是鞍点证明:← irmin a.= min max a= max min a= max a min d ak k.max a C 故 1J= C 即(,B.)是G的解

定理1： * * * * , , i j i j G在纯策略中有解( ) ( )是鞍点      * * * * * * * * * * * * * * * * * * * * : min min max max min max min ,max , 1, , 1, , ( , ) ij ij i j ij j j j i i i i j i j ij i j j i ij i j i j i j ij i j i j i j a a a a a a a a a a a a i m j n a a a   G  === = =   = =    证明记故即是的解

iisa maxa. <a.< min a min max a.<maxa,≤a,.<mina,≤ max min a 但对于任意A,有 max min a≤ min max a 只有a..= min max a= max min a 即(,,B,)是鞍点证毕

* * * * * * * * * * * * * * * * 1, , 1, , max min min max max min max min A, max min min max min max max min ( , ) ij i j i j ij i j i j i j ij ij ij i j i j j j j i i i ij ij i i j j ij ij i j j j i i i j a a a i m j n a a a a a a a a a a a a a      = =          = = 但对于任意有只有即是鞍点证毕

例1 22-27-2 4③853 V=3 8-6 1-6 (c,B,)=(a2,B2) 例2 min max a=2 0-22 max min a 23-4 鞍点不存在即在纯策略意义下无解

例 1 -2 2 -2 7 4 3 8 5 8 -6 2 -1           −2−63 * * G 2 2 V 3 ( , ) ( , ) i j     = = 例 2 0 2 2 5 4 3 2 3 4   −   −       − −2−−43 5 4 2 min max 2 max min 2 , ij j i ij i j aa = = − 鞍点不存在即在纯策略意义下无解

点击下载完整版文档（PPT格式）

共26页，试读已结束，阅读完整版请下载

点击下载（PPT格式）

浏览记录