正在加载图片...
运筹学讲义 显然,这是一个对策问题,其中局中人为甲(1),乙(2),局中人集合为I={1,2};局中人1 的策略可能有ax1=(出正面),a2=(出反面),局中人2的策略可能有B1=(出正面,B2=(出 反面),∴局中人1,2的策略集合分别为S1={a1,a2},S2={B1,B2} 当局中人1,2分别从其策略集合中选择一个策略后,就得到一个局势.∴∵局势集合为 S1×S2={(a1B1)(a1,B2).(a2,B)(2,B2) 由双方的约定知,局中人1,2在各局势下的收益分别为 H1(a1,B1)=1,H1(a1,B2)=-1,H1(a2,B1)=-1,H1(a2,B2)=1 H2(a1,B1)=-1,H2(a1,B2)=1,H2(a2,B1)=1,H2(a2,B2)=-1 二人有限零和对策(2- player finite zero- sum game):在一个对策问题中,有两个局中人 I={12},每个局中人的策略集合为有限集:S1={a1,a2…,an},S2={B1,B2,…,Bn} m,n<+∞.两个局中人的收益函数H1,H2满足H1+H2=0 显然,在二人有限零和对策中,局势集合为S1xS2={(a1,B,)|i=12…,m,j=1,2,…,n 且|S1×S2=m 设H1(a1,B,)=an,则由H1+H2=0知,H2(ax,B)=-an,i=12…,m,j=1,2,…,n (局中人1的)收益矩阵:A=(an)m,其中a=H1(a,B,),i=12,…,m,j 由收益矩阵的定义知,A的第i行各元素分别为局中人1出策略α,,局中人2出策略 B,B2;…,Bn时对应的局势下局中人1的收益:A的第j列各元素分别为局中人2出策略B,局中 人1出策略∝1,α2…an时对应的局势下局中人1的收益 显然,给定一个二人有限零和对策,即可确定一个支付矩阵;反之,给定一个矩阵A=(an1)m 若令|S=m|S2F=n,H1(a1,B)=an,H2(a1,B)=-an,则可确定一个二人有限零和对策 如此,二人有限零和对策和矩阵一一对应故二人有限零和对策亦称为矩阵对策( matrix game),记作: 2运 筹 学 讲 义 2 显然,这是一个对策问题,其中局中人为甲(1),乙(2),局中人集合为 I = {1,2} ;局中人 1 的策略可能有 1 = (出正面),  2 = (出反面),局中人 2 的策略可能有 1 = (出正面),  2 = (出 反面),  局中人 1,2 的策略集合分别为 { , } S1 = 1  2 , { , } S2 = 1  2 . 当局中人 1,2 分别从其策略集合中选择一个策略后,就得到一个局势. 局势集合为 {( , ),( , ),( , ),( , )} S1  S2 = 1 1 1  2 2 1 2  2 . 由双方的约定知,局中人 1,2 在各局势下的收益分别为 H1 (1 ,1 ) =1, H1 (1 , 2 ) = −1, H1 ( 2 ,1 ) = −1, H1 ( 2 , 2 ) =1 ; H2 (1 ,1 ) = −1, H2 (1 , 2 ) =1, H2 ( 2 ,1 ) =1, H2 (2 , 2 ) = −1.▍ 二人有限零和对策(2-player finite zero-sum game):在一个对策问题中,有两个局中人 I = {1,2} ,每个局中人的策略集合为有限集: { , , , } S1 = 1  2   m , { , , , } S2 = 1  2   n , m,n  +.两个局中人的收益函数 1 2 H ,H 满足 H1 + H2 = 0 . 显然,在二人有限零和对策中,局势集合为 {( , ) | 1,2, , , 1,2, , } S1  S2 =  i  j i =  m j =  n , 且 | S1  S2 |= mn. 设 H i j = aij ( , ) 1   ,则由 H1 + H2 = 0 知, H i j = −aij ( , ) 2   ,i = 1,2,  ,m, j = 1,2,  ,n . (局中人 1 的)收益矩阵: A = aij mn ( ) ,其中 ( , ) aij = H1  i  j ,i = 1,2,  ,m, j = 1,2,  ,n . 由收益矩阵的定义知, A 的第 i 行各元素分别为局中人 1 出策略  i ,局中人 2 出策略    n , , , 1 2  时对应的局势下局中人 1 的收益; A 的第 j 列各元素分别为局中人 2 出策略  j ,局中 人 1 出策略    n , , , 1 2  时对应的局势下局中人 1 的收益. 显然,给定一个二人有限零和对策,即可确定一个支付矩阵;反之,给定一个矩阵 A = aij mn ( ) , 若令 | S1 |= m,| S2 |= n , H i j = aij ( , ) 1   , H i j = −aij ( , ) 2   ,则可确定一个二人有限零和对策. 如此,二人有限零和对策和矩阵一一对应.故二人有限零和对策亦称为矩阵对策(matrix game),记作:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有