正在加载图片...
不同 用A表示博弈的局中人集合,S。表示局中人a∈A的策略集合,f。表示a的收益函数 则G=(Sa,∫a)nA就表示了一个博弈。根据局中人的多少,博弈可分为二人博弈和多人博弈 根据博弈的策略集合是否有限,博弈还又可分为有限博弈和无限博弈。例如,便士匹配和囚徒 难题都是有限博弈,而古诺博弈和贝特兰博弈都是无限博弈。还可根据所有局中人的收益总和 是否固定,把博弈分为常和博弈和变和博弈。常和博弈分为零和博弈(即收益总和为零的博弈) 和非零和博弈。二人零和有限博弈是所有博弈中最简单、最重要的一类,通常称为矩阵博弈。 本节以二人博弈为重点,介绍有关策略博弈的概念与理论 策略表与收益矩阵 设二人博弈的局中人是甲和乙。甲有m种可选策略,策略表为X={x1,x2,…,xm};乙有n 种可选策略,策略表为Y={υ1,y2,…,yn}。当甲采取策略x,,乙采取策略y时,(x,y)称 为博弈的局势,集合S=X×Y就是局势集合(局势表、局势矩阵),即 (x1,y)(x1,y2) S={x,y)1=12…,m/=12…,n=(2y)(x2,y)…(x2,)=(x,y, 每个局中人选择自己的策略时,都要考虑对手的行动。这样每个局中人的收益不但与自 己的选择有关,而且与对手的选择有关,收益函数是定义在局势集合S上的函数,这里假定了 局中人的收益是可以用实数来都来计量的。用∫表示局中人甲的收益函数,用g表示局中人 乙的收益函数。由于局势集合S是有限集合,收益函数∫和g都可用矩阵加以表示,这些矩 就称为收益矩阵。记f=f(x,y),gm=g(x,y),则甲和乙的收益矩阵分别为 f=umm,g=gu) 当∫+g≡C(常数)(=1,2,…,mj=1,2,…,m)时,该博弈就是常和博弈。否则,就是变和 博弈。局中人的策略与收益也可用收益表加以表达: 表1:博弈的收益表 乙的策略 甲的策略 y y IJ2n, g2n 般情况下,二人博弈可表示成G=G2=(X,f},g)。但对于二人常和博弈,则可简单 地表示成G=G2(C)=(X,Y,f,C),其中C为收益的常数和。而矩阵博弈则可更简单地表示 成G=G2=(XY,∫),或者直接用甲的收益矩阵∫来表示矩阵博弈。 最小最大原理 局中人的目标是选择使自己收益最大化的策略,我们来分析局中人如何决策。假定甲乙 双方彼此了解对方的收益表。如果甲通过间谍获悉乙采取某种策略y,时,甲必然会采取相应 的某种策略x,以求自己的收益最大,即选择x;使下式成立第八章 博弈论 232 不同。 用 A 表示博弈的局中人集合, a S 表示局中人 a A 的策略集合, a f 表示 a 的收益函数, 则 a a a A G S f =  ( , ) 就表示了一个博弈。根据局中人的多少,博弈可分为二人博弈和多人博弈。 根据博弈的策略集合是否有限,博弈还又可分为有限博弈和无限博弈。例如,便士匹配和囚徒 难题都是有限博弈,而古诺博弈和贝特兰博弈都是无限博弈。还可根据所有局中人的收益总和 是否固定,把博弈分为常和博弈和变和博弈。常和博弈分为零和博弈(即收益总和为零的博弈) 和非零和博弈。二人零和有限博弈是所有博弈中最简单、最重要的一类,通常称为矩阵博弈。 本节以二人博弈为重点,介绍有关策略博弈的概念与理论。 一.策略表与收益矩阵 设二人博弈的局中人是甲和乙。甲有 m 种可选策略,策略表为 X = x1 , x2 ,  , xm  ;乙有 n 种可选策略,策略表为 Y = y1 , y2 ,  , yn  。当甲采取策略 i x ,乙采取策略 y j 时, (xi , y j) 称 为博弈的局势,集合 S = X Y 就是局势集合(局势表、局势矩阵),即   ( ) m n i j m m m n n n i j x y x y x y x y x y x y x y x y x y x y S x y i m j n  =               = = = = ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ) ( , ): 1,2, , ; 1,2, , 1 2 2 1 2 2 2 1 1 1 2 1          每个局中人选择自己的策略时,都要考虑对手的行动。这样每个局中人的收益不但与自 己的选择有关,而且与对手的选择有关,收益函数是定义在局势集合 S 上的函数,这里假定了 局中人的收益是可以用实数来都来计量的。用 f 表示局中人甲的收益函数,用 g 表示局中人 乙的收益函数。由于局势集合 S 是有限集合,收益函数 f 和 g 都可用矩阵加以表示,这些矩 阵就称为收益矩阵。记 fi j = f (xi , y j) , gi j = g(xi , y j) ,则甲和乙的收益矩阵分别为: ( ) m n i j f f  = , ( ) m n g gi j  = 当 fi j + gi j C (常数) (i =1,2,  ,m; j =1,2,  , n) 时,该博弈就是常和博弈。否则,就是变和 博弈。局中人的策略与收益也可用收益表加以表达: 表 1: 博弈的收益表 乙的策略 甲的策略 y1 y 2 …… y n x1 f11 , g11 f12 , g12 …… f1n , g1n x2 f 21 , g21 f 22 , g22 …… f 2 n , g2 n    ……  xm fm1 , g m1 f m 2 , g m2 …… f mn , g mn 一般情况下,二人博弈可表示成 G = G2 = (X , f ;Y, g) 。但对于二人常和博弈,则可简单 地表示成 G = G2 (C ) = (X,Y, f ,C ) ,其中 C 为收益的常数和。而矩阵博弈则可更简单地表示 成 G = G2 = (X,Y, f ) ,或者直接用甲的收益矩阵 f 来表示矩阵博弈。 二.最小最大原理 局中人的目标是选择使自己收益最大化的策略,我们来分析局中人如何决策。假定甲乙 双方彼此了解对方的收益表。如果甲通过间谍获悉乙采取某种策略 y j 时,甲必然会采取相应 的某种策略 xi ,以求自己的收益最大,即选择 xi 使下式成立:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有