正在加载图片...
234 一般来讲,要想一个二人博弈G2=(X,f;},g)具有确定的结局,必须存在这样的局势 (x*,y=)∈S=X×Y f(x' y*)=max f(x, y*) r∈X g(x, y*)=max g(x', y) 满足这个条件的的局势(x*,υ*),叫做博弈G2的均衡或最优解或最优局势,其中的x*和y*分 别叫做局中人甲和乙的最优策略或均衡策略。这个条件也就叫做博弈的均衡条件。 对于二人常和博弈G2=(X,F,来说,(x*,y*)是博弈的最优解当且仅当 f(x y*)=max f(x,y*)=mn f(x', y) 数学中,满足这个条件的点(x*,y*)叫做函数∫的鞍点。因此,(x*,y*)是博弈的最优解当且 仅当(x*,y*)是收益函数∫的鞍点。下面的定理给出了鞍点的判别条件。 鞍点定理.(x*,y)是收益函数∫:XxY→R的鞍点的充要条件是: f(r,y 率)= max min J(x y)=min max f(x, y) 证明:必要性(→).设(x*,y*)是∫的鞍点,即f(x*+,y)=maxf(x,y*)=minf(x*,y)。 从mnf(x,y)≤f(x,y)可知,minf(x,y)≤maxf(x,y)对一切(x,y)∈XxY成立,这 就蕴含着 max min f(x,y)≤ min max f(xy),即 max mn f(x,y)≤ min max f(x,y) 注意, max min f(x,y)≥minf(x*,y)=f(x*,y*)=maxf(x,y*)≥ mn max f(x,y)。这就 证明了f(x*,y*)= maxmin f(x,y)= min max f(x,y) 充分性(<=).设(x*,y*)∈XxY满足f(x*,y*)= max min f(x,y)= min max f(x,y)。从 f(x*,y*)= max min f(x,y)可知f(x*,y*)=mnf(x*,y);从f(x*,y*)= min max f(x,y)可 知f(x*+,y*)=maxf(x,y*)。所以,f(x*,y*)=maxf(x,y*)=minf(x*,y),即(x*,y*)是函 数∫的鞍点。◆ 既然二人常和博弈的最优解恰好就是收益函数的鞍点,鞍点定理告诉我们,当收益函数 的鞍点存在时,利用最小最大原理确定的博弈局势就是二人常和博弈的最优解。 但是,当收益矩阵不存在鞍点时,常和博弈就没有最优解,博弈的结局就是高度不确定 的。鉴于此,我们将有鞍点的常和博弈称为严格确定的博弈。 三.反应函数 博弈G=(X,fY,g)的局中人总是要考虑对手的行动,然后确定自己的对策。当乙采取 了某种策略ν∈γ,而且被甲所觉察时,甲必然有所反应,要确定出相应的对策x∈X以使自 己的收益∫在乙选择y的情况下达到最大,即要使f(x,y)=max(x,y):x'∈x}。甲对乙的 行动的这种反应,确定了一个从乙的策略集合Y到甲的策略集合x的映射q,即对任何y∈Y第八章 博弈论 234 一般来讲,要想一个二人博弈 G2 = (X, f ;Y, g) 具有确定的结局,必须存在这样的局势 (x*, y*)S = X Y :      = =   ( *, *) max ( *, ) ( *, *) max ( , *) g x y g x y f x y f x y y Y x X 满足这个条件的的局势 (x*, y*) ,叫做博弈 G2 的均衡或最优解或最优局势,其中的 x* 和 y* 分 别叫做局中人甲和乙的最优策略或均衡策略。这个条件也就叫做博弈的均衡条件。 对于二人常和博弈 G2 = (X ,Y, f ) 来说, (x*, y*) 是博弈的最优解当且仅当 f (x*, y*) max f (x, y*) min f (x*, y) xX yY = = 数学中,满足这个条件的点 (x*, y*) 叫做函数 f 的鞍点。因此, (x*, y*) 是博弈的最优解当且 仅当 (x*, y*) 是收益函数 f 的鞍点。下面的定理给出了鞍点的判别条件。 鞍点定理. (x*, y*) 是收益函数 f : X Y → R 的鞍点的充要条件是: f (x*, y*) max min f (x, y) min max f (x, y) xX yY yY xX = = 证明:必要性 () . 设 (x*, y*) 是 f 的鞍点,即 f (x*, y*) max f (x, y*) min f (x*, y) xX yY = = 。 从 min f (x, y ) f (x, y) y Y    可知, min f (x, y ) max f (x , y) y Y x X      对一切 (x, y) X Y 成立,这 就蕴含着 max min f (x, y ) min max f (x , y) x X y Y y Y x X        ,即 max min f (x, y) min max f (x, y) xX yY yY xX  。 注意, max min f (x, y) min f (x*, y) f (x*, y*) max f (x, y*) min max f (x, y) xX yY yY xX yY xX  = =  。这就 证明了 f (x*, y*) max min f (x, y) min max f (x, y) xX yY yY xX = = 。 充分性 () .设 (x*, y*) X Y 满足 f (x*, y*) max min f (x, y) min max f (x, y) xX yY yY xX = = 。从 f (x*, y*) max min f (x, y) xX yY = 可知 f (x*, y*) min f (x * , y) yY = ;从 f (x*, y*) min max f (x, y) yY xX = 可 知 f (x*, y*) max f (x, y*) xX = 。所以, f (x*, y*) max f (x, y*) min f (x*, y) xX yY = = ,即 (x*, y*) 是函 数 f 的鞍点。◆ 既然二人常和博弈的最优解恰好就是收益函数的鞍点,鞍点定理告诉我们,当收益函数 的鞍点存在时,利用最小最大原理确定的博弈局势就是二人常和博弈的最优解。 但是,当收益矩阵不存在鞍点时,常和博弈就没有最优解,博弈的结局就是高度不确定 的。鉴于此,我们将有鞍点的常和博弈称为严格确定的博弈。 三.反应函数 博弈 G = (X, f ;Y, g) 的局中人总是要考虑对手的行动,然后确定自己的对策。当乙采取 了某种策略 yY ,而且被甲所觉察时,甲必然有所反应,要确定出相应的对策 x X 以使自 己的收益 f 在乙选择 y 的情况下达到最大,即要使 f (x, y) = maxf (x  , y): x  X 。甲对乙的 行动的这种反应,确定了一个从乙的策略集合 Y 到甲的策略集合 X 的映射  ,即对任何 yY
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有