正在加载图片...
235 甲的反应策略x=0(y)是按照f(x,y)=f((y,y)=max{(x2y):x∈x来确定的。这个映射 q:Y→X就叫做甲对乙的反应函数。 同样的道理,可以确定出乙对甲的反应函数v:X→Y,即对任何x∈X,y=v(x)是按 照g(x,y)=g(x,v(x)=maxg(x,y):y∈}来确定的 利用反应函数,我们也可以解释博弈的结局。就象古诺博弈一样,假如甲先采取某种策 略x∈Ⅺ,乙通过某种途径获悉了甲的这一行动,并认为甲不会改变他的策略,于是作出反 应,决定采取策略υ=ψ(x1),以使自己的收益最大化。当乙采取策略υ时,甲掌握了这一信 息,并认为乙不会改变他的策略,于是作出反应,改变原来的策略,决定采用x2=(y),以 求收益最大化。这时,乙再次对甲的行为作出反应,采取新策略y2=v(x2)。甲也再次对乙 的行动作出反应,采取新策略x=(y2)。这样的反应不断下去,直到最后达到y=v(x)且 x=φ(υ)时博弈实现了均衡,此时的局势(x,y)就是博弈的最优解(均衡、最优局势)。 综上所述,博弈的结局是实现均衡,并且均衡由甲乙双方的反应函数确定,即由方程组 ∫x=(y)决定。事实上,(x,y+)是该方程组的解当且仅当 f(x', y*)=max f(x, ys) g(x*,y*)=maxg(x*,y’而这 正是博弈G实现均衡的含义。注意,以上关于反应函数的讨论,没有要求策略集合的有限性 即集合X和Y可以是任何集合。 下面考虑二人无限博弈的一种特殊情况:策略集合X和Y都是实数区间。比如,本章第 节例3中古诺博弈的局中人策略集合就是区间[O.+∞)(半直线),例4中贝特兰博弈的局中 人策略集合也是半直线。假设局中人甲和乙的收益函数f:X→R和g:Y→R可微,则甲对 乙的反应函数x=0(y)由方程(一阶条件)af(x,y)/x=0决定,乙对甲的反应函数y=v(x)由 方程(一阶条件)∂g(x,y)/∂y=0决定,从而博弈的最优解就是如下方程组的解 (xy)=0(甲对乙的反应函数x=9(y) (x,y) dy0(乙对甲的反应函数y=v(x)) 例2.二人博弈的反应函数及最优解 设二人博弈中,甲和乙的策略集合X和Y为X=Y=[0,+∞),收益函数∫和g分别如下: f(x, y)=a1x+a2y+a3xy+a4x+asy+ g(x,y)=61x+b2y+b3xy+b4x+b5y+b6 求偏导数得方程组 Jof(x, y)/ax=2a1x+a3,y+a4 ag(x,y)/oy=2b+bx+b°由此可知局中人甲和乙的反应函数分别为 ∫x=g(y)=(a3y+a+)(2a1) ,博弈的最优解为 ∫x*=(ab5-2ab2)/4a1b2-a3b) y=y(x)=(bb3x+b5)/(2b2 y*=(a4b3-2a1bs)/(4a1b2-a3b3) 四.策略选择的经济模拟 第一节中曾经指出,描述一个博弈时策略集合的选择至关重要。比较古诺博弈和贝特兰 博弈,虽然二者的目的都是要模拟同一经济现象一一双头垄断,但二者的结构却很不同。古诺 博弈中厂商的策略是选择产量,厂商的收益是策略变量的连续函数:而贝特兰博弈中厂商的策第八章 博弈论 235 甲的反应策略 x =(y) 是按照 f (x, y) = f (( y), y) = maxf (x  , y): x  X 来确定的。这个映射  :Y → X 就叫做甲对乙的反应函数。 同样的道理,可以确定出乙对甲的反应函数  : X →Y ,即对任何 x X , y =(x) 是按 照 g(x, y) = g(x,(x)) = maxg(x, y ): y Y 来确定的。 利用反应函数,我们也可以解释博弈的结局。就象古诺博弈一样,假如甲先采取某种策 略 x1  X ,乙通过某种途径获悉了甲的这一行动,并认为甲不会改变他的策略,于是作出反 应,决定采取策略 y1 =(x1 ) ,以使自己的收益最大化。当乙采取策略 y1 时,甲掌握了这一信 息,并认为乙不会改变他的策略,于是作出反应,改变原来的策略,决定采用 x2 =( y1 ) ,以 求收益最大化。这时,乙再次对甲的行为作出反应,采取新策略 y2 =(x2 ) 。甲也再次对乙 的行动作出反应,采取新策略 x3 =( y2 ) 。这样的反应不断下去,直到最后达到 y =(x) 且 x =(y) 时博弈实现了均衡,此时的局势 (x, y) 就是博弈的最优解(均衡、最优局势)。 综上所述,博弈的结局是实现均衡,并且均衡由甲乙双方的反应函数确定,即由方程组    = = ( ) ( ) y x x y   决定。事实上, (x*, y*) 是该方程组的解当且仅当      = =   ( *, *) max ( *, ) ( *, *) max ( , *) g x y g x y f x y f x y y Y x X ,而这 正是博弈 G 实现均衡的含义。注意,以上关于反应函数的讨论,没有要求策略集合的有限性, 即集合 X 和 Y 可以是任何集合。 下面考虑二人无限博弈的一种特殊情况:策略集合 X 和 Y 都是实数区间。比如,本章第 一节例 3 中古诺博弈的局中人策略集合就是区间 [0,+) (半直线),例 4 中贝特兰博弈的局中 人策略集合也是半直线。假设局中人甲和乙的收益函数 f : X → R 和 g :Y → R 可微,则甲对 乙的反应函数 x =(y) 由方程(一阶条件) f (x, y) x = 0 决定,乙对甲的反应函数 y =(x) 由 方程(一阶条件)  g(x, y)  y = 0 决定,从而博弈的最优解就是如下方程组的解:        = =   = =   0 ( ( )) ( , ) 0 ( ( )) ( , ) y x y g x y x y x f x y   乙对甲的反应函数 甲对乙的反应函数 例 2.二人博弈的反应函数及最优解 设二人博弈中,甲和乙的策略集合 X 和 Y 为 X = Y =[0,+) ,收益函数 f 和 g 分别如下: 3 4 5 6 2 2 2 1 3 4 5 6 2 2 2 1 ( , ) ( , ) g x y b x b y b x y b x b y b f x y a x a y a x y a x a y a = + + + + + = + + + + + 求偏导数得方程组      = + +   = + + 2 3 5 1 3 4 ( , ) 2 ( , ) 2 g x y y b y b x b f x y x a x a y a 。由此可知局中人甲和乙的反应函数分别为    = = + = = + ( ) ( ) (2 ) ( ) ( ) (2 ) 3 5 2 3 4 1 y x bb x b b x y a y a a   ,博弈的最优解为    = − − = − − * ( 2 ) (4 ) * ( 2 ) (4 ) 4 3 1 5 1 2 3 3 3 5 4 2 1 2 3 3 y a b a b a b a b x a b a b a b a b 。 四.策略选择的经济模拟 第一节中曾经指出,描述一个博弈时策略集合的选择至关重要。比较古诺博弈和贝特兰 博弈,虽然二者的目的都是要模拟同一经济现象——双头垄断,但二者的结构却很不同。古诺 博弈中厂商的策略是选择产量,厂商的收益是策略变量的连续函数;而贝特兰博弈中厂商的策
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有