正在加载图片...
n人有限博弈即为有个决策人参与的博弈,每个决策人只有有限个纯策略。 所谓纯策略,即决策人可以做出的决定。如某企业面对价格竞争,可以选择降价 或者维持原价,则“降价”就是该企业的一个纯策略,同样地,“维持原价”也 是一个纯策略。我们用π,B,v等表示第i个参与者的不同纯策略。 2.混合策略,S1 参与者i的混合策略,是指他的所有纯策略的凸组合。我们用s=∑.CicTja 表示一个混合策略,其中ca≥0且∑acia=1。它的实际意义是参与者i做出 纯策略πia的概率为cia。特别地,如果某个cia>0,则称混合策略s用到了a。 我们说n维策略向量,是指所有参与人的策略所组成的一个向量$=(S1,S2 ,,Sn)。同样地,如果混合策略s用到了a,则称策略向量$用到了a。 3.支付函数,P 对于固定的维策略向量$,每个参与者在博弈中会得到一定的效用。记第ⅰ 个参与者得到的效用为P($),称为参与者ⅰ的支付函数。显然,p对每个参与人 的混合策略是线性的(n元线性)。 为方便起见,引入替代符号($;t)=(S1,52,,5-1,,5+1,…,sn, 用($;t;)表示多次替代($;t);),余此类推。 4.均衡解 我们称一个n维策略向量$是均衡解,当且仅当$满足以下条件: p($)=max{p($;)} 所有r 对一切i=1,2,…,n成立 上式表明,均衡解$表示其他人的策略固定不变的情况下,每一个参与人追 求自身的最大利益(支付)的混合策略。在$中,每一个人的策略都是最优的。 定理1(均衡解的另一充要条件) n维策略向量$是一个均衡解,当且仅当下列条件成立:n 人有限博弈即为有 n 个决策人参与的博弈,每个决策人只有有限个纯策略。 所谓纯策略,即决策人可以做出的决定。如某企业面对价格竞争,可以选择降价 或者维持原价,则“降价”就是该企业的一个纯策略,同样地,“维持原价”也 是一个纯策略。我们用πiα,πiβ,πiγ等表示第 i 个参与者的不同纯策略。 2. 混合策略,si 参与者 i 的混合策略,是指他的所有纯策略的凸组合。我们用si = α ￾ ciαπiα 表示一个混合策略,其中ciα ≥ 0 且 α ￾ ciα = 1。它的实际意义是参与者 i 做出 纯策略πiα的概率为ciα。特别地,如果某个ciα > 0,则称混合策略si用到了πiα。 我们说 n 维策略向量,是指所有参与人的策略所组成的一个向量$ = s1,s2 ,……,sn 。同样地,如果混合策略si用到了πiα,则称策略向量$用到了πiα。 3. 支付函数,pi 对于固定的 n 维策略向量$,每个参与者在博弈中会得到一定的效用。记第 i 个参与者得到的效用为pi $ ,称为参与者 i 的支付函数。显然,pi对每个参与人 的混合策略是线性的(n 元线性)。 为方便起见,引入替代符号 $;ti = s1,s2,…,si−1,t i,si+1,…,sn , 用 $;ti;rj 表示多次替代 $;ti ;rj ,余此类推。 4. 均衡解 我们称一个 n 维策略向量$是均衡解,当且仅当$满足以下条件: pi $ = max 所有ri pi $;ri 对一切 i=1,2,…,n 成立 上式表明,均衡解$表示其他人的策略固定不变的情况下,每一个参与人追 求自身的最大利益(支付)的混合策略。在$中,每一个人的策略都是最优的。 定理 1 (均衡解的另一充要条件) n 维策略向量$是一个均衡解,当且仅当下列条件成立:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有