n 人有限博弈即为有 n 个决策人参与的博弈，每个决策人只有有限个纯策略。

点击下载：上海交通大学：《随机模拟方法与应用 Stochastic Simulation Methods and Its Applications》课程教学资源（学生作业）非合作博弈与纳什均衡——李忠睿王大伟张正强

正在加载图片...

n人有限博弈即为有个决策人参与的博弈，每个决策人只有有限个纯策略。所谓纯策略，即决策人可以做出的决定。如某企业面对价格竞争，可以选择降价或者维持原价，则“降价”就是该企业的一个纯策略，同样地，“维持原价”也是一个纯策略。我们用π，B,v等表示第i个参与者的不同纯策略。 2.混合策略，S1 参与者i的混合策略，是指他的所有纯策略的凸组合。我们用s=∑.CicTja 表示一个混合策略，其中ca≥0且∑acia=1。它的实际意义是参与者i做出纯策略πia的概率为cia。特别地，如果某个cia>0,则称混合策略s用到了a。我们说n维策略向量，是指所有参与人的策略所组成的一个向量$=(S1,S2 ,,Sn)。同样地，如果混合策略s用到了a,则称策略向量$用到了a。 3.支付函数，P 对于固定的维策略向量$，每个参与者在博弈中会得到一定的效用。记第ⅰ 个参与者得到的效用为P($),称为参与者ⅰ的支付函数。显然，p对每个参与人的混合策略是线性的(n元线性)。为方便起见，引入替代符号($；t)=(S1,52,,5-1,,5+1,…,sn, 用($；t;)表示多次替代($；t)；),余此类推。 4.均衡解我们称一个n维策略向量$是均衡解，当且仅当$满足以下条件： p($)=max{p($;)} 所有r 对一切i=1,2,…,n成立上式表明，均衡解$表示其他人的策略固定不变的情况下，每一个参与人追求自身的最大利益（支付）的混合策略。在$中，每一个人的策略都是最优的。定理1（均衡解的另一充要条件) n维策略向量$是一个均衡解，当且仅当下列条件成立：n 人有限博弈即为有 n 个决策人参与的博弈，每个决策人只有有限个纯策略。所谓纯策略，即决策人可以做出的决定。如某企业面对价格竞争，可以选择降价或者维持原价，则“降价”就是该企业的一个纯策略，同样地，“维持原价”也是一个纯策略。我们用πiα，πiβ，πiγ等表示第 i 个参与者的不同纯策略。 2. 混合策略，si 参与者 i 的混合策略，是指他的所有纯策略的凸组合。我们用si = α ciαπiα 表示一个混合策略，其中ciα ≥ 0 且 α ciα = 1。它的实际意义是参与者 i 做出纯策略πiα的概率为ciα。特别地，如果某个ciα > 0，则称混合策略si用到了πiα。我们说 n 维策略向量，是指所有参与人的策略所组成的一个向量$ = s1，s2 ，……，sn 。同样地，如果混合策略si用到了πiα，则称策略向量$用到了πiα。 3. 支付函数，pi 对于固定的 n 维策略向量$，每个参与者在博弈中会得到一定的效用。记第 i 个参与者得到的效用为pi $ ，称为参与者 i 的支付函数。显然，pi对每个参与人的混合策略是线性的（n 元线性）。为方便起见，引入替代符号 $；ti = s1，s2，…，si−1，t i，si+1，…，sn ，用 $；ti；rj 表示多次替代 $；ti ；rj ，余此类推。 4. 均衡解我们称一个 n 维策略向量$是均衡解，当且仅当$满足以下条件： pi $ = max 所有ri pi $；ri 对一切 i=1,2，…，n 成立上式表明，均衡解$表示其他人的策略固定不变的情况下，每一个参与人追求自身的最大利益（支付）的混合策略。在$中，每一个人的策略都是最优的。定理 1 （均衡解的另一充要条件） n 维策略向量$是一个均衡解，当且仅当下列条件成立：

<<向上翻页向下翻页>>