需要补充的一点是,在对策中总是假定每一个局中人都是理智的,聪明的决策者或竞争者。 即对任一局中人来讲,不存在利用其它局中人决策的失误,来扩大自身利益的可能性或相反。 (2)策略集 局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略,参加对策的每 局中人,i∈I都有自己的策略集S;’一般,每一局中人的策略集中至少应包括两个策略 在“齐王赛马”例子中,如用(上、中、下)表示以上马、中马、下马依次参赛次序,这是 个完整的行动方案,即为一个策略。可见,局中人齐王与田忌各自都有六个策略:(上、中、下) (上、下、中)、(中、上、下)、(中、下、上)、(下、中、上)、(下、上、中) (3)赢得函数(支付函数) 在一局对策中,当局势给定以后,就用一个数来表示得失(或输赢),显然,这种“得失”或“输 赢”是局势的函数,称为支付函数。 例如,S;是i个局中人的一个策略,则n个局中人的策略组 是一个局势,全体局势的集合S可用各局人策略集的笛卡尔积表示,即 S=s1×s2×…×sa 当局势出现后,对策结果也就确定了,即对任一局势s∈S,局中人I可能得到一个赢得H(s) 显然H(s)是局势s的函数,称为第Ⅰ个局中人的赢得函数(支付函数) 齐王赛马中,局中人集体I={1.2} 齐王的策略集用S1={a,a2a3.a4as.ad 田忌的策略集用S2={B.B2B3.B4B5Bd表示 这样齐王的任一策略α:和田忌的任一策略β,就决定了一个局势S,如果a=(上、中、下) β1=(上、中、下)则在局势S1下齐王的赢得值为H1(S1)=3 田忌的赢得值为H2(S1)=-3如此等等 般当这三个基本因素确定后,一个对策模型也就给定了,对策论的模型很多,如矩阵对策 连续对策、微分对策、阵地对策、随机对策等 在众多对策模型中占有重要地位的是二人有限零和对策对策,又称矩阵对策。矩阵对策是到目 前为止在理论硏究和求解方法方面比较完善的一类对策,而且这类对策的研究思想和理论结果又是 研究其它类型对策模型的基础,由于学时的限制,我们只能主要介绍矩阵对策的基本理论和方法。 §2矩阵对策 我们来看几个矩阵对策的例子 例1、我们称“石头一剪子一布”游戏是一个对策问题,设参加游戏的是甲、乙两人,他们的 策略集合都是{石头、剪子、布},也就是说他们在每一局比赛中都只能采取各自策略集合中的一个 策略,如果我们再规定,赢得的一方得一分,输的那方得-1分。显然,这个问题是两人有限零和对 策,即矩阵对策 我们可以列出甲、乙两人在一局比赛中的各种局势下的贏输分数。因为这是零和对策,故只 知道甲、乙任何一方在各种局势下的分数,就能够知道对分的情况了。 乙两人在各种局势下的得分情况如下表所示 22 需要补充的一点是,在对策中总是假定每一个局中人都是理智的,聪明的决策者或竞争者。 即对任一局中人来讲,不存在利用其它局中人决策的失误,来扩大自身利益的可能性或相反。 (2)策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略,参加对策的每 局中人,i∈I 都有自己的策略集 i S ,一般,每一局中人的策略集中至少应包括两个策略。 在“齐王赛马”例子中,如用(上、中、下)表示以上马、中马、下马依次参赛次序,这是一 个完整的行动方案,即为一个策略。可见,局中人齐王与田忌各自都有六个策略:(上、中、下)、 (上、下、中)、(中、上、下)、(中、下、上)、(下、中、上)、(下、上、中)。 (3)赢得函数(支付函数) 在一局对策中,当局势给定以后,就用一个数来表示得失(或输赢),显然,这种“得失”或“输 赢”是局势的函数,称为支付函数。 例如,Si 是 i 个局中人的一个策略,则 n 个局中人的策略组 S = (s1,s2 …sn) 是一个局势,全体局势的集合 S 可用各局人策略集的笛卡尔积表示,即 S = s1×s2×…×sn 当局势出现后,对策结果也就确定了,即对任一局势 s∈S,局中人 I 可能得到一个赢得 H(s)。 显然 Hi(s)是局势 s 的函数,称为第 I 个局中人的赢得函数(支付函数) 齐王赛马中,局中人集体 I={1.2} 齐王的策略集用 S1 = {α1,α2,α3,α4,α5,α6} 田忌的策略集用 S2 = {β1,β2,β3,β4,β5,β6}表示 这样齐王的任一策略αi 和田忌的任一策略βj,就决定了一个局势 Sij,如果α1=(上、中、下)、 β1 =(上、中、下)则在局势 S11 下齐王的赢得值为 H1(S11)=3。 田忌的赢得值为 H2(S11)=-3 如此等等 一般当这三个基本因素确定后,一个对策模型也就给定了,对策论的模型很多,如矩阵对策、 连续对策、微分对策、阵地对策、随机对策等。 在众多对策模型中占有重要地位的是二人有限零和对策对策,又称矩阵对策。矩阵对策是到目 前为止在理论研究和求解方法方面比较完善的一类对策,而且这类对策的研究思想和理论结果又是 研究其它类型对策模型的基础,由于学时的限制,我们只能主要介绍矩阵对策的基本理论和方法。 §2 矩阵对策 我们来看几个矩阵对策的例子。 例 1、我们称“石头—剪子—布”游戏是一个对策问题,设参加游戏的是甲、乙两人,他们的 策略集合都是{石头、剪子、布},也就是说他们在每一局比赛中都只能采取各自策略集合中的一个 策略,如果我们再规定,赢得的一方得一分,输的那方得-1 分。显然,这个问题是两人有限零和对 策,即矩阵对策。 我们可以列出甲、乙两人在一局比赛中的各种局势下的赢输分数。因为这是零和对策,故只需 知道甲、乙任何一方在各种局势下的分数,就能够知道对分的情况了。 乙两人在各种局势下的得分情况如下表所示