对策论 由“齐王赛马”引入
对策论 由“齐王赛马”引入
1.对策论的基本概念 °三个基本要素; 1.局中人:参与对抗的各方 ·2.策略集:局中人选择对付其它局 中人的行动方案称为策略 某局中人的所有可能策 略全体称为策略集 3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势, 个局势决定了个局众人的对策结果 (量化)称为该局势对策的盖损值)
1.对策论的基本概念 • 三个基本要素; • 1.局中人:参与对抗的各方; • 2.策略集:局中人选择对付其它局 中人的行动方案称为策略。 某局中人的所有可能策 略全体称为策略集; 3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了个局众人 的对策结果 (量化)称为该局势对策的益损值)
齐王赛马”齐王在各局势中的 盖损值表(单位:千金) β1阝2β3阝45β6 齐王损 (上中下)(上.中下)(上中.下)(上.中.下)(上,中.下)(上,中,下) 益值 S1 C1(上.中.下) C2(上.中.下) 311 C3(上.中.下) C4(上.中.下) C5(上.中.下) 131111 113111 1311 3 C6(上.中.下)
“齐王赛马”齐王在各局势中的 益损值表(单位:千金)
其中 齐王的策略集 S1={aL1,2,a3,a4,5,c6} ·田忌的策略集 S1={β1,β2,β3,B4,β5,β6} 下列矩阵称齐王的嬴得矩阵 A 311111 131111 1131 1311 111131 111113
• 其中: • 齐王的策略集: S1={1,2,3,4,5,6} • 田忌的策略集: S1={1,2,3,4,5,6} 下列矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
1.基本概念(续) 二人有限零和对策:(又称矩阵策略) 局中人为2; 每局中人的策略集中策略权目有限 每一局势的对策均有确定的损益值 并且对同一局势的两个局中人的益 损值之和为零
1.基本概念(续) 二人有限零和对策:(又称矩阵策略) ➢局中人为2; ➢每局中人的策略集中策略权目有限; ➢每一局势的对策均有确定的损益值, 并且对同一局势的两个局中人的益 损值之和为零
1.基本概念(续) ·记矩阵对策为 G={S,S2,A} 甲的策略集 甲的嬴得矩阵 乙的策略集 “齐王赛马”即是一个矩阵策略
1.基本概念(续) • 记矩阵对策为: • G = {S1, S2, A} • • 甲的策略集 甲的赢得矩阵 • 乙的策略集 • “齐王赛马”即是一个矩阵策略
2.矩阵对策的最优纯策略 在甲方嬴得矩阵中: A=;il i行代表甲方策略i=1,2.m J列代表乙方策略j=1,2..n °a;代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-a1;(零 和性质)。 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑
2.矩阵对策的最优纯策略 • 在甲方赢得矩阵中: • A=[aij]m*n • i行代表甲方策略 i=1,2…m • J列代表乙方策略 j=1,2…n • aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零 和性质)。 • 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑
2.矩阵对策的最优纯策略(续) ·例:有交易双方公司甲和乙,甲有 三个策略01,Q2,O3;乙有四个策 略β1,β2,β3,β4,根据获利情况建 立甲方的益损值赢得矩阵, A 322 034 201 3 ·问:甲公司应采取什么策略比较适 合?
2.矩阵对策的最优纯策略(续) • 例:有交易双方公司甲和乙,甲有 三个策略1,2,3;乙有四个策 略1,2,3,4,根据获利情况建 立甲方的益损值 赢得矩阵。 • -3 0 -2 0 • A= 2 3 0 1 • -2 -4 -1 3 • 问:甲公司应采取什么策略比较适 合?
甲 采取01至少得益3(损失3)取大则取a2 0 max min a- 4(损失4) 乙 采取β1甲最多得盖2 (乙最少得益-2)取小则取阝 β2 3(乙得益-3) min max a:0 0(乙得益0) 3(乙得益-3)
甲: 采取1至少得益–3(损失 3) 2 0 3 -4(损失 4) 乙: 采取1甲最多得益2 (乙最少得益-2) 2 3(乙得益-3) 3 0(乙得益 0) 4 3(乙得益-3) 取大则取2 max min aij= 0 i j 取小则取3 min max aij= 0 j i
甲采取策略α不管乙采取如何策略 都至少得益。 °之采取策略β3不管甲采取如何策略, 都至少可以得盖。(最多损失0) 分别称甲,乙公司的最优策略·由噍 性又称最优纯策略 存在前提: max min ai.≡ min ma x a1j=V 又称(2,β3)为对策G={s1,S2,A} 的鞍点。值V为G的值
• 甲采取策略2 不管乙采取如何策略, 都至少得益。 • 乙采取策略3 不管甲采取如何策略, 都至少可以得益。(最多损失0) 分别称甲,乙公司的最优策略,由唯 一性又称最优纯策略。 存在前提: max min aij = min max aij = v i j j i 又称( 2 ,3 )为对策G={s1,s2,A} 的鞍点。值V为G的值