Q买非点藏为同课程运笑学 第七章对策论 Game Theory 7.1基本概念 7.2矩阵对策的纯策略 7.3矩阵对策的混合策略与混合扩充 天津大学运筹学课程网站202.113.13.67/ ourse/ddg
第七章 对策论 (Game Theory) 7.1 基本概念 7.2 矩阵对策的纯策略 7.3 矩阵对策的混合策略与混合扩充
运筹学 operations research 第七章对策论 二人有限零和对策是对策论最基本的内容 Game Theory也可译为博弈论,是研究决策主体的 行为发生直接相互作用时的决策以及这种决策的均 衡问题的学科 1994年诺贝尔经济学奖授给了三位博弈论专家:纳 什、泽尔腾、海萨尼。博弈论已经成为当代经济学 的基石
第七章 对策论 二人有限零和对策是对策论最基本的内容。 Game Theory也可译为博弈论,是研究决策主体的 行为发生直接相互作用时的决策以及这种决策的均 衡问题的学科。 1994年诺贝尔经济学奖授给了三位博弈论专家:纳 什、泽尔腾、海萨尼。博弈论已经成为当代经济学 的基石
运筹学 operations research 第七章对策论 7.1基本概念 对策现象与对策论 1.对策现象 ①下棋:围棋源于我国殷代。 ②齐王赛马:齐王与大将田忌赛马,各自的马都分为三 等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下一上,上一中,中一下 结果田忌胜出
第七章 对策论 7.1 基本概念 一、对策现象与对策论 1. 对策现象 ①下棋:围棋源于我国殷代。 齐王赛马:齐王与大将田忌赛马,各自的马都分为三 等,但齐王的同等马均强于田忌。孙膑给田忌出主意, 用下----上,上----中,中----下, 结果田忌胜出。 ②
运筹学 operations research 第七章对策论 ③猜手:小孩A与B猜手,若规定赢得1分,平 得0分,输得-1分,则A的赢得可用右表 来表示。 顾B石头剪子布 石头01-1 剪子-101 布
第七章 对策论 1 -1 0 -1 0 1 10 -1 A 石头 剪子 石头 剪子 布 赢 B 布 猜手:小孩A与B猜手,若规定赢得1分,平 得0分,输得 -1分,则 A的赢得可用右表 来表示。 ③
运筹学 operations research 第七章对策论 42.对策论的产生 4194.年,纽曼与曼彻斯特发表了题为《对策论和经济 行为》。二次大战前后,由于军事需要,抽象成数学 模型 450年代是对策论发展的鼎盛时期,纳什和夏普利等提 出了讨价还价模型和合作对策的“核”的概念。同时, 非合作对策也开始创立。纳什于1950和1951年发表了 两篇关于非合作对策的文章,图克于1950年定义了“囚 徒困境”问题 460年代,泽尔腾(1965)引入动态分析,提出“精练 纳什均衡”概念。海萨尼(1967-1968)则把不完全信 息引入对策论的研究
第七章 对策论 2 . 对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经济 行为》。二次大战前后,由于军事需要,抽象成数学 模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等提 出了讨价还价模型和合作对策的“核”的概念。同时, 非合作对策也开始创立。纳什于1950和1951年发表了 两篇关于非合作对策的文章,图克于1950年定义了“囚 徒困境”问题。 60年代,泽尔腾(1965)引入动态分析,提出“精练 纳什均衡”概念。海萨尼(1967-1968)则把不完全信 息引入对策论的研究
运筹学 operations research 第七章对策论 二、对策问题的组成 (1)局中人:对策中有决策权的参与者 (2)策略与策略集:在一局对策中,把局中人的一个可行方 案称为它的一个策略,把局中人的策略全体叫做策略集和, (3)局勢:当每个局中人从自己的策略集中选择了一个策略 组成的策略组就称为一个局势 (4)支付:局勢出现后,对策的结果也就确定了,对任一局 势,任一局中人都有一个支付值。显然,支付是局势的函数 分为/零和:各局中人的得失之和为0 非零和:各局中人的得失之和非0
第七章 对策论 二 、对策问题的组成 (1)局中人:对策中有决策权的参与者。 (2)策略与策略集:在一局对策中,把局中人的一个可行方 案称为它的一个策略,把局中人的策略全体叫做策略集和。 (3)局势:当每个局中人从自己的策略集中选择了一个策略 组成的策略组就称为一个局势 。 (4)支付:局势出现后,对策的结果也就确定了,对任一局 势,任一局中人都有一个支付值。显然,支付是局势的函数。 0 0 ⎧ ⎨ ⎩ 零和:各局中人的得失之和为 分为 非零和:各局中人的得失之和非
运筹学 operations research 第七章对策论 7.2矩阵对策的纯策略 纯策略与混合策略 纯策略是指确定的选择某策略; 混合策略则指以某一概率分布选择各策略
第七章 对策论 一、纯策略与混合策略 纯策略是指确定的选择某策略; 混合策略则指以某一概率分布选择各策略。 7.2 矩阵对策的纯策略
运筹学 operations research 第七章对策论 纯策略对策的解 1.引例 例设一对策G={S,D,4,其中S={,s2,s3 D={l1,d2,d3},其赢得矩阵为: d, d d 前提: 2 s,「3121对策双方均理智 6) 3结论: 5-14」最不利中选最有利 问:双方局中人采用何策略最佳
第七章 对策论 二、纯策略对策的解 1. 引例 前提: 对策双方均理智 结论: 最不利中选最有利 例 设一对策 , ,其赢得矩阵为: = { ADSG } ,, ,其中 { } ,, 321 = sssS { } ,, = dddD 321 3 2 1 s s s ddd 321 ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎣ ⎡ 4 1- 5- 3- 0 6 2 1 3 A = 问:双方局中人采用何策略最佳
运筹学 operations research 第七章对策论 q解:可用下述表格表示上述寻找最优纯策略过程: min a 2 1 2 1 s5s 6 0 3 3 5 5 maxa 6 1 故若双方都采取理智行为,局势(S1,d2)为最优纯策略
第七章 对策论 解:可用下述表格表示上述寻找最优纯策略过程: d1 d2 d3 s1 3 1 2 1 s2 6 0 -3 -3 s3 -5 -1 4 -5 6 1 4 ij j min a ij i max a 故若双方都采取理智行为,局势 ),( 21 ds 为最优纯策略
运筹学 operations research 第七章对策论 (1)局中人甲对每个策略s;的评价值为 评价 f(Si=min i 2,故局中人甲选择策略模型为: 纯 策←maxf(s;)= max mn a=Vmx 略 分(2)局中人乙对每个策略的评价值为 析 评价g(d) maxa 故局中人乙选择策略模型为: d; t min g(d; )=min max a=vmin
第七章 对策论 2. 纯 策 略 分 析 (1)局中人甲对每个策略si的评价值为 i s ij j i 评价 = min)( asf 故局中人甲选择策略模型为: max * sfs minmax)(max Vaij i j i i i ← = = (2)局中人乙对每个策略dj的评价值为 j d ij i j 评价 = max)( adg 故局中人乙选择策略模型为: min * dgd maxmin)(min ij Va j i j j j ← = =