博弈论基础 、什么是博弈论 ◆二、博弈的基本概念 占优策略均衡和纳什均衡 四、重复博弈
博弈论基础 一、什么是博弈论 二、博弈的基本概念 三、占优策略均衡和纳什均衡 四、重复博弈
什么是博弈论 博弈即一些个人、队组或其他组织,面 对一定的环境条件,在一定的规则下, 同时或先后,一次或多次,从各自允许 选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。 博弈论就是描述和研究行为者之间的策 略相互依存和相互作用的一种决策理论
一、什么是博弈论 博弈即一些个人、队组或其他组织,面 对一定的环境条件,在一定的规则下, 同时或先后,一次或多次,从各自允许 选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。 博弈论就是描述和研究行为者之间的策 略相互依存和相互作用的一种决策理论
二、博弈的基本概念 1、参与人( players):一个博弈中独立决策、 独立承担结果的主体 2、行动( actions or moves):参与人在博弈 的某个时点的决策变量。 3、策略( strategies):参与人在给定信息 集的情况下的行动规则 ∨4、得益( pay off)(或支付、报酬):指在 个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平
二、博弈的基本概念 1、参与人(players):一个博弈中独立决策、 独立承担结果的主体。 2、行动(actions or moves):参与人在博弈 的某个时点的决策变量。 3、策略(strategies):参与人在给定信息 集的情况下的行动规则 4、得益(pay off)(或支付、报酬):指在 一个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平
囚犯的困境”博弈中的“报酬矩 阵”( Payoff matris) 嫌犯B 坦白不坦白 坦白-10,-100,20 嫌犯A 不坦白-20,0-1,-1
“囚犯的困境”博弈中的“报酬矩 阵”(Payoff Matris) 嫌犯B 坦白 不坦白 坦白 -10,-10 0,20 嫌犯A 不坦白 -20,0 -1,-1
占优策略均衡和纳什均衡 (一)占优策略均衡 Y(二)纳什均衡 Y(三)占优策略均衡和纳什均衡比较
三、占优策略均衡和纳什均衡 (一)占优策略均衡 (二)纳什均衡 (三)占优策略均衡和纳什均衡比较
(一)占优策略均衡 占优策略( Dominant strategies):不论 其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略”; “博弈均衡”指博弈中的所有参与人都 不想改变自己的策略的这样一种状态
(一)占优策略均衡 占优策略(Dominant Strategies):不论 其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略” ; “博弈均衡”指博弈中的所有参与人都 不想改变自己的策略的这样一种状态
(一)占优策略均衡 在一个博弈中,如果每个参与人都有 个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 占优策略均衡的求解: 常用方法——划线法
(一)占优策略均衡 在一个博弈中,如果每个参与人都有一 个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 占优策略均衡的求解: 常用方法——划线法
(一)占优策略均衡 划线法求解“囚犯困境”: 嫌犯B 坦白 不坦白 坦白-10,-100,-20 嫌犯A 不坦白-20,0
(一)占优策略均衡 划线法求解“囚犯困境” : 嫌犯B 坦白 不坦白 坦白 -10,-10 0,-20 嫌犯A 不坦白 -20, 0 -1,-1
(一)占优策略均衡 例:卡特尔组织的博弈 合作不合作 合作10,104,4 甲 不合作12,68,8
(一)占优策略均衡 例:卡特尔组织的博弈 乙 合作 不合作 合作 10,10 4,4 甲 不合作 12,6 8,8
(二)纳什均衡 例:智猪博弈 小猪 按 等待 按5,14,4 大猪 等待9,-10,0
(二)纳什均衡 例:智猪博弈 小猪 按 等待 按 5,1 4,4 大猪 等待 9,-1 0,0