博弈论与信息经济学浅说 目录 序言大博弈的思维观 第一章什么是博弈论:从秦始皇统一天下谈起 1.秦始皇因何统一天下? 2.博弈是一种竞合游戏 3.博弈论不是“万金油” 第二章纳什均衡、纯策略与混和策略 1.从围棋定式谈纳什均衡 2.从爱情故事谈起:优势策略与房地产开发博弈. 3.房地产博弈、警察捉小偷博弈与纳什均衡 4.位置博弈与商家策略. 5.猎鹿模型的合作哲学 第三章“囚徒困境”的启示 1.“囚徒困境”的深刻哲理. 2.经济自由与效率 o12344679 3.“囚徒困境”的破解:无限次重复博弈与有限次重复博弈. 4.威胁、承诺、作弊与惩罚 5.国家法律 6.猴子的故事与道德约束 7.爱克斯罗德试验、针锋相对的策略. 8.合作、利他主义与爱克斯罗德试验的局限 第四章“智猪博弈”:对诸多现象的解释 1.“智猪博弈”的故事. 2“智猪博弈”与激励机制设计 3.企业战略与“智猪博弈” 4.证券市场中的“智猪博弈” 第五章常见的博弈案例 222 1.“斗鸡博弈”与“骑虎难下” 2.银行会垮掉吗? 3.如何以弱胜强? 4.公共地悲剧 5.少数人博弈与酒吧问题 32456 6.房地产市场的多人博弈 第六章信息经济学基础
1 博弈论与信息经济学浅说 目 录 序 言 大博弈的思维观......................................................................................................................... 2 第一章 什么是博弈论:从秦始皇统一天下谈起................................................................................. 3 1.秦始皇因何统一天下?................................................................................................................. 3 2.博弈是一种竞合游戏..................................................................................................................... 5 3.博弈论不是“万金油”................................................................................................................. 7 第二章 纳什均衡、纯策略与混和策略................................................................................................. 8 1.从围棋定式谈纳什均衡................................................................................................................. 8 2.从爱情故事谈起:优势策略与房地产开发博弈....................................................................... 10 3.房地产博弈、警察捉小偷博弈与纳什均衡............................................................................... 11 4.位置博弈与商家策略................................................................................................................... 12 5.猎鹿模型的合作哲学................................................................................................................... 13 第三章 “囚徒困境”的启示............................................................................................................... 14 1.“囚徒困境”的深刻哲理............................................................................................................. 14 2.经济自由与效率........................................................................................................................... 16 3.“囚徒困境”的破解:无限次重复博弈与有限次重复博弈................................................... 17 4.威胁、承诺、作弊与惩罚........................................................................................................... 19 5.国家法律....................................................................................................................................... 20 6.猴子的故事与道德约束............................................................................................................... 21 7.爱克斯罗德试验、针锋相对的策略........................................................................................... 22 8.合作、利他主义与爱克斯罗德试验的局限................................................................................. 23 第四章 “智猪博弈”:对诸多现象的解释......................................................................................... 25 1.“智猪博弈”的故事................................................................................................................... 25 2“智猪博弈”与激励机制设计....................................................................................................... 26 3.企业战略与“智猪博弈”........................................................................................................... 27 4.证券市场中的“智猪博弈”....................................................................................................... 28 第五章 常见的博弈案例....................................................................................................................... 29 1.“斗鸡博弈”与“骑虎难下”................................................................................................... 29 2.银行会垮掉吗?........................................................................................................................... 31 3.如何以弱胜强?........................................................................................................................... 32 4.公共地悲剧................................................................................................................................... 34 5.少数人博弈与酒吧问题............................................................................................................... 35 6.房地产市场的多人博弈............................................................................................................... 36 第六章 信息经济学基础....................................................................................................................... 37
1.信息有价 2.从形象工程谈道德风险 3.逆向选择的困境:二手车市场为何建立不起来? 4.声誉、信号传递与制度设计 5.所罗门故事与信息甄别 第七章讨价还价的策略 1.从情侣博弈谈起 2.先发优势与后发优势 6648 3.谈判的要诀:掌握对方心理与妥协 4.独裁者博弈与劳资谈判 第八章如何做好一个老板 1.管理需要建立预期 2.奖罚分明 3.强强如何有效联合? 4.如何接到一个项目? 534 第九章民主的悲剧 1.社会选择的形式 2.非排序式投票 3.孔多塞投票法则 4. BORDA法则及其他 6800 5.投票操纵的方法:民主的悖论 6.阿罗不可能定理 参考文献: 序言大博弈的思维观 对于许多非数学专业和经济学专业的人们来说,博弈论可能是一个极为陌生的概念。但 在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。1994年诺 贝尔经济学奖即授予三位博弈论专家,1996年诺贝尔经济学奖又授予两位与博弈论一脉相 承的信息经济学的开拓者 经济学的三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革 命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,博弈论与信息经济 学代表着一种新概念、新方法论、新分析方法和一种全新的思想。 经济学家凯恩斯1936年在《就业利息与货币通论》写过这样一段深刻的话,“经济学 家和政治晢学家的思想,不管是正确的还是错误的,其力量之大,往往超出常人意料。事实 上,统治这个世界的就只是这些思想。许多实践家自以为绝不受任何知识的影响,却往往当 上了一些己故经济学家的奴隶。执政的狂人,自称听到了上帝的指示,实际上却是从若干年 前一些学术界劣等思想家那儿拾取了一些怪诞的想法...比起思想的逐渐侵蚀力来,既得 利益的势力被过分夸大了。” 由此可见,博弈论的思想比任何技术性的分析都要重要
2 1.信息有价......................................................................................................................................... 37 2. 从形象工程谈道德风险................................................................................................................39 3.逆向选择的困境:二手车市场为何建立不起来?................................................................... 41 4.声誉、信号传递与制度设计......................................................................................................... 42 5.所罗门故事与信息甄别............................................................................................................... 44 第七章 讨价还价的策略....................................................................................................................... 46 1.从情侣博弈谈起........................................................................................................................... 46 2.先发优势与后发优势................................................................................................................... 47 3.谈判的要诀:掌握对方心理与妥协............................................................................................. 48 4.独裁者博弈与劳资谈判............................................................................................................... 49 第八章 如何做好一个老板................................................................................................................... 50 1.管理需要建立预期....................................................................................................................... 50 2.奖罚分明....................................................................................................................................... 51 3.强强如何有效联合?................................................................................................................... 53 4.如何接到一个项目?................................................................................................................... 54 第九章 民主的悲剧............................................................................................................................... 55 1.社会选择的形式............................................................................................................................. 55 2.非排序式投票................................................................................................................................. 56 3.孔多塞投票法则........................................................................................................................... 58 4.BORDA 法则及其他........................................................................................................................ 60 5.投票操纵的方法:民主的悖论................................................................................................... 60 6.阿罗不可能定理........................................................................................................................... 62 参考文献:............................................................................................................................................. 64 序 言 大博弈的思维观 对于许多非数学专业和经济学专业的人们来说,博弈论可能是一个极为陌生的概念。但 在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。1994 年诺 贝尔经济学奖即授予三位博弈论专家,1996 年诺贝尔经济学奖又授予两位与博弈论一脉相 承的信息经济学的开拓者。 经济学的三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革 命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,博弈论与信息经济 学代表着一种新概念、新方法论、新分析方法和一种全新的思想。 经济学家凯恩斯 1936 年在《就业利息与货币通论》写过这样一段深刻的话,“经济学 家和政治哲学家的思想,不管是正确的还是错误的,其力量之大,往往超出常人意料。事实 上,统治这个世界的就只是这些思想。许多实践家自以为绝不受任何知识的影响,却往往当 上了一些已故经济学家的奴隶。执政的狂人,自称听到了上帝的指示,实际上却是从若干年 前一些学术界劣等思想家那儿拾取了一些怪诞的想法......比起思想的逐渐侵蚀力来,既得 利益的势力被过分夸大了。” 由此可见,博弈论的思想比任何技术性的分析都要重要
实际上,博弈之道是古己有之,但博弈思想的系统化、数学化却是近几十年的事。正是 因为博弈科学是一门新学科,我国管理界、经济界对博弈论与信息经济学的硏究还是停留在 引进介绍层面上,他们发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博 弃论与信息经济学在中国已是一门显学,但却逐渐变成阳春白雪、弃之不用的高深学问或是 概念混乱而被滥用到极至 博弈论与信息经济学不仅仅能在学术领域中光彩夺目,在其它领域如军事、管理、体育 政治、公关、个人生活中同样能得到充分利用,甚至在生物学中都可以觅其踪迹。在普通的 企业管理中,经营者要熟练地掌握管理之术,必须能够自动自发并自觉地运用博弈论与信息 经济学。在日常生活中,人们可以博弈论与信息经济学得思想方法赖分析甚而解决实际问题, 正是因为如此,诺贝尔经济学奖获得者保罗·萨缪尔逊( Paul samuelson)说:“要想在现 代社会做一个有文化的人,你必须对博弈论有一个大致了解。” 笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经济学的大概思路方法,能 用语言可以描述的就尽量少用或不用数学,因此笔者未对博弈论与信息经济学作数学化、系 统的证明与阐述。但是,只有这样才能够使似乎高深的博弈论与信息经济学思想很轻松地为 普通读者所掌握,并能够让读者应用其思想方法来分析甚至是能够解决身边的实际问题。 笔者这里还要解释一下书名的由来,“身边的博弈论”并不是说读者身边看到感受到的 博弈论,这样理解未免过于狭窄。这里“身边的博弈论”的含义是,人们身边无处不在的博 弈哲学,无论是直接感受到还是从未接触过的社会、政治、法律、军事、经济、管理等现象。 由于笔者本人学识有限,对博弈论与信息经济学的理解与研究尚不深刻,错误在所难免, 敬请博弈论与信息经济学的方家高人指点,以免贻误广大读者。 第一章什么是博弈论:从秦始皇统一天下谈起 1.秦始皇因何统一天下? 2000多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的 帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后实力大增,但其经 济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下,六国与秦国的形势就产 生了两种针锋相对的可能:其一,六国采用“合纵”政策对抗秦国,也就是各国缔结军事盟 约,共同抵御秦国的侵略,秦国若对任一国家发动侵略,其它国家必须无条件出兵营救:其 二,六国采用“连横”政策与秦国妥协,也就是各国都与秦国签订友好互助条约,保持双边 和平关系。 当时七国之中,只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。一旦齐国放 弃“合纵”政策,六国的军事同盟就土崩瓦解。真实的历史也证明了这一点,秦国对六国联 盟的破坏正是从齐国开始的 在这种情况下,秦国与齐国都有两种战略政策可以选择,那就是“合纵”与“连横”。 秦国如果默许六国“合纵”,齐国采用“合纵”政策,结果是秦国势力扩张被遏制,而齐国 成为六国领袖,势力得以扩张。秦国采取“连横”政策,齐国仍然采取“合纵”政策,结果 是秦国与六国处于对峙状态。秦国默许六国“合纵”,齐国却采用“连横”政策与秦国示好, 结果是秦国没有吞并六国的野心自然无法一统天下,齐国的势力也没有得以扩张。而历史的 真相是,秦国采取“连横”政策,齐国默许秦国的“连横”政策并与秦国建立友好外交关系
3 实际上,博弈之道是古已有之,但博弈思想的系统化、数学化却是近几十年的事。正是 因为博弈科学是一门新学科,我国管理界、经济界对博弈论与信息经济学的研究还是停留在 引进介绍层面上,他们发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博 弈论与信息经济学在中国已是一门显学,但却逐渐变成阳春白雪、弃之不用的高深学问或是 概念混乱而被滥用到极至。 博弈论与信息经济学不仅仅能在学术领域中光彩夺目,在其它领域如军事、管理、体育、 政治、公关、个人生活中同样能得到充分利用,甚至在生物学中都可以觅其踪迹。在普通的 企业管理中,经营者要熟练地掌握管理之术,必须能够自动自发并自觉地运用博弈论与信息 经济学。在日常生活中,人们可以博弈论与信息经济学得思想方法赖分析甚而解决实际问题。 正是因为如此,诺贝尔经济学奖获得者保罗·萨缪尔逊(Paul Samuelson)说:“要想在现 代社会做一个有文化的人,你必须对博弈论有一个大致了解。” 笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经济学的大概思路方法,能 用语言可以描述的就尽量少用或不用数学,因此笔者未对博弈论与信息经济学作数学化、系 统的证明与阐述。但是,只有这样才能够使似乎高深的博弈论与信息经济学思想很轻松地为 普通读者所掌握,并能够让读者应用其思想方法来分析甚至是能够解决身边的实际问题。 笔者这里还要解释一下书名的由来,“身边的博弈论”并不是说读者身边看到感受到的 博弈论,这样理解未免过于狭窄。这里“身边的博弈论”的含义是,人们身边无处不在的博 弈哲学,无论是直接感受到还是从未接触过的社会、政治、法律、军事、经济、管理等现象。 由于笔者本人学识有限,对博弈论与信息经济学的理解与研究尚不深刻,错误在所难免, 敬请博弈论与信息经济学的方家高人指点,以免贻误广大读者。 第一章 什么是博弈论:从秦始皇统一天下谈起 1.秦始皇因何统一天下? 2000 多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的 帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后实力大增,但其经 济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下,六国与秦国的形势就产 生了两种针锋相对的可能:其一,六国采用“合纵”政策对抗秦国,也就是各国缔结军事盟 约,共同抵御秦国的侵略,秦国若对任一国家发动侵略,其它国家必须无条件出兵营救;其 二,六国采用“连横”政策与秦国妥协,也就是各国都与秦国签订友好互助条约,保持双边 和平关系。 当时七国之中,只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。一旦齐国放 弃“合纵”政策,六国的军事同盟就土崩瓦解。真实的历史也证明了这一点,秦国对六国联 盟的破坏正是从齐国开始的。 在这种情况下,秦国与齐国都有两种战略政策可以选择,那就是“合纵”与“连横”。 秦国如果默许六国“合纵”,齐国采用“合纵”政策,结果是秦国势力扩张被遏制,而齐国 成为六国领袖,势力得以扩张。秦国采取“连横”政策,齐国仍然采取“合纵”政策,结果 是秦国与六国处于对峙状态。秦国默许六国“合纵”,齐国却采用“连横”政策与秦国示好, 结果是秦国没有吞并六国的野心自然无法一统天下,齐国的势力也没有得以扩张。而历史的 真相是,秦国采取“连横”政策,齐国默许秦国的“连横”政策并与秦国建立友好外交关系
齐国最终被灭,千古一帝秦始皇得以名扬千秋 秦国与六国集团之间的争斗实质上就是一种博弈。秦国与齐国之间的战略政策选择正是 为了在保持自身能够生存的基础上谋取更大的利益甚至是统一天下。有利益的争夺是博弈的 目的,也是形成博弈的基础。经济学的最基本的公设就是经济人或理性人的目的就是为了收 益最大化,参与博弈的博弈者正是为了自身收益的最大化而互相争斗。参与博弈的各方形成 相互竞争相互对抗的关系,以争得利益的多少决定胜负,一定的外部条件又决定了竞争和对 抗的具体形式,这就形成了博弈。如象棋对局的参与者是以将对方的军为目标,战争的目的 是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为 了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人 们所需要,而资源的总量具有稀缺性或是有限的,这时就会发生竞争,竞争需要有一个具体 形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始 一场博弈。《孙子兵法》上说,“知己知彼,百战百胜。”,可见竞争对抗还有博弈各方拥 有信息的特征。比如上一个例子中,秦国与齐国都明白对方的策略,从博弈理论来说,更拗 口的说法是秦国知道齐国知道自己的策略,反之齐国亦然,这种句法我们可以一直这么用下 去,一直用到打“……”,而这正是博弈双方所掌握的信息 因此我们可以了解到,形成一个博弈有4个要素 1.博弈要有2个或2个以上的参与者( Player)。在博弈中存在一个必须的因素,那就是 不是一个人在一个毫无干扰的真空作决策。比如,前例中只有秦国,而没有与之对抗的六国, 就不存在“合纵连横”的博弈。从经济学的角度来看,如果是一个人做决策而不受到他人干 扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个 企业在一个既定的局面或情况下如何决策的问题。最简单一个最优化的例子就是,吸烟伤肺, 不吸烟却又伤心,烟民是选择抽烟还是不抽烟,这就需要进行权衡( Tradeoff)。如果这个烟 民非单身贵族,而是有妻子或女友,这种情况下就很有可能形成一个博弈。这也就是,博弈 者的身边充斥着具有主观能动性的决策者,他们的选择与其它博弈者的选择相互作用、相互 影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响着 其他参与者的决策结果。 在冯·诺依曼( Von Neumann)的博弈论奠基之作《博弈论与经济行为》一书中举过这 样一个经典的例子。在《鲁滨逊漂流记》中,与世隔绝的“鲁滨逊”( Robinson crusoe) 个人组成一个独立的经济系统,有中学数学水平的人都能够清楚,这只是一个普通的求解最 大值的问题。因为鲁滨逊面对的是一些死的数据,而不是有主观意愿的人。一旦“星期五” (《鲁滨逊漂流记》中鲁滨逊的黑人仆人)加入这个系统,这个经济系统就形成了一个博弈 问题。 2)博弈要有参与各方争夺的资源或收益( Resources或 Payoff,)。资源指的不仅仅是自然 资源,如矿山、石油、土地、水资源等,还包括了各种社会资源,如人脉、信誉、学历、职 位等。如果这些资源是无限供给的,那么我们也不需要为共产主义而奋斗了,因为一步就可 以迈入“货恶其弃于地也,不必藏于已,力恶其不出于身也,不必为已。”“大道之行也, 天下为公。”的大同社会。当然,不可否认是,一方面,博弈者之间会发生冲突;另一方 面,他们当中也包含着合作的潜力。 笔者在这里还要强调一点是,资源是有主观性的。人们之所以会参与博弈是受到利益 的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。经 济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如 “孩子总是自己的好,妻子总是别人好”:自己的孩子在眼里是无价之宝,而在别人面前相 对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正 是效用递减规律起了作用。最极端的例子大概就是明代小说《镜花缘》中所描绘的君子国
4 齐国最终被灭,千古一帝秦始皇得以名扬千秋。 秦国与六国集团之间的争斗实质上就是一种博弈。秦国与齐国之间的战略政策选择正是 为了在保持自身能够生存的基础上谋取更大的利益甚至是统一天下。有利益的争夺是博弈的 目的,也是形成博弈的基础。经济学的最基本的公设就是经济人或理性人的目的就是为了收 益最大化,参与博弈的博弈者正是为了自身收益的最大化而互相争斗。参与博弈的各方形成 相互竞争相互对抗的关系,以争得利益的多少决定胜负,一定的外部条件又决定了竞争和对 抗的具体形式,这就形成了博弈。如象棋对局的参与者是以将对方的军为目标,战争的目的 是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为 了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人 们所需要,而资源的总量具有稀缺性或是有限的,这时就会发生竞争,竞争需要有一个具体 形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始 一场博弈。《孙子兵法》上说,“知己知彼,百战百胜。”,可见竞争对抗还有博弈各方拥 有信息的特征。比如上一个例子中,秦国与齐国都明白对方的策略,从博弈理论来说,更拗 口的说法是秦国知道齐国知道自己的策略,反之齐国亦然,这种句法我们可以一直这么用下 去,一直用到打“……”,而这正是博弈双方所掌握的信息。 因此我们可以了解到,形成一个博弈有4个要素: 1.博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是 不是一个人在一个毫无干扰的真空作决策。比如,前例中只有秦国,而没有与之对抗的六国, 就不存在“合纵连横”的博弈。从经济学的角度来看,如果是一个人做决策而不受到他人干 扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个 企业在一个既定的局面或情况下如何决策的问题。最简单一个最优化的例子就是,吸烟伤肺, 不吸烟却又伤心,烟民是选择抽烟还是不抽烟,这就需要进行权衡(Tradeoff)。如果这个烟 民非单身贵族,而是有妻子或女友,这种情况下就很有可能形成一个博弈。这也就是,博弈 者的身边充斥着具有主观能动性的决策者,他们的选择与其它博弈者的选择相互作用、相互 影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响着 其他参与者的决策结果。 在冯·诺依曼(Von Neumann)的博弈论奠基之作《博弈论与经济行为》一书中举过这 样一个经典的例子。在《鲁滨逊漂流记》中,与世隔绝的“鲁滨逊”(Robinson Crusoe)一 个人组成一个独立的经济系统,有中学数学水平的人都能够清楚,这只是一个普通的求解最 大值的问题。因为鲁滨逊面对的是一些死的数据,而不是有主观意愿的人。一旦“星期五” (《鲁滨逊漂流记》中鲁滨逊的黑人仆人)加入这个系统,这个经济系统就形成了一个博弈 问题。 2)博弈要有参与各方争夺的资源或收益(Resources或Payoff)。资源指的不仅仅是自然 资源,如矿山、石油、土地、水资源等,还包括了各种社会资源,如人脉、信誉、学历、职 位等。如果这些资源是无限供给的,那么我们也不需要为共产主义而奋斗了,因为一步就可 以迈入“货恶其弃于地也,不必藏于已,力恶其不出于身也,不必为已。”、“大道之行也, 天下为公。”的大同社会。 当然,不可否认是,一方面,博弈者之间会发生冲突;另一方 面,他们当中也包含着合作的潜力。 笔者在这里还要强调一点是,资源是有主观性的。人们之所以会参与博弈是受到利益 的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。经 济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如, “孩子总是自己的好,妻子总是别人好”:自己的孩子在眼里是无价之宝,而在别人面前相 对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正 是效用递减规律起了作用。最极端的例子大概就是明代小说《镜花缘》中所描绘的君子国
人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。 3)参与者有自己能够选择的策略( Strategy)。所谓策略,就是“计利以听,乃为之 势,以佐其外。势者,因利而制权也。”,这指的是直接实用的针对某一个具体问题所采取 的应对方式。通俗的说策略就是计策,是博弈参与者所能够选择的手段方法。比如秦国就采 用了“连横”的策略将六国“合纵”瓦解 般日常生活中,策略选择仅是解决问题的方法,并不牵涉到分析关键因素、确定局 势特征这些理论化的内容。而博弈论种的策略选择,是先对局势和整体状况进行分析,确定 局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。由此可见,博弈论种 的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响 4)参与者拥有一定量的信息( Information)。比如在“合纵连横”的故事中,秦国 与六国之间所拥有的信息就是完全的。但有些时候,信息并不是完全的,俗话说“天有不测 风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班 到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情 理上说,在实际生活中一般是要带伞以防不测。 通俗的说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅 次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上 就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾 和冲突。所谓博弈论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就 是研究,人们如何进行决策、以及这种决策的如何达到均衡问题。每个博弈者在决定采取何 种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能 影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最 大化。 2.博弈是一种竞合游戏 “博弈论”的英文是“ Game Theory”,实际上Gme的本意是游戏,博弈论直接翻译成中 文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。 所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争种包含着潜 在合作的种子,合作中包含着潜在竞争的种子。合作博弈并不是指合作各方具有合作的意向 或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能 公然“串通”或“共谋”。合作博弈最典型的例子就是石油输出国组织欧佩克( Organization of Petroleum Exporting Countries,简称opec),其1960年9月,由伊朗、伊拉克、科 威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司, 维护石油收入。随着成员的增加,欧佩克发展成为亚洲、非洲和拉丁美洲一些主要石油生产 国的国际性石油组织。欧佩克协调和统一各成员国的石油政策,并以石油生产配额制的手段 来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为 防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克 则可依据市场形势减少其石油产量 智力游戏与博弈相近似的本质是,在确定游戏规则的约束下,游戏参与者决策、行动的 过程。各种智力游戏实际上就是一个实际社会、经济、管理、军事、政治等现象抽象出来的 缩微模拟的模型。在这个意义上不妨说,博弈论就是硏究怎么玩好游戏的理论。 游戏是一种抽象。面对复杂现象时,人们经常会“见树木不见森林”,无法抓住某种 现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低, 从而轻松地分析问题并找到合理可行的解决方法
5 人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。 3)参与者有自己能够选择的策略(Strategy)。所谓策略,就是“计利以听,乃为之 势,以佐其外。势者,因利而制权也。”,这指的是直接实用的针对某一个具体问题所采取 的应对方式。通俗的说策略就是计策,是博弈参与者所能够选择的手段方法。比如秦国就采 用了“连横”的策略将六国“合纵”瓦解。 一般日常生活中,策略选择仅是解决问题的方法,并不牵涉到分析关键因素、确定局 势特征这些理论化的内容。而博弈论种的策略选择,是先对局势和整体状况进行分析,确定 局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。由此可见,博弈论种 的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响。 4)参与者拥有一定量的信息(Information)。比如在“合纵连横”的故事中,秦国 与六国之间所拥有的信息就是完全的。但有些时候,信息并不是完全的,俗话说“天有不测 风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班 到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情 理上说,在实际生活中一般是要带伞以防不测。 通俗的说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅 一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上, 就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾 和冲突。所谓博弈论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就 是研究,人们如何进行决策、以及这种决策的如何达到均衡问题。每个博弈者在决定采取何 种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能 影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最 大化。 2.博弈是一种竞合游戏 “博弈论”的英文是“Game Theory”,实际上 Gme 的本意是游戏,博弈论直接翻译成中 文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。 所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争种包含着潜 在合作的种子,合作中包含着潜在竞争的种子。合作博弈并不是指合作各方具有合作的意向 或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能 公然“串通”或“共谋”。合作博弈最典型的例子就是石油输出国组织欧佩克(Organization of Petroleum Exporting Countries,简称 Opec),其 1960 年 9 月,由伊朗、伊拉克、科 威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司, 维护石油收入。随着成员的增加,欧佩克发展成为亚洲、非洲和拉丁美洲一些主要石油生产 国的国际性石油组织。欧佩克协调和统一各成员国的石油政策,并以石油生产配额制的手段 来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为 防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克 则可依据市场形势减少其石油产量。 智力游戏与博弈相近似的本质是,在确定游戏规则的约束下,游戏参与者决策、行动的 过程。各种智力游戏实际上就是一个实际社会、经济、管理、军事、政治等现象抽象出来的 缩微模拟的模型。在这个意义上不妨说,博弈论就是研究怎么玩好游戏的理论。 游戏是一种抽象。面对复杂现象时,人们经常会“见树木不见森林”,无法抓住某种 现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低, 从而轻松地分析问题并找到合理可行的解决方法
中国最古老的围棋最初的功能形态就是模拟战争。围棋包含最多的是军事内涵,如围 而歼之,生死存亡为先,争地夺利为上。围棋以获得最大的利益为胜,抽象出战争的本质和 目的,非常符合战争规律 围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最 终以所占地盘大小定胜负。但其作为一项智力游戏,与战争在很多方面都相通。围棋棋手在 小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎 战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方 国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。基 于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。美军在伊拉克发动“斩 首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。 围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所 有的作战方法都必须是有效的,着子要看在全局中是否有用、有效,而不再是基于棋理、棋 道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐 就是基于效果的典范。 现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出 过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A、B、C、D往演出现 场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯。他们只有一 只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒 不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A 需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17 分钟内过桥吗?”这可不是微软公司的别出心裁,据说世界上许多跻身世界500强的公司在 招收新员工时,都要出类似的智力题 智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错 综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出 条理性。思维方法是抽象的,它不像1+1=2那么简单,只有通过自己的想像,亲自动手操 作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能 力就越强。这一点已成为人们的共识 在许多智力游戏中,都存在这么一个共同的特点,就是参与者所选择的策略对于胜负 有着举足轻重的影响。一个游戏一点规则制订好之后,策略选择的好坏就成了游戏参加者所 能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全 相同的游戏中,策略选择就成了游戏结果的唯一决定因素 至于从围棋初段段到九段之间的差别,从博弈论的角度去看,就是他们之间策略选择 的技巧高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑 的是怎样将这些基本技巧最大限度地发挥出来 任何游戏都有自己的规则( Rule of the game)。实际现实自然也是如此,这就是法律 道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随 着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就是确定了人们行为的 前提条件。因此博弈与游戏都有一个重要的共同特征,那就是这些规则规定游戏参加者可以 做什么,不可以作什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎 样的处罚等 游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自 身的策略选择,同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的 方带来并不坏的结果,原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与 博弈重要的相似之处
6 中国最古老的围棋最初的功能形态就是模拟战争。围棋包含最多的是军事内涵,如围 而歼之,生死存亡为先,争地夺利为上。围棋以获得最大的利益为胜,抽象出战争的本质和 目的,非常符合战争规律。 围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最 终以所占地盘大小定胜负。但其作为一项智力游戏,与战争在很多方面都相通。围棋棋手在 小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。 战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方 国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。基 于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。美军在伊拉克发动“斩 首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。 围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所 有的作战方法都必须是有效的,着子要看在全局中是否有用、有效,而不再是基于棋理、棋 道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐 就是基于效果的典范。 现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出 过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A、B、C、D往演出现 场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯。他们只有一 只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒 不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A 需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17 分钟内过桥吗?” 这可不是微软公司的别出心裁,据说世界上许多跻身世界500强的公司在 招收新员工时,都要出类似的智力题。 智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错 综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出 条理性。思维方法是抽象的,它不像1+1=2那么简单,只有通过自己的想像,亲自动手操 作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能 力就越强。这一点已成为人们的共识。 在许多智力游戏中,都存在这么一个共同的特点,就是参与者所选择的策略对于胜负 有着举足轻重的影响。一个游戏一点规则制订好之后,策略选择的好坏就成了游戏参加者所 能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全 相同的游戏中,策略选择就成了游戏结果的唯一决定因素。 至于从围棋初段段到九段之间的差别,从博弈论的角度去看,就是他们之间策略选择 的技巧高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑 的是怎样将这些基本技巧最大限度地发挥出来。 任何游戏都有自己的规则(Rule of the game)。实际现实自然也是如此,这就是法律、 道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随 着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就是确定了人们行为的 前提条件。因此博弈与游戏都有一个重要的共同特征,那就是这些规则规定游戏参加者可以 做什么,不可以作什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎 样的处罚等。 游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自 身的策略选择,同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的一 方带来并不坏的结果,原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与 博弈重要的相似之处
3.博弈论不是“万金油” 博弈论并不是“万金油”,正如诺贝尔经济学奖得主莱因哈德·泽尔滕教授所说,“博 弈论并不是疗法,也不是处方,它不能帮我们在赌博中获胜,不能帮我们通过投机来致富, 也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算机或者字典 的任务 要求博弈论能够完全刻画真实的世界,那么这命中注定会徒劳无功。根据著名的哥德尔 不完备定理,任何一个理论体系必定是不完全的,任何理论包含了既不能证明为真也不能证 明为假的命题。对这个世界的最好描述可能只有其本身,但是正如罗宾逊夫人的妙语“比例 尺是一比一的地图是没用的”。 博弈论也是这样,博弈论力图用最简单的假设下得到最大范围的推理应用。博弈论的这 种方法与很多应用广泛学科都是相似的。如欧几里德几何的基本假设是两点之间直线,推演 出庞大而严密的几何体系,可以说,在生活中或工程应用中,欧几里德几何学的思想方法是 无处不在、无时不有。其基本公设之一就是,人是理性的( rational)。所谓理性的人是指行 动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。而现实生活中,人们 再做决策时往往是有限理性。 所谓有限理性,也就是说人不是机器,人的理性是有限度的。比方说,某人要签署一份 合同,有三种方法可供选择:一种是计划好,安排好一切,然后不动脑筋按部就班地照计划 进行:另一种是做进度安排的时候都留一点余地,可供签订合同双方私下协商解决:最后 种是完全没有安排,凭着当时的感情与直觉任意为之,这种方法当然不可能是理性的。 后两种一眼就可看出完全不满足博弈论意义上的理性,即使是第一种方法也不是真正意 义上的经济理性。这是因为人们很难对每个措施将要产生的结果具有完全的了解和正确的预 测,常常要在缺乏完全了解的情况下,一定程度地根据主观意识进行决策,个人或企业的决 策都是在有限理性的条件下进行的。完全理性,意味着对每个抉择的确切后果都有完完全全 的了解。事实上,一个人对自己的行动条件的了解,从来都只能是零碎的:至于使他得以从 对当前状况的了解去推想未来后果的那些规律和法则,他也是所知甚微的 人类的精力和时间永远是有限的,人不可能具备完全理性,不可能掌握所有知识和信息 人类也不可能搜寻到所需的全部的信息。另一方面也要意识到信息的搜寻需要成本,而不是 毫不费成本的,因为人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信息, 企图做出收益最优的决策行为有时反而是最不理性的行为 但当我们退而求其次时,博弈论可以得到对现实的客观世界描述的近似。所以博弈论仍 然是我们目前所能得到的最好但非唯一的工具。就像并不完美的力学是自然科学的哲学和数 学一样,博弈论是社会科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法理 解,马用了多大的力拉动一车货物?上帝说“让牛顿来做吧”,于是我们知道了马用的力相 当于克服摩擦力。同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。 著名的博弈论大师鲁宾斯坦( Rubinstein)说过,“一个博弈模型是我们关于现实的观念 的近似,而不是现实的客观描述的近似”。看来“理论之树是灰色的,生命之树常青!”这 句话,我们应该谨记于心
7 3.博弈论不是“万金油” 博弈论并不是“万金油”,正如诺贝尔经济学奖得主莱因哈德·泽尔滕教授所说,“博 弈论并不是疗法,也不是处方,它不能帮我们在赌博中获胜,不能帮我们通过投机来致富, 也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算机或者字典 的任务。” 要求博弈论能够完全刻画真实的世界,那么这命中注定会徒劳无功。根据著名的哥德尔 不完备定理,任何一个理论体系必定是不完全的,任何理论包含了既不能证明为真也不能证 明为假的命题。对这个世界的最好描述可能只有其本身,但是正如罗宾逊夫人的妙语“比例 尺是一比一的地图是没用的”。 博弈论也是这样,博弈论力图用最简单的假设下得到最大范围的推理应用。博弈论的这 种方法与很多应用广泛学科都是相似的。如欧几里德几何的基本假设是两点之间直线,推演 出庞大而严密的几何体系,可以说,在生活中或工程应用中,欧几里德几何学的思想方法是 无处不在、无时不有。其基本公设之一就是,人是理性的(rational)。所谓理性的人是指行 动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。而现实生活中,人们 再做决策时往往是有限理性。 所谓有限理性,也就是说人不是机器,人的理性是有限度的。比方说,某人要签署一份 合同,有三种方法可供选择:一种是计划好,安排好一切,然后不动脑筋按部就班地照计划 进行;另一种是做进度安排的时候都留一点余地,可供签订合同双方私下协商解决:最后一 种是完全没有安排,凭着当时的感情与直觉任意为之,这种方法当然不可能是理性的。 后两种一眼就可看出完全不满足博弈论意义上的理性,即使是第一种方法也不是真正意 义上的经济理性。这是因为人们很难对每个措施将要产生的结果具有完全的了解和正确的预 测,常常要在缺乏完全了解的情况下,一定程度地根据主观意识进行决策,个人或企业的决 策都是在有限理性的条件下进行的。完全理性,意味着对每个抉择的确切后果都有完完全全 的了解。事实上,一个人对自己的行动条件的了解,从来都只能是零碎的;至于使他得以从 对当前状况的了解去推想未来后果的那些规律和法则,他也是所知甚微的。 人类的精力和时间永远是有限的,人不可能具备完全理性,不可能掌握所有知识和信息。 人类也不可能搜寻到所需的全部的信息。另一方面也要意识到信息的搜寻需要成本,而不是 毫不费成本的,因为人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信息, 企图做出收益最优的决策行为有时反而是最不理性的行为。 但当我们退而求其次时,博弈论可以得到对现实的客观世界描述的近似。所以博弈论仍 然是我们目前所能得到的最好但非唯一的工具。就像并不完美的力学是自然科学的哲学和数 学一样,博弈论是社会科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法理 解,马用了多大的力拉动一车货物?上帝说“让牛顿来做吧”,于是我们知道了马用的力相 当于克服摩擦力。同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。 著名的博弈论大师鲁宾斯坦(Rubinstein)说过,“一个博弈模型是我们关于现实的观念 的近似,而不是现实的客观描述的近似”。看来“理论之树是灰色的,生命之树常青!”这 句话,我们应该谨记于心
第二章纳什均衡、纯策略与混和策略 1.从围棋定式谈纳什均衡 我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物 的行为。由于世上人间的事物很少不依赖于其他事物而存在。非合作博弈强调利益的冲突, 即非合作甚至对抗状态。比如,“零和博弈”就是典型的非合作博弈,它是指博弈各方的所 得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度 来看,围棋19×19的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可 见围棋明显是数学意义上的严格的零和博弈 世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,“本手”与“缓 着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损, 因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占 尽便宜。这就导致双方都能接受的方案 围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当, 互有所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成 个双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种 应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。 在经济学中,均衡( equilibrium)意即相关量处于稳定值。比如在经典的供需分析中,若 某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此 时该商品的供求达到了均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均 衡分析是经典经济学中的重要方法。 在讲解纳什均衡之前,我们再来看这样一个例子。一般对博弈论稍微有些了解的人,都 会知道“囚徒困境”这个名词。这个例子就是在“囚徒困境”的基础上所作的修改 A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该局管辖区域内的一宗悬 而未决的银行抢劫案,并且他根据一系列的线索判定A和B是这桩案子的凶犯。因为该局 管辖地区治安一向混乱不堪,C的上级对C非常恼火,直接威胁C如果银行案破不了,就 要撤销C局长的职位,给予降级惩罚。C在上级的压力下不得不耗费大量时间、精力提审A 和B。为了能够让两个囚犯认罪,C想让A和B明白,假如只有他们其中的一人坦白认罪 则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻 发落。 于是,这个警察局长C分别与A、B立下许诺:如果只有一个人坦白认罪,则认罪的 方会收到所有指控,会因银行抢劫而判无期徒刑,另一个人则不会再加刑罚。如果无人认 罪,两个人都会因盗窃罪而判刑2年。如果两个人都坦白,则两个人都被判处有期徒刑5 这样,警察局长C给A和B构造了一个博弈。不妨假设,A和B都是极其精明的会打 小算盘的自私自利不讲“江湖义气”的人,同时A和B被分别审査不能够进行沟通。在这 种情况下,A会在脑子里打小算盘,他会想:如果选择坦白,那么B选择坦白时将判刑5 年,B选择不坦白时将判刑20年,因此选择坦白时最坏的打算就把牢底坐穿:若是选择不 坦白,那么B选择坦白时将无罪释放获得自由,B选择不坦白时将判有期徒刑5年,因此 选择不坦白时最坏的可能就是被囚禁5年。两害相权,取其轻。因此在这种情况下,A必然 会选择不坦白,同样的道理,B也会选择不坦白。这个时候,博弈达到了这样一种局面,这
8 第二章 纳什均衡、纯策略与混和策略 1.从围棋定式谈纳什均衡 我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物 的行为。由于世上人间的事物很少不依赖于其他事物而存在。非合作博弈强调利益的冲突, 即非合作甚至对抗状态。比如,“零和博弈”就是典型的非合作博弈,它是指博弈各方的所 得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度 来看,围棋 1919 的 361 个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可 见围棋明显是数学意义上的严格的零和博弈。 世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,“本手”与“缓 着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损, 因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占 尽便宜。这就导致双方都能接受的方案。 围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当, 互有所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成 一个双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种 应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。 在经济学中,均衡(equilibrium)意即相关量处于稳定值。比如在经典的供需分析中,若 某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此 时该商品的供求达到了均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均 衡分析是经典经济学中的重要方法。 在讲解纳什均衡之前,我们再来看这样一个例子。一般对博弈论稍微有些了解的人,都 会知道“囚徒困境”这个名词。这个例子就是在“囚徒困境”的基础上所作的修改。 A 和 B 是两个因盗窃而被抓的惯犯。警察局局长 C 正在调查该局管辖区域内的一宗悬 而未决的银行抢劫案,并且他根据一系列的线索判定 A 和 B 是这桩案子的凶犯。因为该局 管辖地区治安一向混乱不堪,C 的上级对 C 非常恼火,直接威胁 C 如果银行案破不了,就 要撤销 C 局长的职位,给予降级惩罚。C 在上级的压力下不得不耗费大量时间、精力提审 A 和 B。为了能够让两个囚犯认罪,C 想让 A 和 B 明白,假如只有他们其中的一人坦白认罪 则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻 发落。 于是,这个警察局长 C 分别与 A、B 立下许诺:如果只有一个人坦白认罪,则认罪的 一方会收到所有指控,会因银行抢劫而判无期徒刑,另一个人则不会再加刑罚。如果无人认 罪,两个人都会因盗窃罪而判刑 2 年。如果两个人都坦白,则两个人都被判处有期徒刑 5 年。 这样,警察局长 C 给 A 和 B 构造了一个博弈。不妨假设,A 和 B 都是极其精明的会打 小算盘的自私自利不讲“江湖义气”的人,同时 A 和 B 被分别审查不能够进行沟通。在这 种情况下,A 会在脑子里打小算盘,他会想:如果选择坦白,那么 B 选择坦白时将判刑 5 年,B 选择不坦白时将判刑 20 年,因此选择坦白时最坏的打算就把牢底坐穿;若是选择不 坦白,那么 B 选择坦白时将无罪释放获得自由,B 选择不坦白时将判有期徒刑 5 年,因此 选择不坦白时最坏的可能就是被囚禁 5 年。两害相权,取其轻。因此在这种情况下,A 必然 会选择不坦白,同样的道理,B 也会选择不坦白。这个时候,博弈达到了这样一种局面,这
种局面就是纳什均衡( Nash Equilibrium) 纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能 因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优 策略,并与其他对手达成了某种暂时的平衡。这种平衡在外界环境没有变化的情况下,倘若 有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳 再简单一点说,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策 略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳 什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动 由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个 光滑的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就 可称为是一个纳什均衡点。相反,如果锅是扣在地上的,那么锅底部位是很难放稳一个乒乓 球的,因为往任何方向的一点点移动,都会使球彻底离开锅底。这时的锅底部位就不是一个 纳什均衡点了 博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另 层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改 变或主动改变自己的策略。在上面的“囚徒困境”变形的博弈中,A和B都不坦白就是 个纳什均衡,这对双方来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最 优的。当然博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社 会作为一个整体而言最有利的结果,比如“囚徒困境”的例子导致了整体的不利 围棋与这个博弈的例子是有所不同的。上面的这个例子是A和B双方没有信息交换下 的博弈,这就是博弈论中的静态博弈概念。围棋则是对弈双方相继按照一先一后次序行动的 博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意 图,从而倒后推理,决定自己这一步应该怎么走。这是一条线性的推理链:“假如我这么做, 他就会那么做——若是那样,我会这么反击”,后面的步骤依此类推。也就是说,你怎么走 棋,完全取决于对手的上一招。这在博弈论上叫做“倒推法”。在动态博弈中,存在明显的 马太效应,也就是说凡是少的,连他仅有的也夺过来;凡是多的,就加给他,让他更多。比 如在围棋上,就有“一招不慎,满盘皆输”的谚语,当然我们也要应用动态博弈的马太效应 原理,在获得优势的情况能够保持优势扩大优势,直至最后成功。 而在同时行动的静态博弈里,没有一个博弈者可以在自己行动之前得知另一个博弈者的 整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手 的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你 那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎 么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方 的最佳行动方式。与一条线性的推理链不同,这是一个循环,即“假如我认为对方认为我认 为……”。 这样来看,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为 可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被 验证并长期积累而成。 因此在动态博弈中,纳什均衡的要义在于:即使在对抗条件下,双方可以通过向对方提 出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥 协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”( dominant strategy),即无 论对方作何选择,这一策略优于其他策略
9 种局面就是纳什均衡(Nash Equilibrium)。 纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能 因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优 策略,并与其他对手达成了某种暂时的平衡。这种平衡在外界环境没有变化的情况下,倘若 有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳 定。 再简单一点说,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策 略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳 什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。 由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个 光滑的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就 可称为是一个纳什均衡点。相反,如果锅是扣在地上的,那么锅底部位是很难放稳一个乒乓 球的,因为往任何方向的一点点移动,都会使球彻底离开锅底。这时的锅底部位就不是一个 纳什均衡点了。 博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另 一层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改 变或主动改变自己的策略。在上面的“囚徒困境”变形的博弈中,A 和 B 都不坦白就是一 个纳什均衡,这对双方来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最 优的。当然博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社 会作为一个整体而言最有利的结果,比如“囚徒困境”的例子导致了整体的不利。 围棋与这个博弈的例子是有所不同的。上面的这个例子是 A 和 B 双方没有信息交换下 的博弈,这就是博弈论中的静态博弈概念。围棋则是对弈双方相继按照一先一后次序行动的 博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意 图,从而倒后推理,决定自己这一步应该怎么走。这是一条线性的推理链:“假如我这么做, 他就会那么做——若是那样,我会这么反击”,后面的步骤依此类推。也就是说,你怎么走 棋,完全取决于对手的上一招。这在博弈论上叫做“倒推法”。在动态博弈中,存在明显的 马太效应,也就是说凡是少的,连他仅有的也夺过来;凡是多的,就加给他,让他更多。比 如在围棋上,就有“一招不慎,满盘皆输”的谚语,当然我们也要应用动态博弈的马太效应 原理,在获得优势的情况能够保持优势扩大优势,直至最后成功。 而在同时行动的静态博弈里,没有一个博弈者可以在自己行动之前得知另一个博弈者的 整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手 的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你 那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎 么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方 的最佳行动方式。与一条线性的推理链不同,这是一个循环,即“假如我认为对方认为我认 为……”。 这样来看,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为 可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被 验证并长期积累而成。 因此在动态博弈中,纳什均衡的要义在于:即使在对抗条件下,双方可以通过向对方提 出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥 协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”(dominant strategy),即无 论对方作何选择,这一策略优于其他策略
2.从爱情故事谈起:优势策略与房地产开发博弈 “原地高天,堪叹古今情难尽;痴男怨女,可怜风月债难偿。”我们来先看欧·亨利的小 说《麦吉的礼物》描述的这样一个爱情故事。新婚不久的MM和GG,很是穷困潦倒。除了M 那一头美丽的金色长发,GG那一只祖传的金怀表,便再也没有什么东西可以让他们引以为傲 了。虽然生活很累很苦,他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进 对方的利益,他们愿意奉献和牺牲自己的一切 话说明天就是圣诞节了,小两口都是身无余钱。为了让爱人过得好一点,每个人还是想 悄悄儿准备一份礼物给对方。GG卖掉了心爱的怀表,买了一套漂亮发卡,去配M那一头金色 长发。MM剪掉心爱的长发,拿去卖钱,为GG的怀表买了表链和表袋 最后,到了交换礼物的时刻,他们无可奈何地发现,自己如此珍视的东西,对方已作为 礼物的代价而出卖了。花了惨痛代价换回的东西,竟成了无用之物。出于无私爱心的利他主 义行为,结果却使得双方的利益同时受损 欧·亨利在小说中写道:“聪明的人,送礼自然也很聪明。大约都是用自己有余的物事 来交换送礼的好处。然而,我讲的这个平平淡淡的故事里,两个住公寓的傻孩子,却是笨到 极点,彼此为了对方,白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看,欧亨利似乎 并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨,单从利益的角度来解读。我们 假定,他们每个人,有一个“亳不利己专门利人”的偏好系统,毫不考虑自身利益,专门谋 求别人的幸福。这样,个人选择付出还是不付出,只看对方能不能得益,与自己是否受损无 关。以这样的偏好来衡量,最好的结果自然是自己付出而对方不付出,对方收益增大:次好 的结果是大家都不付出,对方不得益也不牺牲:再次的结果是大家都付出:最坏的结果是别 人付出而自己不付出,靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结 果的评价:第一种结果给3分,第二种结果给1分,第三种结果给1分,最后那种给0分。 不难看出,无论对方选择付出,还是选择不付出,个人自己的最佳选择都是付出。然而 这并不是对大家都有利的选择。事实上,大家都选择不付出,明显优于大家都选择付出的境 况,这就达到了上文提到的纳什均衡 实际上,这里的例子是一个博弈论中所说的占优策略均衡。通俗地说,在占优策略均衡 中,不论所有其他参与人选择什么策略,一个参与人的占优策略都是他的最优策略。显然, 这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。因此,占优策略 均衡一定是纳什均衡。在这个例子中,M选择不付出,也就是不剪掉金发对于M来说是一个 优势策略,也就是说M不付岀,GG不管选择什么策略,M所得的结果都好于GG。同理,G 不卖掉怀表对于GG来说也是一个优势策略 再举个简单的例子:一名篮球前锋和队友在蓝下面对着对方的一个后卫时,形成了二打 的局面,该前锋可以选择直接投篮,也可以选择传球给队友,根据经验,传球过人的成功 率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会 比其他策略差。如果一个球员具有这样一种策略,无论其他球员怎么做,这个策略都会高出 一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策 就会变得非常简单,只要直接采用该策略而完全不必考虑对手的应对策略 还有一个要注意的问题是,采用优势策略得到的最坏结果并不一定比采用另外一个策略 得到的最佳结果要好,这是很多博弈论普及书中容易出错的一个问题。应该说,对局者采用 优势策略在对方采取任何策略时,总能够显示出优势。比如就这个例子来说,就MM来说, 她采用不付出的策略,无论GG付出或不付出,MM的不付出策略总是占有优势。GG的优 势策略也是一样。但是,MM选择不付出的最坏结果是1,二选择付出的最好结果是3,很 明显,MM的优势策略得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出 10
10 2.从爱情故事谈起:优势策略与房地产开发博弈 “原地高天,堪叹古今情难尽;痴男怨女,可怜风月债难偿。”我们来先看欧·亨利的小 说《麦吉的礼物》描述的这样一个爱情故事。新婚不久的MM和GG,很是穷困潦倒。除了MM 那一头美丽的金色长发,GG那一只祖传的金怀表,便再也没有什么东西可以让他们引以为傲 了。虽然生活很累很苦,他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进 对方的利益,他们愿意奉献和牺牲自己的一切。 话说明天就是圣诞节了,小两口都是身无余钱。为了让爱人过得好一点,每个人还是想 悄悄儿准备一份礼物给对方。GG卖掉了心爱的怀表,买了一套漂亮发卡,去配MM那一头金色 长发。MM剪掉心爱的长发,拿去卖钱,为GG的怀表买了表链和表袋。 最后,到了交换礼物的时刻,他们无可奈何地发现,自己如此珍视的东西,对方已作为 礼物的代价而出卖了。花了惨痛代价换回的东西,竟成了无用之物。出于无私爱心的利他主 义行为,结果却使得双方的利益同时受损。 欧·亨利在小说中写道:“聪明的人,送礼自然也很聪明。大约都是用自己有余的物事, 来交换送礼的好处。然而,我讲的这个平平淡淡的故事里,两个住公寓的傻孩子,却是笨到 极点,彼此为了对方,白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看,欧亨利似乎 并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨,单从利益的角度来解读。我们 假定,他们每个人,有一个“毫不利己专门利人”的偏好系统,毫不考虑自身利益,专门谋 求别人的幸福。这样,个人选择付出还是不付出,只看对方能不能得益,与自己是否受损无 关。以这样的偏好来衡量,最好的结果自然是自己付出而对方不付出,对方收益增大;次好 的结果是大家都不付出,对方不得益也不牺牲;再次的结果是大家都付出;最坏的结果是别 人付出而自己不付出,靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结 果的评价:第一种结果给3分,第二种结果给1分,第三种结果给1分,最后那种给0分。 不难看出,无论对方选择付出,还是选择不付出,个人自己的最佳选择都是付出。然而 这并不是对大家都有利的选择。事实上,大家都选择不付出,明显优于大家都选择付出的境 况,这就达到了上文提到的纳什均衡。 实际上,这里的例子是一个博弈论中所说的占优策略均衡。通俗地说,在占优策略均衡 中,不论所有其他参与人选择什么策略,一个参与人的占优策略都是他的最优策略。显然, 这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。因此,占优策略 均衡一定是纳什均衡。在这个例子中,MM选择不付出,也就是不剪掉金发对于MM来说是一个 优势策略,也就是说MM不付出,GG不管选择什么策略,MM所得的结果都好于GG。同理,GG 不卖掉怀表对于GG来说也是一个优势策略。 再举个简单的例子:一名篮球前锋和队友在蓝下面对着对方的一个后卫时,形成了二打 一的局面,该前锋可以选择直接投篮,也可以选择传球给队友,根据经验,传球过人的成功 率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会 比其他策略差。如果一个球员具有这样一种策略,无论其他球员怎么做,这个策略都会高出 一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策 就会变得非常简单,只要直接采用该策略而完全不必考虑对手的应对策略。 还有一个要注意的问题是,采用优势策略得到的最坏结果并不一定比采用另外一个策略 得到的最佳结果要好,这是很多博弈论普及书中容易出错的一个问题。应该说,对局者采用 优势策略在对方采取任何策略时,总能够显示出优势。比如就这个例子来说,就 MM 来说, 她采用不付出的策略,无论 GG 付出或不付出,MM 的不付出策略总是占有优势。GG 的优 势策略也是一样。但是,MM 选择不付出的最坏结果是 1,二选择付出的最好结果是 3,很 明显,MM 的优势策略得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出一