目录 中文版前言…… PREFACE TO THE CHINESE EDITION OF GAME THEORY: ANALYSIS OF CONFLICT ……(Ⅲ) 前言 第一章决葉理论基础 1.1傅弈论、理性和智能性 1.2决策理论的基本概念 1.3公理系 …(7) 1.4期望效用最大化定理 1.5等价表示 (14) 1.6贝叶斯条件概率系……… (16) 1.7贝叶斯模型的局限性 (17) I.8占优… ……………………………(20) 1.9占优定理的证明…… …(24) 习题 ………(26) 簟二章基本模型 29) 2.1展开型博弈 2.2策略型和正规表示 ……………(35) 2.3策略型博弈的等价性…… (40) 24简约的正规表示 (42) 2.5劣策略的剔除… (45) 26多代理人表示……… (48) 2.7共同知识……… 2.8贝叶斯博弈… 2.9不完全信息博弈的建模 58) 习题 65) 第三章策略型博弈的均衡 (69)
溥弈论 3.1占优和可理性化…………… ………(69) 3.2纳什均衡……………… …(71) 3.3计算纳什均衡 34纳什均衡的意义…………………… 3.5焦点效应 36博弈的决策分析法…… (89) 3.7演进、抵制和风险占优…………………………… 3.8两人零和博弈………………… 3.9贝叶斯均衡…………… (99) 3.10均衡中随机策略的纯化……………………………………(101) 3.11拍卖 ………(103) 3.12均衡存在性的证明………………………………………(107) 3.13无限策略集 …………………(110) 习题 筚四章展开魁弈的序贡均衡… (123) 4.1混合策略与行为策略…… 2行为策略均衡 4.3正概率信息状态处的序贯理性…………………………(130 4.4一致信念和所有信息状态处的序贯理性…………………(134) 4.5计算序贯均衡 (141) 4.6子博弈完美均衡 …(145) 4.7完美信息博弈……………………………… (147) 48添加小概率机会事件……………………………………(149) 4.9前向归纳法 4.10投票与二元议程… …………(155) 4.11技术性证明………………………………… (159) 习题 ……(165) 芧五章策略型均衡的赣炼 5.1引言 …(169) 5.2完美均衡 ………(171) 53完美均衡和序贯均衡的存在性…………… …(175) 5.4适度均衡 …(176) 5.5持久均衡 (182) 5.6均衡稳定集 (184) 5.7生成性质………………………… ……………(188) 5.8结论 (190)
目录3 习题 (191) 第六章具有通倌的博弈… ………(193) 6.1合同和相关策略 (193) 62相关均衡 (197) 63具有通信的贝叶斯博弈…… ……………………(204 64贝叶斯集体选择问题和贝叶斯讨价还价问题…………(208) 65具有线性效用的交易问题 (215) 66含合同的贝叶斯博弈的一般参与约束 …(222) 6.7发送一接收博弈 (224) 68可接受的与占优势的相关均衡 (228) 69展开型博弈和多阶段博弈中的通信……(3 习题… (237) 文献注释 (242) 第七章重复博弈 ……(245 7.1重复囚徒困境博弈… ………(245) 72重复博弈的一个一般模型……………… …(247) 73具有完全状态信息和贴现的重复博弈之平稳均衡………(252) 7.4具有标准信息的重复博弈:一些例子… (258) 7.5标准重复博弈的一般可行性定理…………… ……(264) 7.6有限重复博弈和初始怀疑的作用 ……(269) 7.7行动的不完全可观测性………… (272) 7.8大分散群体的重复博弈 (278) 7.9不完全信息下的重复博弈 ………………………(280) 7.10连续时间 …(287) 7.11重复博弈的进化模拟 (289) 习题 (290 第八章爾人博弈的讨价还价与合作……………(295) 8.1合作博弈理论的非合作基础………………… 82两人讨价还价问题和纳什讨价还价解 (298) 83个人之间加权效用的比较 (303) 8.4可转让效用………… (306) 8.5理性威胁…… 86其他讨价还价解 (310 8.7一个轮流报价的讨价还价博弈………………………(313) 88一个具有不完全信息的轮流报价博弈………(318 .9一个离散的轮流报价博弈… (321)
博弈论 8.10再谈判 (325) 习题 第宄章合作博弈中的联盟 …(333) 9.1联盟分析概述………………………… …(333 9.2可转让效用下的特征函数 …………………………(337) 9.3核心 9.4沙普利值 (347) 9.5合作结构下的值 …(353) 6其他的解概念 …………(359) 7不可转让效用下的联盟博弃… (363) 9.8不具可转让效用的核心… 99不具可转让效用的值………(73) 习题 文献注释 (383) 第十章不确定性下的合作 (385) 10.1引言 (385) 10.2有效性的概念………… ……(387) 10.3一个例子…… ……(390) 10.4事后无效性和后续报价…… (393) 10.5计算激励有效的机制…………………………………(396) 10.6不可思议性和持久性… ………(400) 10.7知情委托人的机制选择 ……(405) 10.8中性讨价还价解……………………………………………(410) 10.9不完全信息动态匹配过程 习题 (424 參考文献 ……(427 译后记……………………………… (441
决策理论基砬 博弈论、理性和智能性 博弈论( Game theory)可以被定义为是对智能的理性决策者之间冲突与 合作的数学模型的研究。博弈论为分析那些涉及两个或更多个参与者且其决策 会影响相互间的福利的局势提供了一般的数学方法。就此而论,博弈论便为社 会科学各分支的学者和实际的决策者提供了非常重要的视角。博弈理论家所研 究的局势,不仅仅是“游戏(game)”一词所不幸表示的消遣活动,“冲突分 析”或“相互影响的决策理论∵”或许是描述博弈论更为准确的术语,但“博 弃论”这个名称看来已难以更改了 近代博弈论叮以说是始于策墨洛( Zermelo,1913)、波雷尔( Borel, 1921)、冯·诺依曼( von neumann,1928)的工作,以及冯·诺依曼与摩根斯 特恩( Morgenstern,1944合著的伟大的奠基性著作。博弈论方面的许多早 期著作都是在第二次世界大战期间在普林斯顿完成的,而在这同一个知识团体 中,还有许多著名的理论物理学家在工作(见 Morgenstern,1976)。从更广泛 的知识史的角度来看,这种不同学科在地点上的巧合不完全是一种巧合。博弈 论在社会科学的数学基础中的地位是其产生并广泛运用的根本原因。本世纪, 物理科学中最基础的理论分支所取得的巨大进展引发了威胁我们人类文明存在 的核困境。对于如何设计物理系统来利用放射性物质,人们已经懂得很多,但 对如何创造社会体制来调节冲突中的人类行为却做得不够。因而,希望社会科2 学最基础的理论分支的进展所提供的对人类行为的理解,能与物理科学的巨大 进展相媲美,也就是自然而然的事了。这种愿望也是过去50多年中许多数学 家和社会科学家致力于研究博弈论的动力之一。近年来,有效地证明博弈论的 威力的是其重要应用的多方面发展,特别是在经济学领域。 傅弈理论家力图通过研究定量模型和假设例子来理解冲突与合作。这些例 子可能在很多方面都是脱离现实的简化,但与实际生活中大量更为复杂的情况 相比,这种简化能使我们更容易看出冲突与合作的一些基本问题。当然,这也 也可译作“交互决策理论或互动决策理论”一译者
2博弈论 是任何…个研究领域都应用的分析方法—把问题放在忽略掉现实中不重要的 细枝木节的一个简化模型中加以考虑。因此,即使从未遇到像博弈理论家在研 究中明确规定局中人立场的局势,研究过这些假设例子的人们,仍然能够较好 地理解实际的竞争局势。 在博弈论的语言中,一个博弈(gare)指的是涉及到两个或更多个参与 人的某个社会局势。博弈所涉及的参与人被称为局中人( players)s正如前面 博弈论的定义所述,博弈论家-般要对局中人做两个基本的假设:他们都是 理性的和他们都是智能的。这两个形容词在这里都是技术性术语,所以需要对 其逐一解释。 如果一个决策者在追逐其日标时能前后一致地做决策,我们就称他是理性 的( rationa!)。在基于决策理论的基本结论而建立起来的博弈论中,我们假设 每个局中人的日标是追求其个人期望支付值的最大化,支付则是用某个效用 ( utility))尺度来度量的。理性决策者应该按使自己的期望支付最大化的方式去 做决策的思想,至少可以追溯到伯努里( Bernoulli,1738),但这个思想在近 代被辨明为是正当的,则应归功于冯·诺依曼和摩根斯特恩(1947)。借助关于 理性决策者应该如何行动方面所做的些非常弱的假设,他们证明了,对任一 理性的决策者,一定存在某种方式对他所关心的各种可能结果赋予效用数值 3使其总是选择最大化自己的期望效用。我们称这一结论为期望效用最大化定理 (expected-utility maximization theorem) 这里值得强调的是,证明期望效用最大化定理成立所使用的一些逻辑公埋 都是弱相容性假设。在这个定理的推导过程中,关键的假设一般来说是肯定性 ( sure-thing)或替代性( substitution)公理,它可以被非正式地表述为:“如果 个决策者在事件A发生的偏好选项1胜于选项2,并且在事件A不发生时也 偏好选项1胜于选项2,那么就有,他在知道事件A无论是发生还是不发生之 前都应该偏好选项1胜于选项2。”这样的一个假设,结合几个技术上的正则 性条件,就是以保证存在某个效用尺度,使得决策者总是偏好于能给出最高期 望效用值的选项。 始终最大化期望效用的行为也能从进化选择模型中导出。在一个无序性渐 增成为自然规律的体系中,复杂的有机体(包括人类,更广泛地说包含社会组 织)只有依照能增大其生存和自我繁衍的概率的方式行动才能持久地存在。因 此,进化一选择论提出个体倾向于最大化某个度量其生存和繁衍的适应性或成 功率的变量的期望值(见 Maynard Smith,1982)。 一般来说,最大化期望效用支付与最大化期望货币支付并不必然相同,因 为效用值不一定要用货币单位去度量。一个厌恶风险的人在他贫穷时从增加 美元中得到的效用增加,可能比其富有时得到同一美元所带来的效用的增加更 高。这一现象表明,对于许多决策者来说,效用可能是货币值的一个非线性函 数。例如,一个在决策分析中常用的模型规定,决策者从得到x美元中获得
第一章决秉理论基础 的效用支付是u(x)=1-e,其中c表示他的风险厌恶指数( index of risk aversion,见Prat,1964)。更一般地,一个人的效用支付除了与其自己的货币 值有关外,可能还依赖于很多变量(甚至包括那些令他感到同情或者反感的人 所得到的货币值)。 当存在不确定性( uncertainty)时,仅在所有有关的不确定事件都能够被 指定概率的条件下,期望效用才可能被定义和计算,这些概率定量地度量了每4 个不确定事件发生的可能性。拉姆齐( Ramsey,1926)和萨维奇( Savage, 1954)证明了,即使某些事件不能被指定客观概率,一个理性的决策者应该能 够确定其主观概率值,以应计算这些期望值之需。 然而,在涉及到两个或两个以上决策者的情形时,确定主观概率又出现了 种特殊的困难。例如,假设对某个给定的参与人1而言是未知的一个因素 正是另一个参与人2所选择的行动。为了确定2的每个可能选择行动的概率, 1需要了解2的决策行为,因而1可以设想自己处于2的地位。在这个思维试 验中,1或许意识到2正在尽量理性地解决她自己的决策问题,为此,她也必 须确定1的每个可能选择行动的概率。实际上,1或许能够意识到2可能正设 想她自己处于1的位置以便掌握1将做什么。于是,每个人决策问题的理性解 都依赖于其他人决策问题的解。不了解其他人决策问题的解,就没有一个问题 可以被解。因此,在理性决策者们相互影响时,他们的决策问题必须放到一起 进行分析,像一个方程组一样。这种分析正是博弈论研究的主题。 当我们像博弈论专家或社会科学家那样分析一个博弈时,如果局中人知道 我们对此博弈所知道的一切,并能做出我们对此局势所能做出的一切推断,我 们就说此博弈的局中人是智能的( intelligent)。博弈论一般都假设局中人在上 述意义上是智能的。因此,如果我们研究出一个能描述某个博弈中智能局中人 行为的理论,并且我们相信这一理论是正确的,那么,我们也必须假定该博弈 的每个局中人都了解这一理论及其预测。 对于仅假设理性而不假设智能性的理论,可以考虑经济学中的价格理论 例。在价格理论的一般均衡模型中,假定每个个体都是追求效用最大化的理性 决策者,但并不假定他们像价格理论家那样对经济模型的全部结构有所了解。 在价格理论模型( price-theoretic models)中,个体只观察某些中间价格信号并 且对此做出反应,并且假定每个个体都相信,他可以在这些价格上交易任意数 量而不管这个经济系统中是否有人实际上愿意与其做这种交易。 当然,所有个体都具有完美的理性和智能性的假定,在现实生活情形中可 能从来都没有被满足过。但另一方面,我们也要对与这个假定不相一致的理论 和预测表示怀疑。如果一个理论预测,某些人将经常地被愚弄或做出代价极高 的错误行动,那么在这些人对此局势有更好的理解(从个人经验或这个博弈理 论本身的印刷文本中学会)之后,这个理论将会渐渐地失去其有效性。博弈论 在社会科学中的重要性大多数都是来源于这样一个事实
博弈论 1.2决策理论的基本概念 博弈论的逻辑根源在于贝叶斯决策理论( Bayesian decision theory)。事实 上,博弈论可以被看作是决策理论(对两个或两个以上决策者情形)的一种推 广,或者作为决策理论在本质上的逻辑完备。因此,要理解博弈论的根本思 想,就应该从研究决策理论开始。本章的其余几节专用于对贝叶斯决策理论基 本思想的介绍,这里从期望效用最大化定理的一般推导及其相关结论开始。 从某个角度来说,任何一个对数理社会科学感兴趣的人都会问这样一个问 题:为什么我可以期望一个简化的定量模型能成为人们行为的合理描述呢?通 过证明任何满足一定直觉公理的决策者总是按照在一定的主观概率分布下最大 化其某个效用函数的数学期望值的方式去行动,决策理论的基本结论就直接回 答了上述问题。也就是说,任何一个理性决策者的行为应该都可以用一个能给 出其对结果或彩金偏好的定量刻划的效用函数( utility function),和一个能刻 划其对所有相关未知因素的主观概率分布( subjective probability distribution) 来描述。而且,当有一个新的信息可被这样一个决策者利用时,它的主观概率 应该根据贝叶斯公式做相应修改。 从拉姆奇(1926)、冯·诺依曼和摩根斯特恩(1947)及萨维奇(1954)开 始以来,有关主观概率、期望效用最大化及贝叶斯公式的公理化推导,已有大量 的文献。这些结论的其他著名的推导已由赫斯坦和米尔诺( Milnor and herstein, 1953)、卢斯和雷费( Luce and raiffa,1957)、安斯库姆和奥曼(Ansc 6 Aumann,1963),以及普拉特、雷费和施莱弗( Schleifer,1964)等提供;关于 这方面的个一般性综述,可以参见菲什伯恩( Fishburn,1968)。这里使用的公 理主要是从文献中的早期论文里借用来的,而且没有试图让所使用的公理集实现 其逻辑上的最少化(实际上,在第1.3节中给出的公理中,有些明显是多余的)。 不确定性下的决策通常是用下述两个模型之一描述的:概率模型( probabi ty model)和状态变量模型( state-variable model)。在每一种模型中,我们所说的 决策者都是在彩票( arteries)中进行选择的人,两者的区别仅在于其对彩票的定 义不同。在概率模型中,彩票是彩金的概率分布;而在状态变量模型中,彩票是 从可能状态集到彩金集的函数。这两个模型各自有其最为合适的应用领域。 概率模型适用于描述彩金依赖于具有明显客观概率的事件这一类的赌博, 我们称这样的事件为客观未知( objective unknowns)事件。这类赌博有安斯库 姆和奥曼(1963)的“轮盘彩票”( roulette lotteries)或奈特( Knight,1921) 的“风险( risks)”等。例如,依赖于掷一枚匀质的硬币、轮盘的自旋,或者 从装有同样大小而颜色不同的球的瓮中随机地抽取一个球(各色球的总体已
第一章决策理论基础 知)之类的赌博都可以用概率模型充分地描述。这里用到一个重要的假定是, 就决策的目的而言,具有相同概率分布的两个客观未知是完全等价的。訾如 说,如果用“以各白1/2的概率提供100美元或0美元的彩金”来描述一张彩 票,我们假定彩金是由掷一枚匀质的硬币来决定还是由从一个装有50个白球 和50个黑球的瓮中抽取一个球来决定,都是无关紧要的。 另一方面,很多事件不具有明显的概率;一个未来运动赛事的结果或者股 票市场未来的行情都是很好的例子。我们称这类事件为主观未知( subjective knowns)事件。安斯库姆和奥曼(1963)的“赛马彩票”( horse lotteries) 或奈特(1921)的“不确定性”都相当于是依赖主观未知事件的賭博。这些都 更容易用状态变量模型来描述,因为这类模型允许我们描述彩金是如何由不可 预见事件决定的,而不必事先对这些事件明确其概率。 概率模型和状态变量模型只是本书所定义彩票的两个特例,即在我们研究 的彩票中,其彩金既可依赖于客观未知(它可以直接用概率描述)又可依赖于7 主观未知(它必须用状态变量描述)。用菲什伯恩(1970)的术语来说,我们 的模型允许存在外来概率( extraneous probabilities) 现在,让我们给出一些基本的记号。对于任何一个有限集Z,用△(Z)表 示集Z上的概率分布集,即 △(z)=(g:z→R|∑q(y)=1且q(x)≥0,Vz∈Z:(.1) vEZ (按照常规的集合记号,上述大括号中的“”表示“使得”) 令X表示决策者最终可能获得的彩金(pres)所组成的集;令表示可 能的状态( states)所组成的集,其中之一将是世界真实状态( true state of the world)。为了简化数学,我们假定X和Ω两者都是有限集。我们将彩票定义 为某个函数f,对X中的每个彩金x和中的每个状态t,∫都给出一个非负 实数∫(x|t),使得对Q中的每个t都有∑x∈xf(xlt)=1。令L表示所有 这样的彩票所组成的集合,就是 L=1f:32→△(X) 对Ω中的任一状态t和L中的任一彩票f,f(·|t)表示在状态t下由f确定的 X上的概率分布,即 x|t)}∈x∈△(X) 这里的每个数f(x|t)都可以被理解为:若t是世界真实状态,则由彩票 f得到彩金x的客观条件概率是f(xlt)(按照常规的概率表示记号,小括号 中的“”表示“给定”)。为使这种解释合乎情理,状态必须被定义得足够地 广泛,以致于包括所有可能影响到彩金获得的主观未知事件。从而,一且确定 了状态,余下的只是客观概率,而对于任何一个规范界定的赌博而言,其可能
6博弈论 彩金集上的客观概率分布总是可以被计算出来的。因此,我们对彩票的规范定 义,可用于表示任何一个彩金既依赖于客观未知事件又依赖主观未知事件的赌 博 我们所说的彩金(pize)可以是任何的商品组合或资源配置。我们假定, 定义X中的彩金时已纸使得这些彩金是互不相同的,且穷尽了决策者各种决 8策的可能结果。更进一步,我们假定X中的一个彩金表示了决策者在由其决策 导致的局势中他所关心的各方面的一个完备描述。因而,给定决策者关于世界 真实状态的任一信息,他应该能给出其在彩票集上的偏好序。 决策者关于世界真实状态可能拥有的信息可以用一个事件( event)来描 述,每个事件都是Ω的一个非空子集。我们用三表示所有事件组成的集,则 ={S|Sc且S≠O} 对于L中的任意两个彩票f和g,以及三中的任一事件S,当且仅当,如 果决策者知道了世界真实状态在S中,则对他来说,f至少是和g一样的理想 选择的时候,我们才写作∫≈sg。这就是说,当且仅当决策者在只知道事件S 已经发生而又必须在f和g之间择其一时,选择了彩票f,才有fsg。给定 这个关系(≈s),我们可以定义关系(>s)和(-s)为 f~sg当且仅当fsg且gzsf f>s当且仅当f≈sg且g~sf 这就是说,f~sg意味着,如果决策者在知道S后又必须在f与g之间进行 选择时,他将感到二者之间毫无差异;而f>sg则意昧着在同样的情况下, 他严格地偏好于f。 我们可以用之、>、相应地代替a、>a、~0,即9的某个状态被观 察排除之前没有谈到条件事件时,假定彩票集上的偏好是先验偏好。 值得注意的是,这里假定了决策者在E中任何可能事件发生的条件下都 在彩票集上具有定义完善的偏好。在决策理论的一些论述中,一个决策者的条 件偏好是在做任何观察之前由他所确定的先验偏好(用贝叶斯公式)推导而来 的,但是,这种推导不能在先验概率为0的事件下给出彩票的优劣关系。在博 弈论的领域内,这一疏漏并不像看上去那样无关紧要。克雷普斯( Kreps)和 威尔逊( Wilson,1982)已经证明,一个理性决策者在观察到零概率事件后的 信念和偏好特征对分析一个博弈可能会起到至关重要的作用。 对于满足0≤a≤的任意一个数a和L中任意两个彩票f与g,qf+(1 a)g表示了L中这样的彩票,使得 (af+(1-a)g)(xin)=af(xlt)+(1-a)g(x!), VxEX, teN 为了解释这一定义,考虑从一个瓮中取一个球,瓮中黑球的比例是a,白球的 比例是(1-a)。设想若取出的是黑球,则决策者賭f;而若取出的是白球