《博弈论——矛盾冲突分析》PDF电子书（R·B·迈尔森，共十章）

R·B·迈尔森教授的《博弈论一矛盾冲突分析》一书，全面透彻地考察了非合作博弈及合作博弈的数学模型，阐明了博弈论的方法原理，讨论了展开型博弈的序贯均衡和策略型博弈均衡的精炼，综述了通信博弈、重复博弈、不完全信息贝叶斯博弈等专题，并吸收了博弈论的最新进展。全书内容丰富，取材精练，叙述深人浅出，思想方法与应用并重，特别是在经济理论方面的富有成效的应用。阅读本书所需要的数学知识只是微积分、线性代数和概率论等方面的基本知识，因而适合于本科生高年级和研究生低年级学生，以及想了解博弈论基本方法及其在经济理论中运用的经济学家阅读使用。

团购合买资源类别：文库，文档格式：PDF，文档页数：444，文件大小：10.72MB

决策理论基砬博弈论、理性和智能性博弈论( Game theory)可以被定义为是对智能的理性决策者之间冲突与合作的数学模型的研究。博弈论为分析那些涉及两个或更多个参与者且其决策会影响相互间的福利的局势提供了一般的数学方法。就此而论,博弈论便为社会科学各分支的学者和实际的决策者提供了非常重要的视角。博弈理论家所研究的局势,不仅仅是“游戏(game)”一词所不幸表示的消遣活动,“冲突分析”或“相互影响的决策理论∵”或许是描述博弈论更为准确的术语,但“博弃论”这个名称看来已难以更改了近代博弈论叮以说是始于策墨洛( Zermelo,1913)、波雷尔( Borel, 1921)、冯·诺依曼( von neumann,1928)的工作,以及冯·诺依曼与摩根斯特恩( Morgenstern,1944合著的伟大的奠基性著作。博弈论方面的许多早期著作都是在第二次世界大战期间在普林斯顿完成的,而在这同一个知识团体中,还有许多著名的理论物理学家在工作(见 Morgenstern,1976)。从更广泛的知识史的角度来看,这种不同学科在地点上的巧合不完全是一种巧合。博弈论在社会科学的数学基础中的地位是其产生并广泛运用的根本原因。本世纪, 物理科学中最基础的理论分支所取得的巨大进展引发了威胁我们人类文明存在的核困境。对于如何设计物理系统来利用放射性物质,人们已经懂得很多,但对如何创造社会体制来调节冲突中的人类行为却做得不够。因而,希望社会科2 学最基础的理论分支的进展所提供的对人类行为的理解,能与物理科学的巨大进展相媲美,也就是自然而然的事了。这种愿望也是过去50多年中许多数学家和社会科学家致力于研究博弈论的动力之一。近年来,有效地证明博弈论的威力的是其重要应用的多方面发展,特别是在经济学领域。傅弈理论家力图通过研究定量模型和假设例子来理解冲突与合作。这些例子可能在很多方面都是脱离现实的简化,但与实际生活中大量更为复杂的情况相比,这种简化能使我们更容易看出冲突与合作的一些基本问题。当然,这也也可译作“交互决策理论或互动决策理论”一译者

2博弈论是任何…个研究领域都应用的分析方法—把问题放在忽略掉现实中不重要的细枝木节的一个简化模型中加以考虑。因此,即使从未遇到像博弈理论家在研究中明确规定局中人立场的局势,研究过这些假设例子的人们,仍然能够较好地理解实际的竞争局势。在博弈论的语言中,一个博弈(gare)指的是涉及到两个或更多个参与人的某个社会局势。博弈所涉及的参与人被称为局中人( players)s正如前面博弈论的定义所述,博弈论家-般要对局中人做两个基本的假设:他们都是理性的和他们都是智能的。这两个形容词在这里都是技术性术语,所以需要对其逐一解释。如果一个决策者在追逐其日标时能前后一致地做决策,我们就称他是理性的( rationa!)。在基于决策理论的基本结论而建立起来的博弈论中,我们假设每个局中人的日标是追求其个人期望支付值的最大化,支付则是用某个效用 ( utility))尺度来度量的。理性决策者应该按使自己的期望支付最大化的方式去做决策的思想,至少可以追溯到伯努里( Bernoulli,1738),但这个思想在近代被辨明为是正当的,则应归功于冯·诺依曼和摩根斯特恩(1947)。借助关于理性决策者应该如何行动方面所做的些非常弱的假设,他们证明了,对任一理性的决策者,一定存在某种方式对他所关心的各种可能结果赋予效用数值 3使其总是选择最大化自己的期望效用。我们称这一结论为期望效用最大化定理 (expected-utility maximization theorem) 这里值得强调的是,证明期望效用最大化定理成立所使用的一些逻辑公埋都是弱相容性假设。在这个定理的推导过程中,关键的假设一般来说是肯定性 ( sure-thing)或替代性( substitution)公理,它可以被非正式地表述为:“如果个决策者在事件A发生的偏好选项1胜于选项2,并且在事件A不发生时也偏好选项1胜于选项2,那么就有,他在知道事件A无论是发生还是不发生之前都应该偏好选项1胜于选项2。”这样的一个假设,结合几个技术上的正则性条件,就是以保证存在某个效用尺度,使得决策者总是偏好于能给出最高期望效用值的选项。始终最大化期望效用的行为也能从进化选择模型中导出。在一个无序性渐增成为自然规律的体系中,复杂的有机体(包括人类,更广泛地说包含社会组织)只有依照能增大其生存和自我繁衍的概率的方式行动才能持久地存在。因此,进化一选择论提出个体倾向于最大化某个度量其生存和繁衍的适应性或成功率的变量的期望值(见 Maynard Smith,1982)。一般来说,最大化期望效用支付与最大化期望货币支付并不必然相同,因为效用值不一定要用货币单位去度量。一个厌恶风险的人在他贫穷时从增加美元中得到的效用增加,可能比其富有时得到同一美元所带来的效用的增加更高。这一现象表明,对于许多决策者来说,效用可能是货币值的一个非线性函数。例如,一个在决策分析中常用的模型规定,决策者从得到x美元中获得

第一章决秉理论基础的效用支付是u(x)=1-e,其中c表示他的风险厌恶指数( index of risk aversion,见Prat,1964)。更一般地,一个人的效用支付除了与其自己的货币值有关外,可能还依赖于很多变量(甚至包括那些令他感到同情或者反感的人所得到的货币值)。当存在不确定性( uncertainty)时,仅在所有有关的不确定事件都能够被指定概率的条件下,期望效用才可能被定义和计算,这些概率定量地度量了每4 个不确定事件发生的可能性。拉姆齐( Ramsey,1926)和萨维奇( Savage, 1954)证明了,即使某些事件不能被指定客观概率,一个理性的决策者应该能够确定其主观概率值,以应计算这些期望值之需。然而,在涉及到两个或两个以上决策者的情形时,确定主观概率又出现了种特殊的困难。例如,假设对某个给定的参与人1而言是未知的一个因素正是另一个参与人2所选择的行动。为了确定2的每个可能选择行动的概率, 1需要了解2的决策行为,因而1可以设想自己处于2的地位。在这个思维试验中,1或许意识到2正在尽量理性地解决她自己的决策问题,为此,她也必须确定1的每个可能选择行动的概率。实际上,1或许能够意识到2可能正设想她自己处于1的位置以便掌握1将做什么。于是,每个人决策问题的理性解都依赖于其他人决策问题的解。不了解其他人决策问题的解,就没有一个问题可以被解。因此,在理性决策者们相互影响时,他们的决策问题必须放到一起进行分析,像一个方程组一样。这种分析正是博弈论研究的主题。当我们像博弈论专家或社会科学家那样分析一个博弈时,如果局中人知道我们对此博弈所知道的一切,并能做出我们对此局势所能做出的一切推断,我们就说此博弈的局中人是智能的( intelligent)。博弈论一般都假设局中人在上述意义上是智能的。因此,如果我们研究出一个能描述某个博弈中智能局中人行为的理论,并且我们相信这一理论是正确的,那么,我们也必须假定该博弈的每个局中人都了解这一理论及其预测。对于仅假设理性而不假设智能性的理论,可以考虑经济学中的价格理论例。在价格理论的一般均衡模型中,假定每个个体都是追求效用最大化的理性决策者,但并不假定他们像价格理论家那样对经济模型的全部结构有所了解。在价格理论模型( price-theoretic models)中,个体只观察某些中间价格信号并且对此做出反应,并且假定每个个体都相信,他可以在这些价格上交易任意数量而不管这个经济系统中是否有人实际上愿意与其做这种交易。当然,所有个体都具有完美的理性和智能性的假定,在现实生活情形中可能从来都没有被满足过。但另一方面,我们也要对与这个假定不相一致的理论和预测表示怀疑。如果一个理论预测,某些人将经常地被愚弄或做出代价极高的错误行动,那么在这些人对此局势有更好的理解(从个人经验或这个博弈理论本身的印刷文本中学会)之后,这个理论将会渐渐地失去其有效性。博弈论在社会科学中的重要性大多数都是来源于这样一个事实

博弈论 1.2决策理论的基本概念博弈论的逻辑根源在于贝叶斯决策理论( Bayesian decision theory)。事实上,博弈论可以被看作是决策理论(对两个或两个以上决策者情形)的一种推广,或者作为决策理论在本质上的逻辑完备。因此,要理解博弈论的根本思想,就应该从研究决策理论开始。本章的其余几节专用于对贝叶斯决策理论基本思想的介绍,这里从期望效用最大化定理的一般推导及其相关结论开始。从某个角度来说,任何一个对数理社会科学感兴趣的人都会问这样一个问题:为什么我可以期望一个简化的定量模型能成为人们行为的合理描述呢?通过证明任何满足一定直觉公理的决策者总是按照在一定的主观概率分布下最大化其某个效用函数的数学期望值的方式去行动,决策理论的基本结论就直接回答了上述问题。也就是说,任何一个理性决策者的行为应该都可以用一个能给出其对结果或彩金偏好的定量刻划的效用函数( utility function),和一个能刻划其对所有相关未知因素的主观概率分布( subjective probability distribution) 来描述。而且,当有一个新的信息可被这样一个决策者利用时,它的主观概率应该根据贝叶斯公式做相应修改。从拉姆奇(1926)、冯·诺依曼和摩根斯特恩(1947)及萨维奇(1954)开始以来,有关主观概率、期望效用最大化及贝叶斯公式的公理化推导,已有大量的文献。这些结论的其他著名的推导已由赫斯坦和米尔诺( Milnor and herstein, 1953)、卢斯和雷费( Luce and raiffa,1957)、安斯库姆和奥曼(Ansc 6 Aumann,1963),以及普拉特、雷费和施莱弗( Schleifer,1964)等提供;关于这方面的个一般性综述,可以参见菲什伯恩( Fishburn,1968)。这里使用的公理主要是从文献中的早期论文里借用来的,而且没有试图让所使用的公理集实现其逻辑上的最少化(实际上,在第1.3节中给出的公理中,有些明显是多余的)。不确定性下的决策通常是用下述两个模型之一描述的:概率模型( probabi ty model)和状态变量模型( state-variable model)。在每一种模型中,我们所说的决策者都是在彩票( arteries)中进行选择的人,两者的区别仅在于其对彩票的定义不同。在概率模型中,彩票是彩金的概率分布;而在状态变量模型中,彩票是从可能状态集到彩金集的函数。这两个模型各自有其最为合适的应用领域。概率模型适用于描述彩金依赖于具有明显客观概率的事件这一类的赌博, 我们称这样的事件为客观未知( objective unknowns)事件。这类赌博有安斯库姆和奥曼(1963)的“轮盘彩票”( roulette lotteries)或奈特( Knight,1921) 的“风险( risks)”等。例如,依赖于掷一枚匀质的硬币、轮盘的自旋,或者从装有同样大小而颜色不同的球的瓮中随机地抽取一个球(各色球的总体已

第一章决策理论基础知)之类的赌博都可以用概率模型充分地描述。这里用到一个重要的假定是, 就决策的目的而言,具有相同概率分布的两个客观未知是完全等价的。訾如说,如果用“以各白1/2的概率提供100美元或0美元的彩金”来描述一张彩票,我们假定彩金是由掷一枚匀质的硬币来决定还是由从一个装有50个白球和50个黑球的瓮中抽取一个球来决定,都是无关紧要的。另一方面,很多事件不具有明显的概率;一个未来运动赛事的结果或者股票市场未来的行情都是很好的例子。我们称这类事件为主观未知( subjective knowns)事件。安斯库姆和奥曼(1963)的“赛马彩票”( horse lotteries) 或奈特(1921)的“不确定性”都相当于是依赖主观未知事件的賭博。这些都更容易用状态变量模型来描述,因为这类模型允许我们描述彩金是如何由不可预见事件决定的,而不必事先对这些事件明确其概率。概率模型和状态变量模型只是本书所定义彩票的两个特例,即在我们研究的彩票中,其彩金既可依赖于客观未知(它可以直接用概率描述)又可依赖于7 主观未知(它必须用状态变量描述)。用菲什伯恩(1970)的术语来说,我们的模型允许存在外来概率( extraneous probabilities) 现在,让我们给出一些基本的记号。对于任何一个有限集Z,用△(Z)表示集Z上的概率分布集,即 △(z)=(g:z→R|∑q(y)=1且q(x)≥0,Vz∈Z:(.1) vEZ (按照常规的集合记号,上述大括号中的“”表示“使得”) 令X表示决策者最终可能获得的彩金(pres)所组成的集;令表示可能的状态( states)所组成的集,其中之一将是世界真实状态( true state of the world)。为了简化数学,我们假定X和Ω两者都是有限集。我们将彩票定义为某个函数f,对X中的每个彩金x和中的每个状态t,∫都给出一个非负实数∫(x|t),使得对Q中的每个t都有∑x∈xf(xlt)=1。令L表示所有这样的彩票所组成的集合,就是 L=1f:32→△(X) 对Ω中的任一状态t和L中的任一彩票f,f(·|t)表示在状态t下由f确定的 X上的概率分布,即 x|t)}∈x∈△(X) 这里的每个数f(x|t)都可以被理解为:若t是世界真实状态,则由彩票 f得到彩金x的客观条件概率是f(xlt)(按照常规的概率表示记号,小括号中的“”表示“给定”)。为使这种解释合乎情理,状态必须被定义得足够地广泛,以致于包括所有可能影响到彩金获得的主观未知事件。从而,一且确定了状态,余下的只是客观概率,而对于任何一个规范界定的赌博而言,其可能

6博弈论彩金集上的客观概率分布总是可以被计算出来的。因此,我们对彩票的规范定义,可用于表示任何一个彩金既依赖于客观未知事件又依赖主观未知事件的赌博我们所说的彩金(pize)可以是任何的商品组合或资源配置。我们假定, 定义X中的彩金时已纸使得这些彩金是互不相同的,且穷尽了决策者各种决 8策的可能结果。更进一步,我们假定X中的一个彩金表示了决策者在由其决策导致的局势中他所关心的各方面的一个完备描述。因而,给定决策者关于世界真实状态的任一信息,他应该能给出其在彩票集上的偏好序。决策者关于世界真实状态可能拥有的信息可以用一个事件( event)来描述,每个事件都是Ω的一个非空子集。我们用三表示所有事件组成的集,则 ={S|Sc且S≠O} 对于L中的任意两个彩票f和g,以及三中的任一事件S,当且仅当,如果决策者知道了世界真实状态在S中,则对他来说,f至少是和g一样的理想选择的时候,我们才写作∫≈sg。这就是说,当且仅当决策者在只知道事件S 已经发生而又必须在f和g之间择其一时,选择了彩票f,才有fsg。给定这个关系(≈s),我们可以定义关系(>s)和(-s)为 f~sg当且仅当fsg且gzsf f>s当且仅当f≈sg且g~sf 这就是说,f~sg意味着,如果决策者在知道S后又必须在f与g之间进行选择时,他将感到二者之间毫无差异;而f>sg则意昧着在同样的情况下, 他严格地偏好于f。我们可以用之、>、相应地代替a、>a、~0,即9的某个状态被观察排除之前没有谈到条件事件时,假定彩票集上的偏好是先验偏好。值得注意的是,这里假定了决策者在E中任何可能事件发生的条件下都在彩票集上具有定义完善的偏好。在决策理论的一些论述中,一个决策者的条件偏好是在做任何观察之前由他所确定的先验偏好(用贝叶斯公式)推导而来的,但是,这种推导不能在先验概率为0的事件下给出彩票的优劣关系。在博弈论的领域内,这一疏漏并不像看上去那样无关紧要。克雷普斯( Kreps)和威尔逊( Wilson,1982)已经证明,一个理性决策者在观察到零概率事件后的信念和偏好特征对分析一个博弈可能会起到至关重要的作用。对于满足0≤a≤的任意一个数a和L中任意两个彩票f与g,qf+(1 a)g表示了L中这样的彩票,使得 (af+(1-a)g)(xin)=af(xlt)+(1-a)g(x!), VxEX, teN 为了解释这一定义,考虑从一个瓮中取一个球,瓮中黑球的比例是a,白球的比例是(1-a)。设想若取出的是黑球,则决策者賭f;而若取出的是白球

点击下载完整版文档（PDF格式）

共444页，可试读40页，点击继续阅读 ↓↓

点击下载（PDF格式）

浏览记录