实验:选数博弈 第三章 ·规则:有两个人,1~10十个数字,每个 人可以选择其中的任意五个;如果两个 多重均衡与制度和文化 人的选择没有重复,每人得到50元;否 则,各为0 张维迎 北京大学光华管理学院 多重纳什均衡:产品标准 交通博弈 许多博弈可能有多个纳什均衡 靠左行靠右行 5.5 靠左行 1,-1 S,昱 3.2 约会博弈 进门博弈 芭蕾舞足球场 芭蕾舞 足球场 2,1 后进 ⊥,2 l,-1
第三章 多重均衡与制度和文化 张维迎 北京大学光华管理学院 实验:选数博弈 • 规则:有两个人,1~10十个数字,每个 人可以选择其中的任意五个;如果两个 人的选择没有重复,每人得到50元;否 则,各为0。 多重纳什均衡:产品标准 • 许多博弈可能有多个纳什均衡 3.5“ 5.5“ 3.5“ 5.5“ 8, 8 3, 2 2, 3 6, 6 这个博弈被称为 “协调博弈”:有 两个纯战略纳什 均衡,一个混合 战略均衡。哪一 个将出现呢? 交通博弈 靠左行 靠右行 靠左行 靠右行 1,1 1,1 -1,-1 -1,-1 约会博弈 芭蕾舞 足球场 芭蕾舞 足球场 1,2 0,0 0,0 2,1 进门博弈 先进 后进 先进 后进 -1,-1 -1,-1 2,1 1,2
分蛋糕博弈 资源争夺博弈( chicken) 任何满足x1+x2=1的点都是 Dove 纳什均衡。 5,5 如何协调? 帕累托最优均衡 ·仅仅“理性”是不够的 (3.5“3.5”)帕累托优于(5.5“55”) FOCAL POINT (PROMINENCE) Schelling(1960) heap talk可 以帮助协调 ·帕累托最优均衡:可以通过协商选择 到一个帕累 个纳什均衡; Cheap talking 3.5 托最优均衡 文化与制度 ·行业组织 为什么要相信? 锁定效应与路径依赖 如果博弈参与人很多,达成协议的成本 非帕累托均衡可以被锁定(lock-in),导致路径依賴 ( path dependence:每个人多偏好于新产品(或标 准),如果其他人都选择新产品的话;但由于每个人 都预期其他人不会选择新产品,所以每个人的最优选 择是不转向新产品,结果是整个社会被锁定在现有的 不论C选择什么,他都有积极性告诉R他将选择Cl: 这常被用来作为市场失灵的理论证据; 所以没有理由认为R应该相信C的话。 经验证据: QWERT vS Dvorak键盘: Beta ysⅤHS录象 机:MAC与IBM计算机软件 但最新的研究似乎正在推翻这些广泛流行的结论
分蛋糕博弈 x1 x2 1 1 任何满足x1+x2=1的点都是 纳什均衡。 资源争夺博弈(chicken) Hawk Dove Hawk Dove -1,-1 5,5 10,0 0,10 如何协调? • 仅仅“理性”是不够的; • FOCAL POINT(PROMINENCE): Schelling(1960); • 帕累托最优均衡:可以通过协商选择一 个纳什均衡;Cheap talking; • 文化与制度 • 行业组织; 帕累托最优均衡 3.5“ 5.5“ 3.5“ 5.5“ 8, 8 3, 2 2, 3 6, 6 (3.5“,3.5”) 帕累托优于(5.5“,5.5”) Cheap talk 可 以帮助协调 到一个帕累 托最优均衡 为什么要相信? C1 C2 R1 R2 9,9 0,8 8,0 7,7 不论C选择什么,他都有积极性告诉R他将选择C1; 所以没有理由认为R应该相信C的话。 R C 锁定效应与路径依赖 • 如果博弈参与人很多,达成协议的成本很高,最初的 非帕累托均衡可以被锁定(lock-in), 导致路径依赖 (path dependence):每个人多偏好于新产品(或标 准),如果其他人都选择新产品的话;但由于每个人 都预期其他人不会选择新产品,所以每个人的最优选 择是不转向新产品,结果是整个社会被锁定在现有的 产品(标准)(非帕累托最优); • 这常被用来作为市场失灵的理论证据; • 经验证据:QWERT vs Dvorak键盘;Beta vs VHS录象 机;MAC与IBM计算机软件; • 但最新的研究似乎正在推翻这些广泛流行的结论
键盘的寓言 VHS与 Betamax l868年 Christopher L. Stoles发明 QWERT键盘:由 Remington公司生 ONY公司1975年开始销售 Betamax,并一再把该技木提供给松下 年Doak发明简化键盘CDSK,Dwo 1976年4月三家公司最终同意召开一次会议来比较 Betamax,vH 的手指运动,其优势在于提高速度、减少酸 和VX:但由于VC的侵权,SONY和柱 SONY相信“小”,松下相信“长” 为什么没有被采用?最初的打字员不选择学习 Dvorak,因为 ONY吸引东芝和三洋支持Bca,松下则把日立、夏普和三菱拉 很难找到:办公 k,因为找不到打字 入阵营:一种制式的任何改进都伴随着另一阵营的相同改进 方降价,另一方也跟进。两种制式在几乎所有方面都被证明是完 趁鑄跳法否成工程今方的研咣矍的瓷邊橙科享 VHS播放时间更长,Bcta两小时 时:Bea5小时,vHS8小时 上可靠、重要的优势:(3)打字机市场上的 要比通常报告的 要激烈的多:(4)许多比赛证明了其他键盘的优越性 市场在插放时间和磁带压缩之间的投票是决定性的:1979年前 场份额的份额下降到12%:1984年,只有SONY在生产Beta MAC与IBM 大学改革:教师招聘 据称: Macintosh要比命令行DOS好得多,甚至比基于 OS的 Windows好,但为什么消亡了?通常的解 只留本校生不留本校生 DOS成功了是因为它成功了:有更多的软件,更多的 事实是:(1)成本优势:(2)速度优势;(3)商业 只留本校生2,22.0 环境中,一台机器只用于一种软件,一旦操作员学 acitosh的界面优势就没有了;(4)为DOS写软 要容易的多 Stan Liebowitz, and Stephen Margolis, "The Fable of the 不留本校生 Keys",JLE(1990); Beta, Macitosh and other Fabulot Tales",1999(Winner, Losers and Microsoft 交通博弈与交通规则 法律和社会规范如何协调预期 ·法律和社会规范就是这种协调预期的规则,帮 助人们在多个纳什均衡中筛选一个特定的纳什 均衡。社会规范是通过习惯、长期的交互博弈 靠左行 产生的行为规则,法律是立法机关制定的行为 规则,但不论是法律还是社会规范,它们的 能都是协调预期 靠右行 1,-1 1,L
键盘的寓言 • 1868年Christopher L. Stoles发明QWERT键盘;由Remington公司生 产; • 1936年Dvorak发明简化键盘(DSK,Dvorak Simplified Keyboard): 认为这一键盘通过平衡双手和更有力的手指之间的工作量,极大 地减少了打字产生的手指运动,其优势在于提高速度、减少疲 劳,以及更容易的学习。 • 为什么没有被采用?最初的打字员不选择学习Dvorak,因为 Dvorak机器很难找到;办公室不愿配置Dvorak,因为找不到打字 员; • 但这些说法并不成立:(1)支持Dvorak更好的论点证据不足,许 多是猜测;(2)人体工程学方面的研究发现,它没有任何在科学 上可靠、重要的优势;(3)打字机市场上的竞争要比通常报告的 要激烈的多;(4)许多比赛证明了其他键盘的优越性。 VHS 与Betamax • SONY公司1975年开始销售Betamax, 并一再把该技术提供给松下- JVC; • 1976年4月三家公司最终同意召开一次会议来比较Betamax,VHS 和VX;但由于JVC的侵权,SONY和松下-JVC分道扬镳; • SONY相信“小”,松下相信“长”; • SONY吸引东芝和三洋支持Beta,松下则把日立、夏普和三菱拉 入阵营;一种制式的任何改进都伴随着另一阵营的相同改进;一 方降价,另一方也跟进。两种制式在几乎所有方面都被证明是完 全相同的,除了一方面:VHS播放时间更长,Beta两小时,VHS 4小时;Beta5小时,VHS 8小时。 • 市场在播放时间和磁带压缩之间的投票是决定性的:1979年前, VHS在美国的销售量是Beta的三倍,1983年前,Beta的在世界市 场份额的份额下降到12%;1984年,只有SONY在生产Beta。 MAC与IBM • 据称:Macitosh要比命令行DOS好得多,甚至比基于 DOS的Windows好,但为什么消亡了?通常的解释: DOS成功了是因为它成功了:有更多的软件,更多的 用户; • 事实是:(1)成本优势;(2)速度优势;(3)商业 环境中,一台机器只用于一种软件,一旦操作员学 会, Macitosh的界面优势就没有了;(4)为DOS写软 件要容易的多。 • Stan Liebowitz, and Stephen Margolis, “The Fable of the Keys”, JLE (1990); Beta, Macitosh and other Fabulous Tales”, 1999 (Winner, Losers and Microsoft). 大学改革:教师招聘 只留本校生 不留本校生 只留本校生 不留本校生 2,2 2,0 0,2 10,10 交通博弈与交通规则 靠左行 靠右行 靠左行 靠右行 1,1 1,1 -1,-1 -1,-1 法律和社会规范如何协调预期 • 法律和社会规范就是这种协调预期的规则,帮 助人们在多个纳什均衡中筛选一个特定的纳什 均衡。社会规范是通过习惯、长期的交互博弈 产生的行为规则,法律是立法机关制定的行为 规则,但不论是法律还是社会规范,它们的功 能都是协调预期
交通规则的演变 交通规则的演变 ·在多个纳什均衡之间不存在优劣之分时,偶然 在法国大革命以前,贵族的马车习惯上是靠左行的 事件对选择具有重要意义 穷人在路上看到富人的马车来了,要站在马路的右 从历史上来考察,许多交通规则一开始并不体现为法律,而是长 认为更为“民主”。随着法国大革命,作为一个革命 征,规定所有的车都要靠右走。随着拿破仑对欧洲 陆的征服,拿破仑将法国的规则带给了欧洲,也包 的习惯才逐步演 范。但直到19世纪前,道路规则也仅仅是作为规范而得到遵 括靠右行驶的规则。当然,在地域上这个规则的转变 而不是作为交通法律而得到执行。现在欧洲大陆的靠右走的 也是从西到东逐步完成的。比如说,与靠右行的西班 规则是在法国兴起的 牙接壤的葡萄牙是在一战之后才转为靠右行,奥地利 是从西到东一个省一个省逐步转变的,匈牙利、捷克 到1967年,才通过法律宣布从靠左行改为靠右行。 文化的冲突与协调 解决规则冲突的三个方式 ·为什么欧洲大陆的交通规则收敛于 个规则取代其他的规 分人改变行为 致 谓的“接轨”,如前面 讲的欧洲大陆交通规则的演变所显示 英国将如何办? 是建立全新的规则,如中国人和德国人在一起交流 文化冲突,无论是组织和组织之间的 时都用英语,而不是中文,也不是德文 还是国家和国家之间的,大部分不过是 是建立协调规则的规则。如“入乡随俗”,“客随主 游戏规则一一社会规范和法律的冲突 ·究竟哪一种,与规则要解决的问题有关,也与其他因 用博弈论的话来说,是一个均衡选择问 素有关 ·全球化意味着资源的重新分配。 致与冲突 文化既解决冲突又协调预期 进门博弈 后走 尊老爱幼 妇幼保护 币重教 ·先来后到 社会分层与非对称权力(排位问题;黑社会组 走1,2 织): ·公平观念(如分蛋糕博弈 抓阄
交通规则的演变 • 在多个纳什均衡之间不存在优劣之分时,偶然 事件对选择具有重要意义; • 从历史上来考察,许多交通规则一开始并不体现为法律,而是长 期演化而来的。在欧洲大陆的早期,道路行走规范是非常地方化 的,有些地方采用靠左走的习惯,有些地方采用靠右走的习惯, 是不统一的。只是随着道路的增加和地区间交往的扩大,地方性 的习惯才逐步演变为区域性的规范,然后有演变为全国性的规 范。但直到19世纪前,道路规则也仅仅是作为规范而得到遵 守,而不是作为交通法律而得到执行。现在欧洲大陆的靠右走的 规则是在法国兴起的。 交通规则的演变 • 在法国大革命以前,贵族的马车习惯上是靠左行的, 穷人在路上看到富人的马车来了,要站在马路的右 边。因此,靠左行与“特权阶级”相联系,而靠右行被 认为更为“民主”。随着法国大革命,作为一个革命的 象征,规定所有的车都要靠右走。随着拿破仑对欧洲 大陆的征服,拿破仑将法国的规则带给了欧洲,也包 括靠右行驶的规则。当然,在地域上这个规则的转变 也是从西到东逐步完成的。比如说,与靠右行的西班 牙接壤的葡萄牙是在一战之后才转为靠右行,奥地利 是从西到东一个省一个省逐步转变的,匈牙利、捷克 和德国是在二战前才由左行转向右行的。瑞典,一直 到1967年,才通过法律宣布从靠左行改为靠右行。 文化的冲突与协调 • 为什么欧洲大陆的交通规则收敛于一 致? • 英国将如何办? • 文化冲突,无论是组织和组织之间的, 还是国家和国家之间的,大部分不过是 游戏规则――社会规范和法律的冲突, 用博弈论的话来说,是一个均衡选择问 题; • 全球化意味着资源的重新分配。 解决规则冲突的三个方式 • 一是一个规则取代其他的规则,让一部分人改变行为 规范适应另一部分人,也就是所谓的“接轨”,如前面 讲的欧洲大陆交通规则的演变所显示的。 • 二是建立全新的规则,如中国人和德国人在一起交流 时都用英语,而不是中文,也不是德文; • 三是建立协调规则的规则。如“入乡随俗”,“客随主 便”。 • 究竟哪一种,与规则要解决的问题有关,也与其他因 素有关。 一致与冲突 先走 后走 先走后走 -1,-1 2,1 1,2 -1,-1 进门博弈 文化既解决冲突又协调预期 • 尊老爱幼; • 妇幼保护; • 尊师重教; • 先来后到; • 社会分层与非对称权力(排位问题;黑社会组 织); • 公平观念(如分蛋糕博弈); • 抓阄;
分蛋糕问题与公平观念 信息与身份(identity) ·信息对预期的协调很重要:如果不知道 谁是谁,协调就很困难; ·身份是传递信息的重要工具; 0.5 ·身份的外在化:服饰,车座,秘书; ·学界的官本位问题 0.5 资源争夺博弈(chicken) 产权的先占规则 人们为什么遵守这个规则? Hawk Dove 人们希望得到别人认可的愿望: 一旦规则建立,每个人都预期其他人会遵守规则:给定这个预 期,每个人发现遵守规则是自己的利益所在,也希望别人能遵守 hawk-1,-110,0 这个规则。任何不守规则的行为 守规则的人受 感到威胁,从而引起后者的愤怒:任何其他人也因此会觉得自己 未来的利益受到威胁,对此种行为表示不满,对受害人表示同 情: 0105,5 少数人不守规则并不会导致规则的消失: 但如果规则总是偏向于某一组特定的人群,受到不公正对待的人 并不会蔑视不守规则的人,规则就容易被违反 罗尔斯(Rawls)的正义论 关于论资排辈问题 为什么制度要有稳定性? ·容易被个人操纵的信息是没有价值的; ·制度是为了稳定预期,频繁的变化会打 当缺乏其他有效的信息时,资历可以成 乱人们的预期; 为协调博弈的信息 ·希思罗机场的 Meeting Point ·孙不扬于万历22年(1595年)出任吏部 尚书,创建了“掣签法”:官员们无论贤 愚清浊,一律抽签上岗。(吴思《潜规 则》)
分蛋糕问题与公平观念 x1 x2 0.5 0.5 信息与身份(identity) • 信息对预期的协调很重要:如果不知道 谁是谁,协调就很困难; • 身份是传递信息的重要工具; • 身份的外在化:服饰,车座,秘书; • 学界的官本位问题; 资源争夺博弈(chicken) Hawk Dove Hawk Dove -1,-1 5,5 10,0 0,10 产权的先占规则 • 人们为什么遵守这个规则? • 人们希望得到别人认可的愿望: • 一旦规则建立,每个人都预期其他人会遵守规则;给定这个预 期,每个人发现遵守规则是自己的利益所在,也希望别人能遵守 这个规则。任何不守规则的行为都会使守规则的人受到损害或者 感到威胁,从而引起后者的愤怒;任何其他人也因此会觉得自己 未来的利益受到威胁,对此种行为表示不满,对受害人表示同 情; • 少数人不守规则并不会导致规则的消失; • 但如果规则总是偏向于某一组特定的人群,受到不公正对待的人 并不会蔑视不守规则的人,规则就容易被违反。 • 罗尔斯(Rawls)的正义论 关于论资排辈问题 • 容易被个人操纵的信息是没有价值的; • 当缺乏其他有效的信息时,资历可以成 为协调博弈的信息; • 孙丕扬于万历22年(1595年)出任吏部 尚书,创建了“掣签法”:官员们无论贤 愚清浊,一律抽签上岗。(吴思《潜规 则》) 为什么制度要有稳定性? • 制度是为了稳定预期,频繁的变化会打 乱人们的预期; • 希思罗机场的Meeting Point;