2006博弈与社会第一次作业 本次作业提交时间2006年3月15日 1.2004年6月,俄罗斯第四大银行遭挤兑,随后的影响险些造成继1998年后 又一次的金融危机。请用所学博弈论的知识简要说明银行挤兑的原因,以及有哪 些预防措施?(提示:从储户间的博弈来分析) 2.设想有一个居民点,居民住宅延一条公路均匀排开。现有两家商店要在小区 开张,假定两家商店货物完全相同,居民仅仅到离自己比较近的商店购物,商店 的最优开张地点是哪里,若有三家商店呢?用Nash均衡的观点给予解释。 3.分析下面的支付矩阵,回答问题 L M R 4,3 6,2 2,1 8,43,6 3,09,62,8 1)请根据“重复剔除严格劣战略”( iterated elimination of strictly dominated strategy)的思路找到均衡,并简述过程。 2)你得到的均衡是 Kaldor- Hicks有效的吗?是 Pareto有效的吗?请给出简短 解释。 4.思考简答题 1)举例说明宿舍同学曾经给你带来过的外部性(正或负),你是怎么应对的? 2)BT或Maze下载是大家现在耳熟能详的下载方式,跟FTP相比有着他独特 的优势,思考里面蕴含什么的博弈论原理?
2006 博弈与社会第一次作业 本次作业提交时间 2006 年 3 月 15 日 1.2004 年 6 月,俄罗斯第四大银行遭挤兑,随后的影响险些造成继 1998 年后 又一次的金融危机。请用所学博弈论的知识简要说明银行挤兑的原因,以及有哪 些预防措施?(提示:从储户间的博弈来分析) 2.设想有一个居民点,居民住宅延一条公路均匀排开。现有两家商店要在小区 开张,假定两家商店货物完全相同,居民仅仅到离自己比较近的商店购物,商店 的最优开张地点是哪里,若有三家商店呢?用 Nash 均衡的观点给予解释。 3.分析下面的支付矩阵,回答问题: L M R 4,3 5,1 6,2 2,1 8,4 3,6 3,0 9,6 2,8 U M D 1)请根据“重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路找到均衡,并简述过程。 2)你得到的均衡是 Kaldor-Hicks 有效的吗?是 Pareto 有效的吗?请给出简短 解释。 4.思考简答题 1) 举例说明宿舍同学曾经给你带来过的外部性(正或负),你是怎么应对的? 2) BT 或 Maze 下载是大家现在耳熟能详的下载方式,跟 FTP 相比有着他独特 的优势,思考里面蕴含什么的博弈论原理?
2006博弈与社会第二次作业(提交时间:3月29日) 请在作业上写清姓名、院系、学号和作业编(助教在第一次作ν上写的数字) (1)用博弈的标准型表达式描述“剪刀、石头、布”的游戏(即写出双方的支付矩阵) 假设获胜的一方得1,失利的一方得-1,战平各得0,并找出该博弈的所有纳什均衡(纯战 略纳什均衡和混合战略纳什均衡)。 (2)如果修改游戏规则,获胜的方式不同则得分不同 剪刀赢布,赢的一方(出剪刀的一方)得3,输的一方(出布的一方)得-3 石头赢剪刀,赢的一方得2,输的一方得-2 布赢石头,赢的一方得1,输的一方得-1 打平仍然各得0。 重新回答第(1)题中的问题。 2、“索尼爱立信”和“明基西门子”两家公司在手机市场上的定位是相似的,二者面对的是 几乎相同的潜在消费群,存在着直接的竞争,不同的是索爱更先进入市场。假设两者都面临 着同样的两个可行的行动:主攻照相功能(简称为照相)和主攻音乐功能(简称为音乐), 但是“索爱”先于“明西”行动,刻画两者行为的博弈树如下所示 明西 照相 (5,4) 照 (10,8) 索爱 (11,9) 音乐 (6,5) (1)写出索爱和明西的全部战略(注意战略的定义); (2)根据双方的战略,用标准型(支付矩阵)的表述方式重新刻画这个博弈树 (3)只考虑纯战略的情况,找出全部的纳什均衡,找出全部的精炼(完美)纳什均衡 3、重新考虑双寡头竞争的市场,市场上有两家企业,生产完全相同的产品,消费者对这种 产品的需求函数为,P(Q=aQ,Q=q1+q2,其中q1和q2分别是企业1和企业2的产量,生产 的成本函数为C(q)=cq,其中=1,2,每个企业都追求利润的最大化,即企业选择最佳的q使 得=P(Qq1-cq最大,i=1,2。上面的假设与讲义第16页中提到的 Cournot博弈模型是完全 一致的,下面我们做一个改动,现在两家企业不再同时决策,而是有一个先后顺序。企业 先制定自己的产量,企业2随后根据企业1的产量决策自己的生产,并且决策一旦做出就无 法更改。求解双方的最优决策(纳什均衡),思考在这种情况下是“先下手为强”还是“先 下手遭殃”?简单解释背后的原因。 【提示】米用逆向归纳的办法,从企业2的决策开始向前推
2006 博弈与社会第二次作业(提交时间:3 月 29 日) 请在作业上写清姓名、院系、学号和作业编码(助教在第一次作业上写的数字) 1、(1)用博弈的标准型表达式描述“剪刀、石头、布”的游戏(即写出双方的支付矩阵), 假设获胜的一方得 1,失利的一方得-1,战平各得 0,并找出该博弈的所有纳什均衡(纯战 略纳什均衡和混合战略纳什均衡)。 (2)如果修改游戏规则,获胜的方式不同则得分不同: z 剪刀赢布,赢的一方(出剪刀的一方)得 3,输的一方(出布的一方)得-3; z 石头赢剪刀,赢的一方得 2,输的一方得-2; z 布赢石头,赢的一方得 1,输的一方得-1; z 打平仍然各得 0。 重新回答第(1)题中的问题。 2、“索尼爱立信”和“明基西门子”两家公司在手机市场上的定位是相似的,二者面对的是 几乎相同的潜在消费群,存在着直接的竞争,不同的是索爱更先进入市场。假设两者都面临 着同样的两个可行的行动:主攻照相功能(简称为照相)和主攻音乐功能(简称为音乐), 但是“索爱”先于“明西”行动,刻画两者行为的博弈树如下所示: 索爱 照相 音乐 明西 照相 照相 音乐 音乐 (5,4) (10,8) (11,9) (6,5) (1)写出索爱和明西的全部战略(注意战略的定义); (2)根据双方的战略,用标准型(支付矩阵)的表述方式重新刻画这个博弈树; (3)只考虑纯战略的情况,找出全部的纳什均衡,找出全部的精炼(完美)纳什均衡。 3、重新考虑双寡头竞争的市场,市场上有两家企业,生产完全相同的产品,消费者对这种 产品的需求函数为,P(Q)=a-Q,Q=q1+q2,其中q1和q2分别是企业 1 和企业 2 的产量,生产 的成本函数为C(qi)=cqi,其中i=1,2,每个企业都追求利润的最大化,即企业i选择最佳的qi使 得Πi=P(Q)qi-cqi最大,i=1,2。上面的假设与讲义第 16 页中提到的Cournot博弈模型是完全 一致的,下面我们做一个改动,现在两家企业不再同时决策,而是有一个先后顺序。企业 1 先制定自己的产量,企业 2 随后根据企业 1 的产量决策自己的生产,并且决策一旦做出就无 法更改。求解双方的最优决策(纳什均衡),思考在这种情况下是“先下手为强”还是“先 下手遭殃”?简单解释背后的原因。 【提示】采用逆向归纳的办法,从企业 2 的决策开始向前推
博弈与社会第三次作业 1.假定A公司市值2000万,A公司为了长期发展需招聘一名优秀的职业经 理人。你作为优秀经理人才可以有80%的概率在一年后将A公司市值扩 大到4000万(20%的概率维持2000万)。A公司以公司股份作为支付方 法。按照纳什讨价还价理论,A公司需支付多少股份,你才愿意入主该公 司?(市场只有一个企业和一个经理人,年折现δ=0.8) 根据多重均衡以及重复博弈理论求解 C A4,4 0,0 0,5 B0,0 0,0 0,0 3,3 (1)找出所有纳什均衡(包括混合策略),以及 Pareto最优合作解。 (2)若博弈持续两期,讨论折现率对参与者两期选择的影响 (3)若持续三期呢?请与两期比较,给予简要解释 提示:考虑参与者存在多种背叛策略 思考题 3·近期颇为火爆的电视剧乔家大院″讲述了晋商"汇通天下,货通天下"的伟大 成就,请根据课堂知识和自己的理解分析其成功因素,以及现今可借鉴之处
博弈与社会第三次作业 1. 假定A公司市值 2000 万,A公司为了长期发展需招聘一名优秀的职业经 理人。你作为优秀经理人才可以有 80%的概率在一年后将A公司市值扩 大到 4000 万(20%的概率维持 2000 万)。A公司以公司股份作为支付方 法。按照纳什讨价还价理论,A公司需支付多少股份,你才愿意入主该公 司?(市场只有一个企业和一个经理人,年折现δ = 0.8) 2. 根据多重均衡以及重复博弈理论求解: a b c 4, 4 0, 0 0, 5 0 ,0 1, 1 0, 0 5, 0 0, 0 3, 3 A B C (1) 找出所有纳什均衡(包括混合策略),以及 Pareto 最优合作解。 (2) 若博弈持续两期,讨论折现率对参与者两期选择的影响。 (3) 若持续三期呢?请与两期比较,给予简要解释 提示:考虑参与者存在多种背叛策略 思考题 3.近期颇为火爆的电视剧“乔家大院”讲述了晋商“汇通天下,货通天下”的伟大 成就,请根据课堂知识和自己的理解分析其成功因素,以及现今可借鉴之处
2006博弈与社会第四次作业 提交时间:2006年5月24日星期三 (对题目叙述如有不清楚之处,可以在网上提出) 甲、乙、丙是三位有代表性的北大学生,他们各有一辆价值为100的自行车 甲、乙两人住在校内,在这里丢车的概率P(甲)=P(乙)=0.19,丙住在南门外,治 安比起校内较差,丢车的概率P(丙)=0.36。在对风险的态度上,乙、丙和广大 的普通同学一样,都比较谨慎,是风险厌恶者;而甲这类人更为开朗,做事情不 会顾虑太多,是一个风险中性者。用效用函数来描述会更加精确:给定一定数量 的财富w(可以是货币,也可以是有价值的财物,比如本题中的自行车),乙 丙两人(以及他们这一类人)的效用函数均为u(v)=√w,甲(以及同类的人) 的效用函数为(w)=05。面临着丢车的不确定性,三位同学追求的是自身期 望效用的最大化。 (1)给定丢车的概率,分别写出自行车这笔财富对三人的期望效用(提示 根据不同状态下的效用值和状态本身的概率,算出效用函数的期望值); 中关村保险公司推出了“自行车失窃”保险业务,投保者的自行车被盗后可 以获得相当于自行车价值的全额赔付。具体保费完全取决于丢车的概率,公司制 定了两个价格,针对住在北大、清华校园内的用户是一个价格(基于0.19的丢 车率),住在校园以外的用户是另外一个价格(基于0.36的丢车率),在保费上 保险公司只需要保本即可(即保费等于期望赔付) (PS:不必担心保险公司的盈利问题,他们可以利用收到的保费去投资其他 的项目而获利)。 (2)计算出投保一辆价值100元的自行车的两种保费(校园价和社区价)。 (3)中关村保险公司的一个业务员分别要向甲、乙、丙三人推销这种保险, 预测一下他的业绩(即甲、乙、丙三人谁会买保险) 保险业务推出半年以来,出现了严重的亏损。经过缜密的调查,发现是由于 类似于丙的一类保户,由于他们自身是北大学生,可以出具校内宿舍的住宿卡, 于是可以享受校园价,但由于他们实际上住在校外,自行车丢失概率很高。在现 有的条件下,保险公司无法识别出客户是否真的实际居住在校内,所以必须改变 现有的定价策略。公司战略发展部首先提出了下面一个方案: 【方案一 取消现有的根据校内校外的分区定价方式,采用统一定价。定价仍然是期望 收益保本原则,只不过保费的确定要受客户构成的影响,就现有的客户结构来看, 来自校内和来自校外的客户各占一半
2006 博弈与社会第四次作业 提交时间:2006 年 5 月 24 日星期三 (对题目叙述如有不清楚之处,可以在网上提出) 甲、乙、丙是三位有代表性的北大学生,他们各有一辆价值为 100 的自行车, 甲、乙两人住在校内,在这里丢车的概率 P(甲)=P(乙)=0.19,丙住在南门外,治 安比起校内较差,丢车的概率 P(丙)=0.36。在对风险的态度上,乙、丙和广大 的普通同学一样,都比较谨慎,是风险厌恶者;而甲这类人更为开朗,做事情不 会顾虑太多,是一个风险中性者。用效用函数来描述会更加精确:给定一定数量 的财富 w(可以是货币,也可以是有价值的财物,比如本题中的自行车),乙、 丙两人(以及他们这一类人)的效用函数均为 )( = wwu ,甲(以及同类的人) 的效用函数为 。面临着丢车的不确定性,三位同学追求的是自身期 望效用的最大化。 = 5.0)( wwu (1)给定丢车的概率,分别写出自行车这笔财富对三人的期望效用(提示: 根据不同状态下的效用值和状态本身的概率,算出效用函数的期望值); 中关村保险公司推出了“自行车失窃”保险业务,投保者的自行车被盗后可 以获得相当于自行车价值的全额赔付。具体保费完全取决于丢车的概率,公司制 定了两个价格,针对住在北大、清华校园内的用户是一个价格(基于 0.19 的丢 车率),住在校园以外的用户是另外一个价格(基于 0.36 的丢车率),在保费上 保险公司只需要保本即可(即保费等于期望赔付) (PS:不必担心保险公司的盈利问题,他们可以利用收到的保费去投资其他 的项目而获利)。 (2)计算出投保一辆价值 100 元的自行车的两种保费(校园价和社区价)。 (3)中关村保险公司的一个业务员分别要向甲、乙、丙三人推销这种保险, 预测一下他的业绩(即甲、乙、丙三人谁会买保险) 保险业务推出半年以来,出现了严重的亏损。经过缜密的调查,发现是由于 类似于丙的一类保户,由于他们自身是北大学生,可以出具校内宿舍的住宿卡, 于是可以享受校园价,但由于他们实际上住在校外,自行车丢失概率很高。在现 有的条件下,保险公司无法识别出客户是否真的实际居住在校内,所以必须改变 现有的定价策略。公司战略发展部首先提出了下面一个方案: 【方案一】 取消现有的根据校内校外的分区定价方式,采用统一定价。定价仍然是期望 收益保本原则,只不过保费的确定要受客户构成的影响,就现有的客户结构来看, 来自校内和来自校外的客户各占一半
(4)分析方案一存在的问题,预测统一定价的价格走势和最终的客户构成。 经过一段时间的实施,公司高层对方案一不甚满意,于是战略发展部又给出 了下面一个方案。 【方案二】 同样是不再根据客户居住地定价,而是给出一种基于投保比例的定价方式 具体来说保险变成两种套餐,一种是全额承保(丢车后赔付全部车款),一种是 小额承保(30%)(丢车后保险公司只赔付30%的车价,即30元)。 (5)方案二的设计理念是让不同风险的客户对号入座,但还没有具体落实 到操作层面上,你作为公司战略发展部的实习生,请帮助完成这样一个产品设 计(包括a.全额套餐的目标客户,b.全额套餐的定价,c小额30%套餐的目标客 户,d小额30%套餐的定价,其中定价仍然是给出公司的保本价格,并给出可 行性分析)。 有了你智慧的设计,方案二的运行效果还是相当不错的。当然美中不足 段时间后,又出现了一些小的问题,这些问题在全额套餐的用户身上更加明显 (6)猜想这会是什么问题?并解释产生的原因。(提示:前面只考虑了逆向 选择问题) (7)回忆信号机制与甄别机制的区别,并在现实生活中各找一到两个信号 机制与甄别机制的例子(不要重复课上已经讲过的例子)
(4)分析方案一存在的问题,预测统一定价的价格走势和最终的客户构成。 经过一段时间的实施,公司高层对方案一不甚满意,于是战略发展部又给出 了下面一个方案。 【方案二】 同样是不再根据客户居住地定价,而是给出一种基于投保比例的定价方式, 具体来说保险变成两种套餐,一种是全额承保(丢车后赔付全部车款),一种是 小额承保(30%)(丢车后保险公司只赔付 30%的车价,即 30 元)。 (5)方案二的设计理念是让不同风险的客户对号入座,但还没有具体落实 到操作层面上,你作为公司战略发展部的实习生,请帮助完成这样一个产品设 计(包括 a.全额套餐的目标客户,b.全额套餐的定价,c.小额 30%套餐的目标客 户,d.小额 30%套餐的定价,其中定价仍然是给出公司的保本价格,并给出可 行性分析)。 有了你智慧的设计,方案二的运行效果还是相当不错的。当然美中不足,一 段时间后,又出现了一些小的问题,这些问题在全额套餐的用户身上更加明显。 (6)猜想这会是什么问题?并解释产生的原因。(提示:前面只考虑了逆向 选择问题) (7)回忆信号机制与甄别机制的区别,并在现实生活中各找一到两个信号 机制与甄别机制的例子(不要重复课上已经讲过的例子)
(仅作为参考答案,主观题言之成理即可,如有疑问,欢迎课间找我) 1.2004年6月,俄罗斯第四大银行遭挤兑,随后的影响险些造成继1998年后 又一次的金融危机。请用所学博弈论的知识简要说明银行挤兑的原因,以及有哪 些预防措施?(提示:从储户间的博弈来分析) 答:储户有取款和不取款两种策略。恶意取款会造成银行破产,对储户都是不利 的。可以用“囚徒困境”的情形来具体分析。(注意自己构造的支付矩阵数值不 要太离谱) 预防措施有提髙银行的保证金储备,以及银行间互相拆借和求助国家储备等等 2.设想有一个居民点,居民住宅延一条公路均匀排开。现有两家商店要在小区 开张,假定两家商店货物完全相同,居民仅仅到离自己比较近的商店购物,商店 的最优开张地点是哪里,若有三家商店呢?用Nash均衡的观点给予解释。 答:两家最优为中间,这个应该没有什么问题 三家实际上是没有纯策略№E,注意NE的定义是给定其他两人的选择,第三个人 没有动机去背离。(同学们主要的错误是定义的理解存在偏差) 3分析下面的支付矩阵,回答问题 M R 2,1 8,4 3,6 3,0 9,6 2,8 1)请根据“重复剔除严格劣战略”( (iterated elimination of strictly dominated strategy)的思路找到均衡 E: First del M(up), then del D and M, finally R 均衡是(U,L)。注意不能说均衡是(4,3)这只是支付。 2)你得到的均衡是 Kaldor- Hicks有效的吗?是 Pareto有效的吗?请给出简短 解释 不是KH有效,也不是P有效,(D,M)严格优于(U,L)
(仅作为参考答案,主观题言之成理即可,如有疑问,欢迎课间找我) 1.2004 年6月,俄罗斯第四大银行遭挤兑,随后的影响险些造成继 1998 年后 又一次的金融危机。请用所学博弈论的知识简要说明银行挤兑的原因,以及有哪 些预防措施?(提示:从储户间的博弈来分析) 答:储户有取款和不取款两种策略。恶意取款会造成银行破产,对储户都是不利 的。可以用“囚徒困境”的情形来具体分析。(注意自己构造的支付矩阵数值不 要太离谱) 预防措施有提高银行的保证金储备,以及银行间互相拆借和求助国家储备等等。 2.设想有一个居民点,居民住宅延一条公路均匀排开。现有两家商店要在小区 开张,假定两家商店货物完全相同,居民仅仅到离自己比较近的商店购物,商店 的最优开张地点是哪里,若有三家商店呢?用 Nash 均衡的观点给予解释。 答:两家最优为中间,这个应该没有什么问题。 三家实际上是没有纯策略 NE,注意 NE 的定义是给定其他两人的选择,第三个人 没有动机去背离。(同学们主要的错误是定义的理解存在偏差) 3 分析下面的支付矩阵,回答问题 L M R 4,3 5,1 6,2 2,1 8,4 3,6 3,0 9,6 2,8 U M D 1)请根据“重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路找到均衡。 答:First del M(up), then del D and M, finally R 均衡是(U ,L) 。 注意不能说均衡是(4,3)这只是支付。 2)你得到的均衡是 Kaldor-Hicks 有效的吗?是 Pareto 有效的吗?请给出简短 解释。 不是KH有效,也不是P有效,(D,M)严格优于(U,L)
思考题 1.举例说明宿舍同学曾经给你带来过的外部性(正或负),你是怎么应对的? 大家都答的很好,暂略。 BT或Maze下载是大家现在耳熟能详的下载方式,跟FTP相比有着他独特 的优势,思考里面蕴含什么的博弈论原理? 我的本意是希望大家从BT的上传与下载方面来分析,做到“人人为我,我为 人人。”如果从外部性等其他方面解释,只要言之成理都可以
思考题 1.举例说明宿舍同学曾经给你带来过的外部性(正或负),你是怎么应对的? 大家都答的很好,暂略。 2.BT或 Maze 下载是大家现在耳熟能详的下载方式,跟 FTP 相比有着他独特 的优势,思考里面蕴含什么的博弈论原理? 我的本意是希望大家从BT的上传与下载方面来分析,做到“人人为我,我为 人人。”如果从外部性等其他方面解释,只要言之成理都可以
2006博弈与社会第二次作业(提交时间:3月29日) 在作ψ上写清姓名、院系、学号和作业编玛(勛教在第一次作些上写的数字) 1、(1)用博弈的标准型表达式描述“剪刀、石头、布”的游戏(即写出双方的支付矩阵), 假设获胜的一方得1,失利的一方得-1,战平各得0,并找出该博弈的所有纳什均衡(纯战 略纳什均衡和混合战略纳什均衡)。 剪刀 石头 布 剪刀 0,0 1,1 石头 1,-1 0,0 -1,1 0,0 该博弈不存在纯策略纳什均衡。 混合策略纳什均衡:(1/3,1/3,1/3,1/3,1/3,1/3),即双方各以同样的概率出剪刀、石头、和布 具体做法(略)见第(2)问 (2)如果修改游戏规则,获胜的方式不同则得分不同: 剪刀赢布,赢的一方(出剪刀的一方)得3,输的一方(出布的一方)得-3 石头赢剪刀,赢的一方得2,输的一方得-2 布赢石头,赢的一方得1,输的一方得-1 打平仍然各得0。 重新回答第(1)题中的问题。 剪刀 石头 布 剪刀 石头 2,-2 0,0 -1,1 1,-1 0,0 该博弈同样不存在纯策略纳什均衡 (很多同学提出“石头、石头”是不是一个纯策略纳什均衡,实际上不是。石头尽管是一个 看上去成本收益最好的战略,但并不意味着可以以1的概率选择石头,因为给定任何一方选 择必出石头,对方肯定会用出布来战胜他,尽管出布不是一个很“好”的策略,看还不至于 坏到可以将其排除的程度。“布”这个战略存在的意义就在于牵制对方出石头的行为) 考虑混合策略纳什均衡:设甲分别以a、b和1-a-b的概率出剪刀石头布,乙分别以ⅹ、y和 1-x-y的概率出剪刀石头布。给定双方的战略,甲和乙的期望支付分别为: Payoff甲)=ax[0×x-2×y+3×(1-x-y)+b×[2×x+0×y-1×(1-x-y)+(1-a-b) ×[-3×x+1×y+0×(1-x-y) Payoff)=x×[0×a-2×b+3×(1-a-b)]+y×[2×a+0×b-1×(1-a-b)+(1-x-y) -3×a+1×b+0×(1-a-b 其中a、b与x、y是对称的。 甲决策的目标是最大化 Payoff甲),他能够控制的变量为a和b,分别对其求偏导得到两个
2006 博弈与社会第二次作业(提交时间:3 月 29 日) 请在作业上写清姓名、院系、学号和作业编码(助教在第一次作业上写的数字) 1、(1)用博弈的标准型表达式描述“剪刀、石头、布”的游戏(即写出双方的支付矩阵), 假设获胜的一方得 1,失利的一方得-1,战平各得 0,并找出该博弈的所有纳什均衡(纯战 略纳什均衡和混合战略纳什均衡)。 乙 甲 剪刀 石头 布 剪刀 0,0 -1,1 1,-1 石头 1,-1 0,0 -1,1 布 -1,1 1,-1 0,0 该博弈不存在纯策略纳什均衡。 混合策略纳什均衡: (1/3,1/3,1/3; 1/3,1/3,1/3),即双方各以同样的概率出剪刀、石头、和布。 具体做法(略)见第(2)问 (2)如果修改游戏规则,获胜的方式不同则得分不同: z 剪刀赢布,赢的一方(出剪刀的一方)得 3,输的一方(出布的一方)得-3; z 石头赢剪刀,赢的一方得 2,输的一方得-2; z 布赢石头,赢的一方得 1,输的一方得-1; z 打平仍然各得 0。 重新回答第(1)题中的问题。 乙 甲 剪刀 石头 布 剪刀 0,0 -2,2 3,-3 石头 2,-2 0,0 -1,1 布 -3,3 1,-1 0,0 该博弈同样不存在纯策略纳什均衡。 (很多同学提出“石头、石头”是不是一个纯策略纳什均衡,实际上不是。石头尽管是一个 看上去成本收益最好的战略,但并不意味着可以以 1 的概率选择石头,因为给定任何一方选 择必出石头,对方肯定会用出布来战胜他,尽管出布不是一个很“好”的策略,看还不至于 坏到可以将其排除的程度。“布”这个战略存在的意义就在于牵制对方出石头的行为) 考虑混合策略纳什均衡:设甲分别以 a、b 和 1-a-b 的概率出剪刀石头布,乙分别以 x、y 和 1-x-y 的概率出剪刀石头布。给定双方的战略,甲和乙的期望支付分别为: Payoff(甲)=a×[0×x-2×y+3×(1-x-y)]+b×[2×x+0×y-1×(1-x-y)]+(1-a-b) ×[-3×x+1×y+0×(1-x-y)] Payoff(乙)=x×[0×a-2×b+3×(1-a-b)]+y×[2×a+0×b-1×(1-a-b)]+(1-x-y)× [-3×a+1×b+0×(1-a-b)] 其中 a、b 与 x、y 是对称的。 甲决策的目标是最大化 Payoff(甲),他能够控制的变量为 a 和 b,分别对其求偏导得到两个
一阶条件 0×x-2×y+3×(1-x-y)=-3×x+1×y+0×(1-x-y) 2×x+0×y-1×(1-x-y)=-3×x+1×y+0×(1-x-y) 这实际上就是让对方出剪刀(上式左边)、出石头(下式左边)和出布(两式右边)无差异 的条件,而这也是我们讲的求解混合战略纳什均衡的简单方法,这就是其理论根据。 求解得到x=1/6,y=1/2,1-xy=1/3 也就是说给定乙以(1/6,12,1/3)的概率出剪刀、石头、布,甲的任何战略都是最优的; 同样可以由乙的优化问题解得a=1/6,b=1/2,1-a-b=1/3 也就是说给定甲以(1/6,12,1/3)的概率出剪刀、石头、布,乙的任何战略都是最优的 因此,甲乙都以(1/6,1/2,1/3)的概率出剪刀、石头、布,可以实现一个均衡的结果,用 标准的博弈论语言表述就是:甲的混合战略(16,12,1/3)和乙的混合战略(1/6,1n2, 1/3)构成一个纳什均衡。 2、“索尼爱立信”和“明基西门子”两家公司在手机市场上的定位是相似的,二者面对的是 几乎相同的潜在消费群,存在着直接的竞争,不同的是索爱更先进入市场。假设两者都面临 着同样的两个可行的行动:主攻照相功能(简称为照相)和主攻音乐功能(简称为音乐), 但是“索爱”先于“明西”行动,刻画两者行为的博弈树如下所示 明西 照相 (5,4) 照 (10,8) 索爱 (11,9) 音乐 (6,5) (1)写出索爱和明西的全部战略(注意战略的定义); (索爱只有一个信息集,所以其战略为一维的:而明西有两个(分别对应索爱选照相和 索爱递音乐的情况),其战略为二维的。) 索爱的全部战略(两个)为 1、主攻照相:2、主攻音乐。 明西的全部战略(四个)为: 1、(照相,照相)——意为:不管对方选择什么策略,我选择照相 2、(音乐,音乐)——意为:不管对方选择什么策略,我选择音乐 3、(音乐,照相)——意为:如果索爱照相,我主攻音乐:如果索爱音乐,我主攻照相 4、(照相,音乐)一意为:如果索爱照相,我也主攻照相;如果索爱音乐,我也主攻音乐 (2)根据双方的战略,用标准型(支付矩阵)的表述方式重新刻画这个博弈树; (博弈的标准型表达式是定义在双方的全部线略上的)
一阶条件: 0×x-2×y+3×(1-x-y)=-3×x+1×y+0×(1-x-y) 2×x+0×y-1×(1-x-y)=-3×x+1×y+0×(1-x-y) 这实际上就是让对方出剪刀(上式左边)、出石头(下式左边)和出布(两式右边)无差异 的条件,而这也是我们讲的求解混合战略纳什均衡的简单方法,这就是其理论根据。 求解得到 x=1/6,y=1/2,1-x-y=1/3 也就是说给定乙以(1/6,1/2,1/3)的概率出剪刀、石头、布,甲的任何战略都是最优的; 同样可以由乙的优化问题解得 a=1/6,b=1/2,1-a-b=1/3 也就是说给定甲以(1/6,1/2,1/3)的概率出剪刀、石头、布,乙的任何战略都是最优的; 因此,甲乙都以(1/6,1/2,1/3)的概率出剪刀、石头、布,可以实现一个均衡的结果,用 标准的博弈论语言表述就是:甲的混合战略(1/6,1/2,1/3)和乙的混合战略(1/6,1/2, 1/3)构成一个纳什均衡。 2、“索尼爱立信”和“明基西门子”两家公司在手机市场上的定位是相似的,二者面对的是 几乎相同的潜在消费群,存在着直接的竞争,不同的是索爱更先进入市场。假设两者都面临 着同样的两个可行的行动:主攻照相功能(简称为照相)和主攻音乐功能(简称为音乐), 但是“索爱”先于“明西”行动,刻画两者行为的博弈树如下所示: 索爱 照相 音乐 明西 照相 照相 音乐 音乐 (5,4) (10,8) (11,9) (6,5) (1)写出索爱和明西的全部战略(注意战略的定义); (索爱只有一个信息集,所以其战略为一维的;而明西有两个(分别对应索爱选照相和 索爱选音乐的情况),其战略为二维的。) 索爱的全部战略(两个)为: 1、主攻照相;2、主攻音乐。 明西的全部战略(四个)为: 1、(照相,照相)——意为:不管对方选择什么策略,我选择照相 2、(音乐,音乐)——意为:不管对方选择什么策略,我选择音乐 3、(音乐,照相)——意为:如果索爱照相,我主攻音乐;如果索爱音乐,我主攻照相 4、(照相,音乐)——意为:如果索爱照相,我也主攻照相;如果索爱音乐,我也主攻音乐 (2)根据双方的战略,用标准型(支付矩阵)的表述方式重新刻画这个博弈树; (博弈的标准型表达式是定义在双方的全部战略上的)
明西 索爱 (音乐,音乐)(照相,照相)(音乐,照相)(照相,音乐) 相 10,8 5,4 5,4 音乐 11,9 l1,9 6,5 (3)只考虑纯战略的情况,找出全部的纳什均衡,找出全部的精炼(完美)纳什均衡。 (纳什均衡也是定义在双方的战略上的) 纳什均衡包括[照相,(音乐,照相)]、[音乐,(照相,照相)]和音乐,(音乐,照相)] 个。这是在支付矩阵中找到的 其中唯一的精炼纳什均衡是最后一个[音乐,(音乐,照相)],它意味着在博弈的每 个子博弈中也构成纳什均衡,这可以使用逆向归纳法寻找。 3、重新考虑双寡头竞争的市场,市场上有两家企业,生产完全相同的产品,消费者对这种 产品的需求函数为,P(Q=aQ,Q=q1+q2,其中q1和q2分别是企业1和企业2的产量,生产 的成本函数为C(q=cq,其中=1,2,每个企业都追求利润的最大化,即企业i选择最佳的q使 得∏=PQ1-cq最大,=12。上面的假设与讲义第16页中提到的 Cournot博弈模型是完全 致的,下面我们做一个改动,现在两家企业不再同时决策,而是有一个先后顺序。企业1 先制定自己的产量,企业2随后根据企业1的产量决策自己的生产,并且决策一旦做出就无 法更改。求解双方的最优决策(纳什均衡),思考在这种情况下是“先下手为强”还是“先 下手遭殃”?简单解释背后的原因 【逆向归纳】 (1)假设到了第二家企业决策的时候,这时第一家企业的产量q已经变成已知,企业2 的问题是选择自己的产量q2以使得利润n2=P(Qq2-cq2=(a-q1-q2)q2-cq2最大 化,该问题的一阶条件为a-q1-2q2-c=0,解得q2=(a-c-q1)2,这可以看作企 业2的最优反应函数,意为不管企业1选择什么样的产量q1,企业2都会选择与之 对应的q2 (2)既然如此,回到第一家企业决策的时候,问题就是如何选择一个q使得利润n1= PQq1-cq1=(a-q1-q2)q2-cq2最大化,带入企业2的反应函数q2=(a-c-qy 并求出关于q的一阶条件得:q1=(a-c)2,同时可知q2=(a-c)4 (3)比较双方同时进入的情况(q1=q2=(a-c)/3)可知,在产量竞争中,的确存在着“先 下手为强”的先动优势,这个模型就是张老师课上提到过的斯塔克尔伯格 ( Stackelberg)模型的标准形式 【两点启示】 (1)在博弈中信息多并不一定是好事:企业2拥有信息优势,但还是不能够扭转其战略 劣势; (2)可信的承诺是重要的:第一家企业的产量一旦确定就不能再更改,否则先动优势就 会拱手相让。关于这一点的理解不妨再考虑一下这样的情况:按照这样的过程,企 业1生产(a-cy2,然后企业2生产(a-c)/4,这时看到企业2生产(a-c)4后,如果 企业的产量决策可以任意更改,那么这时企业1的最优决策就不再是(a-c)2,简单 计算可知,给定企业2生产(a-c)4,企业1最优的决策应该为3(a-c)/8(利用最优 反应函数),而一旦预期到企业1实际上会生产3(a-c)8,那么企业2就不会选择生 产(a-c)4,而是5a-c)16,相应的企业2又会11(a-c)32,企业1又会21(a-c)/64, 直到达到[a-c)3,(a-c)4]的纳什均衡,这样就完全等同于同时决策的情况了
明西 索爱 (音乐,音乐) (照相,照相) (音乐,照相) (照相,音乐) 照相 10,8 5,4 10,8 5,4 音乐 6,5 11,9 11,9 6,5 (3)只考虑纯战略的情况,找出全部的纳什均衡,找出全部的精炼(完美)纳什均衡。 (纳什均衡也是定义在双方的战略上的) 纳什均衡包括 [照相,(音乐,照相)]、[音乐,(照相,照相)]和[音乐,(音乐,照相)] 三个。这是在支付矩阵中找到的。 其中唯一的精炼纳什均衡是最后一个[音乐,(音乐,照相)],它意味着在博弈的每一 个子博弈中也构成纳什均衡,这可以使用逆向归纳法寻找。 3、重新考虑双寡头竞争的市场,市场上有两家企业,生产完全相同的产品,消费者对这种 产品的需求函数为,P(Q)=a-Q,Q=q1+q2,其中q1和q2分别是企业 1 和企业 2 的产量,生产 的成本函数为C(qi)=cqi,其中i=1,2,每个企业都追求利润的最大化,即企业i选择最佳的qi使 得Πi=P(Q)qi-cqi最大,i=1,2。上面的假设与讲义第 16 页中提到的Cournot博弈模型是完全 一致的,下面我们做一个改动,现在两家企业不再同时决策,而是有一个先后顺序。企业 1 先制定自己的产量,企业 2 随后根据企业 1 的产量决策自己的生产,并且决策一旦做出就无 法更改。求解双方的最优决策(纳什均衡),思考在这种情况下是“先下手为强”还是“先 下手遭殃”?简单解释背后的原因。 【逆向归纳】 (1) 假设到了第二家企业决策的时候,这时第一家企业的产量q1已经变成已知,企业 2 的问题是选择自己的产量q2以使得利润Π2=P(Q)q2-cq2=(a-q1-q2) q2-cq2最大 化,该问题的一阶条件为a-q1-2q2-c=0,解得q2=(a-c-q1)/2,这可以看作企 业 2 的最优反应函数,意为不管企业 1 选择什么样的产量q1,企业 2 都会选择与之 对应的q2。 (2) 既然如此,回到第一家企业决策的时候,问题就是如何选择一个q1使得利润Π1= P(Q)q1-cq1=(a-q1-q2) q2-cq2最大化,带入企业 2 的反应函数q2=(a-c-q1)/2, 并求出关于q1的一阶条件得:q1=(a-c)/2,同时可知q2=(a-c)/4。 (3) 比较双方同时进入的情况(q1=q2=(a-c)/3)可知,在产量竞争中,的确存在着“先 下手为强”的先动优势,这个模型就是张老师课上提到过的斯塔克尔伯格 (Stackelberg)模型的标准形式。 【两点启示】 (1) 在博弈中信息多并不一定是好事:企业 2 拥有信息优势,但还是不能够扭转其战略 劣势; (2) 可信的承诺是重要的:第一家企业的产量一旦确定就不能再更改,否则先动优势就 会拱手相让。关于这一点的理解不妨再考虑一下这样的情况:按照这样的过程,企 业 1 生产(a-c)/2,然后企业 2 生产(a-c)/4,这时看到企业 2 生产(a-c)/4 后,如果 企业的产量决策可以任意更改,那么这时企业 1 的最优决策就不再是(a-c)/2,简单 计算可知,给定企业 2 生产(a-c)/4,企业 1 最优的决策应该为 3(a-c)/8(利用最优 反应函数),而一旦预期到企业 1 实际上会生产 3(a-c)/8,那么企业 2 就不会选择生 产(a-c)/4,而是 5(a-c)/16,相应的企业 2 又会 11(a-c)/32,企业 1 又会 21(a-c)/64, 直到达到[(a-c)/3,(a-c)/4]的纳什均衡,这样就完全等同于同时决策的情况了