纳什均衡与一致预期 张维迎教授 北京大学光华管理学院
纳什均衡与一致预期 张维迎 教授 北京大学光华管理学院
博弈的基本概念(1) ·参与人( players):博弈中决策主体的集合:什 么人参与博弈?每个人是什么角色? 行动( actions):每个人有些什么样行动可以选 择?在什么时候行动? 信息( (information):在博弈中的知识;每个人 知道些什么(包括特征、行动等)? 战略( strategies):行动计划;每个人有什么战 略可供选择?战略的完备性;
博弈的基本概念(1) • 参与人(players):博弈中决策主体的集合:什 么人参与博弈?每个人是什么角色? • 行动(actions): 每个人有些什么样行动可以选 择?在什么时候行动? • 信息(information):在博弈中的知识;每个人 知道些什么(包括特征、行动等)? • 战略(strategies):行动计划;每个人有什么战 略可供选择?战略的完备性;
博弈的基本概念(2) 支付( payoffs):每个人在不同战略组合下得到 些什么?依赖于所有参与人的选择; 均衡( equilibrium):所有参与人最优战略的组 合 结果( outcomes):我们所感兴趣的东西
博弈的基本概念(2) • 支付(payoffs):每个人在不同战略组合下得到 些什么?依赖于所有参与人的选择; • 均衡(equilibrium):所有参与人最优战略的组 合; • 结果(outcomes):我们所感兴趣的东西
静态博弈 最简单的博弈:所有参与人同时选择行 动,并且只选择一次; ·“同时”是一个信息概念,而不一定与 日历上的时间一致
静态博弈 • 最简单的博弈:所有参与人同时选择行 动,并且只选择一次; • “同时”是一个信息概念,而不一定与 日历上的时间一致;
囚徒困境( prisoners'dilemma) 囚徒困境 坦白 不坦白 坦白 8,-80,-10 不坦白 10,0 无论对方如何选择,每个人的最优选择:坦白。 所以,我们可以预测,结果将是(坦白,坦白)
囚徒困境(prisoners’ dilemma) • 囚徒困境 坦白 不坦白 坦白 不坦白 -8,-8 0,-10 -10,0 -1,-1 无论对方如何选择,每个人的最优选择:坦白。 所以,我们可以预测,结果将是(坦白,坦白)
占优均衡 (dominant-strategy equilibrium) 般来说,由于每个参与人的效用依赖于所有人的选 择,因此每个人的最优选择(战略)也依赖于所有其 他人的选择(战略)。但在上述例子中,一个人的最 优选择并不依赖于他人的选择。这样的最优战略,被 称为“占优战略”( dominant strategy)。由所有参与人 的占优战略构成的战略组合被称为“占优均衡”。 占优战略均衡的出现只要求所有人都是理性的,但不 要求每个参与人知道其他参与人是否理性 ·囚徒困境博弈有占优均衡,所以其结果很容易预测
占优均衡 (dominant-strategy equilibrium) • 一般来说,由于每个参与人的效用依赖于所有人的选 择,因此每个人的最优选择(战略)也依赖于所有其 他人的选择(战略)。但在上述例子中,一个人的最 优选择并不依赖于他人的选择。这样的最优战略,被 称为“占优战略”(dominant strategy)。由所有参与人 的占优战略构成的战略组合被称为“占优均衡”。 • 占优战略均衡的出现只要求所有人都是理性的,但不 要求每个参与人知道其他参与人是否理性。 • 囚徒困境博弈有占优均衡,所以其结果很容易预测
个人理性与集体理性的冲突 囚徒困境”表明个人理性与集体理性的冲突 这样的例子很多:寡头竞争,军备竞赛,团队 生产中的劳动供给,公共产品的供给,等等; 许多的制度就是为解决“囚徒困境”而存在的;
个人理性与集体理性的冲突 • “囚徒困境”表明个人理性与集体理性的冲突。 • 这样的例子很多:寡头竞争,军备竞赛,团队 生产中的劳动供给,公共产品的供给,等等; • 许多的制度就是为解决“囚徒困境”而存在的;
公共产品( public goods) 提供不提供 提供 4,4 1,5 不提供5, 0,0 无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供)
公共产品(public goods) 提供 不提供 提供 不提供 4,4 -1,5 5,-1 0,0 无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供)
公共产品与税收制度 比较私人产品与公共产品的不同:使用 上排他性 私人产品是志愿购买的,但公共产品可 能需要强制购买; 税收制度就是保证公共产品的生产,解 决公共产品生产上的“囚徒困境
公共产品与税收制度 • 比较私人产品与公共产品的不同:使用 上排他性; • 私人产品是志愿购买的,但公共产品可 能需要强制购买; • 税收制度就是保证公共产品的生产,解 决公共产品生产上的“囚徒困境
“囚徒困境”的一般表示 合作 不合作 作 S, R 不合作 R, S 满足:R>T>P>S;(S+RT+T
“囚徒困境”的一般表示 合作 不合作 合作 不合作 T,T S,R R,S P,P 满足:R>T>P>S; (S+R)<T+T