正在加载图片...
第八章博弈论 前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策 相互影响的问题。本章讨论这个问题,建立复杂环境下的决策理论。开展这种研究的的理论叫 做博弈论,也称为对策论( Game Theory)。最近十几年来,博弈论在经济学中得到了广泛应用 在揭示经济行为相互制约性质方面取得了重大进展。大部分经济行为都可视作博弈的特殊情 况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。博弈论的 思想精髓与方法,已成为经济分析基础的必要组成部分。 第一节博弈事例 博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双 方的目的都是要战胜对方,互不相容,互相影响,互相制约。一般来讲,博弈现象的特征表现 为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的 行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时 博弈的局势就暂时确定下来。博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局 中人( player)。 博弈论推广了标准的一人决策理论。在每个局中人的收益都依赖于其他局中人的选择的 情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局 中人都必须考虑其他局中人面临的问题。下面来举例说明 例1.便士匹配( Matching Pennies)(二人零和博弈) 设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否 正面朝上。局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢 得1元,乙输掉1元:如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输 掉1元,乙赢得1元。 对于这个博弈,每个局中人可选择的策略都有两种 衰1:便士匹配博弈局势表 正面朝上和反面朝上,即甲和乙的策略集合都是{正面, 正面 反面 反面}。当甲和乙都作出选择时,博弈的局势就确定了。 显然,该博弈的局势集合是{(正面,正面),(正面,反面),饭反L正面(正,正)(正,反) 面,正面),(反面,反面)},即各种可能的局势的全体,也称 为局势表,即表1 每个局中人的收益都取决于所有局中人的决策,也就是说,局中人的收益是博弈局势的 函数。本例中,甲的收益函数∫为:f(正,正)=1, 表2:甲和乙的收益表 f(正,反)=-1,f(反,正)=-1,f(反,反)=1;乙的收益函 数g为:g(正,正) g(正,反)=1,g(反 g(反,反)=-1。局中人的收益函数也可用表格或矩阵加以 表示,并称其为收益表或收益矩阵。表2中,甲的收益列 在左边,乙的收益列在右边第八章 博弈论 228 第八章 博弈论 前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策 相互影响的问题。本章讨论这个问题,建立复杂环境下的决策理论。开展这种研究的的理论叫 做博弈论,也称为对策论(Game Theory)。最近十几年来,博弈论在经济学中得到了广泛应用, 在揭示经济行为相互制约性质方面取得了重大进展。大部分经济行为都可视作博弈的特殊情 况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。博弈论的 思想精髓与方法,已成为经济分析基础的必要组成部分。 第一节 博弈事例 博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双 方的目的都是要战胜对方,互不相容,互相影响,互相制约。一般来讲,博弈现象的特征表现 为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的 行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时, 博弈的局势就暂时确定下来。博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局 中人(player)。 博弈论推广了标准的一人决策理论。在每个局中人的收益都依赖于其他局中人的选择的 情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局 中人都必须考虑其他局中人面临的问题。下面来举例说明。 例 1.便士匹配(Matching Pennies)(二人零和博弈) 设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否 正面朝上。局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢 得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输 掉1元,乙赢得1元。 对于这个博弈,每个局中人可选择的策略都有两种: 正面朝上和反面朝上,即甲和乙的策略集合都是{正面, 反面}。当甲和乙都作出选择时,博弈的局势就确定了。 显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反 面,正面),(反面,反面)},即各种可能的局势的全体,也称 为局势表,即表 1。 每个局中人的收益都取决于所有局中人的决策,也就是说,局中人的收益是博弈局势的 函数。本例中,甲的收益函数 f 为: f (正,正) =1 , f (正,反) = −1, f (反,正) = −1, f (反,反) =1 ;乙的收益函 数 g 为: g(正,正) = −1 , g(正,反) =1 , g(反,正) =1 , g(反,反) = −1 。局中人的收益函数也可用表格或矩阵加以 表示,并称其为收益表或收益矩阵。表 2 中,甲的收益列 在左边,乙的收益列在右边。 表 1: 便士匹配博弈局势表 乙 甲 正面 反面 正面 (正,正) (正,反) 反面 (反,正) (反,反) 表 2: 甲和乙的收益表 乙 甲 正面 反面 正面 1 , −1 −1 , 1 反面 −1 , 1 1 , −1
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有