第三章效用、损失和风险 nd risk) 本章主要参考文献:60,56,86,87,92,129,156,169,183,184 §3-1效用的定义和公理系统 引言 为什么要引入效用 决策问题的特点:自然状态不确定——以概率表示; 后果价值待定 以效用度量 1无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量 2即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。 例一:同是100元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的100 元,与已有10000元再增加100元的作用不同,这是钱的边缘价值问题 上图作为商业、经营中实际问题的数学模型有普遍意义 有人认为打赌不如礼品即 *由上面两个例子可知:在进行决策分析时,存在如何描述(表达)后果的实际价值,以便 反映决策的人偏好次序( preference order)的问题 偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养, 心理和生理身体状态有关 *除风险偏好之外,还时间偏好。i,折扣率ⅱ,其他 而效用( Utility)就是偏好的量化,是数实值函数 Daniel bernoulli在1738年指出
3- 1 第三章 效用、损失和风险 (Utility,Loss and Risk) 本章主要参考文献:60,56,86,87,92,129,156,169,183,184 §3—1 效用的定义和公理系统 一、引言 ·为什么要引入效用 决策问题的特点:自然状态不确定——以概率表示; 后果价值待定: 以效用度量。 1.无形后果,非数字量(如信誉、威信、出门带伞问题的后果)需以数值度量; 2.即使是数值量(例如货币)表示的后果,其价值仍有待确定,后果的价值因人而异。 例一:同是 100 元钱,对穷人和百万富翁的价值绝然不同;对同一个人,身无分文时的 100 元,与已有 10000 元再增加 100 元的作用不同,这是钱的边缘价值问题。 例二: 礼品 抽奖 1 0.5 0.5 10元 0 上图作为商业、经营中实际问题的数学模型有普遍意义 有人认为打赌不如礼品,即 250元 *由上面两个例子可知:在进行决策分析时,存在如何描述 10元 优于 0.5 0.5 0 250元 (表达)后果的实际价值,以便 反映决策的人偏好次序(preference order)的问题 *偏好次序是决策人的个性与价值观的反映,与决策人所处的社会、经济地位,文化素养, 心理和生理(身体)状态有关。 * 除风险偏好之外,还时间偏好。 i, 折扣率 ii,其他 而效用(Utility)就是偏好的量化,是数(实值函数). Daniel Bernoulli 在 1738 年指出:
若一个人面临从给定行动集(风险性展望集中作选择的决策问题,如果他知道与给定行 动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能 后果的偏好的期望值最高的行动 二、效用的定义 1符号 AB(即APB)读作A优于B:( Prefer(ed)AtoB) AB(即ARB)A不劣于B A~B(即AIB)A无差别于B( difference i,展望( prospect):可能的前景 即各种后果及后果出现概率的组合 P=(p1,c1;…:p 既考虑各种后果( consequence) 又考虑了各种后果的概率( probability or likelihood)分布 所有P的集合记作P il|奖( (lottery))与确定当量 若C1~(p,C2;(1-p)C3 则称确定性后果C1为抽奖(p,C2;(1-p)C3)的确定当量 2效用的定义(A) 在集合P上的实值函数u,若它和P上的优先关系一致,即 若p u(p1)≥u(p2) 则称u为效用函数 三、效用存在性公理理性行为公理 94[169 公理1连通性( Connectivity)又称可比性 B1P2∈P,则p1P2orp1~p2orp2p1 公理2传递性( Transitivity) P,P2P3∈P,若P1p2,P2P3则pp3 公理3替代性公理(加等量时优先关系不变) 若n,P2p3∈P,p1p2且0B则ap1+(1-a)p2βp1+(1-B)p2 即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。 公理4连续性公理--偏好的有界性
3- 2 若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行 动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能 后果的偏好的期望值最高的行动。 二、效用的定义 1.符号 i,A B(即 APB)读作 A 优于 B:(Prefer(ed) A to B) A B(即 ARB) A 不劣于 B A~B(即 AIB) A 无差别于 B (Indifference) ii, 展望(prospect): 可能的前景 即各种后果及后果出现概率的组合 P=( p c 1 1 , ; …; p , c ; i i … p c n n , ) 既考虑各种后果 (consequence) 又考虑了各种后果的概率(probability or likelihood)分布 所有 P 的集合记作 p iii,抽奖(lottery)与确定当量 1.0 C3 C1 C2 p 1-p 若 C1 ( p,C2 ; (1 ), − p C3 ) 则称 确定性后果 C1 为抽奖 ( p,C2 ; (1 ), − p C3 ) 的确定当量 2.效用的定义(A) 在集合 p 上的实值函数 u,若它和 p 上的优先关系 一致,即: 若 p1 p2 , p , p1 p2 iff u( p1 )≥u( p2 ) 则称 u 为效用函数 三、效用存在性公理 理性行为公理 Von Neumann-Morenstern, 1994 [169] ·公理 1 连通性 (Connectivity)又称可比性 p1 p2 , p, 则 p1 p2 or p1 p2 or p2 p1 ·公理 2 传递性 (Transitivity) p1 p2 p3 , , p, 若 p1 p2 , p2 p3 则 p1 p3 ·公理 3 替代性公理 ( 加等量时优先关系不变) 若 p1 p2 p3 , , p, p1 p2 且 0 1 则 对任何 p3 ∈p ,必有 p1 +(1-) p3 p2 +(1-) p3 或者表达成: p1 p2 , 则 p1 +(1-) p2 p1 +(1-) p2 即二种后果中,决策人所偏好的后果出现机会较大的情况是决策人所喜爱的。 ·公理 4 连续性公理 ---- 偏好的有界性
若p1P2P3则存在0β 使ap1+(1-a)pP2βp1+(1-B)p3 由ap1+(1-x)p3P2可知p3不是无穷劣即u(p3)-∞ 由p2阝p1+(1-B)3可知p1不是无穷优即up1)∞ P即使是死亡,亦不至于无穷劣 例:i过马路 无法到 目的地 到目的地 若死亡为无穷劣,则不能过马路 ⅱ狂犬病疫苗 不注射 述公理看来是合乎理性的,事实上并不尽然 例: Allais悖论( Paradox 例如,1953年Alai在一次学术会议上提出如下问题,请效用理论权威 Sage回答 3-3
3- 3 若 p1 p2 p3 则 存在 01, 01, 使 p1 +(1-) p3 p2 p1 +(1-) p3 由 p1 +(1-) p3 p2 可知 p3 不是无穷劣,即 u( p3 )− 由 p2 p1 +(1-) p3 可知 p1 不是无穷优, 即 u( p1 ) p3 即使是死亡,亦不至于无穷劣 例:i,过马路 1 10−7 无法到 目的地 不过 过 死亡 到目的地 若死亡为无穷劣,则不能过马路 ii,狂犬病疫苗 1 10−6 注射 不注射 20 元 死亡 生存 上述公理看来是合乎理性的,事实上并不尽然. 例:Allais 悖论(Paradox 〕 例如,1953 年 Allais 在一次学术会议上提出如下问题,请效用理论权威 Svage 回答
Savage的回答是A组宁择 B组宁择ⅱ allais指出:B组的i,i,均以0.89的s500,000取代0.89的$0,即与A组的i,i相对应,照 公理3、A、B两组中,ⅱ,的优先关系应当不变。 Savage当时语塞 效用的公理化定义 在上述公理系统中,若P上存在实值函数u,使 p>P,当且仅当u(p)>u(P) ii. u(a Pr: 1-a P,=au(p)+(I-a)( P,) il对满足上述条件的u1,a2必有u1(p)=b2(p,)+c,其中b,c∈R,b>0 则u(P)称为(基数)效用函数 *关于线性:将ⅱu(ap;1-αp)=au(p2)+(1-au(p)推广到般 若P∈P;20,12-m;∑=则u∑4P)∑A,以P) 四、基数效用与序数效用( Cardinal! Ordinal Utility) 基数:实数:1,2,3,T 序数:第一,二,…,4,3,2,1 区别: 1基数效用定义在展望集P上(考虑后果及其概率分布),是实数 序数效用定义在后果集C上,不涉及概率,可以是整正数 2基数效用反映偏好强度:(正线性变换下唯一)
3- 4 A i. B i. i. i. $2,50,0 $50,0 $50,0 $0 $0 $0 $50,0 $2,50,0 1.0 .89 .01 .1 .1 .89 .1 Savage 的回答是 A 组宁择 .9 i, B 组宁择 ii, Allais 指出:B 组的 i, ii, 均以 0.89 的$500,000 取代 0.89 的 $0,即与 A 组的 i,ii,相对应,照 公理 3、A、B 两组中 i,ii,的优先关系应当不变。 Savage 当时语塞。 ·效用的公理化定义 在上述公理系统中,若 p 上存在实值函数 u,使 i, pi p j 当且仅当 u( pi ) >u( p j ) ii. u(α, pi ; 1-α, p j )= αu( pi ) +(1-α)u( p j ) iii, 对满足上述条件的 u1 , u2 必有 u1 ( pi ) =b u2 ( pi )+c , 其中 b, c ∈ R 1 , b>0 则 u(P)称为(基数)效用函数 *关于线性:将 ii. u(α, pi ; 1-α, p j )= αu( pi ) +(1-α)u( p j ) 推广到一般, 若 pi ∈p ; i ≥0 , i=1,2,…m; i i =1; 则 u( i m = 1 i pi )= i m = 1 i u( pi ) 四、基数效用与序数效用 (Cardinal & Ordinal Utility) 基数:实数:1,2,3,π 序数:第一,二,…,4,3,2,1 ·区别: 1.基数效用定义在展望集 p 上(考虑后果及其概率分布),是实数; 序数效用定义在后果集 C 上,不涉及概率,可以是整正数 2.基数效用反映偏好强度:(正线性变换下唯一)
原数列可变换为b+c,2b+c,3b+c,Ttb+c,其中b,c∈R,b>0 而序数效用不反映偏好强度,(保序变换下唯-),原序数列可变换为 16,9,4,1,或86,4,2,或10,7,6,1等 序数效用的存在性公理 1连通性(可比 2传递性 3对任何确定的后果ⅹ,优势集与劣势集均为闭集。(教材:P29§3.1) §32效用函数的构造 离散型的概率分布 后果元素有限 各后果效用设定的步骤NM法 由公理4若p>P2>P3则可找到0C1 令叫(C1)=0,u(C2) 所选择的C1、C2应使比较易于进行 第二步:对C2>C3>C1,求(0C2,求α(0C4>C3且C32C42C3已知, 由C4~aC5+(1-a)C3求得u(C4) 若u'(C4)与已知的u(C4)不符,则反复进行二、三、四步,直到致性校验通过
3- 5 原数列可变换为:b+c, 2b+c, 3b+c, πb+c; 其中 b, c ∈ R 1 , b>0. 而序数效用不反映偏好强度,(保序变换下唯一), 原序数列可变换为 16,9,4,1;或 8,6,4,2,或 10,7,6,1 等. ·序数效用的存在性公理 1.连通性(可比) 2.传递性 3.对任何确定的后果 x,优势集与劣势集均为闭集。(教材:P29 §3.1) §3.2 效用函数的构造 一、离散型的概率分布 后果元素有限 ·各后果效用设定的步骤 NM 法 由公理 4: 若 p1 p2 p3 ,则可找到 0<α<1, 使 p2 α p1 +(1-α) p3 第一步: 选定 C1 , C2 C , 使 C2 C1 令 u( C1 )=0, u( C2 )=1 所选择的 C1、 C2 应使比较易于进行. 第二步:对 C2 C3 C1 ,求α(0<α<1), 使 C3 α C2 +(1-α) C1 则 u( C3 )=u(α C2 +(1-α) C1 )= αu( C2 )+(1-α)u( C1 ) 第三步:若 C4 C1 , 求α(0<α<1), 使 C1 α C2 +(1-α) C4 则 u( C1 )=u(α C2 +(1-α) C4 )=αu( C2 )+(1-α)u( C4 ) u( C4 )=α/(α-1) 第四步:若 C5 C2 , 求α(0<α<1), 使 C2 α C5 +(1-α) C1 则 u( C2 )=u(α C5 +(1-α) C1 )= αu( C5 ) u( C5 )=1/α 第五步:一致性校验 设 C5 C4 C3 且 C5 , C4 , C3 已知, 由 C4 α C5 +(1-α) C3 求得 u’( C4 ) 若 u’( C4 ) 与已知的 u( C4 ) 不符,则反复进行二、三、四步,直到一致性校验通过. 例
丌(61) 雨看球 r(62) 无雨看球 )下雨看电视 n(2) 无雨看电视 设C2xC3xC4>C1 uC1)=0,叫(C2)=1 二、C3~0.7C2+03C1u(C3)=0.7 4C2+0.6C1u(C4)=0.4 校验设C3~04C2+06C4u'(C3)=060.7 重复二、三、若u(C3)不变u(C4)=0.5则通过校验 二、连续型后果集 当C为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线 例1.每天学习时间的效用曲线 效用 10121416小时厌 在10~12小时/日处效用最大 8小时/日处效率最高效用/小时) 例2.见讲义P31之例 注意∶效用的唯性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1 §33风险与效用 效用函数包含的内容 1对风险的态度 3-6
3- 6 a2 a1 c1 c2 c 3 ( ) 1 ( ) 2 ( ) 1 ( ) 2 下雨看球 无雨看球 下雨看电视 c4 无雨看电视 设 C2 C3 C4 C1 一、u( C1 )=0, u( C2 )=1 二、 C3 0.7 C2 +0.3 C1 u( C3 )=0.7 三、 C4 0.4 C2 +0.6 C1 u ( C4 )=0.4 校验 设 C3 0.4 C2 +0.6 C4 u’( C3 )=0.66≠0.7 重复二、三、若 u ( C3 ) 不变 u ( C4 )=0.5 则通过校验. 二、连续型后果集 ·当 C 为连续变量时,u(c)是光滑的,因此可分段构造,求特征点的效用,再连成光滑曲线 例 1.每天学习时间的效用曲线 在 10~12 小时/日 处 效用最大 8 小时/日处效率最高(效用/小时) 例 2.见讲义 P31 之例 ·注意:效用的唯一性(在正线性变换下唯一)使效用的值域为整个实轴,而不必限于[0,1] §3.3 风险与效用 一、效用函数包含的内容 1.对风险的态度
风险厌恶 Risk aversion) 风险中立( Risk neutralness) 风险追求( Risk proneness)即有冒险倾向 以上是初期对风险的解释( Pratt C,1964) 2对后果的偏好强度 钱的边缘价值没某人现有积蓄为0增加800地的作用价值)与有了800元后再加1200 元相等则此人的财富的价值函数是凹函数 2000 若他认为800元~(0.5,0;0.5,2000),则与其说此人是风险厌恶不如说他是相对风险中 立。为此有必要对确定性后果的偏好强度加以量化 3效用表示时间偏好十分复杂,我们在第八章再介绍。 可测价值函数 确定性后果偏好强度的量化 定义 在后果空间X上的实值函数v,对u,x,y,z∈X有 xyz当且仅当U(u)-u(x)2U(y)-u(z),且 ⅱv对正线性变换是唯一确定的。 则称U为可测价值函数 说明:i,ωxyz表示ωX之间偏好强度之差超过y,z之间偏好强度之差
3- 7 风险厌恶(Risk Aversion) 风险中立(Risk Neutralness) 风险追求(Risk Proneness) 即有冒险倾向 以上是初期对风险的解释(Pratt C.,1964) 2.对后果的偏好强度 钱的边缘价值:设某人现有积蓄为 0,增加 800 地的作用(价值)与有了 800 元后再加 1200 元相等,则此人的财富的价值函数是凹函数。 若他认为 800 元(0.5,0; 0.5,2000), 则与其说此人是风险厌恶不如说他是相对风险中 立。为此有必要对确定性后果的偏好强度加以量化。 3.效用表示时间偏好十分复杂,我们在第八章再介绍。 二、可测价值函数 ——确定性后果偏好强度的量化 定义: 在后果空间 X 上的实值函数 v,对ω,x, y, z∈X 有 i, ωx yz 当且仅当υ(ω)-υ(x)≥υ(y)-υ(z), 且 ii, v 对正线性变换是唯一确定的。 则称υ为可测价值函数 说明:i,ωx yz 表示ω,x 之间偏好强度之差超过 y,z 之间偏好强度之差
ⅱ由定义之ⅱ,可测价值函数具有基数性质但与基数效用不同:VF不反映DMer的风 险态度 ⅲi,它定在后果空间上,能起序数效用的作用但又与OUF不同:能反映后果的偏好 强度 三、相对风险态度 设效用函数u和测价值函数ⅴ在X上都是单调递增,且连续二次可微。 1风险的局部测度 >0u在x处凹,风险厌恶 r(x)=u?(x)u(x){=0u在x处线性,风险中立 <0u在x处凸,风险追求 2偏好强度的局部测度 0在x处有递减的边缘价值 m(x)=v(x)/v'(x)=0在x处有不变的边缘价值 0在x处有递增的边缘价值 3真正的(相对风险态度的定义 若m(x)<r(x)称为在X区内相对风险厌恶 m(x)=r(x)称为在X内相对风险中立 m(x)=r(x)称为在X内相对风险追求 四、风险酬金 k E(x)-S 这是决策人为了避免风险而顾意损失的金额
3- 8 ii,由定义之 ii,可测价值函数具有基数性质但与基数效用不同:VF 不反映 DMer 的风 险态度。 iii,它定在后果空间上,能起序数效用的作用但又与 OUF 不同:能反映后果的偏好 强度. 三、相对风险态度 设 效用函数 u 和测价值函数 v 在 X 上都是单调递增,且连续二次可微。 1.风险的局部测度 > 0 u 在 x 处凹, 风险厌恶 r(x)=-u”(x)/u’(x) = 0 u 在 x 处线性, 风险中立 0 在 x 处有递减的边缘价值 m(x)=-v”(x)/v’(x)=0 在 x 处有不变的边缘价值 <0 在 x 处有递增的边缘价值 3.真正的(相对)风险态度的定义 若 m(x)<r(x)称为在 X'区内相对风险厌恶 m(x)=r(x)称为在 X'内相对风险中立 m(x)=r(x)称为在 X'内相对风险追求 四、风险酬金 k E(x)-S 这是决策人为了避免风险而顾意损失的金额 k=f(v,P)
Elx) 五、钱的效用 性质 i,单调递增:愈多愈好 有界:全世界财富总量不足$1016,u(10)与u(100)几乎无差异 i,x较小(相对于决策人资产而言)时,u(x近乎线性 ⅱx>0时ux)通常是凹的递减的边缘价值 风险厌恶 x>0与x+0.5+0.5 u(125=0.25 550~0.5+0.5 u(550)=0.75 由0~0.5+0.5 设a=250 则u(-250)=u(500=0.72 -250~0.5+0.5
3- 9 五、钱的效用 1.性质 i, 单调递增:愈多愈好 有界:全世界财富总量不足$ 1016 , u( 10100 )与 u( 1090 )几乎无差异 ii, x 较小(相对于决策人资产而言)时,u(x)近乎线性 iii, x>0 时 u(x)通常是凹的 递减的边缘价值 风险厌恶 x>0 与 x+0.5 u(300)=0.5 又 125~0.5+0.5 u(125)=0.25 550~0.5+0.5 u(550)=0.75 由 0~0.5+0.5 设 a=-250 则 u(-250)=-u(500)=-0.72 -250~0.5+0.5
原因:i价值函数是S型 ⅱ在一定范围内相对风险态度不变 ⅲ负债到定程度以上有冒险倾向 riedmann- Savage效用曲线(1948) §34损失、风险和贝叶斯风险 损失函数L 有些文献采用损失函数进行分析 u(c)=u(6,a) l(e,a)-u(a)则损失函数与效用作用相同 为了使损失值非负,可取 1( 0, a)=Sup Supu(0, a)-u(0, a) 二、风险函数 自然状态集Q--参数空间 行动集 A--决策空间
3- 10 原因:i,价值函数是 S 型 ii,在一定范围内相对风险态度不变 iii,负债到一定程度以上有冒险倾向 Friedmann-Savage 效用曲线(1948): §3.4 损失、风险和贝叶斯风险 一、损失函数 L 有些文献采用损失函数进行分析 ∵u(c)=u(θ,a) ∴l(θ,a) -u(θ,a) 则损失函数与效用作用相同 为了使损失值非负,可取 l(θ,a)= a A Sup Sup u(θ,a)-u(θ,a) 二、风险函数 自然状态集 Θ -----参数空间 行动集 A -----决策空间