第四章贝叶斯分析 Bayesean Analysis 540引言 一、决策问题的表格表示—损失矩阵 对无观察(No-data问题a=6 可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失) T[(0 Tt (8 或 T(O1) T(,) 损失矩阵直观、运算方便 二、决策原则 通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原 则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策 原则。 三、决策问题的分类 1.不确定型(非确定型) 自然状态不确定,且各种状态的概率无法估计. 2风险型 自然状态不确定,但各种状态的概率可以估计. 四、按状态优于 l≤lk,且至少对某个i严格不等式成立,则称行动a按状态优于a4 541不确定型决策问题
4- 1 第四章 贝叶斯分析 Bayesean Analysis §4.0 引言 一、决策问题的表格表示——损失矩阵 对无观察(No-data)问题 a=δ 可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失): a1 … a j … a m π ( 1 ) l 11 l 1 j l 1m … π ( i ) l i1 l ij … π ( n ) lm1 l nm 或 π ( 1 ) … π ( i ) … π ( n ) a1 l 11 l 1i l 1n … a j l ij … a m lm1 lmn 损失矩阵直观、运算方便 二、决策原则 通常,要根据某种原则来选择决策规则δ ,使结果最优(或满意),这种原则就叫决策原 则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策 原则。 三、决策问题的分类: 1.不确定型(非确定型) 自然状态不确定,且各种状态的概率无法估计. 2.风险型 自然状态不确定,但各种状态的概率可以估计. 四、按状态优于: l ij ≤ l ik I, 且至少对某个 i 严格不等式成立, 则称行动 a j 按状态优于 ak §4.1 不确定型决策问题
一、极小化极大(wald原则法则、准则)a1a2a4 min max 1(0,, a) 或 max min u 例 g 16 6 各行动最大损失:13 12 其中损失最小的损失对应于行动a3 采用该原则者极端保守,是悲观主义者,认为老天总跟自己作对 二、极小化极小 min min 1(0,, a,) maX 例 θ0θθ 各行动最小损失 其中损失最小的是行动a2 采用该原则者极端冒险,是乐观主义者,认为总能撞大运。 三、 Hurwitz准则 上两法的折衷,取乐观系数入 min [A min 1(0, a,)+(1-a max 1(0,, a)1 例如λ=0.5时 3.5 (1-A〕maxk:6.5 两者之和:8.58.5 其中损失最小的是:行动a4 四、等概率准则( aplace) 用∑4来评价行动a的优劣 选mn∑l 2
4- 2 一、极小化极大(wald)原则(法则、准则) a1 a2 a4 min j max i l ( i , a j ) 或 max j min i uij 例: a1 a2 a3 a4 1 10 8 7 9 2 4 1 9 2 3 13 16 12 14 4 6 9 8 10 各行动最大损失: 13 16 12 14 其中损失最小的损失对应于行动 a3 . 采用该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对. 二、极小化极小 min j min i l ( i , a j ) 或 max j max i uij 例: a1 a2 a3 a4 1 10 8 7 9 2 4 1 9 2 3 13 16 12 14 4 6 9 8 10 各行动最小损失: 4 1 7 2 其中损失最小的是行动 a2 . 采用该原则者极端冒险,是乐观主义者,认为总能撞大运。 三、Hurwitz 准则 上两法的折衷,取乐观系数入 min j [λ min i l ( i , a j )+(1-λ 〕 max i l ( i , a j )] 例如 λ =0.5 时 λ min i l ij : 2 0.5 3.5 1 (1-λ 〕 max i l ij : 6.5 8 6 7 两者之和: 8.5 8.5 9.5 8 其中损失最小的是:行动 a4 四、等概率准则(Laplace) 用 i l ij 来评价行动 a j 的优劣 选 min j i l ij
上例:∑4:33343635其中行动a的损失最小 五、后梅值极小化极大准则 sage- Niehans) 定义后梅值 l, -min I k 其中minl为自然状态为,时采取不同行动时的最小损失 构成后梅值(机会成本矩阵S={sn}灬n使后梅值极小化极大即 min max Si 例损失矩阵同上,后梅值矩阵为 1402 0324 各种行动的最大后梅值为3484 其中行动a的最大后梅值最小所以按后梅值极小化极大准则应采取行动1 六、Krle准则: 使损失是效用的负数后果的效用化),再用等概率( Laplace准则 七、莫尔诺( Molnar)对理想决策准则的要求(1954) 1能把方案或行动排居完全序 2优劣次序与行动及状态的编号无关; 3若行动a按状态优于a,则应有a优于a 4无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变; 5在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变 6在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变 542风险型决策问题的决策原则 、最大可能值准则 令T(4)=maxn(O,) 选a,使I(0k,a)=min(Ok,a) 例 T()a1 0.2 6.5 6 62 0.5 63 0.3 π(O2)概率最大,各行动损失为345 应选行动a1 4-3
4- 3 上例: i l ij : 33 34 36 35 其中行动 a1 的损失最小 五、后梅值极小化极大准则(svage-Niehans) 定义后梅值 sij = l ij - min k l ik 其中 min k l ik 为自然状态为 i 时采取不同行动时的最小损失. 构成后梅值(机会成本)矩阵 S={ sij } mn ,使后梅值极小化极大,即: min max j i sij 例:损失矩阵同上, 后梅值矩阵为: 3 1 0 2 3 0 8 1 1 4 0 2 0 3 2 4 各种行动的最大后梅值为: 3 4 8 4 其中行动 a1 的最大后梅值最小,所以按后梅值极小化极大准则应采取行动 1. 六、Krelle 准则: 使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则. 七、莫尔诺(Molnor)对理想决策准则的要求 (1954) 1.能把方案或行动排居完全序; 2.优劣次序与行动及状态的编号无关; 3.若行动 ak 按状态优于 a j ,则应有 ak 优于 a j ; 4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变; 5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变; 6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。 §4.2 风险型决策问题的决策原则 一、最大可能值准则 令 π ( k )=maxπ ( i ) 选 ar 使 l( k , ar )= min j l( k , a j ) 例: π ( i ) a1 a2 a3 1 0.2 7 6.5 6 2 0.5 3 4 5 3 0.3 4 1 0 π ( 2 ) 概率最大, 各行动损失为 3 4 5 ∴ 应选行动 a1
二、贝叶斯原则 使期望损失极小 ∑a,a)(a,) 上例中各行动的期望损失分别为4.13.63.7,对应于a,的期望损失36最小 应选a 三、贝努利原则 损失函数取后果效用的负值再用 Bayes原则求最优行动 四、E_V(均值一方差)准则 若El≤El4且σ≤σ则a优于a 通常不存在这样的a 上例中 E 3.6 5.967 不存在符合EV准则的行动,这时可采用印(p,0)的值来判断μ为效益型后果的期望) - f(p,σ=卩-aσ2 f越大越优 五、不完全信息情况下的决策原则 hodges- Lehmann原则) 状态概率分布不可靠时,可采用 q(a∑v可+mv=12,…,m=12…,n φ越大越优 543贝叶斯定理 条件概率 1A、B为随机试验E中的两个事件 P(A B)=P(AB)/P(B 由全概率公式4j=1,2…,n是样本空间的一个划分 P(B)=∑PBA)P(A) 得 Bayes公式 P(AIB=P(B A)P(A/P(B) =P(BIA) P(A,)/> P(B, )P(A,) 2.对O,X两个随机变量
4- 4 二、贝叶斯原则 使期望损失极小: min j { i l( i , a j ) π ( i ) } 上例中,各行动的期望损失分别为 4.1 3.6 3.7, 对应于 a2 的期望损失 3.6 最小 ∴ 应选 a2 . 三、贝努利原则 损失函数取后果效用的负值,再用 Bayes 原则求最优行动. 四、E—V(均值—方差)准则 若 E l ij ≤ E l ik 且 j k 则 a j 优于 ak 通常不存在这样的 a j 上例中: a1 a2 a3 E 4.1 3.6 3.7 V( 2 ) 2.29 3.79 5.967 不存在符合 E—V 准则的行动, 这时可采用 f(μ ,σ )的值来判断(μ 为效益型后果的期望) μ -α σ f( μ ,σ )= μ -α σ 2 μ -α (μ 2 +σ 2 ) f 越大越优. 五、不完全信息情况下的决策原则(Hodges-Lehmann 原则) 状态概率分布不可靠时, 可采用: φ ( a j )=λ uij i i + min i uij i=1,2,… ,m j=1,2,… ,n φ 越大越优. §4.3 贝叶斯定理 一、条件概率 1.A、B 为随机试验 E 中的两个事件 P(A|B)=P(AB)/P(B) 由全概率公式: A j j=1,2,… ,n 是样本空间的一个划分, P(B)= j P(B| A j )P( A j ) 得 Bayes 公式 P( Ai |B)=P(B| Ai )·P( Ai )/P(B) = P(B| Ai )·P( Ai )/ j P(B| A j )P( A j ) 2. 对Θ ,Χ 两个随机变量
条件概率密度 f(6|x)=f(x6)f(6)f(x) 在主观概率论中 (6|x)=f(x))r(6 其中:π()是θ的先验概率密度函数 f(x|θ)是θ出现时,x的条件概率密度又称似然函数 m(x)是x的边缘密度,或称预测密度 m(x)= f(x|0 )(0 ∑pxm(日,) T(|x)是观察值为x的后验概率密度。 例:A坛中白球30%黑球70% B坛中白球70%黑球30% 两坛外形相同,从中任取一坛,作放回摸球12次其中白球4次,黑球8次,求所取为A坛 的概率 解:设观察值4白8黑事件为x,记取A坛为1,取B坛为O2 在末作观察时,先验概率p(61)=p(2)=0.5 则在作观察后,后验概率 P(81Ix)=p(x0,p(0,)/ p(x],p(0,+p(xe2)p(02) =034x078×0.5/(034×078×0.5+07×038×0.5) =074/(0.74×032) 0.2401/0.2482 =0.967 显然,通过试验、观察、可修正先验分布 544贝叶斯分析的正规型与扩展型 一、正规型分析 由 Baysean原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则δ,使贝叶斯风险 r(π,d)=infr(π,S(x) 其中:r(m,8(x)=ER(θ,8(x) =E[El6,8(x)) 1(0, 8(x)f(x 0 )dxT(e )de 据(1)式,选δ使r(π,δ)达到极小,这就是正规型的贝叶斯分析。 在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂 时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。实际上可用下法 二、扩展型贝叶斯分析( Extensive Form Analysis 在(1)式中因l6,8)>-00,f(x|0),π()均为有限值
4- 5 ·条件概率密度 f(θ | x)=f(x |θ )f(θ )/f(x) ·在主观概率论中 π (θ | x)=f(x |θ )π (θ )/m(x) 其中:π (θ )是θ 的先验概率密度函数 f(x|θ )是θ 出现时,x 的条件概率密度,又称似然函数. m(x)是 x 的边缘密度, 或称预测密度. m(x)= f(x |θ )π (θ ) dθ 或 i p(x| i )π ( i ) π (θ |x)是观察值为 x 的后验概率密度。 例:A 坛中白球 30%黑球 70% B 坛中白球 70%黑球 30% 两坛外形相同,从中任取一坛,作放回摸球 12 次,其中白球 4 次,黑球 8 次,求所取为 A 坛 的概率. 解:设观察值 4 白 8 黑事件为 x,记取 A 坛为 1 , 取 B 坛为 2 在未作观察时,先验概率 p( 1 )=p( 2 )=0.5 则在作观察后,后验概率 P( 1 |x)=p(x| 1 )p( 1 ) p(x| 1 )p( 1 )+p(x| 2 )p( 2 ) = 0 3 4 . × 0 7 8 . ×0.5 ( 0 3 4 . × 0 7 8 . ×0.5+ 0 7 4 . × 0 3 8 . ×0.5) = 0 7 4 . ( 0 7 4 . × 0 3 4 . ) =0.2401 0.2482 =0.967 显然, 通过试验、观察、可修正先验分布. §4.4 贝叶斯分析的正规型与扩展型 一、正规型分析 由 Baysean 原则:先验分布为π (θ )时,最优的决策规则δ 是贝叶斯规则 ,使贝叶斯风险 r(π , )= inf r(π ,δ (x)) 其中:r(π ,δ (x))= E R(θ ,δ (x)) = E [ E x l(θ ,δ (x)) = x l(θ ,δ (x)) f(x |θ )dxπ (θ ) dθ (1) 据(1)式,选 使 r(π ,δ )达到极小,这就是正规型的贝叶斯分析。 在解实际问题时,求使(1)式极小的δ (x)往往十分困难,尤其在状态和观察值比较复杂 时,Δ 集中的策略数目很大,穷举所有的δ (x)有困难,且计算量颇大。实际上可用下法: 二、扩展型贝叶斯分析(Extensive Form Analysis) 在(1)式中因 l(θ ,δ )>-∞,f(x|θ ),π (θ )均为有限值
由 Fubin定理,积分次序可换 即r(m,6(x)= 1( 0, 8(x)f(x0 )dxtt(0 )d0 =.L I(e, 8(x)f(x e )(0 )de dx 显然,要使(2)试式达到极小,应当对每个x∈X,选择δ, 使 ∫ne8(x) f(x 0 )T(e)d0 (2)为极小 6(x)=a∴若对给定的x选a,使l0,8(x)fx)(0)d0为极小 亦即, 使m到e1m(e)B [联(,)m(a|)d0或∑O,aO) (3)达极小 即可使(1)式为极小 结论 对每个ⅹ,选择行动a,使之对给定x时θ的后验分布π(θ|x)的期望损失为极小,即 可求得贝叶斯规则 这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫 formal Bayesean Rule Raiffa sehlaifer,1961年提出。 使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则 扩展型比正规型更直观,也容易计算,故更常用; 许多分析人员只承认扩型,理由是 i,π(θ|x)描述了试验后的θ的分布,比π(θ)更客观,因此,只要损失函数是由效 用理论导出的(即考虑了DMer的价值判断、风险偏好),在评价行动a的优劣时就应当用后 验期望损失 i,r(π,6)是根据π(θ)求出的,而用先验分布π(θ)来确定行动a并不一定适当。 从根本上讲,这种观点是正确的 无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视 具体问题,据计算方便而定 经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决 策规则同样成立。使所有ⅹ上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的 Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。 三、例先看无观察问题) 农民选择作物问题,设某地旱年θ1占60%,正常年景θ2占40%;a1种植耐旱作物 a2种不耐旱作物,后果矩阵为 260100
4- 6 ∴ 由 Fubini 定理,积分次序可换 即 r(π ,δ (x))= x l(θ ,δ (x)) f(x |θ )dxπ (θ ) dθ = x l(θ ,δ (x)) f(x |θ )π (θ ) dθ dx (2) 显然,要使(2)式达到极小,应当对每个 x∈X,选择δ , 使 l(θ ,δ (x)) f(x |θ )π (θ ) dθ (2’)为极小 ∵ δ (x)=a ∴ 若对给定的 x,选 a,使 l(θ ,δ (x)) f(x |θ )π (θ ) dθ 为极小 亦即, 使 1 m(x) l(θ ,a) f(x |θ )π (θ ) dθ = l( i ,a) π ( i |x) dθ 或 i l( i ,a)p( i |x) (3) 达极小, 即可使(1)式为极小. ·结论: 对每个 x,选择行动 a,使之对给定 x 时θ 的后验分布π (θ |x)的期望损失为极小,即 可求得贝叶斯规则。 这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫 formal Bayesean Rule ——Raiffa Sehlaifer,1961 年提出。 ·Note ·使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则; ·扩展型比正规型更直观,也容易计算,故更常用; ·许多分析人员只承认扩型,理由是: i,π (θ |x)描述了试验后的θ 的分布,比π (θ )更客观,因此,只要损失函数是由效 用理论导出的(即考虑了 DMer 的价值判断、风险偏好),在评价行动 a 的优劣时就应当用后 验期望损失。 ii, r(π ,δ )是根据π (θ )求出的,而用先验分布π (θ )来确定行动 a 并不一定适当。 从根本上讲,这种观点是正确的。 ·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视 具体问题,据计算方便而定。 ·已经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决 策规则同样成立。使所有 x 上后验期望损失极小的贝叶斯规则也是随机性规则集Δ *中的 Bayes 规则,因此,总可以找到一验期望损失极小的非随机性规则。 三、例(先看无观察问题) 农民选择作物问题,设某地旱年 1 占 60%,正常年景 2 占 40%; a1 种植耐旱作物 a2 种不耐旱作物,后果矩阵为: a1 a2 1 20 0 2 60 100
决策人的效用函数u(y)=(1-ey) 0865 解:i令:I(y)=1-uy) y 100 ⅱ作决策树 丌(62) 001 在无观察时,R=, ∑ I(,aT(,) T =0.62×0.6+0.19×0.4 0.448 r(T,a2)=61,a2)T(01)+(02,a2)T(O2) =1.0×0.6+0×0.4 0.6 风险r小者优,δ=a1,是贝叶斯规则,即贝叶斯行动即应选择耐旱作物。 四、例续上) 设气象预报的准确性是0.8,即p(x1|1)=0.8p(x2|02)=0.8 其中,x1预报干旱 x2预报正常年景 则m(x1)=p(x1|01)m(61)+p(x1|02厘(O2)
4- 7 决策人的效用函数 u(y)= 1 0.865 (1- e −0.02 y ) 解:i 令:l(y)=1-u(y) ii,作决策树: a1 a2 ( ) 1 ( ) 1 ( ) 2 60 .81 .19 y u l 20 .38 .62 0 0 1 100 1 0 iii, 在无观察时, R=l, r= 1=1 n l( i ,a)π ( i ) r(π , a1 )=l( 1 , a1 )π ( 1 )+l( 2 , a1 )π ( 2 ) =0.62 ×0.6+0.19 ×0.4 =0.448 r(π , a2 )= l( 1 , a2 )π ( 1 )+l( 2 , a2 )π ( 2 ) =1.0 ×0.6+0 ×0.4 =0.6 风险 r 小者优, ∴ δ = a1 ,是贝叶斯规则, 即贝叶斯行动.即应选择耐旱作物。 四、例(续上) 设气象预报的准确性是 0.8,即 p( x1 | 1 )=0.8 p( x2 | 2 )=0.8 其中, x1 预报干旱 x2 预报正常年景 则 m( x1 )=p( x1 | 1 )π ( 1 )+p( x1 | 2 )π ( 2 )
=0.8×0.6+0.2×0.4=0 (O1|x1)p(x1|01)(a1) 0.8×0.6/0.56=0.86 (1|x2)=p(x2|,)m(a1)/m(x2) 0.2×0.6/0.44=027 T(O2|x1)=0.14 (O2|x2)=0.73 1正规型分析 ①策略δ1:a1=6(x)a2=81(x2) ∑∑(0,6(x,)(xm(a,) 4-7 =1(01,a1)p(x1|01T(01川+1(01,a2)p(x2|01m(01) 1(02,a1)p(x1O2T(O2)+1(02,a2)p(x2|02m(O2) =0.62×0.8×0.6+1.0×0.2×0.6+0.19×0.2×0.4+0.0×0.8×0.4 策略 (x1) ,S2)=∑∑1(,62(x)P(x,Om(,) 1(01,a1)p(x2|61厘(61川+(01,a2)p(x1|01T(61) +1(62,a1)p(x2|62T(62川+1(02,a2)(x1|62川(62) =0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8×0.4+0.0×0.8×0.4 ③策略δ3;a1=δ(x1)a1=6(x2) r(T,3)=0 ④策略δ:a2=64(x1)a2=6(x2 6)=06 r(T,o1)6>6>δ2δ1是贝叶斯行动
4- 8 =0.8 ×0.6+0.2 ×0.4=0.56 m( x2 )=0.44 π ( 1 | x1 )=p( x1 | 1 )π ( 1 ) m( x1 ) =0.8 ×0.6/0.56=0.86 π ( 1 | x2 )=p( x2 | 1 )π ( 1 ) m( x2 ) =0.2 ×0.6/0.44=0.27 π ( 2 | x1 )=0.14 π ( 2 | x2 )=0.73 1.正规型分析 ①策略 1 : a1 = 1 ( x1 ) a2 = 1 ( x2 ) r(π , 1 )= i j l ( i , 1 ( x j ))p( x j | i )π ( i ) 4-7 = l ( 1 , a1 )p( x1 | 1 )π ( 1 )+l ( 1 , a2 )p( x2 | 1 )π ( 1 ) + l ( 2 , a1 )p( x1 | 2 )π ( 2 )+l ( 2 , a2 )p( x2 | 2 )π ( 2 ) =0.62×0.8×0.6+1.0 ×0.2×0.6+0.19 ×0.2×0.4+0.0× 0.8×0.4 =0.4328 ②策略 2 : a1 = 2 ( x2 ) a2 = 2 ( x1 ) r(π , 2 )= i j l ( i , 2 ( x j ))p( x j | i )π ( i ) = l ( 1 , a1 )p( x2 | 1 )π ( 1 )+l ( 1 , a2 )p( x1 | 1 )π ( 1 ) + l ( 2 , a1 )p( x2 | 2 )π ( 2 )+l ( 2 , a2 )p( x1 | 2 )π ( 2 ) = 0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8× 0.4+0.0×0.8× 0.4 =0.6152 ③策略 3 : a1 = 3 ( x1 ) a1 = 3 ( x2 ) r(π , 3 )=0.45 ④策略 4 : a2 = 4 ( x1 ) a2 = 4 ( x2 ) r(π , 4 )=0.6 ∵ r(π , 1 ) <r(π , 3 ) <r(π , 4 ) <r(π , 2 ) ∴ 1 3 4 2 1 是贝叶斯行动
r(el=u 丌(621 x((|x1) x(|x1) x(|x2) r(o,a n(|x2) n以2 4-83扩展型之一:据2):J,e6(x)x)m()记作r ①给定x1(预报干旱) 采用a1r=∑1(,a1)p(x1)m(O) =1(01,a1)p(x1|01(1)+1(02,a1)p(x1|2m(62) 0.62×0.8×0.6+0.19×0.2×0.4 0.3128 采用a2r'=1(01,a2)p(x1|01(e1)+1(2,a2)p(x1|02)(2) 风险小者优∴给定x,应选a ②给定x2(预报天气正常) 采用a1r'=1(0,a1)p(x2|01)(01)+1(02,a1)p(x2|02)(O2) =0.62×0.2×0.6+0.19×0.8×0.4 0.135 采用a2r'=1(01,a2)p(x11r(a1)+1(02,a2)p(x1|02)T(O2) =10×0.2×0.6+0 0.12 给定x2应选a2 由此得形式 Bayes规则δ:a1=o(x1)a2=8(x2) 3扩展型之二:据(式即,)m(d或∑O,anm(0记作r ①给定x1
4- 9 x1 a1 x2 1 a1 a 2 a 2 ( | ) 1 x 1 ( | ) 2 x1 ( | ) 2 x1 ( | ) 2 x2 ( | ) 2 x2 ( | ) 1 x1 ( | ) 1 x2 ( | ) 1 x1 ( | ) 1 x2 4-82.扩展型之一:据(2’) : l(θ ,δ (x)) f(x |θ )π (θ ) dθ 记作 r’ ①给定 x1 (预报干旱): 采用 a1 r‘= i l ( i , a1 )p( x1 | i )π ( i ) = l ( 1 , a1 )p( x1 | 1 )π ( 1 ) + l ( 2 , a1 )p( x1 | 2 )π ( 2 ) = 0.62×0.8×0.6+0.19 ×0.2×0.4 =0.3128 采用 a2 r’= l ( 1 , a2 )p( x1 | 1 )π ( 1 ) + l ( 2 , a2 )p( x1 | 2 )π ( 2 ) =0.48 ∵ 风险小者优 ∴ 给定 x1 应选 a1 ②给定 x2 (预报天气正常) 采用 a1 r’= l ( 1 , a1 )p( x2 | 1 )π ( 1 ) + l ( 2 , a1 )p( x2 | 2 )π ( 2 ) =0.62×0.2×0.6 + 0.19× 0.8× 0.4 =0.135 采用 a2 r’= l ( 1 , a2 )p( x1 | 1 )π ( 1 ) + l ( 2 , a2 )p( x1 | 2 )π ( 2 ) =1.0×0.2×0.6 + 0 =0.12 ∴ 给定 x2 应选 a2 由此得形式 Bayes 规则 : a1 = ( x1 ) a2 = ( x2 ) 3.扩展型之二:据(3)式 即 l( i ,a) π ( i |x) dθ 或 i l( i ,a)π ( i |x)(记作 r”) ①给定 x1
采用ar=∑O,a1)m(O,x1) I(1,a1)π(1|x1)+1(02,a1)Tt(2|x1) =0.62×0.86+0.19×0.14 采用a2r=(01,a2)π(O1|x1)+1(O2,a2)(62|x1) =10×0.86+0×0.14 给定x1,应选行动a1 ②给定x2 采用ar∑I,a)m(a,|x2) =1(01,a1)(O1x2)+102,a1)T(O2 =0.62×0.27+0.19×0.73=0.3061 采用a2广∑0,a2)m(x2) =1(01,a2)(O1|x2)+1(02,a2T(02|x2) 1.0×0.27+0×0.73=0.27 给定x2应选择行动a2 形式 Bayes规则o:a1=(x1)a2=o(x2) 545非正常先验与广义贝叶斯规则 非正常先验( Improper Prior 概率测度的三个条件 i规范性:P(Ω)=1 i非负性:0≤P(A)≤1 ⅲ可列可加性 在设定先验分布时,若不满足规范性,则称为非正常先验 二、广义贝叶斯规则 General Bayesean Rule) 1定义 决策问题的损失函数为l(,a),T(6)为非正常先验分布,对给定的θ,,使 Je.(x)x)mr(6)d0为极小,或者 1.0<m对)<∞时使J,)m(N)为极小的策略行动),构成广义叶斯规则 2Nole:①在许多重要场合,所有允许的都是GBR ②在无法得到正常先验时,除此别无良策 ③GBR不一定是最好的决策规则 546一种具有部分先验信息的贝叶斯分析法
4- 10 采用 a1 r”= i l( i , a1 )π ( i | x1 ) = l( 1 , a1 )π ( 1 | x1 ) + l( 2 , a1 )π ( 2 | x1 ) =0.62 ×0.86 + 0.19 ×0.14 =0.56 采用 a2 r”= l( 1 , a2 )π ( 1 | x1 ) + l( 2 , a2 )π ( 2 | x1 ) = 1.0 ×0.86 + 0× 0.14 =0.86 ∴ 给定 x1 ,应选行动 a1 . ②给定 x2 采用 a1 r”= i l( i , a1 )π ( i | x2 ) = l( 1 , a1 )π ( 1 | x2 ) + l( 2 , a1 )π ( 2 | x2 ) =0.62 ×0.27 + 0.19 ×0.73 = 0.3061 采用 a2 r”= i l( i , a2 )π ( i | x2 ) = l( 1 , a2 )π ( 1 | x2 ) + l( 2 , a2 )π ( 2 | x2 ) =1.0 ×0.27 + 0 ×0.73 =0.27 ∴ 给定 x2 应选择行动 a2 . ∴ 形式 Bayes 规则 : a1 = ( x1 ) a2 = ( x2 ) §4.5 非正常先验与广义贝叶斯规则 一、非正常先验(Improper Prior) 概率测度的三个条件: i,规范性:P(Ω )=1 ii,非负性:0≤ P(A)≤ 1 iii,可列可加性 在设定先验分布时,若不满足规范性,则称为非正常先验. 二、广义贝叶斯规则(General Bayesean Rule) 1.定义: 决策问题的损失函数为 l(θ ,a),π (θ )为非正常先验分布,对给定的 i ,使 i, l(θ ,δ (x)) f(x |θ )π (θ ) dθ 为极小,或者 ii, 0<m(x)<-∞时,使 l( i ,a) π ( i |x) dθ 为极小的策略(行动),构成广义贝叶斯规则. 2.Nole:①在许多重要场合,所有允许的都是 GBR ②在无法得到正常先验时,除此别无良策; ③GBR 不一定是最好的决策规则 §4.6 一种具有部分先验信息的贝叶斯分析法