清华大学：《粒子物理与核物理实验中的数据分析》课程教学资源（课件讲稿）第十一讲置信区间

统计误差中的标准误差问题经典置信区间问题利用似然函数或二乘函数确定置信区间

团购合买资源类别：文库，文档格式：PDF，文档页数：23，文件大小：313.7KB

粒子物理与核物理实验中的数据分析陈少敏清华大学第十一讲：置信区间

本讲要点统计误差中的标准误差问题经典置信区间问题 ■利用似然函数或二乘函数确定置信区间 2

2 本讲要点统计误差中的标准误差问题经典置信区间问题利用似然函数或二乘函数确定置信区间

测量结果的表述与含义实验数据：x,,X 实验目的：估计日并且还应给出6的方差，即o房。结果应该报告成下述形式 0b±66=5.73±021 其真正的含义是什么呢？如果我们知道0将服从某一概率密度函数分布g(0,O),那么上述结果的正确表述应该是 0的估计值为5.73 的估计值为0.21 → o,测量了g(0,0)的分布宽度 3

3 测量结果的表述与含义其真正的含义是什么呢？ 1,..., n 实验数据：x x ˆ 实验目的：估计 θobs ˆ 5.73 0.21 ˆ ± ˆ = ± θ θ obs σ ˆ ˆ 如果我们知道 θ θ (; 将服从某一概率密度函数分布 g θ )，那么上述结果的正确表述应该是 θ 的估计值为 5.73 ˆ 0.21 θ σ 的估计值为 m2 ˆ ˆ θ 并且还应给出 θ σ 的方差，即。结果应该报告成下述形式 ˆ ˆ g( ; ) θ σ θ 测量了 θ 的分布宽度

参数估计值的分布通常参数估计值服从的概率密度分布函数g(0;)是多维高斯分布 6和=cov©，0，]综合了我们对g(0,0)的了解或估计可以用来作误差传递的输入参量，以及用最小二乘法求平均值等等。我们可以此约定来报告误差，而不管概率密度函数g(0:)的形式。唯一例外的是当我们要对不同实验求平均值时，它的形式就会发挥作用。如果g(0,)是高斯形式的话，置信区间可以表述为 [0b-6,0s+6a] 给出了对应于68.3%置信区间范围。如果g(0:0)不是服从高斯分布中心置信区间应给出不对称的误差 4

4 参数估计值的分布 ˆ 通常参数估计值服从的概率密度分布函数 g( ; θ θ ) 是多维高斯分布 ˆ ˆ ˆ m ˆ ˆ co v[ , ] ( ; ) θ θ V g = i j θ θ θ G G G 和综合了我们对的了解或估计可以用来作误差传递的输入参量，以及用最小二乘法求平均值等等。 ˆ 如果 g( ; θ θ ) 是高斯形式的话，置信区间可以表述为 ˆ ] ˆ ˆ , ˆ [ ˆ ˆ θ θ θ obs − σ θ obs + σ 中心置信区间应给出不对称的误差 ˆ 如果 g( ; θ θ ) 不是服从高斯分布 ˆ 我们可以此约定来报告误差，而不管概率密度函数 (g θ θ; ) 的形式。唯一例外的是当我们要对不同实验求平均值时，它的形式就会发挥作用。给出了对应于 68.3% 置信区间范围

经典置信区间假设我们对参数0有估计量日，并且有估计值 obs> 为了正确表述结果，对于所有的0我们仍需要知道g(0:O)的形式。首先需要指定“上下分布尾部的概率”，例如：=B=0.05 然后找出4.(O),ye(0),使得 a=P(0≥ua(0) (e:e)6 o,8(d,e)d0 =1-G(u,(0);8) 0.5 B=P(0≤VB(0) B 」g(dodd =G(ye(0);0) 5

5 经典置信区间首先需要指定“上下分布尾部的概率”，例如： α = β = 0.05 ( ) ( ) ˆ ( ( ) ) ˆ ˆ ( ; ) 1 ( ( ); ), ˆ ( ( ) ) ˆ ˆ ( ; ) ( ( ); ) u P u g d G u P g d G α β α θ α β ν θ β α θ θ θ θ θ θ θ β θ ν θ θ θ θ ν θ θ ∞ −∞ = ≥ = = − = ≤ = = ∫ ∫ ˆ ˆ , 假设我们对参数 θ 有估计量 θ θ ，并且有估计值 obs ˆ 为了正确表述结果，对于所有的θ θ 我们仍需要知道 g( ; θ )的形式。 , u ( ) ( ), 然后找出 α β θ ν θ 使得

经典置信区间（续一）无论0为何值，在置信带找到0的概率为。 P(ye(0)≤0≤u(0》=1-a-B 3 假设u(0),Ye(O)是单调变化的，那么 b (9) a(0)≡u(0)，b(0)≡vg(⊙ 不等式 a 0≥u.(0),0≤vp(0) 3 等价于在4.(0)，v(O)之间的区域称为置信带 a(⊙)≥0，b(⊙)≤0→P(a(⊙≥0)=a,P(b(⊙≤0)=B 或者合并成在不知道真值0的情况下，通过估计 P(a(0≤0≤b(0)=1-a-阝值与函数a,b给出0的置信区间。 6

6 经典置信区间 (续一 ) 不等式或者合并成 ˆ 无论θ θ 为何值，在置信带找到的概率为 ˆ P v( ( ) u ( ) ) 1 β β θ ≤ ≤ θ θ = − α − β () u v, ( ) 假设 α β θ θ 是单调变化的，那么 1 1 ˆ ˆ ˆ ˆ a u ( ) ( ), b v ( ) ( ) θ α β θ θ θ − − ≡ ≡ ˆ ˆ u v ( ), ( ) θ ≥ ≤ α β θ θ θ 等价于 θ ≥ θ θ ) ≤ θ ˆ ) , ( ˆ a ( b ˆ ˆ P a( (θ ) ) ≥ = θ α, P ( b (θ ) ) ≤ = θ β. θ ≤ θ ≤ θ )) = 1 − α − β ˆ ) ( ˆ P ( a ( b u ( ), ( ) 在 α β θ υ θ 之间的区域称为置信带。 ˆ a b, θ θ θ 在不知道真值的情况下，通过估计值与函数给出的置信区间

经典置信区间（续二）区间a(0),b(0)]称为具有置信水平或覆盖概率1-o-B的置信区间。它的深刻含义是包含真实参数的概率为1--B 注意，该区间是随机的，真值0是一个未知常数。通常情况下，将区间[a,b]报告为0，即c=0-a,d=b-0。那么0=80.250g 意味着什么呢？它并不意味着任意一次实验： P(80.00<0<80.56)=1-0-B 而是意味着：重复同样样本大小的实验多次，每次按同样的描述构造置信区间，有1-α-B部分的实验，置信区间将覆盖0。有时，只有指定的a或B 单边区间（极限）通常，取a=B=y2 覆盖概率为1-y 中心置信区间注意：中心置信区间并不意味着区间对于0是对称的，它仅因为=B。粒子物理与核物理的误差惯例是：68.3%的中心置信区间。 7

7 经典置信区间 (续二 ) 它的深刻含义是注意，该区间是随机的，真值 θ 是一个未知常数。 ˆ ˆ 区间[ ( a b θ θ ), ( )] 1 称为具有置信水平或覆盖概率 − − α β 的置信区间。包含真实参数的概率为 1 - α - β ˆ ˆ ˆ [ , ] , , d c a b θ c θ θ a d b + 通常情况下，将区间报即告为 − = − = − 。 0.31 0.25 ˆθ 80.25 + 那么 = − 意味着什么呢？它并不意味着任意一次实验： P (80.00 < θ < 80.56 ) = 1 − α − β 而是意味着：重复同样样本大小的实验多次，每次按同样的描述构造置信区间，有 1 - α - β 部分的实验，置信区间将覆盖 θ。通常，取 α= β=γ /2 有时，只有指定的 α 或 β 单边区间 (极限 ) 粒子物理与核物理的误差惯例是：68.3%的中心置信区间。覆盖概率为1-γ 中心置信区间 ˆ 注意:中心置信区间并不意味着区间对于θ α 是对称的，它仅因为 = β

经典置信区间（续三）通常，我们并不构造置信带，而是解下列方程 ax=gg(d,a)d0=1-G(⑥，；a） B=g(0:b)d0-G(0:b) 得到a与b的区间极限。 a是B的假设值使得：P(0>0,s)=au b是0的假设值使得：P(0<0s)=B (a) (b) bs 0.5 0.5 0 0 3 5 0 8

8 经典置信区间 (续三 ) 通常，我们并不构造置信带，而是解下列方程得到 a 与 b的区间极限。 ; ) ˆ ( ˆ ; ) ˆ ( ; ) ˆ 1 ( ˆ ; ) ˆ ( ˆ ˆ g b d G b g a d G a obs obs obs obs β θ θ θ α θ θ θ θ θ = = = = − ∫ ∫ − ∞ ∞ ˆ ˆ () obs a P 是 θ 的假设值使得： θ θ > = α ˆ ˆ () obs b P 是 θ 的假设值使得： θ θ < = β

高斯分布估计量的置信区间如果存在 n 为了找到0置信区间，解下列方程 e1-G0ao,）1- Cois-a 8-oaa,=n2s6 得到a与b的解 9

9 高斯分布估计量的置信区间如果存在为了找到 θ 置信区间，解下列方程 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − = 2 ˆ 2 2 ˆ 2 ) ˆ ( exp 2 1 ; ) ˆ ( θ θ σ θ θ πσ g θ θ , ˆ ; , ) ˆ ( , ˆ ; , ) 1 ˆ 1 ( ˆ ˆ ˆ ˆ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = = Φ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = − = − Φ θ θ θ θ σ θ β θ σ σ θ α θ σ b G b a G a obs obs obs obs 得到 a 与 b的解

高斯分布估计量的置信区间（续）前面的函数G是对于0的累积分布，且 w-2元e 是标准高斯的累积函数，可以证明 a=0-0,Φ'(1-)， b=0s+oΦ'(1-B) 这里Φ给出标准高斯的分位点（累积分布的倒数，可以调用CERNLIB 的程序GAUSIN计算)。 Φ(1-0)，Φ(1-B)→给出a与b离0有多少标准偏差。 10

10 高斯分布估计量的置信区间 ( 续 ) ∫− ∞ − Φ = x x x e dx' 2 1 ( ) ' / 2 2 π 1 ˆ 1 ˆ ˆ (1 ), ˆ (1 ) obs obs a b θ θ θ σ α θ σ β − − = − Φ − = + Φ − 1 CERN L I B GAUS IN − 这里 Φ 给出标准高斯的分位点(累积分布的倒数，可以调用的程序计算)。 ( 1 ), ( 1 ) 1 1 Φ − α Φ − β − − 是标准高斯的累积函数，可以证明 G ˆ 前面的函数是对于 θ 的累积分布，且 ˆ 给出 a 与 b 离 θ 有多少标准偏差

点击下载完整版文档（PDF格式）

共23页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录