第3章区间估计 区间估计的背景: 对于一个量,如某工件的长厦通过测量和计算 得到它的一个近似值在工程技术上还要同餚出 这个近似值的误差也就是说给出一个区商-ε, a+cl,量a一定落入这个区间于参数的估计世 有类似的问题点估计仅仅给出了参数一个估计 值,有时还需要知道它的蘖性程度这就需要给出 个区间并且说明这个区间以友的概率包含参 数的真值这就是区间估计 3-1
3 - 1 第3章 区间估计 区间估计的背景: , . , , , , ˆ ], . , [ˆ , ˆ 数的真值这就是区间估计 一个区间并且说明这个区间以多大的概率包含参 值 有时还需要知道它的可靠性程度这就需要给出 有类似的问题点估计仅仅给出了参数的一个估计 量 一定落入这个区间内对于参数的估计也 这个近似值的误差 也就是说给出一个区间 得到它的一个近似值在工程技术上还要同时给 出 对于一个量 如某工件的长度通过测量和计算 a a a a, a , , + −
3.1置信区间与置信限 设总体的分布函数(x;0)形 式已知,但其中含有参数,若对于给定值 a(0<α<1),统计量61=61(X1,X2,…,xn)和 02=02(X1,X2,…,Xn)满足: P{1<6<02}=1-0 则称随机区间01,02)是0的置信度为-a的置信区 间,01和02分别称为置信度,a的置信下限和量 信上限,1-c称为置信度。 3-2
3 - 2 3.1 置信区间与置信限 信上限, 称为置信度。 间 , 和 分别称为置信度为 的置信下限和置 则称随机区间 是 的置信度为 的置信区 满足 ,统计量 和 式已知,但其中含有未知参数 ,若对于给定值 设总体 的分布函数 的 形 − − − = − = = 1 1 ˆ ˆ ) 1 ˆ , ˆ ( } 1 ˆ ˆ P{ (X ,X , ,X ) : ˆ ˆ (X ,X , ,X ) ˆ ˆ (0 1) X F(x; ) 1 2 1 2 1 2 2 2 1 2 n 1 1 1 2 n
注: 置信区间不同于一般的间, 它是随机区间,不同本值对应不同的区间在 这些区间中有的包含数的真值,有的则不仓。 当置信度为-α时,这个区间包舍的真值的概率 为1-α。如取=0.05,则置信度熄95说明01,02) 以0.9-的概率包的真值。粗略地说,在随机区间 (01,02)的100个观察值中有5个包含的真值 3-3
3 - 3 注: 的 个观察值中有 个包含 的真值。 以 的概率包含的真值。粗略地说,在随机区间 为 。如取 ,则置信度为 ,说明 当置信度为 时,这个区间包含的真值的概率 这些区间中有的包含参数的真值,有的则不包含 。 它是随机区间,不同的样本值对应不同的区间。 在 置信区间不同于一般的区间, ) 100 9 5 ˆ , ˆ ( 0.9 5 ) ˆ , ˆ 1 0.0 5 0.9 5 ( 1 1 2 1 2 − = −
例1设总体~N(H2σ2),σ2已知 未知设X1,X2,…,X是来自的 样本求μ的置信度为-a的置信区间 解是μ的无偏估计,及~N(0,, 且不依赖于任何其它数,按标准正态分布的o 分位点的定义,有P X一kn2}=1-o,即 PX-.a 2 <H<x+-ua12 =1-a 故我们得到的一个置信度为c的置信区间 3-4
3 - 4 样 本 求 的置信度为 的置信区间。 未 知 设 是来自 的 例 设总体 已 知 − , 1 , X , X , ,X X 1. X ~ N( , ) , , 1 2 n 2 2 故我们得到的一个置信度为 的置信区间: 分位点的定义,有 , 即 且不依赖于任何其它参数,按标准正态分布的上 解 因 是 的无偏估计,及 , − = − + − = − − − 1 z } 1 . n z X n P{X | z } 1 n X P{| ~ N(0,1) n X X / 2 / 2 2 u 2 u 2 u 2
(X c/25 n 或记为Xun2)如取=0.05 则有a2=1.96,若σ=1,n=16于是可得一个置亻 度为09的区间:(X±1,96/16)=(X±049 若由一个样本值算得棒均值的观察值=520, 则得(471,569) 注:10.(4.71,5.69)已不是一个随机区间,但仍称它 为置信度为0.95的置信区间,其直观含义是:若反复抽样 多次,每个样本值(n=16)均确定一个区间,在这么多的区 间中,包含μ的约占95%,不包含的约占5%。现抽样得到的 区间(4.71,5.69)属于那些包含μ的区间的可信度为95%, 或“该区间包含μ”这一事实的可信度为95%
3 - 5 注: 10.(4.71, 5.69)已不是一个随机区间,但仍称它 为置信度为0.95的置信区间,其直观含义是:若反复抽样 多次,每个样本值(n =16)均确定一个区间,在这么多的区 间中,包含的约占95%,不包含的约占5%。现抽样得到的 区间(4.71, 5.69)属于那些包含的区间的可信度为95%, 或“该区间包含”这一事实的可信度为95% . (4.7 1, 5.6 9) . x 5.2 0 0.9 5 (X 1.9 6 1 6) (X 0.4 9) z 1.9 6 1, n 1 6 z ) 0.0 5 n (X z ) n z , X n (X / 2 / 2 / 2 / 2 则 得 若由一个样本值算得样本均值的观察值 , 度 为 的区间: 。 则 有 , 若 ,于是可得一个置信 或记为 。如取 , = = = = = = + − u 2 u 2 u 2 u 2
20置信区间是不唯一的如在上例中,若取 X <0}=0.95, 可得X-0u0n,x+=0)也是的置信 度为9置信区间 3对于同一未知参数以有各种不同的置偌间 显然置信度相同时置信区间越短越好一般地 对于密度函数为单幃称的随机变量如正秀布 或分布取双侧分位点置信区间最短。 3-6
3 - 6 或 分 布 取双侧分位点时置信区间最短。 对于密度函数为单峰对称的随机变量如正态分 布 显然置信度相同时置信区间越短越好一般地 对于同一未知参数可以有各种不同的置信区 间 t , , , , , , 3 , , 0 度为 的置信区间。 可得 也 是 的置信 置信区间是不唯一的。如在上例中,若取 0.9 5 z ) n z ,X n (X z } 0.9 5, n X P{ z 2 0.0 1 0.0 4 0.0 4 0.0 1 0 + − = − − u0.04 u0.01 u0.01 u0.04
求置信区间的一般步骤: 1.设法构造一个随机变量Z=Z(X1,X2…,Xn;0),除 了参数θ外,Z不包含其他任何未知参数,Z的分布 已知(或可求出),并且不依赖于参数θ,也不依赖 于其他任何未知参数。 2.对于给定的置信度-a,求出a,b,使得 {a<Z(X1,X2,…,xn;6)<b} 3.由不等式<Z(X1,X2,…,Xn;0)<b解得 (X1,X2,…,Xn;a,b)<6<θ2(X1,X2,…,Xn;a,b) 这样就得到的置信区间 3-7
3 - 7 求置信区间的一般步骤: 1. 设法构造一个随机变量Z=Z(X1 , X2 , …, Xn ;),除 了参数外, Z不包含其他任何未知参数, Z的分布 已知(或可求出),并且不依赖于参数, 也不依赖 于其他任何未知参数。 = − − P{a Z(X ,X , ,X ; ) b} 1 2. 1 , a,b, 1 2 n 对于给定的置信度 求 出 使 得 . (X ,X , ,X ;a,b) ˆ (X ,X , ,X ;a,b) ˆ 3. a Z(X ,X , ,X ; ) b 1 1 2 n 2 1 2 n 1 2 n 这样就得到了的置信区间 由不等式 解 得
3.2单参数分布族的置信区间 设总体X~N(μ,J2),X1,X2,…,X,是一个样本 1当2已知时,求的置信区间 选耶UX一,由例可得的置信度为-a的 置信区间:(X±-r4a2) 例2.有一大批糖果,现从中随机地取16袋,称得重量如下: 506508499503504510497512 514505493496506502509496 设袋装糖果的重量近似地服从N(,6)分布,试 求:总体均值的置信度为0.95的置信区间。 3-8
3 - 8 3.2 单参数分布族的置信区间 X ~ N( , ), X , X , X . 1 2 设总体 2 , n 是一个样本 例2. 有一大批糖果,现从中随机地取16袋,称得重量如下: 设袋装糖果的重量近似地服从 分布,试 求:总体均值μ的置信度为 0.95 的置信区间。 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ( , 6 ) 2 N z ) . n (X 1 1 n X Z 1. / 2 2 − − = 置信区间: 选 取 ,由例可 得 的置信度为 的 当 已知时,求的置信区间。 U u 2
的1-a置信区间为X±=na2=5035±:×1.96 n 16 2.求2的置信区间: 考虑z(n-D2 ∝2-,由定理131知z~x2(n-1),不依赖 于任何未知参数。对给定的置信度1-c,注意到 ∫(n-D)s 2 1)S x,1-a2(n-1) 2 1-P(n-1)s2 >X 0 x1-a/2(-1)xa/2(n-1) 3-9
3 - 9 2 ( 1) ( 1) 1 , 1.3.1 ~ ( 1) , ( 1) 2. 2 2 , 2 2 2 2 2 2 = − − − − − = n n S P Z n n S Z 于任何未知参数。对于给定的置信度 ,注意到 考 虑 由定理 知 不依赖 求 的置信区间: = − 1.96 16 6 1 2 503.75 u n 的 置信区间为 X 2 ( 1) ( 1) 1 ( 1) ( 1) 2 2 , 1 2 2 2 2 , 1 2 2 = − − = − − − − − n n S P n n S P ( 1) 2 / 2 − ( 1) n 2 1 / 2 − − n 2 2
故有 P{xa/2(n-1)<(n-1)s2 2 <Xa/2(n-1)}=1 2的置信度为-o的置信区间为 (n-1)S (n-1)S2 xa/2(n-1)xi-a/2(n-1) 而σ的置信度为-c的置信区间为 n=Is n-Is xa2(m-1)√x1-a/2(n-1) 3-10
3 - 10 ) . (n 1) n 1S (n 1) n 1S ( 1 ) (n 1) (n 1)S (n 1) (n 1)S ( 1 (n 1) } 1 (n 1)S P{ (n 1) 2 1 / 2 2 / 2 2 1 / 2 2 2 / 2 2 2 2 2 / 2 2 2 1 / 2 − − − − − − − − − − − = − − − − − − , 而 的置信度为 的置信区间为 , 的置信度为 的置信区间为 故 有