s4区间估计
2 §4 区间估计
对一个未知量,人们在测量或计算时,常不以 得到近似值为满足,还需估计误差,即要求知 道近似值的精确程度(亦即所求真值所在的范 围)类似地,对于未知参数e除了求出它的点 估计外,还希望估计出一个范围,并希望知 道这个范围包含参数磌真值的可信程度这样 的范围通常以区间的形式给出,同时还给出此 区间包含参数真值的可信程度这种形式的 估计称为区间估计
3 对一个未知量, 人们在测量或计算时, 常不以 得到近似值为满足, 还需估计误差, 即要求知 道近似值的精确程度(亦即所求真值所在的范 围). 类似地, 对于未知参数q, 除了求出它的点 估计 外, 还希望估计出一个范围, 并希望知 道这个范围包含参数q真值的可信程度. 这样 的范围通常以区间的形式给出, 同时还给出此 区间包含参数q真值的可信程度. 这种形式的 估计称为区间估计. q ˆ
置信区间设总体X的分布函数F(x;6含有 个未知参数,6∈6e是啪可能取值范围),对 于给定值a(0<a<1,若由样本X1X2,YXn确定 的两个统计量=BX1X2,Xn)和 0=X1,X2…,XxQ<,对于任意∈e满 足 P{6(X12X2…,m)<6<X1X2,Ym)}1-a (41) 则称随机区间(,6是硝置信水平为1-a的 置信区间,旦和6分别称为置信水平为1-a的 双侧置信区间的置信下限和置信上限
4 置信区间 设总体X的分布函数F(x;q)含有一 个未知参数q, q(是q的可能取值范围), 对 于给定值a(0<a<1), 若由样本X1 ,X2 ,...,Xn确定 的两个统计量q = q(X1 ,X2 ,...,Xn )和 `q =`q(X1 ,X2 ,...,Xn )(q <`q), 对于任意q 满 足 P{q(X1 ,X2 ,...,Xn ) < q <`q(X1 ,X2 ,...,Xn )}1-a (4.1) 则称随机区间(q ,`q)是q的置信水平为1-a的 置信区间, q 和`q分别称为置信水平为1-a的 双侧置信区间的置信下限和置信上限
当X是连续型随机变量时,对于给定的a,总是 按要求P(Q<<6=1-a求出置信区间,而当 X是离散型随机变量时,对于给定的a常常找 不到区间(Q,的使得P(<<0恰为1-a此 时去找区间(Q,使得P(<<6至少为 1-a,且尽可能地接近1-a
5 当X是连续型随机变量时, 对于给定的a, 总是 按要求P(q < q <`q)=1-a求出置信区间, 而当 X是离散型随机变量时, 对于给定的a, 常常找 不到区间(q ,`q)使得P(q < q <`q)恰为1-a. 此 时去找区间(q ,`q)使得P(q < q <`q)至少为 1-a, 且尽可能地接近1-a
(41)式的含义为若反复抽样多次(各次得到 的样本的容量相等,都是n),每个样本值确定 个区间(,6,每个这样的区间要么包含日 的真值,要么不包含硝的真值,按大数定律,包 含θ真值的约占1001-0)%不包含值的约 占100a%,例如,若a=0.01,反复抽样1000次, 则得到的1000个区间中不包含真值的约仅为 10个
6 (4.1)式的含义为:若反复抽样多次(各次得到 的样本的容量相等, 都是n), 每个样本值确定 一个区间(q ,`q), 每个这样的区间要么包含q 的真值, 要么不包含q的真值, 按大数定律, 包 含q真值的约占100(1-a)%, 不包含q真值的约 占100a%, 例如, 若a=0.01, 反复抽样1000次, 则得到的1000个区间中不包含q真值的约仅为 10个
区间估计的图示 6
7 区间估计的图示 q
例设总体X~Npa2),a2为已知,为未知,设 1%429 ●●● Xn是来自X的样本,求的置信水平为 1-a的置信区间 解我们知道X是m的无偏估计,且有 N(0,1) O/√n X所服从的分和V.不依赖于任何未知 参数
8 例 设总体X~N(m,s2 ), s2为已知, m为未知, 设 X1 ,X2 ,...,Xn是来自X的样本, 求m的置信水平为 1-a的置信区间. 解 ~ (0,1). , N n X X s m m - 我们知道 是 的无偏估计且 有 所服从的分布N(0,1)不依赖于任何未知 n X s - m 参数
按标准正态分布的上a分位点的定义,有 P ∠a2=1-a 9 O/√n 2 d2 02 a2
9 按标准正态分布的上a分位点的定义, 有 1 , (4.3) / 2 a s m a = - - z n X P 0 a/2 za/2 a/2 -za/2
P X-A < /2 PX-zn2<4<X+7=za2}=1-a.(44) 这样就得到了的一个置信水平为1-a置信 区间 a/29 X+ c/2 45) vn 常写成 a/2 (46)
10 这样就得到了m的一个置信水平为1-a的置信 区间 , . (4.5) / 2 / 2 - a + a s s z n z X n X 常写成 1 . (4.4) 1 , (4.3) / 2 / 2 / 2 a s m s a s m a a a = - - + = - - z n z X n P X z n X P . (4.6) / 2 a s z n X
如果取a=0.05,即1-a=0.95,又若a=1,n=16, 查表得m2=025=1.96于是得到一个置信水 平为0.95的置信区间 X±.×1.96,即(X±0.49).(47 √16 再者,若由一个观察值算得样本均值的观察值 x=5.20,则得到一个区间 (520±0.49),即(4.71,569)
11 如果取a=0.05, 即1-a=0.95, 又若s=1, n=16, 查表得za/2=z0.025=1.96. 于是得到一个置信水 平为0.95的置信区间 1.96 , ( 0.49). (4.7) 16 1 X 即 X 再者, 若由一个观察值算得样本均值的观察值 `x =5.20, 则得到一个区间 (5.200.49), 即 (4.71, 5.69) . (4.6) / 2 a s z n X