引言 前面,我们讨论了参数点估计.它是用样本算 得的一个值去估计未知参数.但是,点估计值仅仅 是未知参数的一个近似值,它没有反映出这个近似 值的误差范围,在实际问题中,我们不仅需要求出 参数的近似值,还需要大致估计这个近似值的精确 度与可靠性,区间估计正好能够解决点估计不能解 决的这个问题
引言 前面,我们讨论了参数点估计. 它是用样本算 得的一个值去估计未知参数. 但是,点估计值仅仅 是未知参数的一个近似值,它没有反映出这个近似 值的误差范围,在实际问题中,我们不仅需要求出 参数的近似值,还需要大致估计这个近似值的精确 度与可靠性,区间估计正好能够解决点估计不能解 决的这个问题
譬如,在估计湖中鱼数的问题中,若我们 根据一个实际样本,得到鱼数N的极大似然估 计为1000条 实际上,N的真值可能大于1000条,也可 能小于1000条 若我们能给出一个区间,在此区间内我们 合理地相信N的真值位于其中.这样对鱼数的 估计就有把握多了
譬如,在估计湖中鱼数的问题中,若我们 根据一个实际样本,得到鱼数 N 的极大似然估 计为1000条. 若我们能给出一个区间,在此区间内我们 合理地相信 N 的真值位于其中. 这样对鱼数的 估计就有把握多了. 实际上,N的真值可能大于1000条,也可 能小于1000条
也就是说,我们希望确定一个区间,使我们能 以比较高的可靠程度相信它包含真参数值 湖中鱼数的真值 《 这里所说的“可靠程度”是用概率来度量的, 称为置信水平 习惯上把置信水平记作1-c,这里a是一个 很小的正数
也就是说,我们希望确定一个区间,使我们能 以比较高的可靠程度相信它包含真参数值. • 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度量的 , 称为置信水平. 习惯上把置信水平记作 1− ,这里 是一个 很小的正数
置信水平的大小是根据实际需要选定的 例如,通常可取置信水平1-G0.95或09等 根据一个实际样本,由给定的置信水平,我 们求出一个尽可能小的区间(O,O2),使 P{61<6<62}=1-a 称区间(,02)为6的置信水平为1-a的 置信区间
置信水平的大小是根据实际需要选定的. 例如,通常可取置信水平 1− =0.95或0.9等. 根据一个实际样本,由给定的置信水平,我 们求出一个尽可能 小的区间 ( ˆ 1 , ˆ 2 ) ,使 P{ ˆ 1 ˆ 2 } = 1− 置信区间. 称区间 ( ˆ 1 , ˆ 2 ) 为 的置信水平为 1− 的
置信区问定义 设b是一个待估参数,给定c>0.若由样本 X1,X2Yn确定的两个统计量 61=B1(X1,X2,…,Xnb 62=2(X1,X2,…,Xn (61<62) 满足 P6 61<6<23=1-a 则称区间(61,62是的置信水平为1-a的置信区间 6和6分别称为置信下限和置信上限
一、 置信区间定义 满足 X1 ,X2 ,…Xn确定的两个统计量 设 是 一个待估参数,给定 0, 若由样本 ˆ 1 = ˆ 1 (X1 , X2 , , Xn ), ˆ 2 = ˆ 2 (X1 , X2 , , Xn ), P{ ˆ 1 ˆ 2 } = 1− 则称区间 ) 是 的置信水平为 1− 的置信区间. ˆ , ˆ (1 2 1 和 分别称为置信下限和置信上限. ˆ 2 ˆ ) ˆ ˆ (1 2
置信区间的意义可以解释如下: 如果进行N次抽样,第k次得到的样本观测值记为 (xk,x,…,xm,k=1,2,…,N则我们随机地得到N个区间 (64<a3),k=12…,N这N个区间中,有的包含教O 有的不包含,则当P{1<0<2}=1-a时,这些区间中, 包含参数真值的区间大约占001-a)%
置信区间的意义可以解释如下: (x1k , x2k , , xnk ), k = 1,2, , N 有的不包含,则当 时,这些区间中, 则我们随机地得到N个区间 k , N 这N个区间中,有的包含参数 k k ), 1 2, , ˆ ˆ (1 2 = 如果进行N次抽样,第k次得到的样本观测值记为 P{ ˆ 1 ˆ 2 } = 1− 包含参数的真值的区间大约占100(1−)%
二、单个正态总体均值p的区间估计 02为已知 X~N(A,a2)并设X,…,Xn为来自总体的 样本,X,S2分别为样本均值和样本方差.σ=o已知 求参数的置信水平为-c的置信区间 (1)选μ的统计量 X-N(0,1) 对于给定的置信水平,根据u的分布,确定一 个区间,使得u取值于该区间的概率为置信水平
二、单个正态总体均值m的区间估计 1. 2 σ 为已知 并设 X X 1 , , n 为来自总体的 样本 , 2 X S, 分别为样本均值和样本方差 . ~ ( , ) 2 X N m , = 0 已知 求参数 m 的置信水平为 1− 的置信区间. 0 - ~ (0,1) X u N n m (1) 选 m 的统计量 = 对于给定的置信水平, 根据u的分布,确定一 个区间, 使得u取值于该区间的概率为置信水平. (2)
标准正态分布的上侧a分位数 设U~N(0,1),若数2满条件 P(x) P{>la}=a,0<a<1 则称点l为标准正态分布的上侧Q分位数
标准正态分布的上侧分位数 设 U N~ 0,1 , ( ) 若数 u 满足条件 则称点 u 为标准正态分布的上侧 α 分位数. (x) u P{U uα } =,0 1
(2)对于给定的置信水平,根据的分布,确定 个区间,使得取值于该区间的概率为置信水平 对给定的置信水平1-c,查正态分布表得la2, 使P{-2< < (3)P{X u<u<x+ 可得到u的置信水平为1-a的置信区间为 2,xX+=la2) 12
对给定的置信水平 1−, 查正态分布表得 , u 2 2 2 0 { } 1 X P u u n m − 使 − = − 对于给定的置信水平, 根据u的分布,确定一 个区间, 使得u取值于该区间的概率为置信水平. (2) 0 0 2 2 P X u X u { } 1 n n − + = − m 0 0 2 2 ( , ) X u X u n n − + (3) 可得到 m 的置信水平为 1− α 的置信区间为