《概率论与数理统计》课程教学资源（教案讲义，理工类）第六章参数估计（6.3）置信区间

前面讨论了参数的点估计,它是用样本算出的一个值去估计未知参数即点估计值仅仅是未知参数的一个近似值,它没有给出这个近似值的误差范围例如,在估计某湖泊中鱼的数量的问题中,若根据一个实际样本,利用最大似然估计法估计出鱼的数量为50000条,这种估计结果使用起来把握不大实际上鱼的数量的真值可能大于50000条,也可能小于50000条且可能偏差较大若能给出一个估计区间,让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量的真值被含在这个区间内,这样的估计显然更有实用价值。

团购合买资源类别：文库，文档格式：DOC，文档页数：5，文件大小：440KB

第三节置信区间前面讨论了参数的点估计,它是用样本算出的一个值去估计未知参数.即点估计值仅仅是未知参数的一个近似值,它没有给出这个近似值的误差范围例如,在估计某湖泊中鱼的数量的问题中,若根据一个实际样本,利用最大似然估计法估计出鱼的数量为50000条,这种估计结果使用起来把握不大实际上,鱼的数量的真值可能大于500条,也可能小于50000条.且可能偏差较大若能给出一个估计区间,让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量的真值被含在这个区间内,这样的估计显然更有实用价值本节将要引入的另一类估计即为区间估计,在区间估计理论中,被广泛接受的一种观点是置信区间,它由奈曼 (Neyman)于1934年提出的分布图示 ★引言 ★置信区间的概念 ★寻求置信区间的方法 ★例1 ★例2 ★例3 ★0-1分布参数的区间估计 ★单侧置信区间 ★例5 ★例6 ★内容小结 ★课堂练习 ★习题6-3 返回内容要点置信区间的概念定义1设0为总体分布的未知参数,X1,X2…,X是取自总体X的一个样本,对给定的数1-a(0<a<1),若存在统计量 =6(X1,X2,…,Xn),6=6(X1,X2…Xn) 使得 P{6<6<6}=1 则称随机区间(,0)为θ的1-a双侧置信区间,称1-a为置信度,又分别称与b为θ的双侧置信下限与双侧置信上限注:1.置信度1-a的含义:在随机抽样中,若重复抽样多次,得到样本X1,X2,…,Xn的多个样本值(x1,x2,…xn),对应每个样本值都确定了一个置信区间(旦,0),每个这样的区间要么包含了θ的真值,要么不包含θ的真值.根据伯努利大数定理,当抽样次数充分大时, 这些区间中包含θ的真值的频率接近于置信度(即概率)1-a,即在这些区间中包含O的真值的区间大约有1001-a)%个,不包含θ的真值的区间大约有100%个.例如,若令 1-a=0.95,重复抽样100次,则其中大约有95个区间包含θ的真值,大约有5个区间不包含θ的真值 2.置信区间(,6)也是对未知参数O的一种估计,区间的长度意味着误差,故区间估计与点估计是互补的两种参数估计 3.置信度与估计精度是一对矛盾置信度l-a越大,置信区间(,b)包含θ的真值的概率就越大,但区间(,b)的长度就越大,对未知参数6的估计精度就越差.反之,对参数的估计精度越高,置信区间巴,θ)长度就越小,(旦,θ)包含θ的真值的概率就越低,置信度 1-α越小.一般准则是:在保证置信度的条件下尽可能提高估计精度. 二、寻求置信区间的方法寻求置信区间的基本思想在点估计的基础上,构造合适的函数,并针对给定的置信度

第三节置信区间前面讨论了参数的点估计, 它是用样本算出的一个值去估计未知参数. 即点估计值仅仅是未知参数的一个近似值, 它没有给出这个近似值的误差范围. 例如, 在估计某湖泊中鱼的数量的问题中, 若根据一个实际样本, 利用最大似然估计法估计出鱼的数量为 50000 条, 这种估计结果使用起来把握不大. 实际上, 鱼的数量的真值可能大于 50000 条, 也可能小于 50000 条.且可能偏差较大. 若能给出一个估计区间, 让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量的真值被含在这个区间内, 这样的估计显然更有实用价值. 本节将要引入的另一类估计即为区间估计, 在区间估计理论中, 被广泛接受的一种观点是置信区间, 它由奈曼(Neymann)于 1934 年提出的. 分布图示 ★ 引言 ★ 置信区间的概念 ★ 寻求置信区间的方法 ★ 例1 ★ 例2 ★ 例3 ★ 0 − 1 分布参数的区间估计 ★ 例4 ★ 单侧置信区间 ★ 例5 ★ 例6 ★ 内容小结 ★ 课堂练习 ★ 习题 6-3 ★ 返回内容要点一、置信区间的概念定义 1 设  为总体分布的未知参数, X X Xn , , , 1 2  是取自总体 X 的一个样本, 对给定的数 1−(0  1) , 若存在统计量 ( , , , ), ( , , , ),  = X1 X2  Xn  = X1 X2  Xn 使得 P{   }=1−, 则称随机区间 (, ) 为  的 1− 双侧置信区间, 称 1− 为置信度, 又分别称  与  为  的双侧置信下限与双侧置信上限. 注: 1. 置信度 1− 的含义: 在随机抽样中, 若重复抽样多次, 得到样本 X X Xn , , , 1 2  的多个样本值 ( , , , ) 1 2 n x x  x , 对应每个样本值都确定了一个置信区间 (, ) , 每个这样的区间要么包含了  的真值, 要么不包含  的真值. 根据伯努利大数定理, 当抽样次数充分大时, 这些区间中包含  的真值的频率接近于置信度(即概率) 1− , 即在这些区间中包含  的真值的区间大约有 100(1−)% 个, 不包含  的真值的区间大约有 100% 个. 例如, 若令 1− = 0.95 , 重复抽样 100 次, 则其中大约有 95 个区间包含  的真值, 大约有 5 个区间不包含  的真值. 2. 置信区间 (, ) 也是对未知参数  的一种估计, 区间的长度意味着误差, 故区间估计与点估计是互补的两种参数估计. 3. 置信度与估计精度是一对矛盾.置信度 1− 越大, 置信区间 (, ) 包含  的真值的概率就越大, 但区间 (, ) 的长度就越大, 对未知参数  的估计精度就越差. 反之, 对参数  的估计精度越高, 置信区间 (, ) 长度就越小, (, ) 包含  的真值的概率就越低, 置信度 1− 越小. 一般准则是: 在保证置信度的条件下尽可能提高估计精度. 二、寻求置信区间的方法寻求置信区间的基本思想: 在点估计的基础上, 构造合适的函数, 并针对给定的置信度

导出置信区间. 一般步骤: (1) 选取未知参数  的某个较优估计量  ˆ ; (2) 围绕  ˆ 构造一个依赖于样本与参数  的函数 ( , , , , ); u = u X1 X2  Xn  (3) 对给定的置信水平 1− ,确定 1 与 2 ,使 { } 1 , P 1  u  2 = − 通常可选取满足 2 { } { } 1 2  P u   = P u   = 的 1 与 2 ，在常用分布情况下, 这可由分位数表查得; (4) 对不等式作恒等变形化后为 P{   }=1− , 则 (, ) 就是  的置信度为 1− 的双侧置信区间。三、(0—1)分布参数的置信区间考虑(0—1)分布情形, 设其总体 X 的分布率为 P{X =1} = p,P{X = 0} =1− p,(0  p 1), 现求 p 的置信度为 1− 置信区间. 已知(0—1)分布的均值和方差分别为 E(X) = p,D(X) = p(1− p), 设 X X Xn , , , 1 2  是总体 X 的一个样本, 由中心极限定理知, 当 n 充分大时, p p n X p D X n X E X u ( )/ (1 )/ ( ) − − = − = 近似服从 N(0,1) 分布, 对给定的置信度 1− , 则有 1 , (1 )/  / 2  −          − − u p p n X p P 经不等式变形得 { 0} 1 , 2 P ap +bp + c   − 其中 ( ) , 2 ( ) , ( ) . 2 2 /2 2 a = n + u / 2 b = − nX − u c = n X 解式中不等式得 { } 1 , P p1  p  p2  − 其中 ( 4 ). 2 1 ( 4 ), 2 1 2 2 2 1 b b ac a b b ac p a p = − − − = − + − 于是 ( , ) p1 p2 可作为 p 的置信度为 1− 的置信区间. 四、单侧置信区间前面讨论的置信区间 (, ) 称为双侧置信区间, 但在有些实际问题中只要考虑选取满足 P{u  1 } = 或 P{u  2 } = 的 1 与 2 ，对不等式作恒等变形后化为 P{ } =1− 或 P{  }=1− 从而得到形如 ( ,+) 或 (−, ) 的置信区间. 例如, 对产品设备、电子元件等来说, 我们关心的是平均寿命的置信下限, 而在讨论产品的废品率时, 我们感兴趣的是其置信上限. 于是我们引入单侧置信区间. 定义设  为总体分布的未知参数, X X Xn , , , 1 2  是取自总体 X 的一个样本, 对给定的数 1−(0  1) , 若存在统计量 ( , , , ),  = X1 X2  Xn 满足 P{ } =1−

则称 ( ,+) 为  的置信度为 1− 的单侧置信区间, 称  为  的单侧置信下限; 若存在统计量 ( , , , ),  = X1 X2  Xn 满足 P{  } =1−, 则称 (−, ) 为  的置信度为 1− 的单侧置信区间, 称  为  的单侧置信上限. 例题选讲寻求置信区间的方法例 1(E01) 设总体 2 2 X ~ N(, ), 为已知,  为未知, 设 X X X n , , , 1 2  是来自 X 的样本, 求  的置信水平为 1 − 的置信区间. 解已知 X 是  的无偏估计, 且 ~ (0,1), / N n X  −  而 N(0,1) 不依赖于任何未知参数. 按标准正态分布的双侧  分位数的定义, 有 1 , / / 2     = −          − u n X P 即 1 . / / 2       = −       −   + u n u X n P X n 这样, 就得到了  的一个罡信水平为 1− 的置信区间 , , / / 2         −  +    u n u X n X n 常写成 . / 2            u n X 若取  = 0.05, 即 1− = 0.95, 及  =1,n =16, 查表得 1.96, u / 2 = u0.025 = 则得到一个置信水平为 0.95 的置信区间 (X  0.49). 若由一个样本值得样本均值的观察值 x = 5.20, 则进一步得到一个置信水平为 0.95 的置信区间 (5.20  0.49) = (4.71,5.69). 这个区间的含义是: 若反复抽样多次, 每个样本值均确定一个区间, 在这些区间中, 包含  的约占 95%, 或者说该区间属于包含  的区间的可信程度为 95%. 例 2 设总体 X ~ N(,8),  为未知参数, 1 36 X ,  , X 是取自总体 X 的简单随机样本, 如果以区间 (X −1, X +1) 作为  的置信区间, 那么置信度是多少? 解 ~ ( , ), 2 X N   所以 . 9 2 , 36 8 ~ ( , , 2        =      =             N N n X N 从而 ~ (0,1), 2 / 3 N X −  依题意 P{X −1   X +1}=1−, 即         −   −        −   + =  2 3 2 3 P{ 1 X  1} 1 2 3 2  −      =  = 2(2.121) −1 = 0.966 =1−, 所求的置信度为 96.6%

点击下载完整版文档（DOC格式）

已到末页，全文结束

点击下载（DOC格式）

浏览记录