正在加载图片...
第三节置信区间 前面讨论了参数的点估计,它是用样本算出的一个值去估计未知参数.即点估计值仅仅 是未知参数的一个近似值,它没有给出这个近似值的误差范围 例如,在估计某湖泊中鱼的数量的问题中,若根据一个实际样本,利用最大似然估计法 估计出鱼的数量为50000条,这种估计结果使用起来把握不大实际上,鱼的数量的真值可 能大于500条,也可能小于50000条.且可能偏差较大 若能给出一个估计区间,让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量 的真值被含在这个区间内,这样的估计显然更有实用价值 本节将要引入的另一类估计即为区间估计,在区间估计理论中,被广泛接受的一种观点 是置信区间,它由奈曼 (Neyman)于1934年提出的 分布图示 ★引言 ★置信区间的概念 ★寻求置信区间的方法 ★例1 ★例2 ★例3 ★0-1分布参数的区间估计 ★单侧置信区间 ★例5 ★例6 ★内容小结 ★课堂练习 ★习题6-3 返回 内容要点 置信区间的概念 定义1设0为总体分布的未知参数,X1,X2…,X是取自总体X的一个样本,对给定 的数1-a(0<a<1),若存在统计量 =6(X1,X2,…,Xn),6=6(X1,X2…Xn) 使得 P{6<6<6}=1 则称随机区间(,0)为θ的1-a双侧置信区间,称1-a为置信度,又分别称与b为θ的双 侧置信下限与双侧置信上限 注:1.置信度1-a的含义:在随机抽样中,若重复抽样多次,得到样本X1,X2,…,Xn的 多个样本值(x1,x2,…xn),对应每个样本值都确定了一个置信区间(旦,0),每个这样的区间 要么包含了θ的真值,要么不包含θ的真值.根据伯努利大数定理,当抽样次数充分大时, 这些区间中包含θ的真值的频率接近于置信度(即概率)1-a,即在这些区间中包含O的真 值的区间大约有1001-a)%个,不包含θ的真值的区间大约有100%个.例如,若令 1-a=0.95,重复抽样100次,则其中大约有95个区间包含θ的真值,大约有5个区间不包 含θ的真值 2.置信区间(,6)也是对未知参数O的一种估计,区间的长度意味着误差,故区间估计 与点估计是互补的两种参数估计 3.置信度与估计精度是一对矛盾置信度l-a越大,置信区间(,b)包含θ的真值的概 率就越大,但区间(,b)的长度就越大,对未知参数6的估计精度就越差.反之,对参数 的估计精度越高,置信区间巴,θ)长度就越小,(旦,θ)包含θ的真值的概率就越低,置信度 1-α越小.一般准则是:在保证置信度的条件下尽可能提高估计精度. 二、寻求置信区间的方法 寻求置信区间的基本思想在点估计的基础上,构造合适的函数,并针对给定的置信度第三节 置信区间 前面讨论了参数的点估计, 它是用样本算出的一个值去估计未知参数. 即点估计值仅仅 是未知参数的一个近似值, 它没有给出这个近似值的误差范围. 例如, 在估计某湖泊中鱼的数量的问题中, 若根据一个实际样本, 利用最大似然估计法 估计出鱼的数量为 50000 条, 这种估计结果使用起来把握不大. 实际上, 鱼的数量的真值可 能大于 50000 条, 也可能小于 50000 条.且可能偏差较大. 若能给出一个估计区间, 让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量 的真值被含在这个区间内, 这样的估计显然更有实用价值. 本节将要引入的另一类估计即为区间估计, 在区间估计理论中, 被广泛接受的一种观点 是置信区间, 它由奈曼(Neymann)于 1934 年提出的. 分布图示 ★ 引言 ★ 置信区间的概念 ★ 寻求置信区间的方法 ★ 例1 ★ 例2 ★ 例3 ★ 0 − 1 分布参数的区间估计 ★ 例4 ★ 单侧置信区间 ★ 例5 ★ 例6 ★ 内容小结 ★ 课堂练习 ★ 习题 6-3 ★ 返回 内容要点 一、置信区间的概念 定义 1 设  为总体分布的未知参数, X X Xn , , , 1 2  是取自总体 X 的一个样本, 对给定 的数 1−(0  1) , 若存在统计量 ( , , , ), ( , , , ),  = X1 X2  Xn  = X1 X2  Xn 使得 P{   }=1−, 则称随机区间 (, ) 为  的 1− 双侧置信区间, 称 1− 为置信度, 又分别称  与  为  的双 侧置信下限与双侧置信上限. 注: 1. 置信度 1− 的含义: 在随机抽样中, 若重复抽样多次, 得到样本 X X Xn , , , 1 2  的 多个样本值 ( , , , ) 1 2 n x x  x , 对应每个样本值都确定了一个置信区间 (, ) , 每个这样的区间 要么包含了  的真值, 要么不包含  的真值. 根据伯努利大数定理, 当抽样次数充分大时, 这些区间中包含  的真值的频率接近于置信度(即概率) 1− , 即在这些区间中包含  的真 值的区间大约有 100(1−)% 个, 不包含  的真值的区间大约有 100% 个. 例如, 若令 1− = 0.95 , 重复抽样 100 次, 则其中大约有 95 个区间包含  的真值, 大约有 5 个区间不包 含  的真值. 2. 置信区间 (, ) 也是对未知参数  的一种估计, 区间的长度意味着误差, 故区间估计 与点估计是互补的两种参数估计. 3. 置信度与估计精度是一对矛盾.置信度 1− 越大, 置信区间 (, ) 包含  的真值的概 率就越大, 但区间 (, ) 的长度就越大, 对未知参数  的估计精度就越差. 反之, 对参数  的估计精度越高, 置信区间 (, ) 长度就越小, (, ) 包含  的真值的概率就越低, 置信度 1− 越小. 一般准则是: 在保证置信度的条件下尽可能提高估计精度. 二、寻求置信区间的方法 寻求置信区间的基本思想: 在点估计的基础上, 构造合适的函数, 并针对给定的置信度
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有