§7.4区间佔计 0、引言: 从点估计中,我们知道:若只是对总体的某个未知参数O的值进行统计推断,那么点估 计是一种很有用的形式,即只要得到样本观测值(x1,x2…,xn),点估计值θ(x1,x2…,xn)能给 我们对θ的值有一个明确的数量概念。但是O(x1,x2……xn)仅仅是的一个近似值,它并没 有反映出这个近似值的误差范围,这对实际工作都来说是不方便的,而区间估计正好弥补了 点估计的这个缺陷。前面我们知道:区间估计是指由两个取值于⊙的统计量O1,O2组成一个 区间,对于一个具体问题得到的样本值之后,便给出了一个具体的区间[e,B2],使参数 尽可能地落在该区间内 事实上,由于B1,2是两个统计量,所以[61,2]实际上是一个随机区间,它覆盖O(即 ∈[e,B21)就是一个随机事件,而P0∈/0,62刀就反映了这个区间估计的可信程度; 另一方面,区间长度θ2-θ1也是一个随机变量,E(O2-B1反映了区间估计的精确程度。我们 自然希望反映可信程度越大越好,反映精确程度的区间长度越小越好。但在实际问题,二者 常常不能兼顾。为此,这里引入置信区间的概念,并给出在一定可信程度的前提下求置信区 间的方法,使区间的平均长度最短。 、置信区间的概念 定义1:设总体X的分布函数F(x,O)含有一个未知参数O,对于给定的a(0<a<1),若 由样本(x1,X2…Xn)确定的两个统计量(X1,X2…Xn)和2(X1,X2…Xn)满足: p{61≤6≤62}=1-a 则称:[O,O2为θ的置信度为1-a的置信区间,1-a称为置信度或置信水平,1称为双侧置 信区间的置信下限,2称为置信上限。 当X是连续型随机变量时,对于给定的a,我们总是按要求p{O1≤0≤02}=1-a求出 置信区间;而当X是离散型随机变量时,对于给定的α,我们常常找不到区间[O1,O2-]使得 p(B1≤O≤a2}恰为1-a,此时我们取找区间O1,02至少为1-a且尽可能接近1-a。12 §7.4 区间估计 0、引言: 从点估计中,我们知道:若只是对总体的某个未知参数 的值进行统计推断,那么点估 计是一种很有用的形式,即只要得到样本观测值 ( , , ) 1 2 n x x x ,点估计值 ( , , ) 1 2 n x x x 能给 我们对 的值有一个明确的数量概念。但是 ( , ) 1 2 n x x x 仅仅是 的一个近似值,它并没 有反映出这个近似值的误差范围,这对实际工作都来说是不方便的,而区间估计正好弥补了 点估计的这个缺陷。前面我们知道:区间估计是指由两个取值于 的统计量 1 , 2 组成一个 区间,对于一个具体问题得到的样本值之后,便给出了一个具体的区间[ 1 , 2 ],使参数 尽可能地落在该区间内。 事实上,由于 1 , 2 是两个统计量,所以[ 1 , 2 ]实际上是一个随机区间,它覆盖 (即 [ 1 , 2 ])就是一个随机事件,而 P{ [ , ]} 1 2 就反映了这个区间估计的可信程度; 另一方面,区间长度 2 − 1 ˆ 也是一个随机变量, ( ) 2 1 E − 反映了区间估计的精确程度。我们 自然希望反映可信程度越大越好,反映精确程度的区间长度越小越好。但在实际问题,二者 常常不能兼顾。为此,这里引入置信区间的概念,并给出在一定可信程度的前提下求置信区 间的方法,使区间的平均长度最短。 一、置信区间的概念 定义 1:设总体 X 的分布函数 F(x; ) 含有一个未知参数 ,对于给定的 (0 1) ,若 由样本 ( , , ) X1 X2 Xn 确定的两个统计量 ( , , ) 1 X1 X2 Xn 和 ( , , ) 2 X1 X2 Xn 满足: p{1 2 } = 1− ………………………………(*) 则称:[ 2 1 , ]为 的置信度为 1− 的置信区间, 1− 称为置信度或置信水平, 1 称为双侧置 信区间的置信下限, 2 称为置信上限。 当 X 是连续型随机变量时,对于给定的 ,我们总是按要求 p{1 2 } = 1− 求出 置信区间;而当 X 是离散型随机变量时,对于给定的 ,我们常常找不到区间[ 2 1 , ]使得 { } p 1 2 恰为 1− ,此时我们取找区间 2 1 , 至少为 1− 且尽可能接近 1−