区间估计的定义与一般步骤 点估计方法有两个缺陷 (1)不能说明估计值与真值的偏差到底有多大(精 确性) (2)不能说明这个估计有多大的可信度(可靠性);
• 区间估计的定义与一般步骤 点估计方法有两个缺陷: (1)不能说明估计值与真值的偏差到底有多大(精 确性); (2)不能说明这个估计有多大的可信度(可靠性); e
例:设有一批电子元件的寿命XN(a,1),现 从中抽取容量为5的一组样本,算得其样本均 值为5000小时,试估计a
• 例:设有一批电子元件的寿命X~N(a,1),现 从中抽取容量为5的一组样本,算得其样本均 值为5000小时,试估计a.
解:由点估计,a的估计值为a=5000 实际上a的值是非真是5000呢?显然,不同的 抽样,可得到不同的a值,故5000与a会有差 异.这种差异有多大呢? 我们从另一个角度考虑
• 解:由点估计,a的估计值为 . 实际上a的值是非真是5000呢?显然,不同的 抽样,可得到不同的 值,故5000与a会有差 异.这种差异有多大呢? 我们从另一个角度考虑 a ˆ a ˆ = 5000 a ˆ
由于a=x是一个随机变量,它有自己的分布 X~N(a2-) 因此 N(O,1) 于是对给定的一个正数a(0<a<1),有 X-a <z}=1-a PLF. z aX+z=1-a
ˆ 1 ( , ) (0,1) 1 (0 1), { 1 1 1 { X X N a n X a U N n X a P n P X X n n − = − − + 由于a= 是一个随机变量,它有自己的分布 因此, 于是对给定的一个正数 有 <z }=1- 即 z <a< z }=1-
由于a=是一个随机变量,它有自己的分布 X~N(a,-) 因此,r_X-a ~N(0,1) 如果取a=0.05有Z=1.96,于是有 P(10.72<a<1248=095 这就是说,我们有95%的把握认为a在区间 (10.72,12.48)内
ˆ 1 ( , ) (0,1) 1 0.05 1.96, {10.72 12.48 0.95 X X N a n X a U N n P − = = = 由于a= 是一个随机变量,它有自己的分布 因此, 如果取 有Z 于是有 <a< }= 这就是说,我们有95%的把握认为a在区间 (10.72 , 12.48) 内
定义:设总体X的分布中含有未知参数,a 是任意给定的正数(0<a<1)如果能从样本 出发确定出两个统计量(x12X2…Xn) O2(X12H2,…,Xn),使得 P{<0<2}=1-a 成立我们称1-a为置信度或置信概率,区间 (B,2)为参数e的置信度为-a的置信区间分 别称O,O2为置信上限和置信下限
1 2 1 2 2 : X , (0< <1), ˆ ( , , , ), ˆ ( , , , ), ˆ ˆ } 1 , 1 ˆ ˆ , ) 1 . ˆ ˆ , n n X X X X X X = − − − 1 2 1 2 1 2 1 定义 设总体 的分布中含有未知参数 是任意给定的正数 如果能从样本 出发确定出两个统计量 使得 P{ 成立 我们称 为置信度或置信概率,区间 ( 为参数 的置信度为 的置信区间分 别称 为置信上限和置信下限
需要指出 区间估计中的精确性与可靠性是相互矛盾的 当样木容量一定时提高估计的可靠度,将降低 估计的精度,相反,提高估计的精度,将降低 估计的可靠度
• 需要指出: 区间估计中的精确性与可靠性是相互矛盾的. 当样本容量一定时,提高估计的可靠度,将降低 估计的精度,相反,提高估计的精度,将降低 估计的可靠度
区间估计的一般步骤: 1)选取一个合适的随机变量T,这个随机 变量一方面包括了待佔参数,另一方面, 它的分布是已知的; (2)根据实际需要,选取合适的置信度1-c; (3)根据相应分布的分位数概念,写出如下 形式的概率表达式 PT1<T<72}=1-a
2 T T } 1 1 = − 区间估计的一般步骤: (1)选取一个合适的随机变量T,这个随机 变量一方面包括了待估参数 ,另一方面, 它的分布是已知的; (2)根据实际需要,选取合适的置信度1- ; (3)根据相应分布的分位数概念,写出如下 形式的概率表达式 P{T