第九章参数估计 参数估计,通俗地说,就是根据抽样结果来合理地、科学地估计总体的参数 很可能是什么?或者在什么范围 点估计:根据样本数据算出一个单一的估计值,用来估计总体的参数值。 区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础 上,确定总体参数的所在范围或区间 第一节点估计 点估计:点值估计,是以一个最适当的样本统计值来代表总体参数值。 估计量如果具有无偏性、一致性和有效性,就可以认为这种统计量是总体 参数的合理估计或最佳估计 、求点估计值的标准 无偏性:要求统计量抽样分布的均值恰好等于被估计的参数之值。比如,中 心极限定理告诉我们,样本均值抽样分布的均值恰好等于总体均值,因此用样本 均值估计总体均值就满足这个标准 有效性:要求估计值的抽样分布有较小的分散性,即选择抽样分布的标准差 较小的统计量作为估计量 致性:要求统计量随着样本容量n的增大以更大的概率接近被估计参数。 二、点估计值的计算 1.总体均值的点估计 2.总体方差的点估计值 ∑ )2
第九章 参数估计 参数估计,通俗地说,就是根据抽样结果来合理地、科学地估计总体的参数 很可能是什么?或者在什么范围。 点估计:根据样本数据算出一个单一的估计值,用来估计总体的参数值。 区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础 上,确定总体参数的所在范围或区间。 第一节 点估计 点估计:点值估计,是以一个最适当的样本统计值来代表总体参数值。 估计量如果具有无偏性、一致性和有效性,就可以认为这种统计量是总体 参数的合理估计或最佳估计。 一、求点估计值的标准 无偏性:要求统计量抽样分布的均值恰好等于被估计的参数之值。比如,中 心极限定理告诉我们,样本均值抽样分布的均值恰好等于总体均值,因此用样本 均值估计总体均值就满足这个标准。 有效性:要求估计值的抽样分布有较小的分散性,即选择抽样分布的标准差 较小的统计量作为估计量。 一致性:要求统计量随着样本容量 n 的增大以更大的概率接近被估计参数。 二、点估计值的计算 1. 总体均值的点估计 2. 总体方差的点估计值 n X X = 2 2 2 1 ( ) 1 1 S n n X X n S i − − = − =
在统计学中,常常用符号“ 来表示无偏估计量。数学上可以证明,对于 随机样本而言,S才是总体方差的无偏估计量,它称为修正样本方差 [例]研究者要调査某社区居民家庭收入分布的差异情况,现随机抽查了10 户,得到样本方差为=200(元2)。试以此资料估计总体家庭收入分布的差异情 [解]因为样本容量较小,宜用修正样本方差作为总体方差点估计量。 200=222 10-1 第二节区间估计 区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估 计到的概率大大增加。可靠性和精确性(即信度和效度)在区间估计中是相互矛盾 的两个方面。 、有关区间估计的几个概念 1.置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了 增加参数被估计到的信心而在点估计两边设置的估计区间。 2.显著性水平α:用置信区间来估计的不可靠程度 3.置信度(水平)1-α:用置信区间估计的可靠性(把握度) 抽样平均误差与概率度2 抽样平均误差 :样本均值抽样分布的标准差。反映在参数周围 抽样平均值的平均变异程度 x越大,样本均值越分散。 概率度:Z在参数估计中被称为概率度,其大小由α决定
在统计学中,常常用符号“ ” 来表示无偏估计量。数学上可以证明,对于 随机样本而言, 才是总体方差 的无偏估计量,它称为修正样本方差 。 [例]研究者要调查某社区居民家庭收入分布的差异情况,现随机抽查了 10 户,得到样本方差为=200(元 2)。试以此资料估计总体家庭收入分布的差异情 况。 [解] 因为样本容量较小,宜用修正样本方差作为总体方差点估计量。 即 = = =222.2 第二节 区间估计 区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估 计到的概率大大增加。可靠性和精确性(即信度和效度)在区间估计中是相互矛盾 的两个方面。 一、有关区间估计的几个概念 1. 置信区间:区间估计是求所谓置信区间的方法。置信区间就是我们为了 增加参数被估计到的信心而在点估计两边设置的估计区间。 2. 显著性水平α:用置信区间来估计的不可靠程度。 3. 置信度(水平)1-α:用置信区间估计的可靠性(把握度) 4. 抽样平均误差 与概率度 Z 抽样平均误差 :样本均值抽样分布的标准差。反映在参数周围 抽样平均值的平均变异程度。 越大,样本均值越分散。 概率度:Z 在参数估计中被称为概率度,其大小由α决定。 S 2 ˆ S 2 2 1 S n n− 200 10 1 10 − 2 ˆ S X X X
显著性水平、置信水平、概率度之间的关系: =0.10时, =0.90,Za/2=1.65 0.05时, 0.95,Za/2=1.96 =0.01时, =0.99,Za/2=2.58 区间估计的做法 从点估计值开始,向两侧展开一定倍数的抽样平均误差,并估计总体参数很 可能就包含在这个区间之内。 Aiti> 1.96 1.960 1.960 1.960x 1.96 1.96σ 对参数μ的区间估计的步骤 首先从总体抽取一个样本,根据收集的样本资料求出它的均 2.根据合乎实际的置信水平查表求得概率度 3.根据总体标准差和样本容量求出抽样平均误差 4.以均值为基准,向两侧展开Z倍抽样平均误差的区间
显著性水平、置信水平、概率度之间的关系: =0.10 时, =0.90,Z α/2=1.65 =0.05 时, =0.95,Z α/2=1.96 =0.01 时, =0.99,Z α/2=2.58 二、区间估计的做法 从点估计值开始,向两侧展开一定倍数的抽样平均误差,并估计总体参数很 可能就包含在这个区间之内。 对参数μ 的区间估计的步骤: 1. 首先从总体抽取一个样本,根据收集的样本资料求出它 的均 值。 2. 根据合乎实际的置信水平查表求得概率度 3. 根据总体标准差和样本容量求出抽样平均误差 4. 以均值为基准,向两侧展开 Z 倍抽样平均误差的区间。 X − Z X X + Z X
抽样极限误差(更普遍地可以写成抽样估计的允许误差) 抽样估计的精度 三、大样本,总体均值的区间估计 (根据总体方差是否知道,估计分两种情况) 已知 2.□未知,用s代替 ≤X+ [例]设某工厂妇女从事家务劳动服从正态分布 N[μ,0.662],根据36人的随机抽样调查,样本每天平均从事家 务劳动的时间为2.65小时,求μ的置信区间(置信度1-a=0.95)。 [例]从某校随机地抽取100名男学生,测得平均身高为170厘米,标准差 为7.5厘米,试求该校学生平均身高95%的置信区间 第三节其他类型的置信区间 1.小样本,且为正态总体,总体均值的区间估计(用t分布)
抽样极限误差(更普遍地可以写成抽样估计的允许误差 ) 抽样估计的精度 三、大样本,总体均值的区间估计 ( 根据总体方差是否知道,估计分两种情况) 1. 已知 2. 未知,用 S 代替 [例] 设某工厂妇女从事家务劳动服从正态分布 N [μ,0.662 ],根据 36 人的随机抽样调查,样本每天平均从事家 务劳动的时间为 2.65 小时,求μ的置信区间(置信度 1-α=0.95)。 [例] 从某校随机地抽取 100 名男学生,测得平均身高为 170 厘米,标准差 为 7.5 厘米,试求该校学生平均身高 95%的置信区间。 第三节 其他类型的置信区间 1. 小样本,且为正态总体 ,总体均值的区间估计(用 t 分布) X = Z XX A = − X 1 2 n X Z n X Z − / 2 + / 2 2 n S X Z n S X − Z / 2 + / 2 = − − − ) 1 / 1 ( / 2 t S n X p
C/2 ≤X [例]在一个正态总体中抽取一个容量为25的样本,其均值为52,标准 差为12,求置信水平为95%的总体均值的置信区间 2.大样本总体成数的估计 从总体的均值估计过渡到总体的成数估计,其方法和思路完全相同,只 要用N代替 xn圆 若总体成数未知,允许误差取 pa a/2 三、总体方差的区间估计 由第八章X分布的性质,我们知道有 72AS2 r( 因此,对于给定的置信水平,总体方差的区间估计为 (A) (k)
[例] 在一个正态总体中抽取一个容量为 25 的样本,其均值为 52,标准 差为 12,求置信水平为 95%的总体均值的置信区间。 2. 大样本总体成数的估计 从总体的均值估计过渡到总体的成数估计,其方法和思路完全相同,只 要用 代替 ,用 代替 若总体成数未知,允许误差取 三、总体方差的区间估计 由第八章 X 2分布的性质,我们知道有 因此,对于给定的置信水平 ,总体方差的区间估计为 1 1 / 2 / 2 − + − − n S X t n S X t p X n pq n ( , ) / 2 / 2 n pq p Z n pq p− Z + n p q e Z = / 2 ~ ( 1) 2 2 2 n − nS ( ) ( ) 2 1 / 2 2 2 2 / 2 2 k nS k nS −
第四节抽样平均误差 1.简单随机抽样 回置抽样 不回置抽样 校正因子 主要用于总体不够大时。 抽样设计效果指标deff detr Deff<1,说明该抽样方式误差小于简单随机抽样 2.分层抽样 层内方差的平均(层间方差不进入) 7.O O Oi 回置抽样 o(Xs)
第四节 抽样平均误差 1. 简单随机抽样 回置抽样 不回置抽样 校正因子 主要用于总体不够大时。 抽样设计效果指标 deff Deff<1,说明该抽样方式误差小于简单随机抽样 2.分层抽样 层内方差的平均(层间方差不进入): 回置抽样: n X = n pq p = N n N n N n n X − − − = 1 1 − N n 1 ) ˆ ( ) ˆ ( 0 1 D D deff = = = 2 2 2 i i i i st n n n n n n X st i i i i st = = = 2 2 2 ( )
不回置抽样 o(Xs) VN 3.整群抽样 总体可看作是以群为单位的简单随机抽样。 群间方差(群内方差不进入): ∑(X1-) 整群抽样平均误差: 第五节 样本容量的确定 回置 不回置 Nzo △N+Zo
不回置抽样 3.整群抽样 总体可看作是以群为单位的简单随机抽样。 群间方差(群内方差不进入): 整群抽样平均误差: 第五节 样本容量的确定 回置 不回置 N n n X st ( st) = 1− R X R i i = − = 1 2 2 ( ) r Xcl ( ) = n X Z = n X Z = 2 2 2 x Z n = n pq p = Z 2 2 p Z pq n = N n n X = Z 1− 2 2 2 2 2 N Z NZ n X + =
设某市家庭月户均收入服从正态分布,标准差为160元,现要对该市家庭之 月平均收入加以估计, (1)若置信水平为95%,平均收入的最大误差在10元以内,问样本容量为 多少? (2)若置信水平为90%,平均收入的最大误差在10元以内,问样本容量为 多少? (3)若置信水平为99%,平均收入的最大误差在10元以内,问样本容量为 多少? (4)若置信水平为95%,平均收入的最大误差在20元以内,问样本容量为 多少? (5)改变最大误差,对样本大小有什么影响? (6)改变置信水平,对样本大小有什么影响?(983,697,1704,246) 4、从7225名社区居民中以不回置法抽取500成人的调查显示,51%的回答 者认为“父母在必要时应该打小孩”。尽管大部分儿童成长专家说,打是不恰当 的。请指出在置信水平为99%时成人总体参数P的估计的最大误差。 5、进行电话调查来估计有个人电脑的住户的比例。被调查的350户中,75 户有个人电脑。(1)给出有个人电脑的总体比例的点估计;(2)给出95%的置信 度时估计的最大误差
设某市家庭月户均收入服从正态分布,标准差为 160 元,现要对该市家庭之 月平均收入加以估计, (1)若置信水平为 95%,平均收入的最大误差在 10 元以内,问样本容量为 多少? (2)若置信水平为 90%,平均收入的最大误差在 10 元以内,问样本容量为 多少? (3)若置信水平为 99%,平均收入的最大误差在 10 元以内,问样本容量为 多少? (4)若置信水平为 95%,平均收入的最大误差在 20 元以内,问样本容量为 多少? (5)改变最大误差,对样本大小有什么影响? (6)改变置信水平,对样本大小有什么影响? (983,697,1704,246) 4、从 7225 名社区居民中以不回置法抽取 500 成人的调查显示,51%的回答 者认为“父母在必要时应该打小孩”。尽管大部分儿童成长专家说,打是不恰当 的。请指出在置信水平为 99%时成人总体参数 P 的估计的最大误差。 5、进行电话调查来估计有个人电脑的住户的比例。被调查的 350 户中,75 户有个人电脑。(1)给出有个人电脑的总体比例的点估计;(2)给出 95%的置信 度时估计的最大误差