第九章參数估计 第一节点估计 点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性) 第二节区间估计 抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大 样本总体均值的区间估计 第三节其他类型的置信区间 a未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区 间估计 第四节抽样平均误差 简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均 抽样误差·系统抽样的抽样平均误差 第五节样本容量的确定 影响样本容量的因素·抽样条件与样本容量的确定 填空 1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和()。 2.对总体均值求置信区间的方法是:从()起向两侧展开一定倍数()的抽 样平均误差O,并估计很可能就包含在这个区间之内 3.假设在某省抽样调查的1600名城镇待业人员中有1024名青年,则待业人员中青年 占比重的0.95置信区间为()。 4.在其他条件不变得情况下,如果允许误差缩小为原来的1/2,则样本容量将增加为原 来的() 二、单项选择 1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认 为是()估计 A有效 C无偏 D精确 2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来 越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个()的估计量 A有效 B一致 C无偏 D精确 3.估计量的()指统计量的抽样分布集中在真实参数周围的程度。 A有效性B一致性C无偏性D精确性 4.用简单随机重复抽样方法抽样,如果要使抽样误差降低50%,则样本容量需要扩大 到原来的()。 A2倍 C4倍 D5倍
第九章 参数估计 第一节 点估计 点估计的概念·总体参数合理估计的标准(无偏性、一致性、有效性) 第二节 区间估计 抽样估计的精确性和可靠性·抽样平均误差与概率度·区间估计的步骤及大 样本总体均值的区间估计 第三节 其他类型的置信区间 σ未知,小样本总体均值的区间估计·总体成数的区间估计·总体方差的区 间估计 第四节 抽样平均误差 简单随机抽样的抽样平均误差·分层抽样的抽样平均误差·整群抽样的平均 抽样误差·系统抽样的抽样平均误差 第五节 样本容量的确定 影响样本容量的因素·抽样条件与样本容量的确定 一、填空 1.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和( )。 2.对总体均值求置信区间的方法是:从( )起向两侧展开一定倍数( )的抽 样平均误差(),并估计 很可能就包含在这个区间之内。 3.假设在某省抽样调查的 1600 名城镇待业人员中有 1024 名青年,则待业人员中青年 占比重的 0.95 置信区间为( )。 4.在其他条件不变得情况下,如果允许误差缩小为原来的 1/2,则样本容量将增加为原 来的( )。 二、单项选择 1.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认 为是( )估计。 A 有效 B 一致 C 无偏 D 精确 2.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来 越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个( )的估计量。 A 有效 B 一致 C 无偏 D 精确 3.估计量的( )指统计量的抽样分布集中在真实参数周围的程度。 A 有效性 B 一致性 C 无偏性 D 精确性 4.用简单随机重复抽样方法抽样,如果要使抽样误差降低 50%,则样本容量需要扩大 到原来的( )。 A 2 倍 B 3 倍 C 4 倍 D 5 倍
5.除抽样误差σ外,影响允许误差Δx大小的因素还有 A总体标准差B样本标准差C推断估计的把握程度D随机因素 6.在用样本指标推断总体指标时,把握程度越高则()。 A误差范围越小 B误差范围越大 C抽样平均误差越小 D抽样平均误差越大 三、多项选择 1.在统计中,为了确定每一种估计究竟如何,就必须掌握以下标准()。 A无偏性B精确性C一致性D有效性E权变性 2.对于大样本,置信区间的大小主要由()这两个量所决定。 DE(X 3.影响抽样误差的因素有()。 A总体标志变异程度 B样本标志值的大小 C样本容量 D抽样方法 E抽样方式 4.影响样本容量大小的因素有()。 A总体标准差大小 B允许误差的大小 C置信度 D抽样方法 E抽样方式 5.在其他条件不变的情况下,抽样极限误差的大小与置信度的关系是( A抽样极限误差范围越大,置信度越大 B成正比关系 C抽样极限误差范围越小,置信度越小 D成反比关系 E抽样极限误差范围越大,置信度越小 6.分层抽样误差的大小主要取决于()。 A总体标志值的变异程度 B各层内标志值的变异程度 C各层间标志值得变异程度D各层样本容量的大小 E各层样本容量的分配方法 在概率度一定的条件下, A置信区间越大,应抽取的单位数越多 B置信区间越小,应抽取的单位数越多 C抽样估计的效度要求越高,应抽取的单位数越少 D抽样估计的效度要求越低,应抽取的单位数越少 E应抽取的单位数也是确定的 四、名词解释 点估计 2.区间估计 3.置信区间 五、判断题
5.除抽样误差 σX 外,影响允许误差 ΔX 大小的因素还有( )。 A 总体标准差 B 样本标准差 C 推断估计的把握程度 D 随机因素。 6.在用样本指标推断总体指标时,把握程度越高则( )。 A 误差范围越小 B 误差范围越大 C 抽样平均误差越小 D 抽样平均误差越大 三、多项选择 1.在统计中,为了确定每一种估计究竟如何,就必须掌握以下标准( )。 A 无偏性 B 精确性 C 一致性 D 有效性 E 权变性 2.对于大样本,置信区间的大小主要由( )这两个量所决定。 A Z B C X D E(X) 3.影响抽样误差的因素有( )。 A 总体标志变异程度 B 样本标志值的大小 C 样本容量 D 抽样方法 E 抽样方式 4.影响样本容量大小的因素有( )。 A 总体标准差大小 B 允许误差的大小 C 置信度 D 抽样方法 E 抽样方式 5.在其他条件不变的情况下,抽样极限误差的大小与置信度的关系是( )。 A 抽样极限误差范围越大,置信度越大 B 成正比关系 C 抽样极限误差范围越小,置信度越小 D 成反比关系 E 抽样极限误差范围越大,置信度越小 6.分层抽样误差的大小主要取决于( )。 A 总体标志值的变异程度 B 各层内标志值的变异程度 C 各层间标志值得变异程度 D 各层样本容量的大小 E 各层样本容量的分配方法 7.在概率度一定的条件下,( )。 A 置信区间越大,应抽取的单位数越多 B 置信区间越小,应抽取的单位数越多 C 抽样估计的效度要求越高,应抽取的单位数越少 D 抽样估计的效度要求越低,应抽取的单位数越少 E 应抽取的单位数也是确定的 四、名词解释 1.点估计 2.区间估计 3.置信区间 五、判断题
1.就参数估计而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。() 2.抽样平均误差x可以认为是决定区间估计信度的关键因素。 3.进行区间估计,置信水平总是预先给定的 4.在参数估计中,概率度的大小由显著性水平a所决定,它可以认为是决定区间估计 信度的关键因素 5.可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-a)”。() 六、计算题 1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:X=235(岁),S=3 (岁),求置信水平为95%的初婚年龄的置信区间。(已知to.0s(21)=1.721、to.。5(20) =1.725、10.025(21)=2.080、o,025(20)=2.086)。 2.某工厂妇女从事家务劳动时间服从正态分布N(μ,062)。根据36人的随机抽 样调查,每天平均从事家务劳动时间X为:X=2,65小时。求的双侧置信区间(置信度 取0.95和0.99两种)。 3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P 的置信区间(置信度为0.95)。 4.某工厂根据200名青年职工的抽样调查,得知其中有60%参加各种形式的业余学习 求青年职工参加业余学习成数的区间估计。(置信水平取0.90 5.电视台要调查电视观众收看电视剧《渴望》的收视率。问在95%的置信度下,允许 误差+5%,问样本容量需要多大才能最大限度地满足调查要求? 6.某企业有职工1385人,现从中随机抽出50人调査其工资收入情况如下 月收入(元)220285310330375405440495530 工人数(人)46 10 3 2 试以0.95的置信度估计该企业职工的 工资收入所在范围。 某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:9.6、10.2、98、 100、10.4、9.8、10.2。如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛 肉干盒平均重量的置信区间是多少? 8.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米 试求该校女生平均身高95%的置信区间 9.如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估 计误差不超过6%,试问调查的样本容量应该有多大?
1.就参数估计而言,在精确性和可靠性两因素之中,精确性是矛盾的主要方面。( ) 2.抽样平均误差 X 可以认为是决定区间估计信度的关键因素。 ( ) 3.进行区间估计,置信水平总是预先给定的。 ( ) 4.在参数估计中,概率度的大小由显著性水平 所决定,它可以认为是决定区间估计 信度的关键因素。 ( ) 5.可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1- )”。 ( ) 六、计算题 1.已知初婚年龄服从正态分布,根据 21 个人的抽样调查有: X = 23.5 (岁), S = 3 (岁),求置信水平为95%的初婚年龄的置信区间。(已知 t0。05(21) =1.721、t0。05(20) =1.725、t0。025(21) =2.080、t0,025(20) =2.086)。 2.某工厂妇女从事家务劳动时间服从正态分布 N( , 2 0.66 )。根据 36 人的随机抽 样调查,每天平均从事家务劳动时间 X 为: X =2.65 小时。求 的双侧置信区间(置信度 取 0.95 和 0.99 两种)。 3.根据某地 100 户的随机抽查,其中有 60 户拥有电冰箱,求该地区拥有电冰箱成数 P 的置信区间(置信度为 0.95)。 4.某工厂根据 200 名青年职工的抽样调查,得知其中有 60%参加各种形式的业余学习。 求青年职工参加业余学习成数的区间估计。(置信水平取 0.90) 5.电视台要调查电视观众收看电视剧《渴望》的收视率。问在 95%的置信度下,允许 误差 +5% ,问样本容量需要多大才能最大限度地满足调查要求? 6.某企业有职工 1385 人,现从中随机抽出 50 人调查其工资收入情况如下: 月收入(元) 220 285 310 330 375 405 440 495 530 工人数(人) 4 6 6 8 10 7 4 3 2 试以 0.95 的置信度估计该企业职工的月平均工资收入所在范围。 7.某食品公司所生产的牛肉干中,随机抽 7 盒,称得各盒重量如下:9.6、10.2、9.8、 10.0、10.4、9.8、10.2。如牛肉干盒重量近似于正态分布,求置信水平为 95%的情况下,牛 肉干盒平均重量的置信区间是多少? 8.从某校随机地抽取 81 名女学生,测得平均身高为 163 厘米,标准差为 6.0 厘米, 试求该校女生平均身高 95%的置信区间。 9.如果认为该市农民工参保率是 35%,若要求在 95%的置信水平上保证这一比例的估 计误差不超过 6%,试问调查的样本容量应该有多大?
0.若某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03的95%的 置信区间,需要多大样本?若住房拥有者的比例改为0.5,那么建立总宽度为0.03的95% 的置信区间,又需要多大样本? 1l.已知总体X服从正态分布N(100,3),X1,X2,…Xn是正态总体X的样 本,X为样本均值,若概率P{X≤101}≥0.95,问样本容量n至少应取多大? 七、问答题 简述统计量成为总体参数的合理估计的三个标准 2.简述在参数估计中准确性和可靠性的辨正统一的关系
10.若某一居民小区中住房拥有者的比例近似 0.75,那么建立总宽度为 0.03 的 95%的 置信区间,需要多大样本?若住房拥有者的比例改为 0. 5,那么建立总宽度为 0.03 的 95% 的置信区间,又需要多大样本? 11. 已知总体 X 服从正态分布 N (100,3 2 ), X1 , X2 ,… Xn 是正态总体 X 的样 本, X 为样本均值,若概率 P { X ≤101}≥0.95,问样本容量 n 至少应取多大? 七、问答题 1.简述统计量成为总体参数的合理估计的三个标准。 2.简述在参数估计中准确性和可靠性的辨正统一的关系
参考答案 填空 1.区间估计2.点估计值X、23.σ4.(61.648%66352%)5.4倍 二、单项选择 1.C2.B3.A4.C5.C6.B 三、多项选择 1. ACD 2 AC 3. ACDE 4. ABCDE 5ACd 6. BDE 7 BC 四、名词解释 1.点估计 所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。 2.区间估计 所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上 确定总体参数的所在范围或区间。 3.置信区间 置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间 五、判断题 1.(√) (×)3.(√)4.(√)5.(× 六、计算题 1.【22.10,2490】 已知a=005,10.025(20)=2.086, =0.67 X±la2 23.5±2.086×0.67=23.5±1.39762 置信区间为2.10和24.90之间 2.【24344,2.8656】、【2.3662,2.9338】 已知a=05,=m2=1.%6,X-zS ≤H≤X+7S 0.66 ,265±1.96 24344,2.8656】 已知a=01,258,2-zn25≤≤x+乙n238,265±238:06 n 【23662,2.9338】
参考答案 一、填空 1.区间估计 2.点估计值 X 、Z 3. X 4.〔61.648%,66.352% 〕 5.4 倍 二、单项选择 1. C 2. B 3.A 4.C 5.C 6.B 三、多项选择 1.ACD 2.AC 3.ACDE 4.ABCDE 5.ACD 6.BDE 7.BC 四、名词解释 1.点估计 所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。 2.区间估计 所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上, 确定总体参数的所在范围或区间。 3.置信区间 置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。 五、判断题 1.( √ ) 2.( × ) 3.( √ ) 4.( √ ) 5.( × ) 六、计算题 1. 【22.10,24.90】 已知 =0.05,t0,025(20) =2.086, n −1 S = 21 1 3 − =0.67 X ± / 2 t n −1 S =23.5±2.086 0.67=23.5±1.39762 置信区间为 22.10 和 24.90 之间 2. 【2.4344,2.8656】、【2.3662,2.9338】 已知 =0.05, / 2 z =1.96,X - Z / 2 n S ≤ ≤ X + Z / 2 n S ,2.65±1.96 36 0.66 = 【2.4344,2.8656】 已知 =0.01, / 2 z =2.58,X - Z / 2 n S ≤ ≤ X + Z / 2 n S ,2.65±2.58 36 0.66 = 【2.3662,2.9338】
3.【0.5040,0.6960】 已知a=0.05,=1.96,置信区间为 0.6*0.4 (p-z 0.5040,0.69 100 4.【0.5428,0.6572】 5.【384,样本取整数400】 6.【355.6,363.6】 【338.5,380.6】 x-zn2≤≤X+Z S (已知 196,)3596± 19676=【38386 7.【9.74.10.24】 【9.74.10.26】 X X96+102+98+10+104+9.8+10.2 x (X X 0.262 )=10±2.4469× =【9.74.10.26】 8.【161.7,164.3】 10.【3201】【4268】 np 100 q=0.09,则p=0.91,所以n=x,=10989 0.91 七、问答题 简述统计量成为总体参数的合理估计的三个标准 估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体 参数的合理估计或最佳估计。 (1)无偏性 如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是
3. 【0.5040,0.6960】 已知 =0.05, / 2 z =1.96,置信区间为 ( p - Z / 2 n pq , p + Z / 2 n pq )0.6±1.96 100 0.6*0.4 =【0.5040,0.6960】 4. 【0.5428,0.6572】 5. 【384,样本取整数 400】 6. 【355.6,363.6】 【338.5,380.6】 N= f =50, X = f fX =359.6, S = ( ) N X − X 2 =76, X - Z / 2 n S ≤ ≤ X + Z / 2 n S ,(已知 =0.05, / 2 z =1.96,)359.6± 1.96 50 76 =【338.5,380.6】 7. 【9.74,10.24】 【9.74,10.26】 X = N X = 7 9.6 +10.2 + 9.8 +10 +10.4 + 9.8 +10.2 =10 S = ( ) N X − X 2 =0.262,已知 =0.05, (6) / 2 t =2.4469 ( X − / 2 t n −1 S , X + / 2 t n −1 S ) =10±2.4469 7 1 0.262 − =【9.74,10.26】 8. 【161.7,164.3】 9. 【971】 10.【3201】【4268】 11. 109.89 np=100,npq=9, q=0.09,则 p=0.91,所以 n= 0.91 100 =109.89 七、问答题 1. 简述统计量成为总体参数的合理估计的三个标准。 估计量如果具有无偏性、一致性和有效性这三个要求或标准,就可以认为这种统计量是总体 参数的合理估计或最佳估计。 (1)无偏性 如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是
无偏估计。 (2)一致性 虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接 近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量 3)有效性 估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。如果估计是无偏的, 就可以用估计量的标准差来量度这种集中程度。标准差越小,估计量的有效性越高。 总而言之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳 估计量。数理统计知识证明,只要样本容量大一些,用样本均值作为总体均值的估计量,总 能满足上述三个标准,所以可以认为这是质量很高的点估计。 2.简述在参数估计中准确性和可靠性的辨正统一的关系 精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。两者的对立统一,停 留在经验描述水平上是无法真正讲清楚的。这就要从参数估计的角度(而不仅仅是从假设检 验的角度)来运用概率论。粗略地讲,效度和信度是成反比的。当精确程度达到最大而可信 程度达到最小时,就过渡到了点估计。但若仔细分析不难发现,在参数估计中对效度和信度 的要求并不是并重的。由于复杂系统内部事物矛盾运动的客观统计规律性,我们可以做点估 计,即使这时估计区间为零,但估计对总体仍有一定的代表性。我们却不可以将估计区间任 意放大,这样获得的可靠性对统计推论将没有任何意义。所以就此而言,在精确性和可靠性 两因素之中,精确性是矛盾的主要方面
无偏估计。 (2)一致性 虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接 近总体参数,满足这种情况,我们就说该统计量对总体参数是一个一致的估计量。 (3)有效性 估计量的有效性指统计量的抽样分布集中在真实参数周围的程度。如果估计是无偏的, 就可以用估计量的标准差来量度这种集中程度。标准差越小,估计量的有效性越高。 总而言之,如果一个估计量满足无偏性、一致性和有效性这三条准则,就可称其为最佳 估计量。数理统计知识证明,只要样本容量大一些,用样本均值作为总体均值的估计量,总 能满足上述三个标准,所以可以认为这是质量很高的点估计。 2.简述在参数估计中准确性和可靠性的辨正统一的关系。 精确性和可靠性(即效度和信度)在抽样估计中是相互矛盾的两个方面。两者的对立统一,停 留在经验描述水平上是无法真正讲清楚的。这就要从参数估计的角度(而不仅仅是从假设检 验的角度)来运用概率论。粗略地讲,效度和信度是成反比的。当精确程度达到最大而可信 程度达到最小时,就过渡到了点估计。但若仔细分析不难发现,在参数估计中对效度和信度 的要求并不是并重的。由于复杂系统内部事物矛盾运动的客观统计规律性,我们可以做点估 计,即使这时估计区间为零,但估计对总体仍有一定的代表性。我们却不可以将估计区间任 意放大,这样获得的可靠性对统计推论将没有任何意义。所以就此而言,在精确性和可靠性 两因素之中,精确性是矛盾的主要方面