《统计学精品课程文件之三 《统计学》课程教案 第六章抽样调查 教学目的:1、理解抽样调查的概念、作用及与抽样调查相关的大数定律和中心极限定律 的意义 2、熟练掌握抽样调查中的基本概念 3、熟练掌握抽样估计的基本方法 4、熟练掌握其他抽样组织方式及其抽样估计 [教学重点与难点]:1、抽样调查中的基本概念 2、抽样估计的基本方法 教学时数]:6课时 §1、抽样调查的意义 、抽样调查的概念 抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观察, 并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计 判断,从而达到对全部研究对象的认识的一种统计方法 、抽样调查的特点 (一)、根据部分实际资料对全部总体的数量特征做出估计。 (二)、按随机的原则从全部总体中抽取样本单位。 (三)、抽样推断的抽样误差可以事先计算并且加以控制。 抽样调查的适应范围 (一)、对某些不可能进行全面调査而又要了解其全面情况的社会经济现象,必须应用 抽样调查 (二)、对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间、费用, 提高调查的时效性。 (三)、抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。 (四)、抽样调查可以用于工业生产过程的质量控制 (五)、利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假设的真 伪,以决定行动的取舍。 抽样调查的理论基础 (一)、大数法则:关于大量的随机现象具有稳定性质的法则 (二)、中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变 量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便 趋近于正态分布 §2、抽样调查中的基本概念及理论依据 总体与样本 (一)、总体与总体指标 1、总体:是根据研究目的确定的所要研究的同类事物的全体。总体单位数称为总体容 量,一般用N表示。 2、总体指标:用来反映总体数量特征的指标 (二)、样本与样本指标 1、样本:从总体中抽取的部分总体单位所构成的整体。样本所包含的总体单位个数称 为样本容量,一般用n表示。在实际工作中,人们通常把n≥30的样本称为大
《统计学精品课程文件之三 《统计学》课程教案 5-1 第六章 抽样调查 [教学目的]: 1、理解抽样调查的概念、作用及与抽样调查相关的大数定律和中心极限定律 的意义 2、熟练掌握抽样调查中的基本概念 3、熟练掌握抽样估计的基本方法 4、熟练掌握其他抽样组织方式及其抽样估计 [教学重点与难点]: 1、抽样调查中的基本概念 2、抽样估计的基本方法 [教学时数]:6 课时 §1、抽样调查的意义 一、抽样调查的概念: 抽样调查是按照随机原则从全部研究对象中抽取一部分单位进行观察, 并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计 判断,从而达到对全部研究对象的认识的一种统计方法。 二、抽样调查的特点: (一)、根据部分实际资料对全部总体的数量特征做出估计。 (二)、按随机的原则从全部总体中抽取样本单位。 (三)、抽样推断的抽样误差可以事先计算并且加以控制。 三、抽样调查的适应范围: (一)、对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必须应用 抽样调查。 (二)、对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间、费用, 提高调查的时效性。 (三)、抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。 (四)、抽样调查可以用于工业生产过程的质量控制。 (五)、利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假设的真 伪,以决定行动的取舍。 三、抽样调查的理论基础 (一)、大数法则:关于大量的随机现象具有稳定性质的法则。 (二)、中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变 量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便 趋近于正态分布。 §2、抽样调查中的基本概念及理论依据 一、总体与样本 (一)、总体与总体指标 1、总体:是根据研究目的确定的所要研究的同类事物的全体。总体单位数称为总体容 量,一般用N 表示。 2、总体指标:用来反映总体数量特征的指标。 (二)、样本与样本指标 1、样本:从总体中抽取的部分总体单位所构成的整体。样本所包含的总体单位个数称 为样本容量,一般用n表示。在实际工作中,人们通常把n≥30的样本称为大
《统计学精品课程文件之三 《统计学》课程教案 样本,而把n<30的样本称为小样本。 2、样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综合指标。 三、抽样框:是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽样框的好 坏通常会直接影响到抽样的随机性和调查的效果。 抽样框的主要形式有三种 (一)、名单抽样框:即列出全部总体单位的名录一览表,如职工名单、企业名单等。 (二)、区域抽样框:即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。 (三)、时间表抽样框:即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个 小的时间单位,以此时间单位为抽样单位 四、抽样方法和样本可能数目 (一)、样本的可能数目既和样本的容量有关,也和抽样的方法有关。根据取样方式的不 同,抽样方法有重复抽样和不重复抽样两种。 1、重复抽样:是指从总体的M个单位中抽取一个容量为m的样本,每次抽出一个单 位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一 个样本。 2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下的总 体单位中抽取。 (二)、重复抽样与不重复抽样的区别: 1、重复抽样:同一总体单位有可能被重复抽中;每个总体单位在每次抽样中被抽 中的概率都是相同的:抽样误差较大 2、不重复抽样:同一总体单位不可能被重复抽中;由于每次抽取是在不同数目的 总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相 等;抽样误差较小。 (三)、根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样两种: 1、考虑顺序的抽样:即从总体N中抽取n个单位构成样本,不但要考虑样本各单 位的不同性质,而且还考虑不同性质各单位的中选顺序。相 同构成成分的单位,由于顺序不同,也作为不同样本。 2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本。只考虑样本各单位 的组成成分如何,而不考虑单位的抽样顺序。如果样本的成 分相同,不论顺序有多大不同,都作为一种样本 3、以上抽样方法的两种分类还存在交叉情况,即有 考虑顺序的不重复抽样数目 MI AN 考虑顺序的重复抽样数目 BN=N 不考虑顺序的不重复抽样数目 M! n!(N-n)!
《统计学精品课程文件之三 《统计学》课程教案 5-2 样本,而把 n﹤30的样本称为小样本。 2、样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综合指标。 三、抽样框:是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽样框的好 坏通常会直接影响到抽样的随机性和调查的效果。 抽样框的主要形式有三种: (一)、名单抽样框:即列出全部总体单位的名录一览表,如职工名单、企业名单等。 (二)、区域抽样框:即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。 (三)、时间表抽样框:即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个 小的时间单位,以此时间单位为抽样单位。 四、抽样方法和样本可能数目 (一)、样本的可能数目既和样本的容量有关,也和抽样的方法有关。根据取样方式的不 同,抽样方法有重复抽样和不重复抽样两种。 1、重复抽样:是指从总体的N个单位中抽取一个容量为n的样本,每次抽出一个单 位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一 个样本。 2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下的总 体单位中抽取。 (二)、重复抽样与不重复抽样的区别: 1、重复抽样:同一总体单位有可能被重复抽中;每个总体单位在每次抽样中被抽 中的概率都是相同的;抽样误差较大。 2、不重复抽样:同一总体单位不可能被重复抽中;由于每次抽取是在不同数目的 总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相 等;抽样误差较小。 (三)、根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样两种: 1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,不但要考虑样本各单 位的不同性质,而且还考虑不同性质各单位的中选顺序。相 同构成成分的单位,由于顺序不同,也作为不同样本。 2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本。只考虑样本各单位 的组成成分如何,而不考虑单位的抽样顺序。如果样本的成 分相同,不论顺序有多大不同,都作为一种样本。 3、以上抽样方法的两种分类还存在交叉情况,即有: 考虑顺序的不重复抽样数目 ( ) ! N n N A n N − = 考虑顺序的重复抽样数目 n n BN = N 不考虑顺序的不重复抽样数目 !( )! ! n N n N C n N − =
《统计学精品课程文件之三 《统计学》课程教案 不考虑顺序的重复抽样数目 五、抽样调查的理论基础 (一)、大数法则:关于大量的随机现象具有稳定性质的法则。 (二)、中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变 量的分布如何,随着抽样单位数n的增加,抽样平均数的分布 便趋近于正态分布。 §3、抽样平均误差 抽样误差的概念及种类: 影响抽样平均误差的因素 (一)、总体被研究标志的变异程度。 在其他条件不变的情况下,总体标志的变异程度愈小,则抽样误差也愈 小:总体标志的变异程度愈大,则抽样误差也愈大 (二)、抽样单位数的多少。 在其他条件不变的情况下,抽样单位数愈多,抽样误差愈小:抽样单位 数愈少,抽样误差愈大。 (三)、抽样的方法。 在其他条件不变的情况下,重复抽样的抽样误差大于不重复抽样。 (四)、抽样的组织形式 、抽样平均误差的意义 是抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或 抽样成数)与总体平均数(或总体成数)的平均误差程度。 四、抽样平均误差的计算 重复抽样: 不重复抽样: n √n p(1-p) n §4、全及指标的推断 抽样极限误差:是抽样指标和总体指标之间抽样误差的可能范围。 基于理论上的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量,把 极限误差除以抽样平均误差,得出相对数t,表示极限误差范围为抽样平均误差的若干 倍。t称为概率度。这一变换称为概率的标准化过程。 抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。因为既然抽样误 差是一个随机变量,就不要期望抽样平均数(成数)落在一定区间是一个必然事件,而 只是给予一定的概率保证而已
《统计学精品课程文件之三 《统计学》课程教案 5-3 不考虑顺序的重复抽样数目 n N n n DN = C + −1 五、抽样调查的理论基础 (一)、大数法则:关于大量的随机现象具有稳定性质的法则。 (二)、中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变 量的分布如何,随着抽样单位数 n 的增加,抽样平均数的分布 便趋近于正态分布。 §3、抽样平均误差 一、 抽样误差的概念及种类: 二、 影响抽样平均误差的因素 (一)、总体被研究标志的变异程度。 在其他条件不变的情况下,总体标志的变异程度愈小,则抽样误差也愈 小;总体标志的变异程度愈大,则抽样误差也愈大。 (二)、抽样单位数的多少。 在其他条件不变的情况下,抽样单位数愈多,抽样误差愈小;抽样单位 数愈少,抽样误差愈大。 (三)、抽样的方法。 在其他条件不变的情况下,重复抽样的抽样误差大于不重复抽样。 (四)、抽样的组织形式。 三、 抽样平均误差的意义 是抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或 抽样成数)与总体平均数(或总体成数)的平均误差程度。 四、 抽样平均误差的计算 §4、全及指标的推断 一、抽样极限误差:是抽样指标和总体指标之间抽样误差的可能范围。 基于理论上的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量,把 极限误差除以抽样平均误差,得出相对数t,表示极限误差范围为抽样平均误差的若干 倍。t 称为概率度。这一变换称为概率的标准化过程。 抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。因为既然抽样误 差是一个随机变量,就不要期望抽样平均数(成数)落在一定区间是一个必然事件,而 只是给予一定的概率保证而已。 2 1 x p n n p p n = = − = 重复抽样: ( ) 2 1 1 1 x p n n N p p n n N = − − = − 不重复抽样: ( )
《统计学精品课程文件之三 《统计学》课程教案 所以在进行抽样估计时,不但要考虑抽样误差的可能范围有多大,而且还必须 虑落在这一范围的概率有多大。 前者是估计的准确度问题,后者是估计的可靠性问题,两者密不可分。 、可信程度 631 95.45% 99.73% 3 2 抽样估计 (一)、用抽样指标来估计总体指标有三项要素:估计值:估计值的误差范围:概率 保证程度。 (二)、估计的方法有两种:点估计与区间估计 1、点估计:也称定值估计,即以实际抽样资料得到的抽样指标值作为总体指标的估 计值。 2、区间估计:根据估计可靠程度的要求,选定概率度,以及极限误差,再利用抽样 调查取得的抽样平均数,定出估计的上、下限。区间称为置信区间,估 计可靠程度称为置信度。 ①、总体平均数的估计 第一、定值估计 第二、区间估计: ②、总体成数的估计: 第一、定值估计: 第二、区间估计: §5、抽样方案设计 抽样方案设计的基本原则 二、简单随机抽样 它是按随机原则直接从总体N个单位中抽取n个单位作为样本。是抽样中最基本也是最单纯 的方式,它适用于均匀总体
《统计学精品课程文件之三 《统计学》课程教案 5-4 所以在进行抽样估计时,不但要考虑抽样误差的可能范围有多大,而且还必须 考虑落在这一范围的概率有多大。 前者是估计的准确度问题,后者是估计的可靠性问题,两者密不可分。 二、可信程度 三、抽样估计 (一)、 用抽样指标来估计总体指标有三项要素:估计值;估计值的误差范围;概率 保证程度。 (二)、估计的方法有两种:点估计与区间估计 1、点估计:也称定值估计,即以实际抽样资料得到的抽样指标值作为总体指标的估 计值。 2、区间估计:根据估计可靠程度的要求,选定概率度,以及极限误差,再利用抽样 调查取得的抽样平均数,定出估计的上、下限。区间称为置信区间,估 计可靠程度称为置信度。 ①、总体平均数的估计 第一、定值估计: 第二、区间估计: ②、总体成数的估计: 第一、定值估计: 第二、区间估计: §5、抽样方案设计 一、抽样方案设计的基本原则 二、简单随机抽样 它是按随机原则直接从总体 N 个单位中抽取 n 个单位作为样本。是抽样中最基本也是最单纯 的方式,它适用于均匀总体。 -3 -2 -1 0 1 2 3 68.37% 95.45% 99.73%
《统计学精品课程文件之三 《统计学》课程教案 (- 、类型抽样:它的特点是先对总体各单位按主要标志加以分组,然后再从各组中按随机的 原则抽取一定单位构成样本。 通过分类,可以把总体中比较接近的单位归为一组,使各组的分布比较均匀,而且 保证各组都有中选的机会,这样计算的抽样平均指标变异程度也就比较小,所以在总体 各单位标志值大小悬殊的情况下,运用类型抽样比简单随机抽样可以得到更加准确的结 果 四、等距抽样 它的特点是事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选 调查单位的一种抽样组织形式 五、整群抽样 整群抽样是将总体各单位划分成若干群,然后以群为单位从其中随机抽取一些群, 对中选群的所有单位进行全面调查的抽样组织形式 §6、必要抽样单位数的确定 、确定抽样单位数的意义和原则 二、确定抽样单位数的依据 (一)、抽样单位数受允许误差的制约,允许误差愈小,抽样单位数就愈多。所以在抽样方 案设计中,对抽样误差的可能范围要十分慎重地进行思考。 (二)、为了防止由于抽样单位数不足而扩大抽样误差,在实际工作中往往根据比单位数大 的一个数目进行抽样,以满足共同的需要 (三)、在未知总体标准差或成数时,往往选择最大值或50%,只有这样才能抽取足够多的 样本单位数,以保证抽样后的极限误差在预先设定的允许误差范围之内 三、确定抽样单位数的计算公式 在重置抽样的条件下,抽样平均数的单位数是 在不重置抽样的条件下,抽样平均数的单位数是 (ne 2+t 在重置抽样的条件下,抽样成数的单位数为: t2p(1-p) 在不重置抽样的条件下,抽样成数的单位数为: N△+tp(1-p)
《统计学精品课程文件之三 《统计学》课程教案 5-5 三、类型抽样:它的特点是先对总体各单位按主要标志加以分组,然后再从各组中按随机的 原则抽取一定单位构成样本。 通过分类,可以把总体中比较接近的单位归为一组,使各组的分布比较均匀,而且 保证各组都有中选的机会,这样计算的抽样平均指标变异程度也就比较小,所以在总体 各单位标志值大小悬殊的情况下,运用类型抽样比简单随机抽样可以得到更加准确的结 果。 四、等距抽样 它的特点是事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选 调查单位的一种抽样组织形式。 五、整群抽样 整群抽样是将总体各单位划分成若干群,然后以群为单位从其中随机抽取一些群, 对中选群的所有单位进行全面调查的抽样组织形式。 §6、必要抽样单位数的确定 一、确定抽样单位数的意义和原则 二、确定抽样单位数的依据 (一)、抽样单位数受允许误差的制约,允许误差愈小,抽样单位数就愈多。所以在抽样方 案设计中,对抽样误差的可能范围要十分慎重地进行思考。 (二)、为了防止由于抽样单位数不足而扩大抽样误差,在实际工作中往往根据比单位数大 的一个数目进行抽样,以满足共同的需要。 (三)、在未知总体标准差或成数时,往往选择最大值或 50%,只有这样才能抽取足够多的 样本单位数,以保证抽样后的极限误差在预先设定的允许误差范围之内。 三、确定抽样单位数的计算公式 2 (1 ) x x n n n N = = − 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 x x p p t n t N n N t t p p n t Np p n N t p p = = + − = − = + − 在重置抽样的条件下,抽样平均数的单位数是: 在不重置抽样的条件下,抽样平均数的单位数是: 在重置抽样的条件下,抽样成数的单位数为: ( ) 在不重置抽样的条件下,抽样成数的单位数为: ( ) ( )