第七章抽样调查 教学目的与要求:了解抽样调查的概念、特点、及应用范围等基本内容,掌握抽样平均 误差、极限误差,根据平均误差进行总体的区间估计:理解简单随机抽样、类型抽样、整群 抽样、机械抽样等不同随机抽样的特点,并会进行相应的总体区间估计 教学重点:抽样的平均误差,极限误差、全及指标的推断、必要样本数目的确定 教学难点:抽样的平均误差,极限误差、全及指标的推断、必要样本数目的确定 第一节抽样调查的基本问题 一、抽样调查的概念 在统计调查 ,为了取得某一社会经济现象总体的综合特征,除了运用全面调查方法外 是杏能只对总体的部分单位进行调查,从而掌握总体的综合特征呢?特别是当总体的单位数 众多而不便于采用全面调查,或者当某些现象总体的综合特征是要经过皲坏性的测试才能取 得的情况下,能否只对总体的一部分单位进调查,即可推断总体呢?答案是肯定的。这种统 计调查方法,就是科学的抽样调查。事实上,在我们山常生活中,都自觉或不自觉运用者抽 样调查方法比要对 批生 的零部件 进石 ,质 员不可能对所有产品进行 而往往是抽取一定批次即可掌程全部产品的基本情况,这种方法就是抽样调查方法。当然习 格意义上的抽样调查是要根据一定的科学原理为指导,推断的计算方法是有严格的理论依据 的。 抽样固杏的概今可以有广义狭义之分。按照广义的甲解.凡是抽取一部分单位讲行观 察,并根据观察结果来推断全体的都是抽样调查,其中又分为非随机抽样和随机抽样。 非 机调查是有意识地选择单位,即根据对总体全面了解和具体分析的情况下,有意识地选样 些方面具有代表性的单位进行调查,前面我们在统计调查方法甲所讲的重点调查和典型调查 即是非随机抽样。随机抽样则是根据大数定律的要求,在抽取调查单位时,应保证总体中各 个单位都有同样的机会被抽中。一般所讲的抽样调查,均指获义的抽样调查。所以,严格意 义上的抽样调查是指:按照随机原则从全部对象中抽取一部分单位进行观察,并依据所获得 的样本的指 数值对 对象的数最特征作出具 一定把程度的估: 而达到对 部研究对象的正确认识的一种统计方法。 二、抽样调查的特点 (一)按纯随机的原则从全部总体中由选调查单位。调查单位的确定既不受调查者主观 愿望的影响,也不受被调查者意愿的影响,六全排除了主观意识的作用。呢个单位被抽选或 不被抽选,完全是偶然的事件 点与其他非全面调查,有者显著的区别。随机抽取单位 也不是指随便或任意抽取,而是要保证总体的每 个单位都有同等的抽取或不被抽取的村 会。随机原则也可称为同等可能性原则。按随机原则抽取调查单位,是抽样推断的基本要求 它同抽样推断的日的足密切相关的。抽样调查的日的足推断总体,那么抽取的部分单位就应 具有充分的代表性,这样就有较大的可能性使抽到的这部分单位保持和总体相同的结构,或 者说有相同的分布,从而保证它们对总体的代表性 )从数量特征上山部分推断总体。即根据被抽取的一部分调查单位的资料,对总 的数量特征作出科学的估计与推断。抽样调查是非全面调查,日的在于对总体的规模、水平 结构等指标作出估计,以达到对被研究总体数量特征的认识。例,抽取一定比例的产品, 检验共质量状况来推断整批产品的质量状况:抽取灰林甲一定区域、一定比例的树木,来了
解整个森林甲树木的病虫害。其他非全面调查,一般不能在数量上推算总体,达到对总体数 最特征的认以 (三)抽样推断必然有误差,但是误差是事先可以计算并加以控制的 抽样推断是以一部分单位的资料士推算总体,必然会产生一定的误差。但是这种误差可 事先按一定的资料加以计算出来,并且可以采取一定的组织设计来控制这个误差范围,保证 抽样达到一定的可靠度。也就是说,轴样调查是根据事先给定的误差允许范围进行设计的, 而抽样推断则是且有一定的可靠程度的世计和断, 三、抽样调查的作用 也正是山于抽样调查有以上特点,它较之其它的统计调查则有以下独特的作用: 〔一)有些现象不可能进行全面调查 一方面,对无限总体不能采用全面调查,必须用抽样调查的方法。例如,调查某大河用 面的鱼苗数量、调查某市的空气污染状况。另一方面,有些产品的质量检验具有破坏性。例 如,轮胎的使用寿命、炮弹的杀伤力。这些调查所用的测试手段对产品具有破坏性,不可能 进行全面调查 只能采用抽样调查 (二)有些现象里可以进行全面调查,但不必要或很难进行的,可以采用抽样调 有些现象从理论上讲可以进行全面调查,但实际上山于总体范围过大,单位分布散,没 有必要或很难进行的。例如要了解居民家庭生活状况,虽然可以进行全面调查,但调查的范 太广,单位太多,做全面调查花费人、财、物力太多,因此实际上很难小到,也没有此必 要,通过抽样调查的方式也可 以推算出总体指标数值。另外,抽样调查可以节省时间, 调查的时效性,有助于人们及时采用相应措随或决策。如农产品产量的全面调查,需花费相 当长的时间,能得到有关资料,而抽样调查可及时扶得有关资料,这对于有关部门及时安 排农产品收购、储运、出口等都有很大的好处。 〔一)对全面调查的弥料讲行检哈和修正 全面调查涉及的面很 参与人员很多 工作量很大,容易发生登记性的误。因此 在全面调查,特别是在各种普查后 非常有必要进行抽样复查 根据复查结果计算差错率 并以此为依据来检查和缘正全面调查的结果,从而提高全面调查的质量, (四)可以用于工业生产过程的控制 抽样调查不但泛地用于生产结果的质量检查和估计,而目也可以有效地应用于对成批 或大量连续生产的工业产品在生产过程中的质量控制,检查生产过程是杏正常,及时提供有 关信息,以便采取措施 保证生产过程的正常运转和产品质量的稳定 四、抽样调查的理论依据 就数量关系来说,抽样调查是建立在概率论的大数法则基础上,大数法则的一系列定理 为抽样推断提供了数学依据。 大数法测总关于大量的饰机理象其有稳定件质的法测。它说明!果被研究的总体是山大 量的相对独立的随机因素所构成,而月每个因素对总体的影响都相对的小,那么,对这些大 因素加以综合半均的结果,因素的个别影利将相互抵消,而显现出它们共同作用的倾向,使 总体具有稳定的性质。 具体地说,大数法则的意义可以归纳1下四方面: 1、现象的某种总体规律性,只有当且有这种现象的足够多数的单位综合汇总在一一起的时 候,才能显示出来。因此,只有从大量现象的总体中,才能研究这些现象的规律性 现象的总体性规律 通带是以斗 均数的形 表现出来 3、当所研究的现象总体包含的单位越多,平均数也就越能够正确地反映出这些现象的规 律性 4、各单位的共同倾向决定者半均数的水平,而各单位对平均数的离差则会山于足够多数
单位的综合汇总的结果,而相互抵消,趋于消失。 独立同分布序列的切比雪夫大数定律具体内容为:设独立随机变量序列 X,XA,X,A服从相同分布,E(X)=4,D(X)=G2(1=1,2,A)则对于任意正数 s,有imP啡2x-4<e}I 这一定律表明,当n充分大时,“试验平均值=∑X,与期望的绝对偏差小于任 n后 意给定正数ε”这一事件的概率可以任意接近于1:或者从实际推断原理而言,当n充分大, “试验平均值又与期望“的绝对偏差小于任意给定正数£”几乎必然会发生。即抽样平均 数大概率上收敛于总体Ψ均数 大数定律认证了抽样平均数趋近于总体平均数的趋势,这为抽样推断提供了重要的依据, 但是,抽样半均数和总体半均数的离差究竞有多大?离差不超过一定范围的橱率究竞有多 少?这个离差的分布怎样?大数法则并没有给出具体信息。这个问题要用另一重要的定理, 即中心极限定甲来研究 独立同分布序列的中心极限定理的内容:设相互独立的随机变量序列X1,X,AX。,A 报从相同的概率分布,月E(X)=4,D(X:)=G2,记: ∑(x,)-n4 Z=四 √no 设Z的分布函数为: F.(x)=P2sx 则有:1imE国-2eh=6w 这一定理证明,当n充分大时,独立同分的随机变量之和乙。=之X,的分布近似于 F态分布N(n4,no2) 以上结论证实:如果总体变量存在有限的平均数和方差,那么,不论这个总体变量的分 如,的若抽样单位数n的增.抽样均数的分便格所于正分石,这个结论付于抽 样推断是引分重要的,因为在经济现象中变量和的分布是普遍存在的。例如,全班成绩是每 个学生成绩的总和,所以全班成绩分布可以视为各个学生成绩总和的分布。又,产品标准 规格的偏差是山许多因素综合形成的,所以产品规格离差的分布可以视为许多独立因素之和 的分布。根据中心极限定,我们有理山相信,这些分布都趋于正态。也就是说,在现实生活
中,一个随机变量服从于正念分布未必多,但多个随机变量和的分布趋近于正态分布则是普 遍布存在的。抽样平均数也是一种随机变量和的分布,因此,在抽样单位数n充分大的条件 下,抽样半均也趋近于正态分,这为抽样误差的概率计提供了 个极为有效而且方 的条件。 五、抽样调查的基本概念 (一)全及总体及抽样总体 1、会及总体简称为总体,是指所需认识对象的全体。它是由且有某种共同性质的许多单 位所组成的集合体。根据总体范围大小的不同,总体可分为无限总体和有限总体。在抽样拍 断中,我们研究的一般为有限总体,其单位数通常用N表示。 根据总体单位标志的性质不同,总体可分为变量总体和属性总体,反映数量标志的总体 称为变量总体,如反映居民收入水平的总体,反映企业职工工资水平的总体等。反映品质标 志的总体称为属性总体,如反映质量等级的产品总体等。总体不同,表明总体特征和认识总 体的方法也就不同。同一个总体,有时是变量总体,有时是属性总体,有时两者都是。 2、抽样总体,又称为样本总体,简称样本 子样等,它是指从全及总体中随机抽取出来 用于调查或者观察的那部分单位的集合体。样本总体的单位数称为样本容量,通常用小写 文字母n表示。一般来说,样本单位达到或超过30个称为大样本,而在30个以下称为小样 本。社会经济现象的抽查推数断多取大样本,而自然实验室观察则往往取小样本,以很小的 样本来推断很大的总体,这是抽样推断的特点。 定的 而月是惟一的。但用于观察对象的样本戴不是这样。从一个总体中 可以抽取很多样本,全部样本的可能数目和每一样本容量及随机取样的方法有关。因此样本 不是确定的,也不是唯一的。 (一》全及指标和抽样指标 1、全及指标。全及指标也称总体参数,它是根据全及总体冬个单位的标志值或标志特征 计算的反映全及总体某种属性的综合指标。山于全及总体是唯一确定的,根据全及总体计算 的全及指标也是唯 定的 通常全及指标有总体半均数和总体标准差 对于变量总体,总体平均数是指全及总体的标志总量和总体单位数对比得到的平均数。 ∑x 或者灭= ∑x 相应地总体标准差为:。=、 ∑(x- ∑x-X) 或者0= 对于屈性总休,山于各个单位的标志值不能用数值表示,只能用文字来加以表述。当 个总体可以按某一标志划分为两个组成部分,其中一部分总体单位具有某一标志,可以用 “是”“有”等概念来表 :而另一部分总体单位不具备这一标志时 以用“杏”“无” 来表示,具有这种特性的表志称为交替标志,也称为是非标志。总体中具有某种标志表现的 单位数占总体单位数的比重,称为成数,它是一种特殊的相对数,通常用大定的英文宁母P 来表示。而总体中不具有某种标志表现的单位数占总体单位数的比重用Q来表示。设总体 单位数为N,具有某种标志表现的单位数为N,不具有某种标志表现的单位数为N。,则: N,+N。=N P=0Q=0P+Q=1 交替标志表现了现象质的差别,其标志表现为文宁,若想计算其半均数,首先必须对
其标志进行量化处理。山于交替标志只有两种表现,所以可以用“1”代表“是”或者“有”, 表示总体单位具有某种表现:用“0”代表“公”或者“无”,表示总体单不且有某种表现 经过量化处理以后,就可以对交替标志进行平均数和标准差的运算 半均数X=1+0xN==P N,+N。 N 标准差。= X-x五则。=、 1-P)2N1+(0-P)2N。 ∑f N,+W。 -Qp+p2Q-√PQP+@-√P0=√P1-P) 2、样木指标。样木指标也称样杰统计量,它是想根样木点体各单位的标志值或标志结 征计算的反映样本总体某种属性的综合指标。山于一个总体可以有多个不同的样本,因此样 本指标是不唯一的,随样本的不同而变化,是随机变量。但对于某 个具体的样本而言,该 样本指标是确定的,可以计算的,并月可用它来对未知的全及指标作出估计和推断。 与全及总体相对应,样本指标也有样本平均数和样本标准差。对于变量总体,样本平均 数是指抽样总体各单位标志值的平均数文。 >xf n 其相应的样本标准差计算公式为:3 ∑x-) 或5= ∑x-)f n ∑f 对于属性总体,样本成数是指样本中具有某种标志表现的单位数占总体单位数的比重 其计算式与总体指标的元全一致 (三)重复抽样与不重复抽样 1、重复抽样。重复抽样也称重置抽样或放回抽样。它是指从全及总体中抽取样本时, 随机抽取一个样太单位,得记其¥号或标志值之后,又将它放回全及总中去重新抽样。耳从 全及总体中又随机抽取第二个单位,同样登记后,又把它放回全及总体中去,如此反复抽样 反复回放,直到抽完n个样本单位为止 重复抽样的特点:(1)在抽样过程中,各次抽样相互独立,总体单位数始终不变,都 为N:(2)总体各单位被抽中的概率在每次抽样中都一样,都为1N:(3)可构成的样本个 数N“个,每个样本被抽取的概率都相同 2、不重复抽样。不重复抽样也称为不重置抽样或非回置抽样。它是指从全及总体的 个单位中随机抽取一个容量为n的样本,但每次从总体中抽取一个单位登记其序号或标志值 之后,不丹放回总体中去重新抽样,此连续抽个单位组成样本。因此,不重复抽样实际 上是一次同时从总体中抽取n个单位组成样本。 八承复抽样的特点县:(1)在样的时积中,各次抽样不是相万独立的.每一次抽 的结果都影响下 一次抽样,每抽一次总体单位数就减少 个:(2)总体各单位被抽中的概率 在各次抽样中是不同的:(3)可构成的样本个数为C、,每个样本被抽取的概率是相同的 第二节抽样误差
一、抽样误差基本概念 中样误并只抽样推断中的一个承要概今,它是指山干销机抽样的偶然因素伸样本各单品 结构不足以代表总体各单位结构,从而引起样本指标与总体指标之间的绝对离差,用数学符 号可表示为斥-或p-P川 在抽样调查过程中,用抽样指标来代表总体指标进行必要的推算,必然会产生误差问题。 因为抽样指标山于种种原因,不会与总体指标完全一样,它们两者之间往往不会完全相等, 抽样半均数或抽样成数与总体平均数或总体成数之侧仕往会产生一定的误差。抽样误差越 小,表示样本的代表性越高:反之,抽样误差越大,样本的代表性越低。 1、抽样误差的种类 在抽样调查过程中会产生两类误差,即登记性误差与代表性误差,代表性误差又可分为 系统性误第和偶然性误差 登记性误差是指在统计调查、整理或计算过程中,山于主客观原因影响而产生的误差 这种误差 “切统登中有可论 产生,但登记性误差可以通过提高调查人员的思想素质 和业务水平,改进调查方法和组织工作,建立严格的工作责任制训以避免,属于可避免的误 差。 代表性误差是山于调查过程中以部分来代表总体时,山于代表性不是或不完全而产生的 误差,根据其成因可分为两种,即系统性误差和随机误差。系统性误差是山于没有严格遵守 站机原则而产生的误差 ,如在抽样调查抽取调查单位 调查者没有 亚格遵 守随机原则,而 是有意识地挑选较好或较坏的单位进行调查,山此导致样本的代表性降低,据此计算的抽样 指标数值必然比总体指标数值偏高或偏低,从而产生的误差。系统误差也属于可避免的误差。 随机误差则是指在抽选样本过程中,虽然严格遵守随机原则,但山于样本的非均匀性,可能 油到各种不同的样本,只要样本的结物与总体比有出入,就会出现误。随机误是样 查本身所固有的 是不可避免的 种偶然性的代表性误差。抽样调查中能够计算并加以 控制的就是这种随机误 。以下课程介绍与处理的均指随机误差 2、影响抽样误差的因素 影响抽样误差的主要因素有以下几方面: (1)抽样单位数目的多少 ,在其他条件不变的情况下,抽样单位数越少,抽样误差越大:反之,抽样单位数越多, 如果样本单位数 等于总体单位数N,即样本等于总体时,抽样调查也就等 于全面调查,也就不存在抽样误差 (2)总体各单位标志变异程度 在其他条件不变的情况下,总体单位标志变异程度越小,抽样误差也就越小:反之,总 体单位标志变异程度越大,抽样误差就越大。如果总体各单位标志值相等,则抽样误差为零 面将会通过公式了解到, 抽样误差的变动与总体各单位标志变异程度的大小成正比例关 系 (3)抽样调查的组织形式 抽样调查按组织方式,可分为简单随机抽样、等距抽样、类型抽样和整群抽样。每一种 抽样调查的抽样误差都是不相同的。一般而言,类型抽样的样本代表性较高,等距抽样次之, 而简单随机抽样和整群抽样误差较大。本章第四节将分析各种抽样调查组织方式的误差 (4)抽样方法 抽样的方法不同,抽样误差也不同,一般而言,重复抽样的抽样误差比不重复抽样的抽 样误差要大些。 二、抽样的平均误差
山于样本选取的随机性,则抽样误差下-或p一P是一个随机变量,而日也不可 能求出来,所以在计算过程中,经常用到抽样平均误差的概念 )抽样平均误差的概念 抽样平均误差是所有可能出现的抽样指标和全及指标之间的平均离差,也就是指所有可 能出现的样本指标的标准差,一般用4:或者4。米表示,它概括反映了全部样本总体所有 可能结果的平均误差。 面举例说明抽样平均误差的概念。在实际工作中,应用抽样调查的一个前提条件是总 体单位数是大量的,样本单位数足足够多的。在下面的例子中总体单位数和样本单位数少是 为了便于说明挂样平均误差的慨念及计算方法。 【例1】假设某班组有A、B、C、D、E五名工人,月产量资料分为160、180、200、 220、240件,则全及总体的平均数:即Ψ均班组的月产量=200件,全及总体方若 。=28.3元,现从5人甲随机抽取2人进行抽样调查,推断5名工人的半均月产量。下面 分别采用玉复抽样与不重复抽样两种方法分别研究抽样的平均误差。 (1)在不重复抽样的情况下,以2名工人为样本,共可组成C:=10个样本配合组。 列表计算如下: 某班组工人月产量分析表 表1 样本 月产量x(件) 样本平均数元 离差元- 离差Ψ方(依-)2 1 AB 160,180 170 -30 900 2 AC 160,200 180 -20 400 3 AD 160.220 190 -10 100 4 AE 160.240 200 0 0 5 BC 180,200 190 -10 100 6 BD 180,220 200 0 0 7 BE 180,240 210 10 100 8 CD 200.220 210 10 100 9 CE 200,240 229 400 10 DE 220,240 2530 30 900 ∑(-) 3000 4=样本配合数10 =17.32(元》 在不重复抽样的条件下,抽样平均误差17.32元,是10个样本月平均产量与总体月半 均产量的平均离差,说明不论抽到啸一个样本,平均来说与总体平均指标200元的平均误差 为17.32元。 (2)在重复抽样的条件下,以2名工人为一个样本,共可组成52个样本配合组。 某班组工人月产量分析表 表2 样本 月产量x(件) 样本平均数 离若元一X 离差平方(低-月
1 AA 160.160 160 .40 1600 2 AB 160,180 170 900 3A0 160,200 180 -20 400 4 AD 160.220 190 -10 100 5 AE 160.240 200 6 BA 180,160 170 900 7 BB 180,180 180 -20 400 8 BC 180.200 190 -10 100 9 BD 180.220 200 0 10B 180,240 210 11CA 200,160 180 -20 400 12CB 200.180 190 -10 100 200.200 200 0 0 200,220 210 10 100 15 CE 200,240 220 20 400 16DA 220.160 190 .10 100 17DB 220.180 200 0 220,200 210 0 100 19DD 220,220 220 20 400 20DE 220.240 230 30 900 21EA 240.160 200 0 240,180 210 100 23 EC 240,200 220 20 400 245D 240.220 230 30 900 25 EE 240,240 240 40 1600 ∑(- 以山,表示抽样平均数的平均误差.则“:=样本配合总数25 10000 =20(元) 在重复抽样的条件下,抽样Ψ均误差20元,是25个样本月Ψ均产量与总体月Ψ均产量 的平均离差,说明不论抽到哪一个样本,平均来说与总体平均指标200元的平均误差为20 (二)抽样平均误差的计算公式 根据定义可以将抽样平均误差的公式写成 ∑保,- := k为样本配合总数 应当指出,这是一个理论公式,实际应用存两个困难:一是运用公式要求总体指标是已 知的,但实际上总体指标是不道的,正是抽样调查要推断的:二是运用这个公式要求把所 有的样本都抽选出来,计算它们的指标值,这是不可能的。一般每次抽样训查只抽选一个样 本,计算此样本毕均数。 抽样平均误差的实际计算方法,按照抽取样本单位的方式和方法不同而有所差别,其中 最基本的方法是按简单随机抽样进行的。山于抽样平均误差有平均数的抽样平均误差和成数 的抽样平均误差,它们的抽样半均误差的计算方法有所不同,现分别加以说明:
1、抽样平均数的抽样平均误差 以以,表示抽样半均数的平均误差,。表示总体的标准差。根据定义得: 4:'=E元-E(x=E(依-) -西+名+x+A+x-F+双+F+A+天 =-万+(-万+化-+Λ+.-X (1)玉复抽样抽样平均数的抽样平均误差。在重复抽样的情况下,这时样本变量 x,x,x,人,x是相互独立的,样本变量x与总体变量X同分布,展开上式得 4=B-+E,-万+AE.-+∑E-X-X列 -Ex-+Ex-+A+Ex-X为 ( 上式表阴样Y约的Y约误坐仪为全收总秋福差的石·例如当样太华位数为 ,则半均误差仪为总体标准差的合这说明。,一个总体的某一标志的安动度可能很大 但抽到若干单位加以平均之后,抽样平均数的标准差比总体的标准差大大地箱小了。所以, 抽样平均数作为估计量是史有效的。从上式还可以看出,抽样平均误差和总体标志变动度的 大小成正比,而和样本单位的平方根成反比。例,抽样平均误差要减少,则样本单位 数必须增大到4信:抽样半均误差要减少为原来的},则样本数要扩大到原来的9倍等。 (2)不重复抽样的抽样误差 在不重复抽样的情况下,这时样本变量,x,xAx,不是相互独立。展开上式得 4=E-+E-+AE,-X+∑E-Xe-X列 示之(-形+王-,一刀(你过程路
果司 在总体单位数N很大的情况下,可以近似的表示为: 从上述过程可以看出,不重复抽样平均方差等于重复抽样平均方差乘以校正因子 小-号·式足大于0面于1的流云系上这个小杆1的正数。多然小于来的威。 所以,不重复抽样半均误差的数值一定小于重复抽样的抽样平均误差。也就是说,抽样的方 法对挂件的联差是有影的:在一复指视下,总体单位数限大,曲样北制丹很小,则小-只 接近于1,因此, -月与云运,核季工中,极有送水8验 情况下或者总体单位数N很大时,一般均用重复抽样半均误差公式来计算个重复抽样的半 均误差。 2、抽样成数的抽样平均误差 在掌握抽样平均数的平均误差公式的基础上,再来求抽样成数的平均误差公式是比较简 单的。只须将全及成数的标准差平方代替公式中的全及平均数的标准差的平方,就可以得到 抽样成数的平均误差公式。山第一节可知,对于交替标志: X=p on=pq 根据抽样平均误差与总体标准差平方之间的关系,抽样成数的半均误差计算公式为: 重复抽样抽样数的半均误差4,,P0卫 个复指样地传成的约装法,P1一习 在上面计算抽样平均误差的公式中,无论是平均数的标准差。,还是交替标志的方差 P1一P),都是指全及总体而言。但是在抽样调查的实践中,这两个指标一般都是未知的, 因此,通常采用以下四种方法米解决。 ()用过去调查所得到的资料。可以用全面调查的资料,也可以用抽样调查的资料。 如果有几个不同的总体方差的资料,则应该用数值较大的。 (2)用样本方差的资料代替总体方差。概率论的研究从理论上作了证明,样本方差可以 相当接近于总体方差。这是实际工作中经常使用的一种方法,但它只能在调查之后才能计算 (3)用小规模调查资料。如果既没有过去的材料,又需要在调查之前就估计出抽样误差, 实在不得已时,可以在大规模调查之前,组织一次小规模的试验性训查。 (4)用估计的材料。例,在农产量抽样调查中用农产量预计估产的资料,根据预计