山东滨州职业学院：《统计基础》第6章抽样调查.doc_大学文库

灵活抽样调查的调查单位比全面调查少得多,因而既能节约人力、费用和时间,又能比较快地得到调查的结果,这对许多工作都是很有利的。例如农产量全面调査的统计数字要等收割完毕以后一段时间才能得到,而抽样调查的统计数字在收获的同时就可以得到,一般能早得到两个月左右,这对于安排农产品的收购、储存、运输等都是很有利的。由于调查单位少,有时可以增加调查内容。因此,有的国家在人口普查的同时也进行人口抽样调查,一般项目通过普查取得资料,另一些项目则通过抽样调査取得资料。这样既可以节省调查费用和时间,又丰富了调查内容 (2)有些情况下,抽样调査的结果比全面调查要准确统计数字与客观实际数量之间是会有差别的,这种差别通常称为误差统计误差有两种:一是登记误差,也叫调查误差或工作误差,是指在调查登记、汇总计算过程中发生的误差,这种误差应该设法避免的;二是代表性误差,这是指用部分单位的统计数字为代表,去推算总体的全面数字时所产生的误差,这种误差一定会发生,是不可避免的。全面调查只有登记误差而没有代表性误差,而抽样调查则两种误差全有。因此,人们往往认为抽样调查不如全面调查准确,种看法忽略了两种误差的大小。全面调查的调查单位多,涉及面广,参加调查汇总的人员也多,水平不齐,因而发生登记误差的可能性就大。抽样调查的调查单位少参加调查汇总的人员也少,可以进行严格的培训,因而发生登记误差的可能性就少。在这种情况下,抽样调査的结果会比全面凋査的结果更为准确。 (3)抽选部分单位时要遵循随机原则其他非全面调査,如典型调査和重点调查等,一般是要根据统计调查任务的要求,有意识地选取若干个调查单位进行调查,而抽样调查不同, 从总体中抽取部分单位时,必须非常客观,毫无偏见,也就是严格按照随机原则抽取调查査单位,不受调查人员任何主观意图的影响,否则会带上个人偏见,挑中那部分单位的标志值可能偏高或偏低,失去对总体数量特征的代表性 (4)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制在非全面调查方式中,典型调查固然也有可能用它所取得的部分单位的数量特征去推算全体的数量特征,但这种推算误差范围和保证程度,是无法事先计算并加以控制的。而抽样调查则是在于对一部分单位的统计调査,在实际观察标志值的基础上,去推断总体的综合数量特征。例如,某

灵活抽样调查的调查单位比全面调查少得多，因而既能节约人力、费用和时间，又能比较快地得到调查的结果，这对许多工作都是很有利的。例如，农产量全面调查的统计数字要等收割完毕以后一段时间才能得到，而抽样调查的统计数字在收获的同时就可以得到，一般能早得到两个月左右，这对于安排农产品的收购、储存、运输等都是很有利的。由于调查单位少，有时可以增加调查内容。因此，有的国家在人口普查的同时也进行人口抽样调查，一般项目通过普查取得资料，另一些项目则通过抽样调查取得资料。这样既可以节省调查费用和时间，又丰富了调查内容。 (2)有些情况下，抽样调查的结果比全面调查要准确统计数字与客观实际数量之间是会有差别的，这种差别通常称为误差。统计误差有两种：一是登记误差，也叫调查误差或工作误差，是指在调查登记、汇总计算过程中发生的误差，这种误差应该设法避免的；二是代表性误差，这是指用部分单位的统计数字为代表，去推算总体的全面数字时所产生的误差，这种误差一定会发生，是不可避免的。全面调查只有登记误差而没有代表性误差，而抽样调查则两种误差全有。因此，人们往往认为抽样调查不如全面调查准确，种看法忽略了两种误差的大小。全面调查的调查单位多，涉及面广，参加调查汇总的人员也多，水平不齐，因而发生登记误差的可能性就大。抽样调查的调查单位少，参加调查汇总的人员也少，可以进行严格的培训，因而发生登记误差的可能性就少。在这种情况下，抽样调查的结果会比全面凋查的结果更为准确。 (3)抽选部分单位时要遵循随机原则其他非全面调查，如典型调查和重点调查等，一般是要根据统计调查任务的要求，有意识地选取若干个调查单位进行调查，而抽样调查不同，从总体中抽取部分单位时，必须非常客观，毫无偏见，也就是严格按照随机原则抽取调查单位，不受调查人员任何主观意图的影响，否则会带上个人偏见，挑中那部分单位的标志值可能偏高或偏低，失去对总体数量特征的代表性。 (4)抽样调查会产生抽样误差，抽样误差可以计算，并且可以加以控制在非全面调查方式中，典型调查固然也有可能用它所取得的部分单位的数量特征去推算全体的数量特征，但这种推算误差范围和保证程度，是无法事先计算并加以控制的。而抽样调查则是在于对一部分单位的统计调查，在实际观察标志值的基础上，去推断总体的综合数量特征。例如，某

村种有晚稻3000亩,在稻子成熟后随机抽取50个单位的田块为样本,每个单位为10平方市尺,进行实割实测,求得其平均亩产为410千克,从而推算该村的晚稻总产量为410×3000=1230000千克。当然这种推断也会存在一定的误差,但它与其他统计估算不同,抽样误差的范围可以事先加以计算,并控制这个误差范围,以保证抽样推断的结果达到一定的可靠程度。抽样调査是必不可少的一种调査方法,但是,抽样调查也有它的弱点例如,它只能提供说明整个总体情况的统计资料,而不能提供说明各级状况的详细的统计资料,这就难以满足各级领导和管理部门的要求。抽样调查也很难提供各种详细分类的统计资料。因此,抽样调査和全面调查是不能互相代替的 3.抽样调查的适用范围抽样调查适用的范围是广泛的,从原则上讲,为取得大量社会经济现象的数量方面的统计资料,在许多场合都可以运用抽样调查方法取得:在某些特殊场合,甚至还必须应用抽样调查的方法取得。 (1)有些事物在测量或试验时有破坏性,不可能进行全面调查例如,灯泡耐用时间试验,电视机抗震能力试验,罐头食品的卫生检查,人体白血球数量的化验等等,都是有破坏性的,不可能进行全面调查只能使用抽样调查。 (2)有些总体从理论上讲可以进行全面调查,但实际上办不到例如,了解某森林区有多少棵树,职工家庭生活状况如何等等。从理论上讲这是有限总体,可以进行全面调查,但实际上办不到,也不必要对这类情况的了解一般采取抽样调查方法。 (3)抽样调查方法可以用于工业生产过程中的质量控制抽样调查不但广泛用于生产结果的核算和估计,而且也有效地应用于对成批或大量连续生产的工业产品在生产过程中进行质量控制,检查生产过程是否正常,及时提供有关信息,便于采取措施,预防废品的发生 (4)利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍例如,新教学法的采用、新工艺新技术的改革、新医疗方法的使用等等是否收到明显效果,须对未知的或不完全知道的总体做出一些假设,然后利用抽样调查的方法,根据实验材料对所作的假设进行检验,做出判断。随着抽样理论的发展,抽样技术的进步,抽样方法的完善和统计队伍业务水平的提高,抽样调查方法将在社会经济生活中得到愈加广泛的运用

村种有晚稻 3000 亩，在稻子成熟后随机抽取 50 个单位的田块为样本，每个单位为 10 平方市尺，进行实割实测，求得其平均亩产为 410 千克，从而推算该村的晚稻总产量为 410×3000＝1230000 千克。当然这种推断也会存在一定的误差，但它与其他统计估算不同，抽样误差的范围可以事先加以计算，并控制这个误差范围，以保证抽样推断的结果达到一定的可靠程度。抽样调查是必不可少的一种调查方法，但是，抽样调查也有它的弱点。例如，它只能提供说明整个总体情况的统计资料，而不能提供说明各级状况的详细的统计资料，这就难以满足各级领导和管理部门的要求。抽样调查也很难提供各种详细分类的统计资料。因此，抽样调查和全面调查是不能互相代替的。 3. 抽样调查的适用范围抽样调查适用的范围是广泛的，从原则上讲，为取得大量社会经济现象的数量方面的统计资料，在许多场合都可以运用抽样调查方法取得；在某些特殊场合，甚至还必须应用抽样调查的方法取得。 (1) 有些事物在测量或试验时有破坏性，不可能进行全面调查例如，灯泡耐用时间试验，电视机抗震能力试验，罐头食品的卫生检查，人体白血球数量的化验等等，都是有破坏性的，不可能进行全面调查，只能使用抽样调查。 (2)有些总体从理论上讲可以进行全面调查，但实际上办不到例如，了解某森林区有多少棵树，职工家庭生活状况如何等等。从理论上讲这是有限总体，可以进行全面调查，但实际上办不到，也不必要。对这类情况的了解一般采取抽样调查方法。 (3)抽样调查方法可以用于工业生产过程中的质量控制抽样调查不但广泛用于生产结果的核算和估计，而且也有效地应用于对成批或大量连续生产的工业产品在生产过程中进行质量控制，检查生产过程是否正常，及时提供有关信息，便于采取措施，预防废品的发生。 (4)利用抽样推断的方法，可以对于某种总体的假设进行检验，来判断这种假设的真伪，以决定取舍例如，新教学法的采用、新工艺新技术的改革、新医疗方法的使用等等是否收到明显效果，须对未知的或不完全知道的总体做出一些假设，然后利用抽样调查的方法，根据实验材料对所作的假设进行检验，做出判断。随着抽样理论的发展，抽样技术的进步，抽样方法的完善和统计队伍业务水平的提高，抽样调查方法将在社会经济生活中得到愈加广泛的运用

61.2.关于抽样方法在实际应用中,抽样方法主要有两种:概率抽样和非概率抽样。 1.概率抽样这一方法是根据一个已知的概率选取被调查者,无须调查人员在选样中判断或抽选。从理论上讲,概率抽样是最理想、最科学的抽样方法,它能保证样本数据对总体参数的代表性,而且它能够将调查误差中的抽样误差限制在一定范围之内。但相对于非概率抽样来说,概率抽样也是花费较大的抽样方法。概率抽样有以下几种形式。 (1)简单随机抽样( Simple random sampling)。是最基本的抽样形式, 它是完全随机地选择样本。此法要求有一个完美的抽样框,或者总体中有一个个体的详尽名单 (2)分层抽样( Reduced sampling)。分两个步骤:首先将总体分成不同的“层”,然后在每一层内进行抽样。分层抽样可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。 (3)整群抽样( Cluster sampling)。首先将全部总体分为若干部分,每部分称为一个群,把每一群做为一个抽样单位,在群地进行抽样:然后, 在被抽中的群中做全面调查。例如,在市场调查的入户调查中,可以对被选作抽样单位的某个大院的每家每户进行调查。 (4)等距抽样。又称系统抽样( Systematic sampling),是在样本框中每隔一定距离抽选一个被调查者。这一方法也比较常用,有时还可与整群抽样法和分层抽样法结合使用。例如,可采用系统抽样去抽取选择“群”或个体,也可在某一“层”的范围内进行系统采样 2.非概率抽样不是完全按随机原则选取样本。非概率抽样有三种形式。 (1)主要是由调査人员自由选择被调查者的非随机选样。例如在购物中心采访100位妇女,这100位被调查者可以随机选择。 (2)通过某些条件过滤选择某些被调查者参与调查的判断抽样法。在许多情况下,由于研究对象可能仅限于一部分居民,因而有时采用这种方法能节省大量经费。 (3)大多数种类的研究——产品测试、街访、座谈会,只要不是属于要进行总体推论的大多数项目都可使用非概率抽样法

6.1.2. 关于抽样方法在实际应用中，抽样方法主要有两种：概率抽样和非概率抽样。 1. 概率抽样这一方法是根据一个已知的概率选取被调查者，无须调查人员在选样中判断或抽选。从理论上讲，概率抽样是最理想、最科学的抽样方法，它能保证样本数据对总体参数的代表性，而且它能够将调查误差中的抽样误差限制在一定范围之内。但相对于非概率抽样来说，概率抽样也是花费较大的抽样方法。概率抽样有以下几种形式。 (1)简单随机抽样（Simple random sampling）。是最基本的抽样形式，它是完全随机地选择样本。此法要求有一个完美的抽样框，或者总体中有一个个体的详尽名单。 (2)分层抽样（Reduced sampling）。分两个步骤：首先将总体分成不同的“层”，然后在每一层内进行抽样。分层抽样可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。 (3)整群抽样（Cluster sampling）。首先将全部总体分为若干部分，每一部分称为一个群，把每一群做为一个抽样单位，在群地进行抽样；然后，在被抽中的群中做全面调查。例如，在市场调查的入户调查中，可以对被选作抽样单位的某个大院的每家每户进行调查。 (4)等距抽样。又称系统抽样（Systematic sampling），是在样本框中每隔一定距离抽选一个被调查者。这一方法也比较常用，有时还可与整群抽样法和分层抽样法结合使用。例如，可采用系统抽样去抽取选择“群”或个体，也可在某一“层”的范围内进行系统采样。 2. 非概率抽样不是完全按随机原则选取样本。非概率抽样有三种形式。 (1)主要是由调查人员自由选择被调查者的非随机选样。例如在购物中心采访 100 位妇女，这 100 位被调查者可以随机选择。 (2)通过某些条件过滤选择某些被调查者参与调查的判断抽样法。在许多情况下，由于研究对象可能仅限于一部分居民，因而有时采用这种方法能节省大量经费。 (3)大多数种类的研究––––产品测试、街访、座谈会，只要不是属于要进行总体推论的大多数项目都可使用非概率抽样法

62抽样推断中几个基本概念 621.全及总体和抽样总体在抽样调查中,有两种不同的总体即全及总体和抽样总体。 1.全及总体全及总体简称总体是指所要认识对象的全体,总体是由具有某种共同性质的许多单位组成的,因此,总体也就是具有同一性质的许多单位的集合体。例如,我们要研究某城市职工的生活水平,则该城市全部职工即构成全及总体。我们要研究某乡粮食亩产水平,则该乡的全部粮食播种面积即是全及总体。全及总体按其各单位标志性质不同,可以分为变量总体和属性总体两类。构成变量总体的各个单位可以用一定的数量标志加以计量,例如,研究居民的收入水平,每户居民的收人就是它的数量标志,反映各户的数量特征。但并非所有标志都是可以计量的,有的标志只能用一定的文字加以描述。例如,要研究织布厂1000台织布机的完好情况,这时只能用“完好” 和“不完好”等文字作为品质标志来描述各台设备的属性特征,这种用文字描写属性特征的总体称为属性总体。区分变量总体和属性总体是很重要的,由于总体不同,认识这一总体的方法也就不同对于变量总体可分为无限总体和有限总体两类。无限总体所包含的单位为无限多,因而各单位的变量也就有无限多的取值。这种无限变量又有两种情况:一种是可列的无限变量,即变量值的大小可以按照顺序一一列举直至无穷:另一种情况则是不可列的无限变量,它是一种连续变量,在任何一个区间内都有无限多的变量,不可能按顺序加以一一列举。我们所说的无限总体主要是指后一种情况来说的。有限总体所包含的单位数则是有限的,因而它的变量值也是有限的,当然可以按顺序加以一一列举通常全及总体的单位数用大写的英文字母N来表示。作为全及总体单位数N即使有限,但总是很大,大到几千,几万,几十万,几百万。例如,人口总体,棉花纤维总体,粮食产量总体等等。对无限总体的认识只能采用抽样的方法,而对于有限总体的认识,理论上虽可以应用全面调查来搜集资料,但实际上往往由于不可能或不经济而借助抽样的方法以求得对有限总体的认识 2.抽样总体抽样总体简称样本,是从全及总体中随机抽取出来,代表全及总体部分单位的集合体。抽样总体的单位数通常用小写英文字母n表示。对于全及

6.2 抽样推断中几个基本概念 6.2.1. 全及总体和抽样总体在抽样调查中，有两种不同的总体即全及总体和抽样总体。 1. 全及总体全及总体简称总体,是指所要认识对象的全体，总体是由具有某种共同性质的许多单位组成的，因此，总体也就是具有同一性质的许多单位的集合体。例如，我们要研究某城市职工的生活水平，则该城市全部职工即构成全及总体。我们要研究某乡粮食亩产水平，则该乡的全部粮食播种面积即是全及总体。全及总体按其各单位标志性质不同，可以分为变量总体和属性总体两类。构成变量总体的各个单位可以用一定的数量标志加以计量，例如，研究居民的收入水平，每户居民的收人就是它的数量标志，反映各户的数量特征。但并非所有标志都是可以计量的，有的标志只能用一定的文字加以描述。例如，要研究织布厂 l000 台织布机的完好情况，这时只能用“完好” 和“不完好”等文字作为品质标志来描述各台设备的属性特征，这种用文字描写属性特征的总体称为属性总体。区分变量总体和属性总体是很重要的，由于总体不同，认识这一总体的方法也就不同。对于变量总体可分为无限总体和有限总体两类。无限总体所包含的单位为无限多，因而各单位的变量也就有无限多的取值。这种无限变量又有两种情况：一种是可列的无限变量，即变量值的大小可以按照顺序一一列举直至无穷；另一种情况则是不可列的无限变量，它是一种连续变量，在任何一个区间内都有无限多的变量，不可能按顺序加以一一列举。我们所说的无限总体主要是指后一种情况来说的。有限总体所包含的单位数则是有限的，因而它的变量值也是有限的，当然可以按顺序加以一一列举。通常全及总体的单位数用大写的英文字母 N 来表示。作为全及总体，单位数 N 即使有限，但总是很大，大到几千，几万，几十万，几百万。例如，人口总体，棉花纤维总体，粮食产量总体等等。对无限总体的认识只能采用抽样的方法，而对于有限总体的认识，理论上虽可以应用全面调查来搜集资料，但实际上往往由于不可能或不经济而借助抽样的方法以求得对有限总体的认识。 2. 抽样总体抽样总体简称样本,是从全及总体中随机抽取出来，代表全及总体部分单位的集合体。抽样总体的单位数通常用小写英文字母 n 表示。对于全及

总体单位数N来说,n是个很小的数,它可以是N的几十分之一,几百分之一,几千分之一,几万分之般说来,样本单位数达到或超过30 个称为大样本,而在30个以下称为小样本。社会经济现象的抽样调查多取大样本。而自然实验观察则多取小样本。以很小的样本来推断很大的总体这是抽样调查的一个特点如果说全及总体是唯一确定的,那么,抽样样本就完全不是这样, 个全及总体可能抽取很多个抽样总体,全部样本的可能数目和每一样本的容量有关,它也和随机抽样的方法有关。不同的样本容量和取样方法,样本的可能数目也有很大的差别,抽样本身是一种手段,目的在于对总体做出判断,因此,样本容量要多大,要怎样取样,样本的数目可能有多少, 它们的分布又怎样,这些都是关系到对总体判断的准确程度,都需要加以认真的研究。 622.全及指标和抽样指标 1.全及指标根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标,称为全及指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。不同性质的总体,需要计算不同的全及指标。对于变量总体,由于各单位的标志可以用数量来表示,所以可以计算总体平均数。 X 对于属性总体,由于各单位的标志不可以用数量来表示,只能用一定的文字加以描述,所以,就应该计算结构相对指标,称为总体成数。用大写英文字母P表示,它说明总体中具有某种标志的单位数在总体中所占的比重。变量总体也可以计算成数,即总体单位数在所规定的某变量值以上或以下的比重,视同具有或不具有某种属性的单位数比重。设总体N个单位中,有N1个单位具有某种属性,N0个单位不具有某种属性,N1+N0=N,P为总体中具有某种属性的单位数所占的比重,Q 为不具有某种属性的单位数所占的比重,则总体成数为 N

总体单位数 N 来说，n 是个很小的数，它可以是 N 的几十分之一，几百分之一，几千分之一，几万分之一。一般说来，样本单位数达到或超过 30 个称为大样本，而在 30 个以下称为小样本。社会经济现象的抽样调查多取大样本。而自然实验观察则多取小样本。以很小的样本来推断很大的总体，这是抽样调查的一个特点。如果说全及总体是唯一确定的，那么，抽样样本就完全不是这样，一个全及总体可能抽取很多个抽样总体，全部样本的可能数目和每一样本的容量有关，它也和随机抽样的方法有关。不同的样本容量和取样方法，样本的可能数目也有很大的差别，抽样本身是一种手段，目的在于对总体做出判断，因此，样本容量要多大，要怎样取样，样本的数目可能有多少，它们的分布又怎样，这些都是关系到对总体判断的准确程度，都需要加以认真的研究。 6.2.2. 全及指标和抽样指标 1. 全及指标根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标，称为全及指标。由于全及总体是唯一确定的，根据全及总体计算的全及指标也是唯一确定的。不同性质的总体，需要计算不同的全及指标。对于变量总体，由于各单位的标志可以用数量来表示，所以可以计算总体平均数。 N X X  = 对于属性总体，由于各单位的标志不可以用数量来表示，只能用一定的文字加以描述，所以，就应该计算结构相对指标，称为总体成数。用大写英文字母 P 表示，它说明总体中具有某种标志的单位数在总体中所占的比重。变量总体也可以计算成数，即总体单位数在所规定的某变量值以上或以下的比重，视同具有或不具有某种属性的单位数比重。设总体 N 个单位中，有 N1 个单位具有某种属性，N0 个单位不具有某种属性， N1 + N0 =N，P 为总体中具有某种属性的单位数所占的比重，Q 为不具有某种属性的单位数所占的比重，则总体成数为 P= N N1

重置抽样重置抽样,又称有放回的抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位经登录其有关标志表现后又放回总体中重新参加下一次的抽选。每次从总体中抽取一个单位,可看作是一次试验,连续进行n次试验就构成了一个样本。因此,重置抽样的样本是经 n次相互独立的连续试验形成的。每次试验均是在相同的条件下完全按照随机原则进行的 2.不重置抽样不重置抽样,又称无放回的抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选。经过连续n次不重置抽选单位构成样本,实质上相当于一次性同时从总体中抽中n个单位构成样本。上一次的抽选结果会直接影响到下一次抽选,因此,不重置抽样的样本是经n次相互联系的连续试验形成的 624抽样框与样本数 1.抽样框抽样框,又称抽样结构,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样 2.样本数样本数,又称样本的可能数目,是指从总体N个单位中随机抽选n个单位构成样本,通常有多种抽选方法,每一种抽选方法实际上是n个总体单位的一种排列组合,一种排列组合便构成一个可能的样本,n个总体单位的排列组合总数,称为样本的可能数目 63抽样推断的理论基础一大数定律与中心极限定理抽样推断的理论基础主要是概率论的极限定理中的大数定律与中心极限定理。 63.1大数定律大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大

1. 重置抽样重置抽样，又称有放回的抽样，是指从全及总体 N 个单位中随机抽取一个容量为 n 的样本，每次抽中的单位经登录其有关标志表现后又放回总体中重新参加下一次的抽选。每次从总体中抽取一个单位，可看作是一次试验，连续进行 n 次试验就构成了一个样本。因此，重置抽样的样本是经 n 次相互独立的连续试验形成的。每次试验均是在相同的条件下完全按照随机原则进行的。 2. 不重置抽样不重置抽样，又称无放回的抽样，是指从全及总体 N 个单位中随机抽取一个容量为 n 的样本，每次抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选。经过连续 n 次不重置抽选单位构成样本，实质上相当于一次性同时从总体中抽中 n 个单位构成样本。上一次的抽选结果会直接影响到下一次抽选，因此，不重置抽样的样本是经 n 次相互联系的连续试验形成的。 6.2.4. 抽样框与样本数 1. 抽样框抽样框，又称抽样结构，是指对可以选择作为样本的总体单位列出名册或排序编号，以确定总体的抽样范围和结构。设计出了抽样框后，便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框，则不能计算样本单位的概率，从而也就无法进行概率选样。 2. 样本数样本数，又称样本的可能数目，是指从总体 N 个单位中随机抽选 n 个单位构成样本，通常有多种抽选方法，每一种抽选方法实际上是 n 个总体单位的一种排列组合，一种排列组合便构成一个可能的样本，n 个总体单位的排列组合总数，称为样本的可能数目。 6.3 抽样推断的理论基础—大数定律与中心极限定理抽样推断的理论基础主要是概率论的极限定理中的大数定律与中心极限定理。 6.3.1 大数定律大数定律是指在随机试验中，每次出现的结果不同，但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是，在大

量的观察试验中，个别的、偶然的因素影响而产生的差异将会相互抵消，从而使现象的必然规律性显示出来。例如，观察个别或少数家庭的婴儿出生情况，发现有的生男，有的生女，没有一定的规律性，但是通过大量的观察就会发现，男婴和女婴占婴儿总数的比重均会趋于 50%。大数定律有若干个表现形式。这里仅介绍其中常用的两个重要定律： 1. 切贝雪夫大数定理设 x1，x2 …是一列两两相互独立的随机变量，服从同一分布，且存在有限的数学期望 a 和方差σ2，则对任意小的正数ε，有： 1 lim =        −   →  a  n x P n i 该定律的含义是：当 n 很大，服从同一分布的随机变量 x1，x2 …，xn 的算术平均数 n x i 将依概率接近于这些随机变量的数学期望。将该定律应用于抽样调查，就会有如下结论：随着样本容量 n 的增加，样本平均数将接近于总体平均数。从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。 2 贝努里大数定律设 n 是 n 次独立试验中事件 A 发生的次数，且事件 A 在每次试验中发生的概率为 P，则对任意正数ε，有： 1 lim =        −  →  p  n u P n n 该定律是切贝雪夫大数定律的特例，其含义是，当 n 足够大时，事件 A 出现的频率将几乎接近于其发生的概率，即频率的稳定性。在抽样调查中，用样本成数去估计总体成数，其理论依据即在于此。 6.3.2. 中心极限定理大数定律揭示了大量随机变量的平均结果，但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下，大量独立随机变量的平均数是以正态分布为极限的。中心极限定理也有若干个表现形式，这里仅介绍其中四个常用定理。 1. 辛钦中心极限定理

山东滨州职业学院：《统计基础》第6章 抽样调查

山东滨州职业学院：《统计基础》第6章抽样调查