第六章抽样推断 教学内容: 1.抽样推断的含义、作用 2.抽样推断中的基本概念 3.抽样误差的概念、影响因素 4.概率度、概率保证程度的含义及其二者之间的关系 5.总体参数的抽样估计方法 6.随机抽样的几种抽样组织方式(含义、样本容量的确定、抽样误差的计算) 教学重点 1.抽样误差的概念、影响因素 2.总体参数的抽样估计方法 教学难点 1.抽样平均误差、极限误差的含义及其关系 2.极限误差、概率、概率度的含义及其关系 授课学时:11学时 第一节抽样推断的意义和作用 、抽样推断的概念及特点 抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据 所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性 的估计和判断,从而达到对总体现象的认识的一种方法。 它有如下特点: 1.它是由部分来推断总体的 统计研究的目的是要认识总体现象的数量特征,但不是所有的现象都可能或 可以进行全面调查来达到这种目的,有许多现象我们只能对总体的一部分单位进 行调查,而在认识上又必须对总体的数量特征作出估计和判断,这就产生了矛盾 如,我们要了解炮弹的射程,又不能对每一枚炮弹一一进行测试,要了解某一品 种棉花纤维的长度,不可能对每一根纤维都进行检验等,而抽样推断法就解决了 这个矛盾 2.按照随机的原则抽取调查单位 随机原则指在抽取调查单位时,完全排除了调查者主观因素的影响,保证总 体中每个单位都有机会中选。抽样推断就是以“按照随机原则抽取样本”为前提 的,只有遵守了随机原则,才能有更大的可能性使所抽取的样本结构与总体结构 类似,也只有遵守了随机原则,才可能对抽样误差的范围加以估计和控制
第六章 抽样推断 教学内容: 1.抽样推断的含义、作用 2.抽样推断中的基本概念 3.抽样误差的概念、影响因素 4.概率度、概率保证程度的含义及其二者之间的关系 5.总体参数的抽样估计方法 6.随机抽样的几种抽样组织方式(含义、样本容量的确定、抽样误差的计算) 教学重点: 1.抽样误差的概念、影响因素 2.总体参数的抽样估计方法 教学难点: 1.抽样平均误差、极限误差的含义及其关系 2.极限误差、概率、概率度的含义及其关系 授课学时:11 学时 第一节 抽样推断的意义和作用 一、抽样推断的概念及特点 抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据 所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性 的估计和判断,从而达到对总体现象的认识的一种方法。 它有如下特点: 1.它是由部分来推断总体的 统计研究的目的是要认识总体现象的数量特征,但不是所有的现象都可能或 可以进行全面调查来达到这种目的,有许多现象我们只能对总体的一部分单位进 行调查,而在认识上又必须对总体的数量特征作出估计和判断,这就产生了矛盾。 如,我们要了解炮弹的射程,又不能对每一枚炮弹一一进行测试,要了解某一品 种棉花纤维的长度,不可能对每一根纤维都进行检验等,而抽样推断法就解决了 这个矛盾。 2.按照随机的原则抽取调查单位 随机原则指在抽取调查单位时,完全排除了调查者主观因素的影响,保证总 体中每个单位都有机会中选。抽样推断就是以“按照随机原则抽取样本”为前提 的,只有遵守了随机原则,才能有更大的可能性使所抽取的样本结构与总体结构 类似,也只有遵守了随机原则,才可能对抽样误差的范围加以估计和控制
3.抽样误差是不可避免的,但可以事先计算并加以控制 样本对总体的代表性总会发生误差,但是抽样误差的范围可以事先通过有关 资料加以计算,并且通过一定的组织措施来控制这个误差范围,保证抽样推断的 结果达到一定的可靠程度 、抽样推断的作用 1.在无法或很困难进行全面调查情况下,可以应用抽样法来了解全面情况 ①有些现象的总体过大,单位过于分散,不可能进行全面调查。如水库鱼苗 数、森林的木材积蓄量、居民家计调查等。 ②具有破坏性和损耗性的检查和试验,不可能进行全面调查。如轮胎的行驶 里程、灯炮的耐用时间、电视机的抗震能力、罐头食品的卫生检査、人体白血球 数量的化验、炮弹的杀伤力等都具有破坏性,不可能进行一一的检查试验 2.应用抽样法不但比全面调查有更大的优越性,并可对全面调查的结果加以 补充和订正。 ①有些现象可以进行全面调查,但它费时费力、参加人员多、登记性误差大, 若用抽样法可省时、省力、及时取得统计资料。 ②应用抽样法可以对全面调查的结果加以补充和订正。全面调查单位多、范 围广、参加人员多、人员素质相对低下、登计性误差大。若在全面调查之后,随 机抽取一部分调査单位进行抽样调查,将这些单位两次调查的结果进行对照,计 算其差错率,以修正全面调査资料,这样可以提髙全面调査资料的准确性。 例如,全国人口普査,在填报和复查完毕后,按照规定再抽取一定比例的人 数,重新进行调查,由于后者人数少,登记性误差小,调査比较准确,将两次调 査的结果进行比较,并计算全面调查重复或遗漏的差错率,订正普查数字。 3.用于生产过程中产品质量的检查和控制 抽样推断可以随时检査生产工艺过程是否正常,是否存在某些系统性偏误 (尺寸统计偏大或偏小等),及时提供有关信息,以便采取措施,预防大批次品、 废品的发生。 4.可以对总体的某种假设进行检验
3.抽样误差是不可避免的,但可以事先计算并加以控制 样本对总体的代表性总会发生误差,但是抽样误差的范围可以事先通过有关 资料加以计算,并且通过一定的组织措施来控制这个误差范围,保证抽样推断的 结果达到一定的可靠程度。 二、抽样推断的作用 1.在无法或很困难进行全面调查情况下,可以应用抽样法来了解全面情况 ①有些现象的总体过大,单位过于分散,不可能进行全面调查。如水库鱼苗 数、森林的木材积蓄量、居民家计调查等。 ②具有破坏性和损耗性的检查和试验,不可能进行全面调查。如轮胎的行驶 里程、灯炮的耐用时间、电视机的抗震能力、罐头食品的卫生检查、人体白血球 数量的化验、炮弹的杀伤力等都具有破坏性,不可能进行一一的检查试验。 2.应用抽样法不但比全面调查有更大的优越性,并可对全面调查的结果加以 补充和订正。 ①有些现象可以进行全面调查,但它费时费力、参加人员多、登记性误差大, 若用抽样法可省时、省力、及时取得统计资料。 ②应用抽样法可以对全面调查的结果加以补充和订正。全面调查单位多、范 围广、参加人员多、人员素质相对低下、登计性误差大。若在全面调查之后,随 机抽取一部分调查单位进行抽样调查,将这些单位两次调查的结果进行对照,计 算其差错率,以修正全面调查资料,这样可以提高全面调查资料的准确性。 例如,全国人口普查,在填报和复查完毕后,按照规定再抽取一定比例的人 数,重新进行调查,由于后者人数少,登记性误差小,调查比较准确,将两次调 查的结果进行比较,并计算全面调查重复或遗漏的差错率,订正普查数字。 3.用于生产过程中产品质量的检查和控制 抽样推断可以随时检查生产工艺过程是否正常,是否存在某些系统性偏误 (尺寸统计偏大或偏小等),及时提供有关信息,以便采取措施,预防大批次品、 废品的发生。 4.可以对总体的某种假设进行检验
可以对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍。 新工艺、新配方推广后是否有显著的效果,可以作出某种假设,并确定接受或拒 绝的标准,然后应用抽样推断的方法根据抽样结果对所作的假设进行检验,作出 判断。某种药品临床试验,负作用有多大,效果怎样等。 第二节抽样推断中的基本概念 全及总体和样本总体 (一)全及总体(母体、总体) 概念:它是我们所要了解、认识对象的全体,是由具有某种共同性质的许多 单位构成的。 例如,我们要对西安石油大学所有学生进生统计,西安石油大学的所有学生 构成一个总体;要对某个企业的产品质量进行检验,则该厂所有的产品构成一个 总体。 全及总体的单位数用N表,(N总是很大的) 种类:全及总体按所研究标志的性质不同分为:变量总体、属性总体。 ①变量总体:对于一个总体,若被研究的标志属于数量标志,则把这个总体 称为变量总体。 如反映职工的工资高低、学生的学习成绩、居民的收入水平等,则职工、学 生、居民总体均为变量总体。 ②属性总体:对于一个总体,若被研究的标志属于品质标志,则把这个总体 称为属性总体。 如反映机器设备的完好情况(完全不完好),反映性别差异的新生婴儿总体 反映质量好坏的产品总体等。 对于总体按其所包含的单位数多少分为:有限总体、无限总体。 有限总体:总体中所包含的单位数是有限的,变量的取值也是有限的。如 个工厂的设备、台数,一个国家的人口数等 无限总体:总体中所包含的单位数有无限多。如自然科学中的实验,它可以 无限次地进行下去,因此,也只能通过抽样取得数据
可以对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍。 新工艺、新配方推广后是否有显著的效果,可以作出某种假设,并确定接受或拒 绝的标准,然后应用抽样推断的方法根据抽样结果对所作的假设进行检验,作出 判断。某种药品临床试验,负作用有多大,效果怎样等。 第二节 抽样推断中的基本概念 一、全及总体和样本总体 (一)全及总体(母体、总体) 概念:它是我们所要了解、认识对象的全体,是由具有某种共同性质的许多 单位构成的。 例如,我们要对西安石油大学所有学生进生统计,西安石油大学的所有学生 构成一个总体;要对某个企业的产品质量进行检验,则该厂所有的产品构成一个 总体。 全及总体的单位数用 N 表,(N 总是很大的) 种类:全及总体按所研究标志的性质不同分为:变量总体、属性总体。 ①变量总体:对于一个总体,若被研究的标志属于数量标志,则把这个总体 称为变量总体。 如反映职工的工资高低、学生的学习成绩、居民的收入水平等,则职工、学 生、居民总体均为变量总体。 ②属性总体:对于一个总体,若被研究的标志属于品质标志,则把这个总体 称为属性总体。 如反映机器设备的完好情况(完全不完好),反映性别差异的新生婴儿总体, 反映质量好坏的产品总体等。 对于总体按其所包含的单位数多少分为:有限总体、无限总体。 有限总体:总体中所包含的单位数是有限的,变量的取值也是有限的。如一 个工厂的设备、台数,一个国家的人口数等。 无限总体:总体中所包含的单位数有无限多。如自然科学中的实验,它可以 无限次地进行下去,因此,也只能通过抽样取得数据
(二)样本总体(样本、子样) 样本:它是我们所要观察的对象,它是从全及总体中随机抽取出来的,代表 全及总体的那部分单位所组成的整体(小总体)。 例如,从石油大学所有的学生中随机抽取200名学生进行调查;从所有的产 品中随机抽取100件产品进行产品质量检验等,这200名学生、100件产品是样 本 样本个数:从总体中可能抽取的样本数目。 样本容量:样本总体的单位数叫样本容量,通常用n表示。如上例,第一个 样本容量为200,第二个样本容量为100。 由于样本单位数的多少不同:大样本:n≥30;小样本:n<30。 对于一个问题,全及总体是唯一确定的:而样本总体则不然,一个全及总体 可能抽取许多个样本总体。所有样本的可能数目既和样本的容量大小有关,也和 样本的抽取方法有关 、全及指标和抽样指标 (一)全及指标:根据全及总体各个单位的标志值或标志特征计算的,反映 总体某种属性或特征的综合指标叫全及指标,也称它为参数。例如,某企业所有 职工是总体,则该企业的平均工资是一个全及指标,它是根据每个职工的工资计 算的:又如,某个企业报告期所生产的全部产品是总体,则该批产品的合格率就 是全及指标。 个总体常常有多个参数,它们从各个不同的角度反映总体的数量特征。 1.变量总体的全及指标 由于变量总体各单位的标志值可以用数量来表示,所以可以计算全及总体的 平均数x和总体的标准差 X=2X或X ∑F N-o=/2(X-X2F ∑(x-X ∑F 2.属性总体的全及指标 由于各单位的标志不能用数值来表示,而只能用一定的述语来描述,所以, 全及指标常用成数P来表示具有某种属性的单位数占总体单位数的比重;Q表示
(二)样本总体(样本、子样) 样本:它是我们所要观察的对象,它是从全及总体中随机抽取出来的,代表 全及总体的那部分单位所组成的整体(小总体)。 例如,从石油大学所有的学生中随机抽取 200 名学生进行调查;从所有的产 品中随机抽取 100 件产品进行产品质量检验等,这 200 名学生、100 件产品是样 本。 样本个数:从总体中可能抽取的样本数目。 样本容量:样本总体的单位数叫样本容量,通常用 n 表示。如上例,第一个 样本容量为 200,第二个样本容量为 100。 由于样本单位数的多少不同:大样本:n≥30;小样本:n<30。 对于一个问题,全及总体是唯一确定的;而样本总体则不然,一个全及总体 可能抽取许多个样本总体。所有样本的可能数目既和样本的容量大小有关,也和 样本的抽取方法有关。 二、全及指标和抽样指标 (一)全及指标:根据全及总体各个单位的标志值或标志特征计算的,反映 总体某种属性或特征的综合指标叫全及指标,也称它为参数。例如,某企业所有 职工是总体,则该企业的平均工资是一个全及指标,它是根据每个职工的工资计 算的;又如,某个企业报告期所生产的全部产品是总体,则该批产品的合格率就 是全及指标。 一个总体常常有多个参数,它们从各个不同的角度反映总体的数量特征。 1.变量总体的全及指标 由于变量总体各单位的标志值可以用数量来表示,所以可以计算全及总体的 平均数 x和总体的标准差 。 2.属性总体的全及指标 由于各单位的标志不能用数值来表示,而只能用一定的述语来描述,所以, 全及指标常用成数 P 来表示具有某种属性的单位数占总体单位数的比重;Q 表示 X XF 或 X N F X = 2 2 (X X) (X X) F 或σ= N F - - σ=
不具有某种属性的单位数占总体单位数和比重。 P P+O =P P(1-P 全及指标的特点:全及指标所反映的总体范围是确定的,指标的计算方法是 已知的,具体指标数值是唯一的,但却又是未知的,只能通过抽样指标进行推断 估算 (二)抽样指标 根据样本总体中各个单位的标志值或标志特征计算的指标,又被称为统计 例如,石油大学200名学生的平均成绩;从某个企业所生产的所有产品中, 随机抽选出来的100件产品的合格率等就是抽样指标。 和全及指标相对应,抽样指标有抽样平均数x,抽样成数P和样本标准差s。 变量总体 或x ∑(x-x) 属性总体: x-p p=√p(1-p) 抽样指标的特点:随着样本的不同,抽样指标也不同,它是一个随机变量。 但是,当抽定一个样本后,抽样指标是可以计算出来的。(可计算但不唯一) 三、抽样方法和样本的可能数目 从一个总体中可以抽取多少个样本,它既和样本容量有关,也和抽样的方法 有关。当样本的容量一定时,样本的可能数目便取决于抽样的方法。 抽样方法又可以从取样方式和对样本的要求不同等方面来研究。 (一)根据取样方式的不同,抽样方法分为:重复(置)抽样;不重复(置) 抽样 1.重复抽样
不具有某种属性的单位数占总体单位数和比重。 N N P 1 N N Q 1 P Q 1 x P P(1 P) 全及指标的特点:全及指标所反映的总体范围是确定的,指标的计算方法是 已知的,具体指标数值是唯一的,但却又是未知的,只能通过抽样指标进行推断、 估算。 (二)抽样指标 根据样本总体中各个单位的标志值或标志特征计算的指标,又被称为统计 量。 例如,石油大学 200 名学生的平均成绩;从某个企业所生产的所有产品中, 随机抽选出来的 100 件产品的合格率等就是抽样指标。 和全及指标相对应,抽样指标有抽样平均数 x,抽样成数 P 和样本标准差 s。 变量总体: 属性总体: 抽样指标的特点:随着样本的不同,抽样指标也不同,它是一个随机变量。 但是,当抽定一个样本后,抽样指标是可以计算出来的。(可计算但不唯一) 三、抽样方法和样本的可能数目 从一个总体中可以抽取多少个样本,它既和样本容量有关,也和抽样的方法 有关。当样本的容量一定时,样本的可能数目便取决于抽样的方法。 抽样方法又可以从取样方式和对样本的要求不同等方面来研究。 (一)根据取样方式的不同,抽样方法分为:重复(置)抽样;不重复(置) 抽样。 1.重复抽样 x xf x x n f 或 (x x) (x x) f s n f s 2 2 或 n1 x p n s pq p(1 p)
抽样过程是:从总体N个单位中,要随机抽取一个容量为n的样本,每次从 总体中抽取一个单位,把它看作一次试验,每次抽出一个单位后,把结果登记下 来,又重新放回总体中,参加下一次抽选,连续进行几次试验构成一个样本 特点:①重复抽样由n次相互独立的试验构成 ②每次试验是在相同的条件下进行的(总体单位相等); ③每个单位中选的机会在各次都是完全一样的(N)。 例如:总体有A、B、C、D四个单位,要从中随机重复抽取两个单位构成 个样本。先从四个单位中抽取一个单位,结果登记后放回,然后再从相同的四个 单位中抽取第二个单位,就构成了一个样本,全部可能抽取的样本数目有: CA、CB、CC、CD BA、BB、BC、BD DA、DB、DC、DD 第一个单位为A,第二个可能为A、B、C、D, 第一个单位可能是A、B、C、D中的任何一个,第一个抽定后,都可搭配四 个样本,则样本的可能数目为4×4=42。 般地说,从总体N个单位中,随机重复抽取n个单位构成一个样本,则共 可抽取N个样本 2.不重复抽样 从总体N个单位中,要抽取一个容量为n样本,每次从总体中抽取一个单位, 不再放回参加下一次的抽选,连续进行n次抽取,就构成了一个样本。 其特点:样本是由几次连续抽取结果构成,实质上等于一次同时从总体中抽 取n个样本单位。 ①连续n次抽选的结果不是相互独立的; ②第一次抽取的结果影响下一次的抽取,每抽一次,总体的单位就少一个; ③每个单位的中选机会在各次是不相等的。 例如:总体有A、B、C、D四个单位,用随机不重复的方法从中抽取两个单 位构成一个样本,则全部可能的样本数为 AB、AC、ADBA、BC、BD
抽样过程是:从总体 N 个单位中,要随机抽取一个容量为 n 的样本,每次从 总体中抽取一个单位,把它看作一次试验,每次抽出一个单位后,把结果登记下 来,又重新放回总体中,参加下一次抽选,连续进行几次试验构成一个样本。 特点:①重复抽样由 n 次相互独立的试验构成; ②每次试验是在相同的条件下进行的(总体单位相等); ③每个单位中选的机会在各次都是完全一样的( N 1 )。 例如:总体有 A、B、C、D 四个单位,要从中随机重复抽取两个单位构成一 个样本。先从四个单位中抽取一个单位,结果登记后放回,然后再从相同的四个 单位中抽取第二个单位,就构成了一个样本,全部可能抽取的样本数目有: AA、AB、AC、AD CA、CB、CC、CD BA、BB、BC、BD DA、DB、DC、DD 第一个单位为 A,第二个可能为 A、B、C、D, 第一个单位可能是 A、B、C、D 中的任何一个,第一个抽定后,都可搭配四 个样本,则样本的可能数目为 4×4=4 2。 一般地说,从总体 N 个单位中,随机重复抽取 n 个单位构成一个样本,则共 可抽取 N n个样本。 2.不重复抽样 从总体 N 个单位中,要抽取一个容量为 n 样本,每次从总体中抽取一个单位, 不再放回参加下一次的抽选,连续进行 n 次抽取,就构成了一个样本。 其特点:样本是由几次连续抽取结果构成,实质上等于一次同时从总体中抽 取 n 个样本单位。 ①连续 n 次抽选的结果不是相互独立的; ②第一次抽取的结果影响下一次的抽取,每抽一次,总体的单位就少一个; ③每个单位的中选机会在各次是不相等的。 例如:总体有 A、B、C、D 四个单位,用随机不重复的方法从中抽取两个单 位构成一个样本,则全部可能的样本数为: AB、AC、AD BA、BC、BD
第一个单位有四种抽法,可能是A、B、C、D中的任一个,而第一个单位选 定后,第二个单位只有三种抽法,所以全部可能的样本数目为4×3=12种。 第一次4种可能,每一种都搭配3个样本。 般地说,从总体N个单位中,随机不重复抽取n个单位构成一个样本,则 共有样本为 N(N-1)(N-2)…(N-n+1) (N-n)! 第一个单位有N种抽法,第二个单位有N-1种抽法,第n个单位有N-(n-1) 种,总共抽n个单位∴为(N-n+1) 由此可见,在相同的样本容量要求下,不重复抽样的样本个数总是比重复抽 样的样本个数少。 (二)根据对样本的要求不同,抽样方法又有考虑顺序的抽样、不考虑顺序 的抽样之分。 1.考虑顺序的抽样:从总体N个单位中随机抽取n个单位构成样本,不但要 考虑样本各单位的组成成份,而且要考虑各单位的中选顺序。如AB、BA二者虽 然成份相同,但中选顺序不同,在考虑顺序的情况下算两个样本 2.不考虑顺序的抽样:从总体N个单位中抽取n个单位构成一个样本,只考 虑样本各单位的构成成份如何,不考虑各单位的中选顺序。如AB、BA虽然顺序 不同,但二者的组成成份相同,在不考虑顺序的条件下,只能算一个样本 (三)互叉抽样的样本数目 (考虑顺序在数学上叫排列,不考虑顺序叫组合) 1.考虑顺序的不重复抽样的样本数目(即前面不重复抽样的数目) 即通常所说的不重复排列数,从总体N个单位中每次抽取n个单位不重复排 列,组成样本的可能数目记作N 例如,总体有A、B、C、D四个单位,要从中随机抽取两个单位构成一个样 先从总体的四个单位中抽取第一个单位,第一个单位可能是A、B、C、D中
CA、CB、CD DA、DB、DC 第一个单位有四种抽法,可能是 A、B、C、D 中的任一个,而第一个单位选 定后,第二个单位只有三种抽法,所以全部可能的样本数目为 4×3=12 种。 第一次 4 种可能,每一种都搭配 3 个样本。 一般地说,从总体 N 个单位中,随机不重复抽取 n 个单位构成一个样本,则 共有样本为: ! ( 1)( 2) ( 1) ( )! N N N N N n N n 第一个单位有 N 种抽法,第二个单位有 N-1 种抽法,第 n 个单位有 N-(n-1) 种,总共抽 n 个单位为(N- n+1) 由此可见,在相同的样本容量要求下,不重复抽样的样本个数总是比重复抽 样的样本个数少。 (二)根据对样本的要求不同,抽样方法又有考虑顺序的抽样、不考虑顺序 的抽样之分。 1.考虑顺序的抽样:从总体 N 个单位中随机抽取 n 个单位构成样本,不但要 考虑样本各单位的组成成份,而且要考虑各单位的中选顺序。如 AB、BA 二者虽 然成份相同,但中选顺序不同,在考虑顺序的情况下算两个样本。 2.不考虑顺序的抽样:从总体 N 个单位中抽取 n 个单位构成一个样本,只考 虑样本各单位的构成成份如何,不考虑各单位的中选顺序。如 AB、BA 虽然顺序 不同,但二者的组成成份相同,在不考虑顺序的条件下,只能算一个样本。 (三)互叉抽样的样本数目 (考虑顺序在数学上叫排列,不考虑顺序叫组合) 1.考虑顺序的不重复抽样的样本数目(即前面不重复抽样的数目) 即通常所说的不重复排列数,从总体 N 个单位中每次抽取 n 个单位不重复排 列,组成样本的可能数目记作 n AN 。 例如,总体有 A、B、C、D 四个单位,要从中随机抽取两个单位构成一个样 本。 先从总体的四个单位中抽取第一个单位,第一个单位可能是 A、B、C、D 中
的任何一个,当第一个单位抽出后,不再放回,然后再从剩下的三个中的任何 个 AB、AC、AD DA、DB、DC 第一个抽中A后,A可以搭配三个样本,同样,第一个是B、C、D时它们也 可分别搭配三个样本,则样本的可能数目为:4×3=12 般地,从总体N个单位中,随机不重复抽取n个单位构成一个样本,则共 可抽取A=N(N-1)N-2)…(-n+1)=_M 个样本 (N-n) 又如表2-1资料。 表2 N 样本的可能数目 10 A2=10×9=90 10 A10=10×9×8×7=5040 2.考虑顺序的重复抽样(即前面重复抽样)的样本数目 从总体N个单位中每次抽取n个允许重复的排列组成样本的可能数目记作 例如总体有A、B、C、D四个单位,要从中随机抽取两个单位构成一个样本 先从总体的四个单位中抽取第一个单位,它可能是A、B、C、D中的任何 个,当第一个单位中抽出后,把结果登记下来再放回,然后从相同的四个单位中 抽取第二个样本单位,它也可能是A、B、C、D中的任何一个 BA、BB、BC、BD DA、DB、DC、DD 第一个为A,它可搭配四个样本,同样B、C、D都分别可以搭想四个样本, 总共为4×4=42=16个 般地说,从总体N个单位中随机重复抽取n个单位进行排列,则共可抽取 N个样本。又如表2-2资料
的任何一个,当第一个单位抽出后,不再放回,然后再从剩下的三个中的任何一 个。 AB、AC、AD BA、BC、BD CA、CB、CD DA、DB、DC 第一个抽中 A 后,A 可以搭配三个样本,同样,第一个是 B、C、D 时它们也 可分别搭配三个样本,则样本的可能数目为:4×3=12。 一般地,从总体 N 个单位中,随机不重复抽取 n 个单位构成一个样本,则共 可抽取 个样本 又如表 2-1 资料。 表 2-1 2.考虑顺序的重复抽样(即前面重复抽样)的样本数目 从总体 N 个单位中每次抽取 n 个允许重复的排列组成样本的可能数目记作 n BN 。 例如总体有 A、B、C、D 四个单位,要从中随机抽取两个单位构成一个样本。 先从总体的四个单位中抽取第一个单位,它可能是 A、B、C、D 中的任何一 个,当第一个单位中抽出后,把结果登记下来再放回,然后从相同的四个单位中 抽取第二个样本单位,它也可能是 A、B、C、D 中的任何一个 AA、AB、AC、AD、 BA、BB、BC、BD CA、CB、CC、CD、 DA、DB、DC、DD 第一个为 A,它可搭配四个样本,同样 B、C、D 都分别可以搭想四个样本, 总共为 4×4=4 2=16 个 一般地说,从总体 N 个单位中随机重复抽取 n 个单位进行排列,则共可抽取 N n个样本。又如表 2-2 资料。 N n 样本的可能数目 10 2 10 4 10 9 8 7 5040 4 A10 n N N! = N(N -1)(N - 2) (N - n +1)= (N - n)! A
表2-2 样本的可能数目 2 B=102 4 B6=10+=1000 3.不考虑顺序的不重复抽样的样本数目(不重复组合数) 从总体N个单位中每次抽取n个不允许重复的组合,组成样本的可能数目记 作记作C。 An V!_N(N=1)2,(N=n+1) n! (N-n)!n n 这是因为一个组合的样本,进行排列可有n!个样本。如AB进行排列有: AB、BA2×1=2个排列样本; 又如A、B、C进行排列有:ABC、ACB、BAC、BCA、CAB、CBA3×2=6个 排列样本。因此,用考虑顺序的不重复抽样的样本数目除以n!即为不考虑顺序 的不重复抽样的样本数目。 例如,从A、B、C、D四个单位中随机重复抽取n个单位,其样本的数目为: 考虑顺序的不重复样本数目为4 BA、BC、BD CA、CB、CD DA、DB、DC 共12个,从中把重复的删去,只剩下6个样本。 用上面的公式计算: 4×3 (N-1)…( n 又如表2-3资料。 表2-3 N 样本的可能数目 10×9 45 10×9×8×7 4 =210 4×3×2 4.不考虑顺序的重复抽样的样本数目(可重复组合数)
表 2-2 3.不考虑顺序的不重复抽样的样本数目(不重复组合数) 从总体 N 个单位中每次抽取 n 个不允许重复的组合,组成样本的可能数目记 作记作 。 这是因为一个组合的样本,进行排列可有 n!个样本。如 AB 进行排列有: AB、BA 2×1=2 个排列样本; 又如 A、B、C 进行排列有:ABC、ACB、BAC、BCA、CAB、CBA 3×2=6 个 排列样本。因此,用考虑顺序的不重复抽样的样本数目除以 n!即为不考虑顺序 的不重复抽样的样本数目。 例如,从 A、B、C、D 四个单位中随机重复抽取 n 个单位,其样本的数目为: 考虑顺序的不重复样本数目为 n AN AB、AC、AD BA、BC、BD CA、CB、CD DA、DB、DC 共 12 个,从中把重复的删去,只剩下 6 个样本。 用上面的公式计算: 6 2 4 3 n CN ! ( 1) ( 1) n N N N n 又如表 2-3 资料。 表 2-3 N n 样本的可能数目 10 2 45 2 10 9 10 4 210 4 3 2 10 9 8 7 4.不考虑顺序的重复抽样的样本数目(可重复组合数) N n 样本的可能数目 10 2 10 100 2 2 B10 10 4 10 10000 4 4 B10
记作D8,它等于从N+n-1个单位中抽取n个单位的不重复组合数即: A DN=C (N+n-1)! (N+n-1-n)!n! A 在C的基础上扩大总体单位数,∴重复数目>不重复 例如,从总体A、B、C、D四个单位中随机重复抽取2个单位进行组合,则 样本的个数为 不考虑顺序的不重复抽样N:AB、AC、AD、BC、BD、CD 在前一个基础上增加重复的4个则为 不考虑顺序的重复抽样D:AA、AB、AC、AD、BB、BC、BD、CC、CD、DD 共10个 D"=CMm/≈(4+2-1)5×4×3×2=10 用公式计算 (4-1)2!3×2×2 又如表2-4资料。 表2-4 n 样本的可能数目 (10+2-1)!11×10×9×8×7×6×5×4×3×2 10 =55 (10-1)2!9×8×7×6×5×4×3×2×2 (10+4-1)!13×12×11×10 10 4 =715 (10-1)!4 4×3×2 从以上例子可看到:①重复抽样比不重复抽样的样本数目多得多;②样本容 量增大,则样本的数目也增多。 第三节抽样误差 一、抽样误差的意义 (一)概念 这里的误差是指抽样指标与总体指标之差的绝对值。在抽样调查过程中,会 产生各种各样的误差,根据其产生的原因不同分为 1.登记性误差:由于观察、登记、计量、计算上的差错计起而产生的抽样指 标与总体指标之间的误差
记作 n DN ,它等于从 N+n-1 个单位中抽取 n 个单位的不重复组合数即: ( 1 )! ! ( 1)! ! 1 1 N n n n N n n A D C n n N n N n nN 在 C 的基础上扩大总体单位数,重复数目>不重复 例如,从总体 A、B、C、D 四个单位中随机重复抽取 2 个单位进行组合,则 样本的个数为: 不考虑顺序的不重复抽样 n CN : AB、AC、AD、BC、BD、CD 在前一个基础上增加重复的 4 个则为: 不考虑顺序的重复抽样 : AA、AB、AC、AD、BB、BC、BD、CC、CD、DD 共 10 个 用公式计算: 10 3 2 2 5 4 3 2 (4 1)!2! (4 2 1)! 1 nN n n DN C 又如表 2-4 资料。 表 2-4 N n 样本的可能数目 10 2 10 2 1! 11 10 9 8 7 6 5 4 3 2 55 (10 1)!2! 9 8 7 6 5 4 3 2 2 10 4 (10 4 1)! 13 12 11 10 715 (10 1)!4! 4 3 2 从以上例子可看到:①重复抽样比不重复抽样的样本数目多得多;②样本容 量增大,则样本的数目也增多。第三节 抽样误差 一、抽样误差的意义 (一)概念 这里的误差是指抽样指标与总体指标之差的绝对值。在抽样调查过程中,会 产生各种各样的误差,根据其产生的原因不同分为: 1.登记性误差:由于观察、登记、计量、计算上的差错计起而产生的抽样指 标与总体指标之间的误差