《抽样调查》课程PPT教学课件：第三章简单随机抽样（3.1-3.2-3.3）

3.1 简单随机抽样及实施方法 3.2 总体平均数与总和的估计 3.3 估计量的方差及其估计

团购合买资源类别：文库，文档格式：PPT，文档页数：17，文件大小：375.5KB

第三章简单随机抽样 §1简单随机抽样及实施方法简单随机抽样就是从装有N张票子的盒子里随机无放回地摸取n张票子,它可以有两种摸取方法: (1)从盒子中一次摸取张票。这样摸取共种可能性,每种可能的概率为(N)。抽到的样本称为简单随机样本。 (2)从盒子中随机摸取1张票,相应该票的单元入样后, 票并不放回盒子,从余下的票中再随机摸取1张票,相应此票的单元也入样且票也不返回盒子;依此实施,直到第n 个样本入样

§1 简单随机抽样及实施方法简单随机抽样就是从装有 N 张票子的盒子里随机无放回地摸取 n 张票子，它可以有两种摸取方法：第三章简单随机抽样（1）从盒子中一次摸取 n 张票。这样摸取共有种可能性，每种可能的概率为。抽到的样本称为简单随机样本。         n N         n N 1 （2）从盒子中随机摸取 1 张票，相应该票的单元入样后，票并不放回盒子，从余下的票中再随机摸取 1 张票，相应此票的单元也入样且票也不返回盒子；依此实施，直到第n 个样本入样

这两种方法都使用了随机的方法,而且样本并不重复那么这两种方法是否都算是简单随机抽样呢?要检验一下这两种方法中每一单元的入样概率是否相等。只要验证第二种方法中总体的每,n个单元=组的样本样的可能性等手第种方法中的N即可。利用条件概率即可得到验证。也就是说,两种操作方法是等价的。都是简单随机抽样但由于N、n一般都很大,第二种操作方案较方便。现在介绍一下具体实施简单随机抽样的做法: 首先将N个总体元素编号为:1,2,,N,每一单元对应个号码,若抽到某号,则相应单元入样

这两种方法都使用了随机的方法，而且样本并不重复，那么这两种方法是否都算是简单随机抽样呢？要检验一下这两种方法中每一单元的入样概率是否相等。只要验证第二种方法中总体的每 n 个单元一组的样本入样的可能性等于第一种方法中的即可。         n N 1 利用条件概率即可得到验证。也就是说，两种操作方法是等价的。都是简单随机抽样但由于N、n一般都很大，第二种操作方案较方便。现在介绍一下具体实施简单随机抽样的做法：首先将N个总体元素编号为：1，2，，N，每一单元对应一个号码，若抽到某号，则相应单元入样

(1)抽签法:实际上就是一个盒子模型,将编号为1~N的 N个形状与质地完全相同的纸签放在盒子里,用上述两种方法之一从盒子中摸出n张签。 (2)随机数法:设想N相当大,你会做那么多的签放在盒子里以供抽取吗?随机数法用来解决这个困难。利用随机数表、随机数骰子或计算机可以获得随机数。 ①随机数表:本书最后附有随机数表,它应当被看成0~9数字随机地横竖排列,我们可以随机地从某行某列的数字开始如果需要一至二位数字,则从该数字开始从左向右接连地截取,该行不够则换下一行开始;如果需要三位或三位以上数字,则从开头数字开始向右取三位或三位以上的数从该数纵向往下接连获取其它随机数,不够可另换列执行,直到取到我们所需要的个数n,当然这中间应该去掉可能发生重复的数以及超出N的数字

（1）抽签法：实际上就是一个盒子模型，将编号为1～N的 N个形状与质地完全相同的纸签放在盒子里，用上述两种方法之一从盒子中摸出n 张签。（2）随机数法：设想N相当大，你会做那么多的签放在盒子里以供抽取吗？随机数法用来解决这个困难。利用随机数表、随机数骰子或计算机可以获得随机数。 ①随机数表：本书最后附有随机数表，它应当被看成0～9数字随机地横竖排列，我们可以随机地从某行某列的数字开始如果需要一至二位数字，则从该数字开始从左向右接连地截取，该行不够则换下一行开始；如果需要三位或三位以上数字，则从开头数字开始向右取三位或三位以上的数从该数纵向往下接连获取其它随机数，不够可另换列执行，直到取到我们所需要的个数n ，当然这中间应该去掉可能发生重复的数以及超出N的数字

②随机数骰子:随机数骰子是由均质材料制成的正二十面体面上标有0~9数字各两个。如图所示。通常用3~6个随机骰子,视所需要的随机数的位数而定。骰子用不回的颜色染成可事先规定好哪种颜色的骰子产生个位数,哪种颜色的骰子产生十位数,依次下去。将所需骰子在盒内摇匀等稳定后揭盖读取朝上面的数字,即获取一组随机数。所摇的骰子数m 通常取决于总体单元个数N,满足10m<N≤10m。记m个骰子按约定颜色而确定的顺序读得随机数R,若0≤N,则此R即为一次合格的随机数;否则予以放弃,重新摇取,直到取到n个合格的随机数为止。 ③利用计算机产生随机数:不少现成的统计软件都可提供此类服务。但必须指出,这样产生的随机数一般不能保证其随机性,称为“伪随机数”。因此,提倡前述方法产生随机数

③利用计算机产生随机数：不少现成的统计软件都可提供此类服务。但必须指出，这样产生的随机数一般不能保证其随机性，称为“伪随机数”。因此，提倡前述方法产生随机数。 ②随机数骰子：随机数骰子是由均质材料制成的正二十面体面上标有0～9数字各两个。如图所示。通常用3～6个随机骰子，视所需要的随机数的位数而定。骰子用不同的颜色染成可事先规定好哪种颜色的骰子产生个位数，哪种颜色的骰子产生十位数，依次下去。将所需骰子在盒内摇匀等稳定后揭盖读取朝上面的数字，即获取一组随机数。所摇的骰子数m 通常取决于总体单元个数N，满足。记m个骰子按约定颜色而确定的顺序读得随机数，若，则此即为一次合格的随机数；否则予以放弃，重新摇取，直到取到n个合格的随机数为止。 m m 10 N 10 1   − R0 R0  N R0

§2总体平的数与总和的估针设总体元素为1,H2,…,Y,(1,y2,…’yn)为来自该总体的简单随机样本,有时也记样本为五,,…,了) 1,i2…,l)1,2,…,N)中的某个组合。在后者的表示中随机性体现在下标i(j=1,2,…,n)上。样本(1,y2,,y) 是总体Y1,Y2,…,Y的一个有代表性的剖面总体平均数的估计为、分 N 总体总和的估计自然为:y=N×y= ∑y 由于这两个估计之间仅差一个常数因子N,因而只要重点研究Y的估计量y的若干性质即可。y是样本平均数,由于样本的随机性,样本平均值也是随机变量,y理论上的平均值

§2 总体平均数与总和的估计设总体元素为，为来自该总体的简单随机样本，有时也记样本为为中的某个组合。在后者的表示中随机性体现在下标上。样本是总体的一个有代表性的剖面。 1 2 , , , Y Y YN 1 2 ( , , , ) n y y y 1 2 ( , , , ) n Y Y Y i i i 1 2 ( , , , ) n i i i (1, 2, , ) N ( 1,2, , ) j i j n = 1 2 ( , , , ) n y y y 1 2 , , , Y Y YN 总体平均数 Y 的估计为： = = n i i y n y 1 1 总体总和的估计自然为： = =  = n i i y n N Y N y 1 ~ˆ 由于这两个估计之间仅差一个常数因子N，因而只要重点研究的估计量的若干性质即可。是样本平均数，由于样本的随机性，样本平均值也是随机变量，理论上的平均值 Y y y y

即数学期望为: E(y)= (Y,+Y,+…+.) N ∑ l2 n 其中∑表示对(2,…,N)中所有组合(1,2,,n)求和对于(Y1,Y2,…,Hn)中的每个元素,比如F1,它与其它元素构成样本的可能次数显然 n-1 因此,乃至Y在 ∑中出现的次数均 ,于是 1(N-1 E(=7 ∑ Y =1n

即数学期望为：  + + +         = ( ) 1 1 ( ) 1 2 n Yi Yi Yi n n N E y  其中  表示对 (1,2,  , N) 中所有组合 (i 1 ,i 2 ,  ,i n ) 求和对于中的每个元素，比如，它与其它元素构成样本的可能次数显然为，因此，乃至在中出现的次数均为，于是 ( , , , ) Y1 Y2  Yn Y1 Y1 Yi          − − 1 1 n N         − − 1 1 n N =          − −          = N i Yi n n N n N E y 1 1 1 1 1 ( )

(N-1)!n:(N-n)!Ix (n-1)(N-n) N: ni= ∑Y=∑H=F i=1 即y是Y的无偏估计。同样也是总体总量Y的无偏估计例3.1某班第一小组10人的数学考试成绩分别为: 100,95,92,88,83,75,71,62,60,50 平均分为7.6。先从中任选3个为一组样本,其选法共有120种每种选法都有概率120。以4组样本为例(10095,92),(10083, 50),(88362),(62,60,50)它们的样本平均数分别为95.67, 77.67,77.67,57.33。从抽样调查的角度来看,我们希望抽到第二或第三组样本,根据它们来估计总体平均数相当准确。而第一和第四组样本的估计相当糟糕。但它们入样与第二第三组具有同样的可能性,这是否与y的无偏性相矛盾呢?

=  −  − − − = N i Yi N n n N n n N n N 1 1 ! !( )! ( 1)!( )! ( 1)! Y Y N N i =  i = =1 1 即 y 是 Y 的无偏估计。同样 Y ˆ 也是总体总量的无偏估计 ~ Y ~ 例3.1 某班第一小组10人的数学考试成绩分别为： 100，95，92，88，83，75，71，62，60，50 平均分为77.6。先从中任选3个为一组样本，其选法共有120种每种选法都有概率1/120。以4组样本为例(100,95,92)，(100,83, 50)，(88,83,62)，(62,60,50)它们的样本平均数分别为95.67， 77.67，77.67，57.33。从抽样调查的角度来看，我们希望抽到第二或第三组样本，根据它们来估计总体平均数相当准确。而第一和第四组样本的估计相当糟糕。但它们入样与第二第三组具有同样的可能性，这是否与y 的无偏性相矛盾呢？

其实并不相矛盾。我们关心的是,尽管每一组样本入样的概率相同,像第二第三组这样的“良好”情况就大体而言是否会多像第一第四那样的“糟糕”情况呢?如果肯定的话, 那么就能指望在一次随机抽样中发生的估计误差较小。该问题的解决将由下一节的讨论给出。 §3估计量的方差及其估针下面求y的无偏估计y的方差vr(y) Var(y) M2(3+9 其中∑表示对(,2,…,N)中所有组合(i1,2,…,in)求和

其实并不相矛盾。我们关心的是，尽管每一组样本入样的概率相同，像第二第三组这样的“良好”情况就大体而言是否会多于像第一第四那样的“糟糕”情况呢？如果肯定的话，那么就能指望在一次随机抽样中发生的估计误差较小。该问题的解决将由下一节的讨论给出。 §3 估计量的方差及其估计下面求 Y 的无偏估计 y 的方差 Var( y)          − + + +         = 2 1 2 1 ( ) Y n Y Y Y n N Var y n i i  i 其中 表示对 (1,2,  , N)中所有组合 (i 1 ,i 2 ,  ,i n ) 求和

2 ( -Y)(Y N ∑{2 +2∑ 2 j<k n ∑(x1-F22n1 nN N-1 i i ∑(x1-Y)(-Y) {(1 N-1 O-Y 2,-1 ∑(-Y) N-1i= 1N-n1 ∑(r n N-1 Ni N-n o 2 n、S2 N-1n(或=(1-x)) (36)

           − − + −         = =  n j n j k i i i n Y Y Y Y n Y Y n N j j k 1 2 2 2 ( )( ) 2 1 ( )   =  − − − − = − +  N i N i j i Yi Y Yj Y N n nN Y Y nN 1 2 ( )( ) 1 2 1 ( ) 1 [ ( )] } 1 1 ) ( ) 1 1 {(1 1 1 1 2 2   = = − − − − + − − = − N i N i i Yi Y N n Y Y N n nN =  − − − =  N i Yi Y N N N n n 1 2 ( ) 1 1 1 N n N n 2 1   − − = n S N n 2 （或 = (1− ) ） (3.6)

对随机有放回抽样,由于各次抽取是相互独立的,由概率论的知识可以求得,此时: avIv= (或=(1-x))(3) 比较(36)式与(3.7)式,发现同样用样本平均数来估计总体平均数,它们都是无偏估计,但随机无放回时的方差小于随机有放回时的方差。y的方差表示新盒子的离散程度,也就是表示了y取值范围的大小,方差小表明y取值远离中心Y的可能性较小,这样随机的一组样本得到y的实现值距Y很近的可能性就较大,这正是我们所期望的。因此,在实际抽样中我们采用无放回抽样方式

对随机有放回抽样，由于各次抽取是相互独立的，由概率论的知识可以求得，此时： n Var y 2 ( )  = n S N 2 ) 1 （或 = (1−  ） (3.7) 比较(3.6)式与(3.7)式，发现同样用样本平均数来估计总体平均数，它们都是无偏估计，但随机无放回时的方差小于随机有放回时的方差。的方差表示新盒子的离散程度，也就是表示了取值范围的大小，方差小表明取值远离中心的可能性较小，这样随机的一组样本得到的实现值距很近的可能性就较大，这正是我们所期望的。因此，在实际抽样中我们采用无放回抽样方式。 y y y Y y Y

点击下载完整版文档（PPT格式）

共17页，试读已结束，阅读完整版请下载

点击下载（PPT格式）

浏览记录