第7章抽样和抽样分布 基本概念 总体与样本 名称 样本 总体 定义从总体中抽出的部分单位研究对象的全部单位 特征 统计量 参数 样本容量 总体容量 样本平均数x 总体平均数 符号样本比率 总体比率 样本方差 总体方差 样本标准差 总体标准差
第 7章 抽样和抽样分布 基本概念 • 总体与样本 名 称 样 本 总 体 定义 从总体中抽出的部分单位 研究对象的全部单位 特征 统计量 参数 符号 样本容量 样本平均数 样本比率 样本方差 样本标准差 总体容量 总体平均数 总体比率 总体方差 总体标准差 2 ~ s s p x n 2 P N
随机抽样与判断抽样 随机原则:机会均等原则(抽样时避免主观倾向,以保证样 本的代表性) 非抽样误差和抽样误差 登记性误差 非抽样误差 偏差 总体内部差异度 抽样误差 样本容量 抽样方法
非抽样误差 登记性误差 偏 差 抽样误差 总体内部差异度 样 本容量 抽 样 方 法 • 随机抽样与判断抽样 随机原则:机会均等原则(抽样时避免主观倾向,以保证样 本的代表性) • 非抽样误差和抽样误差
随机抽样设计 纯随机抽样(简单随机抽样) 对总体任何分或排序,完全按随机原则抽样 适用范围:总体规模不大,内部差异较小 例:一个班组有A、B、C、D、E五个工人,随机抽取2个工人的日 工资数作为了解整个班组平均工资水平的样本。 可能的结果是 样本号 AB CDE 重置抽样:25个样本 ABCDE 不重置抽样:20个样本
• 纯随机抽样(简单随机抽样) 对总体不做任何分类或排序,完全按随机原则抽样。 适用范围: 总体规模不大,内部差异较小。 例:一个班组有A、B、C、D、E五个工人,随机抽取2个工人的日 工资数作为了解整个班组平均工资水平的样本。 可能的结果是 重置抽样:25个样本 不重置抽样:20个样本 随机抽样设计 样本号 A B C D E A B C D E
等距抽样(机械抽样或系统抽样) 将总体志值顺排列,然后按一定间隔抽取样本 无关标志 排序标志 有关标志 间隔距离 起点的选择半距中点取样 k 对称等距取样 随机取样 例:从某企业5000名职工中抽取100人进行家庭收入水平调查 样本的距离= 100 起点的选择:按姓氏排序,在第一个间隔中随机选取
• 等距抽样(机械抽样或系统抽样) 将总体按某一标志值顺序排列,然后按一定间隔抽取样本。 间隔距离; 起点的选择 半距中点取样 对称等距取样 随机取样 例:从某企业5000名职工中抽取100人进行家庭收入水平调查。 样本的距离= 起点的选择:按姓氏排序,在第一个间隔中随机选取。 k n N = 排序标志 无关标志 有关标志 50 100 5000 =
类型抽样(分层抽样) 将总体棊ˆ标,然后从各组按随机原则或其他方式抽样。确 定各组样本的方法 n 比例抽样 总体N n n.「适宜抽样 ∑N 例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型抽样 的方法了解平均粮食产量。 地形全部面积(N)样本面积(n) 平原 14000 山区 6000 合计2000
• 类型抽样(分层抽样) 将总体按某个标志分组,然后从各组按随机原则或其他方式抽样。确 定各组样本的方法: 例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型抽样 的方法了解平均粮食产量。 总体N 比例抽样 适宜抽样 N1 N2 N3 n1 n2 n3 n N N n i = 1 n N N n i i i i = 1 地形 全部面积(Ni) 样本面积(ni ) 平原 山区 14000 6000 合计 20000
整群抽样 将总体某个标志分为多个群,随机抽取若干群,对被抽中的群进 行全面调查。 优缺点:调查方便,但抽样误差较大。 总群数R=13 样本数r=4 样本容量 A D B C D n=n tnatn+ G K nk E L 例:从某县100个村中抽出10个村,进行全面调查,就可以大致了 解农村家庭副业发展情况
• 整群抽样 将总体按某个标志分为多个群,随机抽取若干群,对被抽中的群进 行全面调查。 优缺点:调查方便,但抽样误差较大。 例:从某县100个村中抽出10个村,进行全面调查,就可以大致了 解农 村家庭副业发展情况。 总群数R=13 C D G K 样本数r=4 样本容量 n=nc+nd+ng+nk A D C F G H I J K L M B E
多阶段抽样 特点:多个阶段、多种方综合抽样 例:对某山区的林采蓄积量作抽样调査。将总体50块面积相等的地划 为10个区,每个区包括5个地块。采用两阶段抽样,先从10个区选 中30%,再从选中的区域中抽取60%的地块组成样本进行调查 抽样技术放回抽样抽样总体不变 不放回抽样:抽样总体逐次减少
• 多阶段抽样 特点:多个阶段、多种方法综合抽样 例:对某山区的林采蓄积量作抽样调查。将总体50块面积相等的地划 为10个区,每个区包括5个地块。采用两阶段抽样,先从10个区选 中30%,再从选中的区域中抽取60%的地块组成样本进行调查。 • 抽样技术 • 放回抽样:抽样总体不变 不放回抽样:抽样总体逐次减少
抽样分布 样本统计量的概率分布(理论分布)。 样本均值的抽样分布 数字特征〔数学期望E(X)=A 方差;=a=(N= 当总体服从正态分布时,从该总体中取样所得到的样本均 抽样分布值仍然服从正态分布 2从非正态总中抽取的样本,只要容量足够大,根据中心极 限定理可知,样本均值的分布也趋向正态分布 般认为样本容量足够大的标准为:n大于等于30
抽样分布 样本统计量的概率分布(理论分布)。 • 样本均值的抽样分布 数字特征 抽样分布 数学期望 方 差 E(X) = ) 1 ( 2 2 2 2 − − = = N N n n n x x 1 当总体服从正态分布时,从该总体中取样所得到的样本均 值仍然服从正态分布。 2 从非正态总中抽取的样本,只要容量足够大,根据中心极 限定理可知,样本均值的分布也趋向正态分布。 一般认为样本容量足够大的标准为:n大于等于30
正态分布X~N(Aa2 f(r) f(x) (∞x≤+∞) 2兀o 标准正态分布对x标准化:z="z-N(On f(r) e2(-∞-x≤+∞) 2丌
~ ( , ) 2 X N ( ) 2 1 f(x) 2 2 2 ( ) = − + − − e x x 正态分布 f (x) x f (x) 标准正态分布 ~ (0,1) X - X Z Z N 对 标准化: = x 0 f (x) f (x) ( ) 2 1 (x) 2 2 = − + − e x x
两个样本均值之差的抽样分布 两个正态总体 X(A,a12,n)x2(2a2,n2),则X-X的分布为 2 1-X2~N(1-A2 两个非正态总体 x(A1,G12,n1)2X2(2o2mn2)2则又1-X的分布为 x1-x2N(A1-m2+92)
• 两个样本均值之差的抽样分布 两个正态总体 两个非正态总体 X X ~ ) ( , , ), ( , , ), X - X 2 2 2 1 2 1 1 2 1 2, 2 1 2 2 1 2 2 2 2 1 1 1 n n N X n X n − ( − + 则 的分布为 ( 大样本) 则 的分布为 X X ~ ) ( ( , , ), ( , , ), X - X 2 2 2 1 2 1 1 2 1 2, 2 1 2 2 1 2 2 2 2 1 1 1 n n N X n X n − − +