新世纪全国言等中医药院校规划教材 中医药统计 主编 周仁郁
主编 周仁郁
8调道设计 8.1调查设计的全过程 8.1.1调查设计的目的与方法 不加任何干预措施,客观描述研究总体的统计设计, 称为调查设计 调查设计包括确定方案,组织调查,整理分析全过程 调查方法可分为普查,抽样调查,典型调查3种
8.1 调查设计的全过程 8.1.1 调查设计的目的与方法 不加任何干预措施,客观描述研究总体的统计设计, 称为调查设计 调查设计包括确定方案,组织调查,整理分析全过程 调查方法可分为普查,抽样调查,典型调查3种
设计方案 确定耳的及 调查对象 普查称全面调查:就是对总体 定抽样方法 进行调查。普查一般用于了解 及样本容量 总体在某一特定时点上的情况 定调查项目 及观测指标 抽样调查:从总体中抽取一定 组织调查 确定调查方 数量观察单位组成样本,然后 式及调查表 根据样本信息来推断总体特征 宣传目的及 培训调查员 实施调查及 典型调查:称案例调查。在对 抽样复查 事物进行全面分析的基础上, 整理分析 数据录入汇 选择典型的人或单位进行调查 总及复查 计算得统计 及专业结论
定抽样方法 及样本容量 设计方案 确定目的及 调查对象 定调查项目 及观测指标 组织调查 确定调查方 式及调查表 宣传目的及 培训调查员 实施调查及 抽样复查 整理分析 数据录入汇 总及复查 计算得统计 及专业结论 普查称全面调查:就是对总体 进行调查。普查一般用于了解 总体在某一特定时点上的情况 抽样调查:从总体中抽取一定 数量观察单位组成样本,然后 根据样本信息来推断总体特征 典型调查:称案例调查。在对 事物进行全面分析的基础上, 选择典型的人或单位进行调查
8.1.2随机与系统抽样 抽样调查的方法有单纯随机抽样、系统抽样、整群 抽样、分层抽样 单纯随机抽样,是把调查总体的全部观察单位进行编 号,再用随机数表或抽签等方法随机抽取部分观察单 位组成样本。总体例数为N,样本例数为n,样本均 数及样本率的标准误分别为 B-p)
8.1.2 随机与系统抽样 抽样调查的方法有单纯随机抽样、系统抽样、整群 抽样、分层抽样 单纯随机抽样,是把调查总体的全部观察单位进行编 号,再用随机数表或抽签等方法随机抽取部分观察单 位组成样本。总体例数为N,样本例数为n,样本均 数及样本率的标准误分别为 n S N n S X 2 1 1 ˆ 1 ˆ ˆ 1 n p p N n S p
随机抽样时,样本容量估计使用6.1的方法,但要用 有限总体公式进行校正。总体均数、总体率的样本 容量估计校正式分别为 n n nc= 1+n/N nc= 1+(n-1)/N 整群抽样>随机抽样>系统抽样≥分层抽样 系统抽样又称为机械抽样或等距抽样,是把总体观 察单位按一定顺序分为个部分,从第一个部分随机 抽取第k位次的观察单位,再从每一部分中抽取相同 位次的观察单位,由这些观察单位组成样本
随机抽样时,样本容量估计使用6.1的方法,但要用 有限总体公式进行校正。总体均数、总体率的样本 容量估计校正式分别为 n N n nC 1 / n N n nC 1 ( 1) / 整群抽样≥随机抽样≥系统抽样≥分层抽样 系统抽样又称为机械抽样或等距抽样,是把总体观 察单位按一定顺序分为n个部分,从第一个部分随机 抽取第k位次的观察单位,再从每一部分中抽取相同 位次的观察单位,由这些观察单位组成样本
例1某校3000学生用随机数表抽取100人,若乙肝 表面抗原阳性样本率10%,求总体率95%置信区间 把全校学生编为0、1、..、2999号,查统计用表23, 任意指定某行某列,以4个数字为一组,除以3000取 余数为抽取的编号,后面出现与前面有相同的数字 者弃去。如从第9行第5列顺序取100组数 1234297864560782524207443815510013429966.. 除以3000取余,随机抽样编号为 1234297804560782224207440815210013420966.. N=3000,n=100为大样本,样本率p=0.1,标准误为
例1 某校3000学生用随机数表抽取100人,若乙肝 表面抗原阳性样本率10%,求总体率95%置信区间 把全校学生编为0、1、…、2999号,查统计用表23, 任意指定某行某列,以4个数字为一组,除以3000取 余数为抽取的编号,后面出现与前面有相同的数字 者弃去。如从第9行第5列顺序取100组数 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966… 除以3000取余,随机抽样编号为 1234 2978 0456 0782 2242 0744 0815 2100 1342 0966… N=3000,n=100为大样本,样本率p=0.1,标准误为
S。=√(1-100/3000)×0.1×0.9199=0.0296 故总体率的95%置信区间为 p+452S。=0.1±1.96×0.0296=(0.0419,0.1581)) 例2欲调查某社区贫血患病情况,该社区有居民 1000人,试按系统抽样方法,抽取例数为100的样本 先将1000名居民按某一特征的顺序编号,总体例数N =1000,样本例数n=100,抽样间隔1000/100=10, 在1~10之间随机确定一个数字,比如7,每间隔10 个观察单位取一个,抽取7,17,27,..,997组成 样本
S pˆ (1100 / 3000) 0.1 0.9 / 99 0.0296 故总体率的95%置信区间为 p p u0.05/ 2S ˆ ˆ =0.1±1.96×0.0296=(0.0419,0.1581) 例2 欲调查某社区贫血患病情况,该社区有居民 1000人,试按系统抽样方法,抽取例数为100的样本 先将1000名居民按某一特征的顺序编号,总体例数N =1000,样本例数n=100,抽样间隔1000/100=10, 在 1~ 10之间随机确定一个数字,比如7,每间隔10 个观察单位取一个,抽取7,17,27,…,997组成 样本
8.1.3整群与分层抽样 整群抽样是把总体N个观察单位分为K个“群”,每 个群包含若干观察单位,随机抽取k个“群”,用这 些群中的全部观察对象组成样本。 整群抽样样本均数及其标准误分别为 X-K B D-Ty ∑X为各群观察单位之和,T为第群内观察值之和 整群抽样时,样本率及其标准误分别为
8.1.3 整群与分层抽样 整群抽样是把总体N个观察单位分为K个“群” ,每 个群包含若干观察单位,随机抽取k个“群” ,用这 些群中的全部观察对象组成样本。 整群抽样样本均数及其标准误分别为 Xi Nk K X k i X Ti T K k k k N K S 1 2 ( ) ( 1) 1 1 ∑X为各群观察单位之和,Ti为第i群内观察值之和 整群抽样时,样本率及其标准误分别为
p= a5-)心u可 Nk 21 其中,∑i为各群阳性数之和 分层抽样又称分类抽样,是把总体按影响观察值变异 较大的某种特征分为若干类型或组别,称为层,再从 每一层随机抽取一定数量的观察单位合起来组成样本 分层设计时,先确定总样本容量n,再用按比例或最 优法确定第层样本容量n 按比例分配,是由总体第层的观察单位数:占总体 所有观察单位数的比例N,IN决定样本各层的容量:
i a Nk K pˆ k i p ai a K k k k N K S 1 2 ˆ ( ) 1 1 1 其中,∑ai为各群阳性数之和 分层抽样又称分类抽样,是把总体按影响观察值变异 较大的某种特征分为若干类型或组别,称为层,再从 每一层随机抽取一定数量的观察单位合起来组成样本 分层设计时,先确定总样本容量n,再用按比例或最 优法确定第i层样本容量n 按比例分配,是由总体第i层的观察单位数Ni占总体 所有观察单位数的比例Ni/N决定样本各层的容量ni
nN n,= N 最优分配,是由总体第层观察单位数N,和标准差的 大小决定样本各层的容量,均数抽样和率抽样的公 式分别为 Njoj NiP,(I-P) n,="∑N,o n二 ∑N,√p,(I-p,) 分层抽样中,样本均数及其标准误分别为 Y-2 N,x, S,-20-4/Nw N N
N nN n i i 最优分配,是由总体第j层观察单位数Nj和标准差的 大小决定样本各层的容量nj,均数抽样和率抽样的公 式分别为 i i j j j N N n n (1 ) (1 ) i i i j j j j N p p N p p n n 分层抽样中,样本均数及其标准误分别为 N N X X i i N n N N S S Xi i i i X 2 2 (1 / )