meta分析_基本概念复习.doc_大学文库_中国高校课件下载中心

基本概念复习 Meta分析是以统计量为观察单位进行统计分析,因此需要了解统计量的规律性和一些基本统计概念教学目的:复习总体、抽样分布概念、随机现象的规律性一一概率分布,特别正态分布介绍统计量的定义、分布和统计量的总体平均值。效应差异度量( Effect size) 总体:根据研究目的确定所有同质个体的某指标观察值(或测量值)构成的集合称为总体 ( population),或更严谨地称为该观察指标(变量)的总体。总体中所有观察值的平均数称为总体均数。例如:研究某地区7岁健康男孩身高,如果该地区共有10000个7 健康男孩,则这10000个7岁健康男孩的身高测量值构成的集合就是这个研究目的所确定的总体。这10000个7岁男孩的身高平均值就是这个研究问题的总体均数。个体变异:在同一研究目的下确定的相同特征的研究对象(称为同质个体)中,研究对象之间的观察值相互不同,称为个体变异(严格地说研究对象观察值与总体均数的差值称为个体变异)。个体变异是随机的。随机现象的规律性:对某一种随机现象进行大量重复观察,可以发现其规律性。同种随机现象的规律性是相同,但是单个随机现象是无法考察其规律性。例如,观察某地区7 岁健康男孩身高的分布情况,把身高分为3段:第一段为身高小于125cm:第二段为身高在125cm~135cm:第三段为身高高于135cm。对于在该地区随机抽一个7岁健康男孩并测量他的身高而言,该男孩的身高在这3个身高范围中的任何一个都是可能,所以在抽样前不能断定所抽到的健康男孩身高在哪个范围中。但如果在该地区抽了10000个7岁健康男孩并测量其身高,结果为身高小于125cm共有720人占总数的72%;身高在125cm~135cm范围中共有8950人占总数的89.5%;身高大于135cm 共有330人占总数的3.3%,因此可以断定大多数男孩的身高在125cm~135cm范围中,这就是大量重复观察时所呈现的规律性。从另一角度上分析,对于随机考察一个 7岁健康男孩身高而言,虽因为随机性而不能断定其身高在哪个范围中,但可以肯定身高在125cm~135cm范围中的机会要远高于其它身高两个范围。本例只是一种较简单的概率分布。任何随机现象或随机变异在大量重复观察的意义下都会呈现一定的随机特征的规律性,即这种随机特征的规律性就是指观察值出现在可能的不同范围对应有不同的机会(概率),这就是所谓的“概率分布”。统计量:样本表达式构成的样本统计指标估计未知总体参数,这种样本统计指标称为统计量 ( statistIc)并且要求统计量的样本表达式中不含有未知参数。例如:样本均数、样本 OR、样本RR等样本均数的抽样误差:总体均数与样本均数的差称为样本均数的抽样误差。由于通常总体均数是未知的,故用样本均数的标准误大小刻划样本均数的抽样误差的平均度量。由于个体变异是随机的,所以样本均数也是随机的。即:抽样前是无法确切知道样本均数将是多大。由于样本均数的抽样误差=样本均数一总体均数,总体均数是确切的常数, 故样本均数的抽样误差是随机的。下面将举例说明: 例如,已知某地高中三年级男生的平均身高为168.15厘米,这里,将该地高中三年级男生的身高视为一个总体,其总体均数=168.15,总体标准差σ=600。现从该总体中反复抽取5个样本,每个样本中有9个高中三年级男生的身高测量值,每个样本计算样本均数(在每个样本中,对9个身高测量值计算平均数),因此共得到5个样本均数如下:

1 基本概念复习 Meta 分析是以统计量为观察单位进行统计分析，因此需要了解统计量的规律性和一些基本统计概念。教学目的：复习总体、抽样分布概念、随机现象的规律性――概率分布，特别正态分布，介绍统计量的定义、分布和统计量的总体平均值。效应差异度量(Effect Size) 总体：根据研究目的确定所有同质个体的某指标观察值(或测量值)构成的集合称为总体 (population)，或更严谨地称为该观察指标(变量)的总体。总体中所有观察值的平均数称为总体均数。例如：研究某地区 7 岁健康男孩身高，如果该地区共有 10000 个 7 岁健康男孩，则这 10000 个 7 岁健康男孩的身高测量值构成的集合就是这个研究目的所确定的总体。这 10000 个 7 岁男孩的身高平均值就是这个研究问题的总体均数。个体变异：在同一研究目的下确定的相同特征的研究对象(称为同质个体)中，研究对象之间的观察值相互不同，称为个体变异(严格地说研究对象观察值与总体均数的差值称为个体变异)。个体变异是随机的。随机现象的规律性：对某一种随机现象进行大量重复观察，可以发现其规律性。同种随机现象的规律性是相同，但是单个随机现象是无法考察其规律性。例如，观察某地区 7 岁健康男孩身高的分布情况，把身高分为 3 段：第一段为身高小于 125cm；第二段为身高在 125cm～135cm；第三段为身高高于 135cm。对于在该地区随机抽一个 7 岁健康男孩并测量他的身高而言，该男孩的身高在这 3 个身高范围中的任何一个都是可能，所以在抽样前不能断定所抽到的健康男孩身高在哪个范围中。但如果在该地区抽了 10000 个 7 岁健康男孩并测量其身高，结果为身高小于 125cm 共有 720 人占总数的 7.2%；身高在 125cm～135cm 范围中共有 8950 人占总数的 89.5%；身高大于 135cm 共有 330 人占总数的 3.3％，因此可以断定大多数男孩的身高在 125cm～135cm 范围中，这就是大量重复观察时所呈现的规律性。从另一角度上分析，对于随机考察一个 7 岁健康男孩身高而言，虽因为随机性而不能断定其身高在哪个范围中，但可以肯定身高在 125cm～135cm 范围中的机会要远高于其它身高两个范围。本例只是一种较简单的概率分布。任何随机现象或随机变异在大量重复观察的意义下都会呈现一定的随机特征的规律性，即这种随机特征的规律性就是指观察值出现在可能的不同范围对应有不同的机会(概率)，这就是所谓的“概率分布”。统计量：样本表达式构成的样本统计指标估计未知总体参数，这种样本统计指标称为统计量 (statistic)并且要求统计量的样本表达式中不含有未知参数。例如：样本均数、样本 OR、样本 RR 等。样本均数的抽样误差：总体均数与样本均数的差称为样本均数的抽样误差。由于通常总体均数是未知的，故用样本均数的标准误大小刻划样本均数的抽样误差的平均度量。由于个体变异是随机的，所以样本均数也是随机的。即：抽样前是无法确切知道样本均数将是多大。由于样本均数的抽样误差=样本均数－总体均数，总体均数是确切的常数，故样本均数的抽样误差是随机的。下面将举例说明：例如，已知某地高中三年级男生的平均身高为 168.15 厘米，这里，将该地高中三年级男生的身高视为一个总体，其总体均数  =168.15 ，总体标准差  = 6.00 。现从该总体中反复抽取 5 个样本，每个样本中有 9 个高中三年级男生的身高测量值，每个样本计算样本均数(在每个样本中，对 9 个身高测量值计算平均数)，因此共得到 5 个样本均数如下：

样本样本观测值样本均|抽样数(X)误差 161.1173.7173.7167.316221622166.6166.61574165.64-2.51 1668159.1159.11661173.3173.3169.11691165.2166.79-1.36 3 1574174172.3175.81666182.1163.115941594167.79-0.36 174.5182.11685171.317411656173717191675172.133.98 5 164116661696169.6173.8173.21643166.6182.1169.991.84 由上表可知,由于个体变异的存在,而抽样又是随机进行的,因此,各样本均数与总体均数之间一般说来是有差异的。这种由个体变异和随机抽样所引起的样本均数与总体均数 (本例为=16815)之间的差异就是抽样误差,并且是随机的。由于任何的随机变异都是有其随机特征的规律性,只是单个随机变异往往无法考察其规律性,如果大量重复观察同一种随机变异,就可以发现其随机特征的规律性。下面考察如果资料X服从正态分布N(μ,2),它的样本均数的随机特征规律性(概率分布)是什么? 由于在实际研究中,同一特征的研究对象往往只有一个样本,因此只能得到一个样本均数,故往往无法依据样本资料考察样本均数的分布情况。如果我们对同一总体随机抽了许多样本,并且对每个样本计算其样本均数,因此可以得到许多样本均数,然后作这些样本均数 (视为新的样本资料)的频数图,就可以得到样本均数的规律性。因此我们以下将借助计算机随机模拟抽样,在同一正态分布的总体中随机抽许多样本,对每一个样本计算样本均数,因此可以得到许多样本均数,这样可以考察样本均数的随机特征的规律性正态分布样本的样本均数分布为了给读者关于样本均数分布的直观认识,下面做3个抽样试验,仍以某地高三男生的身高为例。设身高变量为X,假定X服从正态分布,记为XM(168.15,62)。从总体X中反复随机抽样,样本含量分别为n=4,n=16和n=36,分别随机抽10000个样本并计算样本均数,把同一样本含量的10000个样本均数视为一个新的样本资料作频数图(见图3.1),并且表3.2分别给出同一样本含量的前20个样本均数。读者不难从频数图和表32可以发现样本均数的变异有如下特点

2 样本号样本观测值 (n=9) 样本均数( X ) 抽样误差 1 161.1 173.7 173.7 167.3 162.2 162.2 166.6 166.6 157.4 165.64 -2.51 2 166.8 159.1 159.1 166.1 173.3 173.3 169.1 169.1 165.2 166.79 -1.36 3 157.4 174 172.3 175.8 166.6 182.1 163.1 159.4 159.4 167.79 -0.36 4 174.5 182.1 168.5 171.3 174.1 165.6 173.7 171.9 167.5 172.13 3.98 5 164.1 166.6 169.6 169.6 173.8 173.2 164.3 166.6 182.1 169.99 1.84 由上表可知，由于个体变异的存在，而抽样又是随机进行的，因此，各样本均数与总体均数之间一般说来是有差异的。这种由个体变异和随机抽样所引起的样本均数与总体均数 (本例为  =168.15 )之间的差异就是抽样误差，并且是随机的。由于任何的随机变异都是有其随机特征的规律性，只是单个随机变异往往无法考察其规律性，如果大量重复观察同一种随机变异，就可以发现其随机特征的规律性。下面考察如果资料 X 服从正态分布 N(， 2 )，它的样本均数的随机特征规律性(概率分布)是什么？由于在实际研究中，同一特征的研究对象往往只有一个样本，因此只能得到一个样本均数，故往往无法依据样本资料考察样本均数的分布情况。如果我们对同一总体随机抽了许多样本，并且对每个样本计算其样本均数，因此可以得到许多样本均数，然后作这些样本均数 (视为新的样本资料)的频数图，就可以得到样本均数的规律性。因此我们以下将借助计算机随机模拟抽样，在同一正态分布的总体中随机抽许多样本，对每一个样本计算样本均数，因此可以得到许多样本均数，这样可以考察样本均数的随机特征的规律性。正态分布样本的样本均数分布为了给读者关于样本均数分布的直观认识，下面做 3 个抽样试验，仍以某地高三男生的身高为例。设身高变量为 X，假定 X 服从正态分布，记为 X~N(168.15, 62 )。从总体 X 中反复随机抽样，样本含量分别为 n=4，n=16 和 n=36，分别随机抽 10000 个样本并计算样本均数，把同一样本含量的 10000 个样本均数视为一个新的样本资料作频数图(见图 3.1)，并且表 3.2 分别给出同一样本含量的前 20 个样本均数。读者不难从频数图和表 3.2 可以发现样本均数的变异有如下特点：

6 X U n   − = (3.3) 则 U 服从标准正态分布 N(0, 1) 。也就是说，若资料服从正态分布 N(, 2 )，样本含量为 n 的样本均数 X 出现在 ( 1.96 , 1.96 ) n n     − + 的概率为 0.95，由此可见样本含量越大，这个范围就越小。 4.若被抽样总体 X 呈偏态分布且样本量 n 较大时(如 n>40)，由上述结果可知样本均数 X 近似地服从正态分布 ( ) 2 N n  , ，作标准化变换 X U n   − = ，则可以证明：U 近似服从标准正态分布 N(0, 1)。例 3.2 已知 7 岁正常发育男孩的身高服从正态分布，在某地的正常 7 岁男孩中随机抽一个样本，样本含量为 110，得到样本均数为 121.92，样本标准差为 4.527，则相应的标准误为 0.4316 110 4.527 = = X S 。例 3.3 已知在某地 7 岁正常发育男孩的身高服从正态分布 N(121,52 )，则正常发育 7 岁男孩身高的 95%范围为 1211.965＝(111.2，130.8)。若在该地正常 7 岁男孩中随机抽一个样本，样本含量为 100，则样本均数 X 的 95％范围为 100 5 1211.96 =(120.2，121.98)，样本含量为 100 的样本均数的变异范围要比个体的变异范围小得多。其他统计量的抽样误差问题：抽样误差：总体统计指标与其样本统计指标的差值称为抽样误差。例如，总体均数与样本均数的差值称为样本均数的抽样误差。由于个体变异的原因，任何随机抽样的样本所构造的统计量都有抽样误差并且这个抽样误差都呈随机变化的。即：抽样前，抽样误差是不知道的。标准误：总体参数往往是未知参数，通常用统计量的标准差估计抽样误差，为了区分资料的标准差，故称统计量的标准差为标准误。例如：样本均数的标准差称为样本均数的标准误。所有的统计量都是有其概率分布的，常用的统计量其概率分布如下：统计量取变换相应的分布两个样本均数的差值服从(或近似服从)正态分布 OR 取对数 ln(OR) 近似服从正态分布 RR 取对数 ln(RR) 近似服从正态分布