第三章 慈体均数的估计 与假设检验
第三章 总体均数的估计 与假设检验
第一 均数的抽样误差与标准误
第一节 均数的抽样误差与标准误
了解总体特征的最好方法是对总体的 每一个体进行观察、试验,但这在医 学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观 察,对有限总体限于人力、财力、物 力、时间或个体过多等原因,不可能 也没必要对所有个体逐一研究。 借助抽样研究
了解总体特征的最好方法是对总体的 每一个体进行观察、试验,但这在医 学研究实际中往往不可行。 对无限总体不可能对所有个体逐一观 察,对有限总体限于人力、财力、物 力、时间或个体过多等原因,不可能 也没必要对所有个体逐一研究。 借助抽样研究
欲了解某地2000年正常成年男性血清 总胆固醇的平均水平,随机抽取该地 200名正常成年男性作为样本。 由于存在个体差异,抽得的样本均数 不太可能恰好等于总体均数。 由个体变异和抽样造成的样本统计量 与总体参数的差异,称为抽样误差
欲了解某地2000年正常成年男性血清 总胆固醇的平均水平,随机抽取该地 200名正常成年男性作为样本。 由于存在个体差异,抽得的样本均数 不太可能恰好等于总体均数。 由个体变异和抽样造成的样本统计量 与总体参数的差异,称为抽样误差
这些来自同一总体的若千样本统计量 间,也存在抽样误差。 在抽样研究中,抽样误差是不可避免 dJo 由于其产生的根本原因是生物个体的 变异性,故抽样误差分布具有一定的 规律性
这些来自同一总体的若干样本统计量 间,也存在抽样误差。 在抽样研究中,抽样误差是不可避免 的。 由于其产生的根本原因是生物个体的 变异性,故抽样误差分布具有一定的 规律性
例31某市1999年18岁男生身高服从 μ=167.7cm、σ=5.3cm正态分布,从 该N(167.7,5.32)总体中随机抽样 (图3-1)。 每次n1=10人,共有样本g=100个, 得到每个样本均数x及标准差S。 将上述100个样本均数看成新变量值 ,这100个样本均数构成一新分布
例3-1 某市1999年18岁男生身高服从 =167.7cm、 =5.3cm正态分布,从 该N(167.7, 5.32)总体中随机抽样 (图3-1)。 每次 =10人,共有样本g=100个, 得到每个样本均数 及标准差 。 将上述100个样本均数看成新变量值 ,这100个样本均数构成一新分布。 j nX j j S j n j S X j
样本均数抽样分布具有如下特点 ①各样本均数未必等于总体均数; ②各样本均数间存在差异(表3-1); ③样本均数围绕总体均数(167.7cm) 呈正态分布(图32); ④样本均数变异范围较原变量变异范 围大大缩小,这100个样本均数的 均数为16769cm、标准差为1.69cm 在非正态分布总体中可进行类似抽样
样本均数抽样分布具有如下特点: ①各样本均数未必等于总体均数; ②各样本均数间存在差异(表3-1); ③样本均数围绕总体均数(167.7cm) 呈正态分布(图3-2); ④样本均数变异范围较原变量变异范 围大大缩小,这100个样本均数的 均数为167.69cm、标准差为1.69cm。 在非正态分布总体中可进行类似抽样
可得到如下结论: 若ⅹ服从正态分布 则x服从正态分布 若X不服从正态分布 n大则x近似服从正态分布 n小:则X为非正态分布
可得到如下结论: 若 服从正态分布 则 服从正态分布 若 不服从正态分布 n大:则 近似服从正态分布 n小:则 为非正态分布 Xi X j Xi X j X j
X的总体均数为μ;而X的标准差 比原个体值的标准差要小,为区别两 者,X的标准差用表示。 样本统计量的标准差称标准误 (standard error, sE) 样本均数的标准差称均数的标准误 (standard error of mean, SEM) 反映样本均数间离散程度
的总体均数为;而 的标准差 比原个体值的标准差要小,为区别两 者, 的标准差用 表示。 样本统计量的标准差称标准误 (standard error, SE)。 样本均数的标准差称均数的标准误 (standard error of mean, SEM), 反映样本均数间离散程度。 XXj X j X j X X j
可证明均数标准误 在实际工作中常未知,用S来估计 。均数标准误估计值 均数标准误大小与标准差大小成正比 与样本含量n的平方根成反比
可证明均数标准误 在实际工作中常未知,用S来估计 。均数标准误估计值 X n = X S S n = X n = X S S n = 均数标准误大小与标准差大小成正比 ,与样本含量n的平方根成反比