第九章数值变量资料的统计分析(2) 第一节数值型变量资料的统计描述 第二节正态分布和参考值范围的估计 第三节数值型变量资料的统计推断 第四节t检验和u检验 第五节方差分析
第九章 数值变量资料的统计分析(2) 第一节 数值型变量资料的统计描述 第二节 正态分布和参考值范围的估计 第三节 数值型变量资料的统计推断 第四节 t检验和u检验 第五节 方差分析
erminology sampling error 抽样误差 standard error 标准误 statistical inference 统计推论 confidence interval 置信区间 hypothesis testing 假设检验 u -test u检验 t-test t-检验 significance level 显著性水平 null hypothesis 零假设,无效假设 alternative hypothesis 备择假设 statistical significance 统计学意义 two-Sided test, (two-tailed test) 双侧检验,(双尾检验) one-Sided test,(one-tailed test 单侧检验,(单尾检验) 拒绝错误
Terminology sampling error 抽样误差 standard error 标准误 statistical inference 统计推论 confidence interval 置信区间 hypothesis testing 假设检验 u-test u-检验 t-test t-检验 significance level 显著性水平 null hypothesis 零假设,无效假设 alternative hypothesis 备择假设 statistical significance 统计学意义 two-sided test, (two-tailed test) 双侧检验,(双尾检验) one-sided test, (one-tailed test) 单侧检验, (单尾检验) rejection error 拒绝错误
随机抽样 参数? 总体 样本 统计量 (一锅) (一勺) X、s、p) 统计推断 参数估计 假设检验
样本 (一勺) 总体 (一锅) 统计推断 随机抽样 参数? 统计量 ( 、、) (X、s、p) 参数估计 假设检验
第三节数值型变量资料的统计推断 均数的抽样误差与标准误 t分布 、总体均数的置信区间的估计 四、假设检验的基本步骤
第三节 数值型变量资料的统计推断 一、均数的抽样误差与标准误 二、t分布 三、总体均数的置信区间的估计 四、假设检验的基本步骤
均数的抽样误差与标准误 均数的抽样误差( sample error of mean) 假定要了解某地14岁健康女学生身高的总体均数,在 该地随机抽取120名作为样本,测得身高的样本均数 15482cm,因存在变异,样本均数x主往总体均数 若每次都从同一个总体中抽取120人的样本,共抽 取n个样本,由于存在个体变异,得到的得各个样 本均数x1,x2 也往往互不相等 这种由抽样而造成的样本均数与总体均数之间的差异, 或样本均数之间的差异,称为均数的抽样误差。 抽样误差的分布是有规律的
一、均数的抽样误差与标准误 均数的抽样误差(sample error of mean): 假定要了解某地14岁健康女学生身高的总体均数,在 该地随机抽取120名作为样本,测得身高的样本均数 =154.82cm,因存在变异,样本均数 x 往往≠总体均数 。 若每次都从同一个总体中抽取120人的样本,共抽 取n个样本,由于存在个体变异,得到的得各个样 本均数 x1 , x2 , , xn 也往往互不相等。 这种由抽样而造成的样本均数与总体均数之间的差异, 或样本均数之间的差异,称为均数的抽样误差。 抽样误差的分布是有规律的
表5-1从正态总体N(155.4,5.32)抽到的100份随机样本的计算结果(n=30) 样羊本号 均数 标准误 95%置信区间 样本号 均数 标准误 95%置信区间 156.7 0.91 154.8 158.6 155.5 1.19 158.0 1234567 158 ).95 156.2 160.1 155.0 0.70 153.5 156.4 155.6 1.16 153.3 158.O 155.5 l.02 153.4 57.6 155.2 1.O3 157,3 155.1 153.1 157.2 155.O 152.9 157.O 155.3 153.2 7 156.4 154.2 158.6 156.3 0.97 154.4 i58.3 154.9 .12 152.6 157.1 0.88 154.8 158.4 156.5 0.74 154.9 158.O 155.4 153.7 157.1 155.O 1.o9 152.8 157.2 46 155. .03 153.8 l58、O 155.9 0.98 157.9 155.3 0.89 153.5 157.1 I I 156.9 0.98 155.O 158.9 154.6 .o9 152.3156 154.0 O.94 152.1 156.O 156.1 8 154.5 157.8 154.4 O.93 152.4 156.3 154.7 1.O4 152.6 156.8 156.5 1.03 154.3 158.6 155.7 O.97 153.7 157.7 155.9 1.07 153.7 158.1 153.7 152.1 155.4 6 155.5 0.96 153.6 157.5 154.8 153.0156.6 156.9 155.1 158.7 155.6 0.92 153.7 157.5 18 156.9 154.8159.1 55 154.8 0.83 153.1 156.5 19 153.4 1.04 151.3155.5 155.6 0.96 153.6 157.6 20 154.8 152.8 156.8 158.2 0.97 156.2 16O.2 21 156.1 154.O 1s8.1 58 154.9 152.7 157.1 155.O 1.09 152.7 1s7.2 153.4 0.91 151.5 155.3 23 154.7 1.25 152.2 157.3 60 156.4 0.98 154.4 158.4 154.5 1.22 152.0 1s7.O 61 153.6 0.94 151.6 155.5 25 155.2 153.31157.1 62 155 6 153.6 157.5 154.6 152.7156.5 63 155.2 O.9 153.4 157.1 156.1 1.14 153.8 158.5 156.7 154.5 158.8 2 6789 155.7 0.97 153.7 157 7 65 154.7 1.02 152.6 156.8 155.1 1.o8 152.157:3 155.1 153.1 157 30 156.1 0.93 154.2 l58.O 155.7 86 153.9 157.5 156.3 1.16 153.9 158.6 68 156.4 0.69 155.0 157.8 32 155.2 1.07 153.0 157.4 155.1 0.91 153.2 156.9 156.O 1.10153.7158.3 70 154.9 .o9 152.7 157.2 155.6 0.88 153,8157.4 7 155.8 l.11 153.5 158.1 35 156.5 0.88 154.7158.3 72 153.9 0.95 152.0 155.9 155.3 0.88 153.5 1571 7 156.2 154.2 158.1 155.2 0.87 153.4 157.O 74 156.O 0.86 154.3 157.8
6 样本均数的抽样分布 假定某年某地所有13岁女学生身高服从 N(155.4,5.32)。 在该总体中作100次随机抽样,ni = 30 计算每份样本的均数:153.6, 153.1, 154.9,····157.7; 现将这100个样本均数看成新的随机变量编制 频数分布表
来自N(15.40,5.30)的10C个平均值的频数分布 5050 E 5050 151152153154155156157158159〈160 身高(cm) 100个样本平均值的频数分布图
100个样本平均值的频数分布图 来自N(155.40,5.30)的100个平均值的频数分布 1 6 1 0 1 8 2 9 2 0 8 6 2 0 0 5 1 0 1 5 2 0 2 5 3 0 3 5 151 152 153 154 155 156 157 158 159 <160 身高(cm) 平均值频数
从正态总体N(1554,532) 抽样得到的100个样本均数的频数分布 组段(cm) 频数频率(%) 152.6 1.00 153.2 4 4.0 153.8 4.0 154.4 22 22.0 155.0~ 25 25.0 155.6 21.0 156.2 17 17.0 156.8~ 152.715.31539154.5155.1155.7156.3156.9157.5158.1 157.4~ 321 2.0 height MIDPOINT 158.0~159.6 1.0 100个样本平均数的频数分布图 合计 100 100.0 (直方图) 8
8 从正态总体N(155.4,5.32) 抽样得到的100个样本均数的频数分布 组段(cm) 频数 频率(%) 152.6~ 1 1.0 153.2~ 4 4.0 153.8~ 4 4.0 154.4~ 22 22.0 155.0~ 25 25.0 155.6~ 21 21.0 156.2~ 17 17.0 156.8~ 3 3.0 157.4~ 2 2.0 158.0~159.6 1 1.0 合计 100 100.0 100个样本平均数的频数分布图 (直方图)
理论上可以证明:若从正态总体Na2)中,反 复多次随机抽取样本含量固定为n的样本,那么 这些样本均数;也服从正态分布,即x的总体均 数仍为m,样本均数的标准差为G/所 抽样分布 抽样分布示意图
9 理论上可以证明:若从正态总体 中,反 复多次随机抽取样本含量固定为n 的样本,那么 这些样本均数 也服从正态分布,即 的总体均 数仍为 ,样本均数的标准差为 。 2 N( , ) X X / n 抽样分布 抽样分布示意图
样本均数的抽样分布具有以下特点 各样本均数未必等于总体均数; 。样本均数之间存在差异; 。样本均数的分布很有规律,围绕着总体均数 (1554cm),中间多、两边少,左右基 本对称,也服从正态分布 样本均数的变异较原变量的变异缩小。 10
10 样本均数的抽样分布具有以下特点 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数 (155.4cm),中间多、两边少,左右基 本对称,也服从正态分布; 样本均数的变异较原变量的变异缩小