参数估计基础 抽样分布 赵耐青 复旦大学卫生统计教研室
参数估计基础 ---抽样分布 赵耐青 复旦大学卫生统计教研室
内容 抽样误差 抽样分布 3 STATA命令 2
2 内容 1 抽样误差 2 抽样分布 3 STATA命令
随机抽样的样本是随机的 心对于任何一个随机试验,当完成随机试验后的随 机试验结果是确切的,根本谈不上随机,所以随 机都是指随机试验前而言的。 在随机抽样前,抽样者是无法知道随机抽样的结 果,当然也无法知道抽到的这个样本的均数。 今任何两个抽样者独立地分别在同一总体进行随机 抽取一个样本,样本量相同,所抽到的这两个样 本的样本均数一般是不同的 所以,对于随机抽样前而言,随机抽样的样本均 数是随机的
3 随机抽样的样本是随机的 ❖对于任何一个随机试验,当完成随机试验后的随 机试验结果是确切的,根本谈不上随机,所以随 机都是指随机试验前而言的。 ❖在随机抽样前,抽样者是无法知道随机抽样的结 果,当然也无法知道抽到的这个样本的均数。 ❖任何两个抽样者独立地分别在同一总体进行随机 抽取一个样本,样本量相同,所抽到的这两个样 本的样本均数一般是不同的。 ❖所以,对于随机抽样前而言,随机抽样的样本均 数是随机的
抽样误差 令抽样误差 Sampling error 对于随机抽样而言,总体参数的样本统计量估 计值与总体参数间的差异称为抽样误差 今来源: 个体变异 随机抽样 表现 总体参数的样本统计量估计值与其总体参数间 的差异 对于总体参数估计,不同随机抽样的样本统计 量之间的差异
4 抽样误差 ❖抽样误差Sampling error ▪ 对于随机抽样而言,总体参数的样本统计量估 计值与总体参数间的差异称为抽样误差 ❖来源: ▪ 个体变异 ▪ 随机抽样 ❖表现 ▪ 总体参数的样本统计量估计值与其总体参数间 的差异 ▪ 对于总体参数估计,不同随机抽样的样本统计 量之间的差异
抽样误差 令从总体均数p.72.5,标准差O为6.3cm的正 态分布总体中随机抽样,样本量n=9,25 样本均数的抽样误差=样本均数-总体均数 n=9,25 X 5
5 抽样误差 ❖从总体均数 为72.5,标准差 为6.3cm的正 态分布总体中随机抽样,样本量n=9,25。 ❖样本均数的抽样误差=样本均数-总体均数 , X S n n 2 , 1 1 X S, n=9,25 3 3 X S, 2 2 X S, … …
样本量和样本均数及其离散程度 样本 样本样本|抽样 编号 均数标准差误差 165686876846480638472486-0.10 27461 65 75677872706769954 60 3737171 67686867 61|6 68,23.4 4.30 474807664667182786773.16.50.60 575727974766580717474.0451.50 x=2X5 (72.4+69.9+…+74.0)=71.52 =2.40≈ 2.10 5-1 6
6 样本量和样本均数及其离散程度 样本 编号 n=9 样本 均数 样本 标准差 抽样 误差 1 65 68 68 76 84 64 80 63 84 72.4 8.6 -0.10 2 74 61 65 75 67 78 72 70 67 69.9 5.4 -2.60 3 73 71 71 67 68 68 67 61 68 68.2 3.4 -4.30 4 74 80 76 64 66 71 82 78 67 73.1 6.5 0.60 5 75 72 79 74 76 65 80 71 74 74.0 4.5 1.50 5 1 1 1 (72.4+69.9+ +74.0)=71.52 5 5 i i X X = = = 5 2 1 ( ) 6.3 2.40 2.10 5 1 9 i i x X X SD = − = = = −
样本量和样本均数的离散程度 样本 n=25 样本样本抽样 均数标准着误差 65686876846480638472777374 7286.30.30 767067637665787272787481 74616575677872706774747474 7165.5-0.90 777269817160706778787764 73717167686867616866706671 70.144 40 727474736667807364757869 74807664667182786779566465 71.67.1-0.90 697464666275718083777671 75727974766580717475797473 73544 1.00 667375667776706879688073 X=∑x=(7.8+71.6+…+73:5)7192 ∑(x- SD 1.30≈=1.26 √25
7 样本量和样本均数的离散程度 样本 编号 n=25 样本 均数 样本 标准差 抽样 误差 65 68 68 76 84 64 80 63 84 72 77 73 74 1 76 70 67 63 76 65 78 72 72 78 74 81 72.8 6.3 0.30 74 61 65 75 67 78 72 70 67 74 74 74 74 2 77 72 69 81 71 60 70 67 78 78 77 64 71.6 5.5 -0.90 73 71 71 67 68 68 67 61 68 66 70 66 71 3 72 74 74 73 66 67 80 73 64 75 78 69 70.1 4.4 -2.40 74 80 76 64 66 71 82 78 67 79 56 64 65 4 69 74 64 66 62 75 71 80 83 77 76 71 71.6 7.1 -0.90 75 72 79 74 76 65 80 71 74 75 79 74 73 5 66 73 75 66 77 76 70 68 79 68 80 73 73.5 4.4 1.00 5 1 1 1 (72.8+71.6+ +73.5)=71.92 5 5 i i X X = = = 5 2 1 ( ) 6.3 1.30 1.26 5 1 25 i i x X X SD = − = = = −
抽样误差 今结果 各样本均数不一定等于总体均数 样本均数间存在差异 样本均数的分布规律:围绕总体均数上下波动 样本均数的变异:由样本均数的标准差描述
8 抽样误差 ❖结果: ▪ 各样本均数不一定等于总体均数 ▪ 样本均数间存在差异 ▪ 样本均数的分布规律:围绕总体均数上下波动 ▪ 样本均数的变异:由样本均数的标准差描述
抽样分布 今样本均数的规律性 随机的 在概率意义下是有规律的-抽样分布 ■通过大量重复抽样,借助频数表描述 ■样本均数的变异规律(抽样分布)与个体观察值 变异规律有关 今即使只有一个样本资料,也可由样本资料的个体 观察值的变异规律间接得到样本均数的变异规律
9 ❖样本均数的规律性 ▪ 随机的 ▪ 在概率意义下是有规律的---抽样分布 ▪ 通过大量重复抽样,借助频数表描述 ▪ 样本均数的变异规律(抽样分布)与个体观察值 变异规律有关 ❖即使只有一个样本资料,也可由样本资料的个体 观察值的变异规律间接得到样本均数的变异规律 抽样分布
正态总体样本均数的分布 今已知某地成人男子的脉搏平均数为M=725次/分, 标准差为a=6.3次/分,将其视为一个总体 今以上述背景,用计算机随机模拟这个总体,并且 模拟从该总体中进行随机抽样 样本含量为n 每次抽取10000个样本并计算各自的样本均数 以10000个样本均数作为一个新的样本制作频 数图 10
10 正态总体样本均数的分布 ❖已知某地成人男子的脉搏平均数为 , 标准差为 ,将其视为一个总体。 ❖以上述背景,用计算机随机模拟这个总体,并且 模拟从该总体中进行随机抽样 ▪ 样本含量为n ▪ 每次抽取10000个样本并计算各自的样本均数 ▪ 以10000个样本均数作为一个新的样本制作频 数图 = 72.5 / 次 分 = 6.3次/分