正在加载图片...
第1期 莫惠株:重抽样技术一自举法 3 表110例沙门氏葡食物中海患者的港伏期(风/h)和3个自举样本 Table 1 Incubation period (/h)of 10 sufferers from Salmomella and 3 bootstrap samples 第1个自华洋本 变量9 第2个自举件本 第3个自举样本 随机号变量号变量Y,随机号变量号变量出,随机号变号变量Y, 25 9 13 29 9 623 23 0.239 96 10 3 8m 5 -5 52动 偏估计数。 2)3个样本平均数的标准误(,)来自各不 表2表1资料自¥抽样各统计数的 平均数和标准误(m一100》 相同的定义:5,85是基于观寒样本随机抽自正 of100 态总体的假设47 是自举样本平均数分布 h 标准误:5.20是自举样本平均数标准误的平均 计 自样本变侧 平均散形标准诞或 数.其最大差异达到(5.85-4.77)/1.53 0.706个标准误.而具有相应定义的3个样本 16.02.6 = 2381 标准差的标准误(,)4.14,483和3.68,其最大 差异达到(483 .68)/1.08 1.05个标 .0 21.43 5.16 误.它们虽然都未达到显着水平,但与:和 相比,差异有扩大趋势.这表明标准差有较大的抽样变异, 3)不论观察样本或自举样本,平均数夕都大于中位数M.这表明表1的潜伏期资料是左偏分 布.所以用21.47士5.16描述潜伏期(即有50%的沙门氏菌食物中毒患者是在取食后21.47h内发 病的,具标准误5.16h)可能比算术平均数更恰当。 3多变量自举 3.1方法 多变量自举又称成组自举,它仅是单变量自举的简单推广.设观察资料为!个变数和每变数n个 变量,每一变量可记为X(G=1,2,…,山j=1,2,…,).则在自举抽样时,1个随机数或变量号是代 表j=c(c为1,2,…,n中的某一指定值)时的一个变量组X,含1个变量:而每一自举样本则是由” 组各含【个变数的1个变量组成。其余方法和步骤都和单变量自举相同. 示例 表3的列2和3是水 场橘5号”12个植株的基部第1拔长节间粗度(X1,长径×短径,mm)和 其德部总粒数(X)的观结果四求得X和X的相关系数r和X,依 1的回归系数b为 a=r=∑xx/√云∑=0.8144, (5) A,=b=∑x1/∑-5.1217粒·mm3, 万方数 第l期 莫惠栋:重抽样技术——自举法 3 表l lo例沙门氏菌食物中毒息者的潜伏期(反/h)和3个自举样本 Table 1 Incubatj帆period(融/h)of lo sufferen from s口f珊肌棚口8Ⅱd 3 bootst哺p轴mpl雌 偏估计数. 2)3个样本平均数的标准误(s,)来自各不 相同的定义:5.8s是基于观察样本随机抽自正 态总体的假设;4.77是自举样本平均数分布的 标准误;5.20是自举样本平均数标准误的平均 数.其最大差异达到(5.85—4.77)/1.53= o.706个标准误.而具有相应定义的3个样本 标准差的标准误(s)4.“,4.83和3.68,其最大 差异达到(4.83—3.68)/1.08=1.065个标准 误.它们虽然都未达到显著水平,但与口:和魏 表2表l资料自举抽样各统计数的 平均数和标准误(m—l∞) Ttble 2 Avtra窖e nhd staⅡ血rd error or 100 boonnp疆mpIes f时Th蝴e l d●“ h 相比,差异有扩大趋势.这表明标准差有较大的抽样变异. 3)不论观察样本或白举样本,平均数,都大于中位数埘z这表明表l的潜伏期资料是左偏分 布.所以用21.47±5.16描述潜伏期(即有50%的沙门氏菌食物中毒患者是在取食后21.47 h内发 病的,具标准误5.16 h)可能比算术平均数更恰当. 3多变量自举 3.1方法 多变量自举又称成组自举,它仅是单变量自举的简单推广.设观察资料为f个变效和每变数n个 变量,每一变量可记为五』(净1,2,…,z;j一1,2,…,n).则在自举抽样时,1个随机数或变量号是代 表J=co为l,2,…,”中的某一指定值)时的一个变量组置。,含f个变量;而每一自举样本则是由n 组各含f个变效的1个变量组成.其余方法和步骤都和单变量自举相同. 3.2示例 表3的列2和3是水稻“扬襦5号”12个植株的基部第1拨长节间粗度(x,,长径×短径,mm2)和 其穗部总粒数(丘)的观察结果‘”.求得x,和xz的相关系数r和五依x,的回归系数6为: 吼=r一∑郴:/√∑z{·∑zz_o.81“,I … 晚一6一∑z。屯/∑z滓5.121 7粒·mm~.J 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有