正在加载图片...
“=E3*200” 并复制G3到G4至G1 5°计算统计量:在B3输入 (F3-G3)A2/G 把H3复制到H4至H1,并在H2输入: Sum(H3: H11) 另一种计算统计量的方法为:在I3输入: “= Whitest(F3:F11,H3:H11)” 在I6输入 “= Chiinv(I3,8)” 可见I6的数值与H12是相同的 6°计算统计量对应的尾区概率:在I9输入 =chidist(16, 6) 7°将I9与a相比,当19>a时,接受H,所观察数据符合正态分布;当I9≤a时,拒 绝H,数据不符合正态分布。在本题中,I9的数值为0.085446>a,因此应接受H,可 认为男孩身高符合正态分布。计算结果如下表 表4.例7的计算结果 组号区间边界正态分布概率观察值理论值(Oi-Ti)2/ Ti Chi-test 1261260.0344250.03442586.8849240.1805970.196303 2[126,130)1300.1002160.0657911313.158230.001903 3[130,134)1340.2292740.1290581725.811633.008134统计量 4[134,138)1380.4198970.1906233738.124670.03317811.09629 5[138,142)1420.6319140.2120175542.403363.742049 6[142,146)1460.8094880.1775743335.514780.17807 7[146,150)1500.921480.1119921822.398320.8636890.085446 8[150,154)1540.974660.053181010.636090.038041 9>15410000010.0253495.0680043.050627 和 分位数12.59158 本来 Whitest函数返回的就是尾区概率,但它使用的自由度为数据个数减1,而现在应使 用数据个数减3为自由度,因此要使用函数Chinⅴ先把尾区概率变回统计量的值,然后再 用 Chidist求出正确自由度下的尾区概率 注意使用不同概率模型时,自由度的变化是不同的。一般来说,模型中使用几个统计量 代替未知参数,自由度就要在原来的基础上再减少几个。例如上面的例题用了样本期望和方 差代替未知参数,因此自由度比正常的 Pearson统计量少2:本书中例3.20,统计模型中没 有未知参数,因此自由度没有变化;例3.21有一个参数需用统计量代替,因此自由度需再 减 四、常用离散分布的统计计算: 离散分布统计计算中关键一点是正确建立尾区。尾区是从观察值开始,向对H成立不利 的方向求和。例如水质检验要求大肠杆菌不大于2个毫升,取2毫升检验,发现5个细菌, 问是否判断超标。此时H为:μ≤4,对H成立不利的方向应是细菌数增加,因此尾区概率 应为:∑P。其中p为2毫升水样中出现i个细菌的概率。“=E3*200” 并复制 G3 到 G4 至 G11。 5°计算统计量:在 H3 输入: “=(F3-G3)∧2/G3” 把 H3 复制到 H4 至 H11,并在 H12 输入: “=Sum(H3:H11)” 另一种计算统计量的方法为:在 I3 输入: “=Chitest(F3:F11, H3:H11)” 在 I6 输入: “=Chiinv(I3, 8)” 可见 I6 的数值与 H12 是相同的。 6°计算统计量对应的尾区概率:在 I9 输入: “=chidist(I6,6) ↙” 7°将 I9 与α相比,当 I9 > α时,接受 H0,所观察数据符合正态分布;当 I9 ≤ α时,拒 绝 H0,数据不符合正态分布。在本题中,I9 的数值为 0.085446 > α,因此应接受 H0,可 认为男孩身高符合正态分布。计算结果如下表。 表 4. 例 7 的计算结果 组号 区间 边界 正态分布 概率 观察值 理论值 (Oi-Ti)2/Ti Chi-test 1 <126 126 0.034425 0.034425 8 6.884924 0.180597 0.196303 2 [126,130) 130 0.100216 0.065791 13 13.15823 0.001903 3 [130,134) 134 0.229274 0.129058 17 25.81163 3.008134 统计量 4 [134,138) 138 0.419897 0.190623 37 38.12467 0.033178 11.09629 5 [138,142) 142 0.631914 0.212017 55 42.40336 3.742049 6 [142,146) 146 0.809488 0.177574 33 35.51478 0.17807 P 7 [146,150) 150 0.92148 0.111992 18 22.39832 0.863689 0.085446 8 [150,154) 154 0.97466 0.05318 10 10.63609 0.038041 9 >154 100000 1 0.02534 9 5.068004 3.050627 和 11.09629 分位数 12.59158 本来 Chitest 函数返回的就是尾区概率,但它使用的自由度为数据个数减 1,而现在应使 用数据个数减 3 为自由度,因此要使用函数 Chiinv 先把尾区概率变回统计量的值,然后再 用 Chidist 求出正确自由度下的尾区概率。 注意使用不同概率模型时,自由度的变化是不同的。一般来说,模型中使用几个统计量 代替未知参数,自由度就要在原来的基础上再减少几个。例如上面的例题用了样本期望和方 差代替未知参数,因此自由度比正常的 Pearson 统计量少 2;本书中例 3.20,统计模型中没 有未知参数,因此自由度没有变化;例 3.21 有一个参数需用统计量代替,因此自由度需再 减一。 四、常用离散分布的统计计算: 离散分布统计计算中关键一点是正确建立尾区。尾区是从观察值开始,向对 H0 成立不利 的方向求和。例如水质检验要求大肠杆菌不大于 2 个/毫升,取 2 毫升检验,发现 5 个细菌, 问是否判断超标。此时 H0 为:μ≤4,对 H0 成立不利的方向应是细菌数增加,因此尾区概率 应为:   i=5 i p 。其中 pi 为 2 毫升水样中出现 i 个细菌的概率
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有