第七章次数资料分析 检验 本章将分别介绍对次数资料、等级资料 进行统计分析的方法。 上一张下一张主页退出
第七章 次数资料分析 —— 2检验 本章将分别介绍对次数资料、等级资料 进行统计分析的方法。 上一张 下一张 主 页 退 出
第一节x统计量与x分布 x2统计量的意义 为了便于理解,现结合一实例说明x2(读 作卡方)统计量的意义。根据遗传学理论,动 物的性别比例是1:1。统计某羊场一年所产的 876只羔羊中,有公羔428只,母羔448只。 按1:1的性别比例计算,公、母羔均应为438 只。以A表示实际观察次数,T表示理论次 数,可将上述情况列成表7-1。 上一张下一张主页退出
第一节 2统计量与 2分布 一、 2统计量的意义 为了便于理解,现结合一实例说明 2 (读 作卡方) 统计量的意义。根据遗传学理论,动 物的性别比例是1:1。统计某羊场一年所产的 876只羔羊中,有公羔428只,母羔448只。 按1:1的性别比例计算,公、母羔均应为438 只。以A表示实际观察次数,T 表 示 理 论次 数,可将上述情况列成表7-1。 上一张 下一张 主 页 退 出
表7-1 羔羊性别实际观察次数与理论次数 性别 实际观察次数中 理论次数 A-7 (A- 公中 48(A)+ 438()-10e 02283+ 母 448(} 4387} 10 02283+ 计! 876- 876 0.4566 上一张下一张主页退出
表7-1 羔羊性别实际观察次数与理论次数 上一张 下一张 主 页 退 出
从表7-1看到, 实际观察次数与理论次 数存在一定的差异,这里公、母各相差10只 这个差异是属于抽样误差(把对该羊场一年所生 羔羊的性别统计当作是一次抽样调查)、还是羔 羊性别比例发生了实质性的变化? 要回答这个问题,首先需要确定一个统计 量用以表示实际观察次数与理论次数偏离的程 度;然后判断这一偏离程度是否属于抽样误 差, 即进行显著性检验
从表7-1看到 , 实际观察次数与理论次 数存在一定的差异,这里公、母各相差10只。 这个差异是属于抽样误差(把对该羊场一年所生 羔羊的性别统计当作是一次抽样调查)、还是羔 羊性别比例发生了实质性的变化? 要回答这个问题, 首先需要确定一个统计 量 用以表示实际观察次数与理论次数偏离的程 度; 然 后 判 断这一偏离程度是否属于抽样误 差,即进行显著性检验
为了度量实际观察次数与理论次数偏离的程 度,最简单的办法是求出实际观察次数与理论次 数的差数。从表7-1看出:A1-T1=-10,A2 T2=10,由于这两个差数之和为0, 显然不能 用这两个差数之和来表示实际观察次数与理论次 数的偏离程度。为了避免正、负抵消,可将两个 差数A1-T1、A2T2平方后再相加,即计算 Σ(A-月2,其值越大,实际观察次数与理论次 数相差亦越大,反之则越小。但利用Σ(A- T)2表示实际观察次数与理论次数的偏离程度尚 有不足。例如某一 组实际观察次数为 一张下一张主页 退出
为了度量实际观察次数与理论次数偏离的程 度,最简单的办法是求出实际观察次数与理论次 数的差数。从表7-1看出:A1 -T1 =-10,A2 - T2=10,由于这两个差数之和为0, 显然不能 用这两个差数之和来表示实际观察次数与理论次 数的偏离程度。为了避免正、负抵消,可将两个 差数A1 -T1、A2 -T2 平 方 后 再 相 加 ,即计算 ∑(A-T) 2,其值越大 ,实际观察次数与理论次 数相差亦越大 , 反之则越小 。 但 利 用 ∑(AT) 2表示实际观察次数与理论次数的偏离程度尚 有 不 足 。例 如 某 一 组 实 际 观 察 次 数为 上一张 下一张 主 页 退 出
505、理论次数为500, 相差5;1 而另一组实 际观察次数为26、 理论次数为21,相差亦为 5。 显然这两组实际观察次数与理论次数的偏 离程度是不同的。因为前者是相对于理论次数 500相差5,后者是相对于理论次数21相差5。 为了弥补这一不足,可先将各差数平方除以相 应的理论次数后再相加,并记之为2,即 上一张下一张主页退出
505、理论次数为500,相差5;而另一组实 际观察次数为26、 理论次数为21,相差亦为 5。显然这两组实际观察次数与理论次数的偏 离程度是不同的。因为前者是相对于理论次数 500相差5,后者是相对于理论次数21相差5。 为了弥补这一不足,可先将各差数平方除以相 应的理论次数后再相加,并记之为 2 ,即 上一张 下一张 主 页 退 出
2=∑4- (7-1) 也就是说22是度量实际观察次数与理论次 数偏离程度的一个统计量,x越小,表明实际 观察次数与理论次数越接近;x2=0,表示两 者完全吻合;越大,表示两者相差越大。 对于表7-1的资料,可计算得 x=∑4-7-102 102 0.4566 T 438 438 表明实际观察次数与理论次数是比较接近的。 上一张下一张主页退出
(7-1) 也就是说 2是度量实际观察次数与理论次 数偏离程度的一个统计量, 2越小,表明实际 观察次数与理论次数越接近; 2 =0,表示两 者完全吻合; 2越大,表示两者相差越大。 对于表7-1的资料,可计算得 表明实际观察次数与理论次数是比较接近的。 − = T A T 2 2 ( ) + = − = − = 0.4566 438 10 438 ( ) ( 10) 2 2 2 2 T A T x 上一张 下一张 主 页 退 出
二、2分布 上面在属于离散型随机变量的次数资料的基 础上引入了统计量,它近似地服从统计学中 一种连续型随机变量的概率分布 x2分布。下 面对统计学中的x2分布作一简略介绍 设有一平均数为小、方差为一2的正态总体 现从此总体中独立随机抽取个随机变量:X1小 X2、、Xn, 并求出其标准正态离差 x1-4 u2= 上一张下一张主页退出
二、2分布 上面在属于离散型随机变量的次数资料的基 础上引入了统计量 2 , 它近似地服从统计学中 一种连续型随机变量的概率分布⎯⎯ 2分布。下 面对统计学中的 2分布作一简略介绍。 设有一平均数为μ、方差为 的正态总体。 现从此总体中独立随机抽取n个随机变量:x1、 x2、…、xn,并求出其标准正态离差: , ,… , 2 − = 1 1 x u − = 2 2 x u − = n n x u 上一张 下一张 主 页 退 出
记这个相互独立的标准正态离差的平方和 为x2: x2=42+u5++42 ∑(x,-40(7-2) =∑4=∑二= 它服从自由度为n的x2分布,记为 ∑(x,-4 i= x2(n): 上一张下一张主页退出
记这n个相互独立的标准正态离差的平方和 为 2 : (7-2) 它服从自由度为n的 2分布,记为 ~ 2 (n); 2 2 2 2 1 2 ... u u un x = + + + 2 1 2 2 2 ( ) ( ) = − = − = = n i i i i x x u 2 1 2 ( ) = − n i i x 上一张 下一张 主 页 退 出
若用样本平均数又代替总体平均数即,则 随机变量 ∑(x,-x)月 x2= i=1 (n-1)S2(7-3) 服从自由度为n=1的x2分布,记为 (n-1)S2 X(n-1) 上一张下一张主页退出
若用样本平均数 代替总体平均数μ,则 随机变量 (7-3) 服从自由度为n-1的 2分布,记为 ~ x 2 2 2 1 2 2 ( 1) ( ) n S x x x n i i − = − = = 2 2 ( 1) n − S (n 1) 2 − 上一张 下一张 主 页 退 出