第七章次数资料分析 x2检验 本章将分别介绍对次数资料、等级资料 进行统计分析的方法。 上一张下一张主页退出
第七章 次数资料分析 —— 2检验 本章将分别介绍对次数资料、等级资料 进行统计分析的方法。 上一张 下一张 主 页 退 出
第一节x2统计量与22分布 x2统计量的意义 为了便于理解,现结合一实例说明x2(读 作卡方)统计量的意义。根据遗传学理论,动 物的性别比例是1:1。统计某羊场一年所产的 876只羔羊中,有公羔428只,母羔448只。 按1:1的性别比例计算,公、母羔均应为438 只。以A表示实际观察次数,T表示理论次 数,可将上述情况列成表7-1 上一张下一张主页退出
第一节 2统计量与 2分布 一、 2统计量的意义 为了便于理解,现结合一实例说明 2 (读 作卡方) 统计量的意义。根据遗传学理论,动 物的性别比例是1:1。统计某羊场一年所产的 876只羔羊中,有公羔428只,母羔448只。 按1:1的性别比例计算,公、母羔均应为438 只。以A表示实际观察次数,T 表 示 理 论次 数,可将上述情况列成表7-1。 上一张 下一张 主 页 退 出
表7-1羔羊性别实际观察次数与理论次数 性别际观察饮数A理论次数?4271(-2 公428(4)443(7)a 母48()41438(7)210121023 合计8760 上一张下一张主页退出
表7-1 羔羊性别实际观察次数与理论次数 上一张 下一张 主 页 退 出
从表7-1看到,实际观察次数与理论次 数存在一定的差异,这里公、母各相差10 这个差异是属于抽样误差(把对该羊场一年所生 羔羊的性别统计当作是一次抽样调查)、还是羔 羊性别比例发生了实质性的变化? 要回答这个问题,首先需要确定一个统计 量用以表示实际观察次数与理论次数偏离的程 度;然后判断这一偏离程度是否属于抽样误 差,即进行显著性检验
从表7-1看到 , 实际观察次数与理论次 数存在一定的差异,这里公、母各相差10只。 这个差异是属于抽样误差(把对该羊场一年所生 羔羊的性别统计当作是一次抽样调查)、还是羔 羊性别比例发生了实质性的变化? 要回答这个问题, 首先需要确定一个统计 量 用以表示实际观察次数与理论次数偏离的程 度; 然 后 判 断这一偏离程度是否属于抽样误 差,即进行显著性检验
为了度量实际观察次数与理论次数偏离的程 度,最简单的办法是求出实际观察次数与理论次 数的差数。从表7-1看出:A1-71=-10,A2 72=10,由于这两个差数之和为0,显然不能 用这两个差数之和来表示实际观察次数与理论次 数的偏离程度。为了避免正、负抵消,可将两个 差数A1-71、A2-72平方后再相加,即计 Σ(A-⑦2,其值越大,实际观察次数与理论次 数相差亦越大,反之则越小。但利用Σ(A 72表示实际观察次数与理论次数的偏离程度尚 有不足。例如某一组实际观察次数为 张下一张主页退出
为了度量实际观察次数与理论次数偏离的程 度,最简单的办法是求出实际观察次数与理论次 数的差数。从表7-1看出:A1 -T1 =-10,A2 - T2=10,由于这两个差数之和为0, 显然不能 用这两个差数之和来表示实际观察次数与理论次 数的偏离程度。为了避免正、负抵消,可将两个 差数A1 -T1、A2 -T2 平 方 后 再 相 加 ,即计算 ∑(A-T) 2,其值越大 ,实际观察次数与理论次 数相差亦越大 , 反之则越小 。 但 利 用 ∑(AT) 2表示实际观察次数与理论次数的偏离程度尚 有 不 足 。例 如 某 一 组 实 际 观 察 次 数为 上一张 下一张 主 页 退 出
505、理论次数为500,相差5;而另一组实 际观察次数为26、理论次数为21,相差亦为 5。显然这两组实际观察次数与理论次数的偏 离程度是不同的。因为前者是相对于理论次数 500相差5,后者是相对于理论次数21相差5。 为了弥补这一不足,可先将各差数平方除以相 应的理论次数后再相加,并记之为x2,即 上一张下一张主页退出
505、理论次数为500,相差5;而另一组实 际观察次数为26、 理论次数为21,相差亦为 5。显然这两组实际观察次数与理论次数的偏 离程度是不同的。因为前者是相对于理论次数 500相差5,后者是相对于理论次数21相差5。 为了弥补这一不足,可先将各差数平方除以相 应的理论次数后再相加,并记之为 2 ,即 上一张 下一张 主 页 退 出
(A-T (7-1) 也就是说2是度量实际观察次数与理论次 数偏离程度的一个统计量,x2越小,表明实际 观察次数与理论次数越接近;x2=0,表示两 者完全吻合;x2越大,表示两者相差越大 对于表7-1的资料,可计算得 2 (A-7)2(-10)210 =0.4566 438438 表明实际观察次数与理论次数是比较接近的。 上一张下一张主页退出
(7-1) 也就是说 2是度量实际观察次数与理论次 数偏离程度的一个统计量, 2越小,表明实际 观察次数与理论次数越接近; 2 =0,表示两 者完全吻合; 2越大,表示两者相差越大。 对于表7-1的资料,可计算得 表明实际观察次数与理论次数是比较接近的。 − = T A T 2 2 ( ) + = − = − = 0.4566 438 10 438 ( ) ( 10) 2 2 2 2 T A T x 上一张 下一张 主 页 退 出
x2分布 上面在属于离散型随机变量的次数资料的基 础上引入了统计量x2,它近似地服从统计学中 种连续型随机变量的概率分布—x2分布。下 面对统计学中的2分布作一简略介绍。 设有一平均数为卩、方差为的正态总体。 现从此总体中独立随机抽取n个随机变量:x1、 2 ,并求出其标准正态离差: 上一张下一张主页退出
二、2分布 上面在属于离散型随机变量的次数资料的基 础上引入了统计量 2 , 它近似地服从统计学中 一种连续型随机变量的概率分布⎯⎯ 2分布。下 面对统计学中的 2分布作一简略介绍。 设有一平均数为μ、方差为 的正态总体。 现从此总体中独立随机抽取n个随机变量:x1、 x2、…、xn,并求出其标准正态离差: , ,… , 2 − = 1 1 x u − = 2 2 x u − = n n x u 上一张 下一张 主 页 退 出
记这n个相互独立的标准正态离差的平方和 为x2: xX=1++.+ ∑(x-m)2(7-2) =∑12=∑( 它服从自由度为n的2分布,记为 x2(n); 上一张下一张主页退出
记这n个相互独立的标准正态离差的平方和 为 2 : (7-2) 它服从自由度为n的 2分布,记为 ~ 2 (n); 2 2 2 2 1 2 ... u u un x = + + + 2 1 2 2 2 ( ) ( ) = − = − = = n i i i i x x u 2 1 2 ( ) = − n i i x 上一张 下一张 主 页 退 出
若用样本平均数代替总体平均数p,则 随机变量 (n-1)S2(7-3) 服从自由度为-1的2分布,记为 (n-1)S 2 x(n-1) 上一张下一张主页退出
若用样本平均数 代替总体平均数μ,则 随机变量 (7-3) 服从自由度为n-1的 2分布,记为 ~ x 2 2 2 1 2 2 ( 1) ( ) n S x x x n i i − = − = = 2 2 ( 1) n − S (n 1) 2 − 上一张 下一张 主 页 退 出