《概率论与数理统计》课程教学课件（讲义）第七章假设检验第三讲拟合优度检验（打印版）.pdf_大学文库

简单地, 就是 χ 2 = X (O − E) 2 E , 其中 O 为观测频数, E 为期望频数. 这个统计量中每项的分母的选取有点讲究, 我们可以这样粗略地解释: 假设 ni 服从 Poisson 分布, 则 ni 的均值和方差均为 npi , 从而 (ni − npi)/ √npi 的极限分布为标准正态分布, 因此 χ 2 近似为 k 个服从自由度为 1 的 χ 2 分布的随机变量之和, 由于 Pk i=1(ni − npi) = 0, 故这 k 个随机变量满足一个约束, 从而 χ 2 的自由度为 k − 1. 事实上, 可以严格地证明, 在一定的条件下, χ 2 的极限分布就是自由度为 k − 1 的 χ 2 分布, 但其证明超出本课程的要求范围. 下面给出一个例子来说明拟合优度检验的应用. 例 7.3.1. 有人制造一个含 6 个面的骰子, 并声称是均匀的. 现设计一个实验来检验此命题: 连续投掷 600 次, 发现出现六面的频数分别为 97, 104, 82, 110, 93, 114. 问能否在显著性水平 0.2 下认为骰子是均匀的? 解: 该问题设计的总体是一个有 6 个类别的离散总体, 记出现六个面的概率分别为 p1, · · · , p6, 则零假设可以表示为 H0 : pi = 1/6, i = 1, · · · , 6. 在零假设下, 理论频数都是 100, 故检验统计量 χ 2 的取值为 (97 − 100)2 100 + (104 − 100)2 100 + (82 − 100)2 100 + (110 − 100)2 100 + (93 − 100)2 100 + (114 − 100)2 100 = 6.94, 跟自由度为 6 − 1 = 5 的 χ 2 分布的上 0.05 分位数 χ 2 5 (0.2) ≈ 7.29 比较, 不能拒绝零假设, 即可在显著性水平 0.2 下认为骰子是均匀的. 例 7.3.2. 孟德尔(Mendel)豌豆杂交试验。纯黄和纯绿品种杂交，因为黄色对绿色是显性的，在Mendel第一定律(自由分离定律)的假设下，二代豌豆中应该有75％是黄色的，25％是绿色的。在产生的n = 8023个二代豌豆中，有n1 = 6022个黄色， n2 = 2001个绿色。我们的问题是检验这些这批数据是否支持Mendel第一定律，要检验的假设是 H0 : π1 = 0.75, π2 = 0.25 解: 在Mendel第一定律(H0)下，黄色和绿色的个数期望值为 µ1 = nπ1 = 8023 ∗ 0.75 = 6017.25, µ2 = nπ2 = 8023 ∗ 0.25 = 2005.75 2

则Pearson χ 2统计量为 Z = X (O − E) 2 E = (6022 − 6017.25)2 /6017.25 + (2001 − 2005.75)2 /2005.75 = 0.015 自由度df = 1，p−value为0.903. 因此可以认为这些数据服从Mendel第一定律。Fisher基于Mendel试验的所有数据，发现其数据与理论值符合的太好，p − value = 0.99993，但这么好的拟合在几万次试验中才发生一次，因而Fisher断定数据可能有伪造的嫌疑[注1]。 (2) 理论分布含若干未知参数的情形当理论总体总含有未知的参数时, 理论频数 npi 一般也与这些参数有关, 此时应该用适当的估计如极大似然估计代替这些参数以得到 pi 的估计 pˆi , 得到的统计量记为 χ 2 = X k i=1 (ni − npˆi) 2 npˆi . 拟合优度检验的提出者 Karl Pearson 最初认为在零假设下, 检验统计量的 χ 2 的极限分布仍等于自由度为 k − 1 的 χ 2 分布, R. A. Fisher 发现自由度应该等于 k − 1 减去估计的独立参数的个数 r, 即 k − 1 − r. 例 7.3.3. 从某人群中随机抽取 100 个人的血液, 并测定他们在某基因位点处的基因型. 假设该位点只有两个等位基因 A 和 a, 这 100 个基因型中 AA, Aa 和 aa 的个数分别为30, 40, 30, 则能否在 0.05 的水平下认为该群体在此位点处达到 Hardy-Weinberg 平衡态? 解: 取零假设为 H0 : Hardy-Weinberg 平衡态成立. 设人群中等位基因 A 的频率为 p, 则该人群在此位点处达到 Hardy-Weinberg 平衡态指的是在人群中 3 个基因型的频率分别为 P(AA) = p 2 , P(Aa) = 2p(1 − p) 和 P(aa) = (1 − p) 2 , 即零假设可等价地写成 H0 : P(AA) = p 2 , P(Aa) = 2p(1 − p), P(aa) = (1 − p) 2 . 在 H0 下, 3 个基因型的理论频数为 100 × pˆ 2 , 100 × 2 × pˆ 2 (1 − pˆ) 和 100 × (1 − pˆ) 2 , 其中 pˆ 等于估计的等位基因频率 0.5, 代入 χ 2 统计量表达式, 得统计量的值等于 4. 该统计量的值大于自由度为 3 − 1 − 1 = 1 (恰好一个自由参数被估计) 的 χ 2 分布上 0.05 分位数 3.84, 故可在 0.05 的水平下认为未达到 Hardy-Weinberg 平衡态. [注1]https://arxiv.org/pdf/1104.2975.pdf 3

7.3.2 列联表的独立性和齐一性检验 (1) 独立性检验下面考虑很常用的列联表. 列联表是一种按两个属性作双向分类的表. 例如肝癌病人可以按所在医院 (属性 A) 和是否最终死亡 (属性 B) 分类. 目的是看不同医院的疗效是否不同. 又如婴儿可按喂养方式 (属性 A, 分两个水平: 母乳喂养与人工喂养) 和小儿牙齿发育状况 (属性 B, 分两个水平: 正常与异常) 来分类. 这两个例子中两个属性都只有两个水平, 相应的列联表称为“四格表”, 一般地, 如果第一个属性有 a 个水平, 第二个属性有 b 个水平, 称为 a × b 表 (见教材 p268) . 实际应用中, 常见的一个问题是考察两个属性是否独立. 即零假设是 H0 : 属性 A 与属性 B 独立. 这是列联表的独立性检验问题. 假设样本量为 n, 第 (i, j) 格的频数为nij . 记 pij = P(属性 A, B 分别处于水平i, j), ui = P(属性 A 有水平i), vi = P(属性 B 有水平j). 则零假设就是 pij = uivj . 将 ui 和 vj 看成参数, 则总的独立参数有 a − 1 + b − 1 = a + b − 2 个. 它们的极大似然估计为 uˆi = ni· n , vˆj = n·j n . 正好是它们的频率 (证明参看教材) . 其中 ni· = Pb j=1 nij , n·j = Pa i=1 nij . 在 H0 下, 第 (i, j) 格的理论频数为 npˆij = ni·n·j/n, 因此在 H0 下, Pa i=1 Pb j=1(nij − npˆij ) 应该较小. 故取检验统计量为 χ 2 = Xa i=1 X b j=1 (nij − ni·n·j/n) 2 (ni·n·j/n) . 在零假设下 χ 2 的极限分布是有自由度为 k − 1 − r = ab − 1 − (a + b − 2) = (a − 1)(b − 1) 的 χ 2 分布. 对于四格表, 自由度为 1. (2) 齐一性检验跟列联表有关的另一类重要的检验是齐一性检验, 即检验某一个属性 A 的各个水平对应的另一个属性 B 的分布全部相同, 这种检验跟独立性检验有着本质的区别. 独立性问题中两属性都是随机的; 而齐一性问题中属性 A 是非随机的, 这样涉及到的分布实际上是条件分布. 虽然如此, 所采用的检验方法跟独立性检验完全一样. 4

《概率论与数理统计》课程教学课件（讲义）第七章 假设检验 第三讲 拟合优度检验（打印版）

《概率论与数理统计》课程教学课件（讲义）第七章假设检验第三讲拟合优度检验（打印版）