第七讲:假设检验 7.3 拟合优度检验 1 7.3.1离散总体情形 2 7.3.2列联表的独立性和齐一性检验···· 8 7.3.3连续总体情形 12 Previous Next First Last Back Forward
第七讲: 假设检验 7.3 拟合优度检验 . . . . . . . . . . . . . . . . . . 1 7.3.1 离散总体情形 . . . . . . . . . . . . . . 2 7.3.2 列联表的独立性和齐一性检验 . . . . . 8 7.3.3 连续总体情形 . . . . . . . . . . . . . . 12 Previous Next First Last Back Forward 1
7.3 拟合优度检验 前面的假设检验基本上是在假定总体是正态的条件下做的,但是 这个假设本身不一定成立,需要收集样本(X1,…,Xn)来检验它.一 般地,检验 Ho:X服从某种分布F 可以采用Karl Pearson提出的X拟合优度检验. 基本想法:基于样本得到F的估计户,计算某种偏差D(F,F), 例如supz∈rFn(x)-F(x)儿当Ho正确时,由于Fn是F的相合估 计,偏差D(户m,F)应该很小 Karl Pearson对离散分布F提出一种检验方法,即拟合优度 检验方法或者称为Pearson卡方检验方法, Previous Next First Last Back Forward 1
7.3 拟合优度检验 前面的假设检验基本上是在假定总体是正态的条件下做的, 但是 这个假设本身不一定成立, 需要收集样本 (X1, · · · , Xn) 来检验它. 一 般地, 检验 H0 : X服从某种分布F 可以采用 Karl Pearson 提出的 χ 2 拟合优度检验. 基本想法: 基于样本得到 F 的估计 Fˆn, 计算某种偏差 D(Fˆn, F), 例如 supx∈R|Fˆn(x) − F(x)|. 当 H0 正确时, 由于 Fˆn 是 F 的相合估 计, 偏差 D(Fˆn, F) 应该很小. Karl Pearson 对离散分布 F 提出一种检验方法, 即拟合优度 检验方法或者称为 Pearson 卡方检验方法. Previous Next First Last Back Forward 1
7.3.1 离散总体情形 (1)理论总体分布不含未知参数的情形 设某总体X服从一个离散分布, X ai ak P Pi Pk p1,·,Pk完全已知.现从该总体抽得一个样本量为n的样本,其落 在类别a1,·,ak的观测数分别为n1,·,nk. 感兴趣的问题是检验 理论频率是否正确,即下面假设是否正确: Ho P(X =a1)=P1;...P(X=ak)=pk. 这类问题只提零假设而不提对立假设,相应的检验方法称为拟合优度 检验.显然,在零假设下,各类别的理论频数分别为np1,…,npk,将 理论频数和观测频数列于下表: Previous Next First Last Back Forward 2
7.3.1 离散总体情形 (1) 理论总体分布不含未知参数的情形 设某总体 X 服从一个离散分布, X a1 . . . ak P p1 . . . pk p1, · · · , pk 完全已知. 现从该总体抽得一个样本量为 n 的样本, 其落 在类别 a1, · · · , ak 的观测数分别为 n1, · · · , nk. 感兴趣的问题是检验 理论频率是否正确, 即下面假设是否正确: H0 : P(X = a1) = p1, · · · , P(X = ak) = pk. 这类问题只提零假设而不提对立假设, 相应的检验方法称为拟合优度 检验. 显然, 在零假设下, 各类别的理论频数分别为 np1, · · · , npk, 将 理论频数和观测频数列于下表: Previous Next First Last Back Forward 2
类别 a1 a2 ak 理论频数 npi np2 nPk 观测频数 ni n2 nk 由大数定律知,在零假设成立时,n:/m依概率收敛于p,故理论 频数np:与观测频数ni接近.Pearson提出检验统计量 1 npi 可以严格地证明,在一定的条件下,当Ho成立时,T的极限分布 就是自由度为k一1的X2分布. 拒绝域:T>X2(k-1) Previous Next First Last Back Forward 2
类别 a1 a2 · · · ak 理论频数 np1 np2 · · · npk 观测频数 n1 n2 · · · nk 由大数定律知, 在零假设成立时, ni/n 依概率收敛于 pi, 故理论 频数 npi 与观测频数 ni 接近. Pearson 提出检验统计量 T = ∑k i=1 (ni − npi) 2 npi = ∑ (O − E) 2 E . 可以严格地证明, 在一定的条件下, 当 H0 成立时, T 的极限分布 就是自由度为 k − 1 的 χ 2 分布. 拒绝域: T > χ2 α(k − 1) Previous Next First Last Back Forward 3
下面给出一个例子来说明拟合优度检验的应用。 有人制造一个含6个面的骰子,并声称是均匀的.现设计一个实 Example 验来检验此命题:连续投掷600次,发现出现六面的频数分别为97, 104,82,110,93,114.问能否在显著性水平0.2下认为骰子是均匀 的? Example 解:该问题设计的总体是一个有6个类别的离散总体,记出现六个面 的概率分别为p1,·,P6,则零假设可以表示为 H0:p=1/6,i=1,…,6. 在零假设下,理论频数都是100,故检验统计量X2的取值为 (07-100)2 +(L04-1002+(82-1002+110-1002+93-100)2+14-10)2=6.94, 100 100 100 100 100 100 跟自由度为6-1=5的X2分布的上0.05分位数X(0.2)≈7.29比 较,不能拒绝零假设,即可在显著性水平02下认为骰子是均匀的 Previous Next First Last Back Forward 4
下面给出一个例子来说明拟合优度检验的应用. ↑Example 有人制造一个含 6 个面的骰子, 并声称是均匀的. 现设计一个实 验来检验此命题: 连续投掷 600 次, 发现出现六面的频数分别为 97, 104, 82, 110, 93, 114. 问能否在显著性水平 0.2 下认为骰子是均匀 的? ↓Example 解: 该问题设计的总体是一个有 6 个类别的离散总体, 记出现六个面 的概率分别为 p1, · · · , p6, 则零假设可以表示为 H0 : pi = 1/6, i = 1, · · · , 6. 在零假设下, 理论频数都是 100, 故检验统计量 χ 2 的取值为 (97−100)2 100 + (104−100)2 100 + (82−100)2 100 + (110−100)2 100 + (93−100)2 100 + (114−100)2 100 =6.94, 跟自由度为 6 − 1 = 5 的 χ 2 分布的上 0.05 分位数 χ 2 5(0.2) ≈ 7.29 比 较, 不能拒绝零假设, 即可在显著性水平 0.2 下认为骰子是均匀的. Previous Next First Last Back Forward 4
孟德尔(Mendel)豌豆杂交试验。纯黄和纯绿品种杂交,因为黄色 Example 对绿色是显性的,在Mendel第一定律(自由分离定律)的假设下,二 代豌豆中应该有75%是黄色的,25%是绿色的。在产生的n=8023 个二代豌豆中,有n1=6022个黄色,2=2001个绿色。我们的问 题是检验这些这批数据是否支持Mendel第一定律,要检验的假设是 H0:T1=0.75,元2=0.25 Example 解:在Mendel第一定律(Ho)下,黄色和绿色的个数期望值为 1=nm1=8023*0.75=6017.25,42=n2=8023*0.25=2005.75 则Pearson x2统计量为 Z=Z0-=(6022-6017.25)2/6017.25+(2001-2005.752/2005.75=0.015 自由度dU=1,p-value为0.903.因此可以认为这些数据服从 Mendel第一定律。Fisher基于Mendel试验的所有数据,发现其数 Previous Next First Last Back Forward
↑Example 孟德尔 (Mendel) 豌豆杂交试验。纯黄和纯绿品种杂交,因为黄色 对绿色是显性的,在 Mendel 第一定律 (自由分离定律) 的假设下,二 代豌豆中应该有 75%是黄色的,25%是绿色的。在产生的 n = 8023 个二代豌豆中,有 n1 = 6022 个黄色,n2 = 2001 个绿色。我们的问 题是检验这些这批数据是否支持 Mendel 第一定律,要检验的假设是 H0 : π1 = 0.75, π2 = 0.25 ↓Example 解: 在 Mendel 第一定律 (H0) 下,黄色和绿色的个数期望值为 µ1 = nπ1 = 8023∗0.75 = 6017.25, µ2 = nπ2 = 8023∗0.25 = 2005.75 则 Pearson χ 2 统计量为 Z= ∑ (O−E) 2 E =(6022−6017.25)2/6017.25+(2001−2005.75)2/2005.75=0.015 自由度 df = 1,p − value 为 0.903. 因此可以认为这些数据服从 Mendel 第一定律。Fisher 基于 Mendel 试验的所有数据,发现其数 Previous Next First Last Back Forward 5
据与理论值符合的太好,p-value=0.99993,但这么好的拟合在几 万次试验中才发生一次,因而Fisher断定数据可能有伪造的嫌疑l。 (2)理论总体分布含若干未知参数的情形设某总体X服从一个离散 分布, X al ak P Pi =p(01,,0r),i=1,.,k依赖于r个未知参数01,,0.此 时理论频数p:一般也与这些参数有关,从而使用最大似然估计代替 这些参数以得到P:的最大似然估计:,得到的统计量记为 (ni-npi)2 npi https://arxiv.org/pdf/1104.2975.pdf Previous Next First Last Back Forward 6
据与理论值符合的太好,p − value = 0.99993,但这么好的拟合在几 万次试验中才发生一次,因而 Fisher 断定数据可能有伪造的嫌疑1。 (2) 理论总体分布含若干未知参数的情形设某总体 X 服从一个离散 分布, X a1 . . . ak P p1 . . . pk pi = pi(θ1, . . . , θr), i = 1, . . . , k 依赖于 r 个未知参数 θ1, . . . , θr. 此 时理论频数 npi 一般也与这些参数有关, 从而使用最大似然估计代替 这些参数以得到 pi 的最大似然估计 pˆi, 得到的统计量记为 χ 2 = ∑k i=1 (ni − npˆi) 2 npˆi . 1https://arxiv.org/pdf/1104.2975.pdf Previous Next First Last Back Forward 6
拟合优度检验的提出者Karl Pearson最初认为在零假设下,检验统计 量的X2的极限分布仍等于自由度为k-1的X2分布,R.A.Fisher 发现自由度应该等于k一1减去估计的独立参数的个数r,即k-1-r. 从某人群中随机抽取100个人的血液,并测定他们在某基因位点 ↑Example 处的基因型.假设该位点只有两个等位基因A和a,这100个基因型 中AA,Aa和aa的个数分别为30,40,30,则能否在0.05的水平下 认为该群体在此位点处达到Hardy-Weinberg平衡态? ↓Example 解:取零假设为 Ho:Hardy-Weinberg平衡态成立. 设人群中等位基因A的频率为p,则该人群在此位点处达到Hardy- Weinberg平衡态指的是在人群中3个基因型的频率分别为P(AA)= Previous Next First Last Back Forward
拟合优度检验的提出者 Karl Pearson 最初认为在零假设下, 检验统计 量的 χ 2 的极限分布仍等于自由度为 k − 1 的 χ 2 分布, R. A. Fisher 发现自由度应该等于 k−1 减去估计的独立参数的个数 r, 即 k−1−r. ↑Example 从某人群中随机抽取 100 个人的血液, 并测定他们在某基因位点 处的基因型. 假设该位点只有两个等位基因 A 和 a, 这 100 个基因型 中 AA, Aa 和 aa 的个数分别为 30, 40, 30, 则能否在 0.05 的水平下 认为该群体在此位点处达到 Hardy-Weinberg 平衡态? ↓Example 解: 取零假设为 H0 : Hardy-Weinberg 平衡态成立. 设人群中等位基因 A 的频率为 p, 则该人群在此位点处达到 HardyWeinberg 平衡态指的是在人群中 3 个基因型的频率分别为 P(AA) = Previous Next First Last Back Forward 7
p2,P(Aa)=2p(1-p)和P(aa)=(1-p)2,即零假设可等价地写成 Ho:P(AA)=p2,P(Aa)=2p(1-p,P(aa)=(1-p)2. 在Ho下,3个基因型的理论频数为100×2,100×2×(1-)和 100×(1-)2,其中方等于估计的等位基因频率0.5,代入X2统计量表 达式,得统计量的值等于4.该统计量的值大于自由度为3-1一-1=1 (恰好一个自由参数被估计)的X2分布上0.05分位数3.84,故可在 O.O5的水平下认为未达到Hardy-Weinberg平衡态. 7.3.2列联表的独立性和齐一性检验 (1)独立性检验 下面考虑很常用的列联表.列联表是一种按两个属性作双向分类 的表.例如肝癌病人可以按所在医院(属性A)和是否最终死亡(属性 B)分类.目的是看不同医院的疗效是否不同.又如婴儿可按喂养方 式(属性A,分两个水平:母乳喂养与人工喂养)和小儿牙齿发育状况 Previous Next First Last Back Forward 8
p 2 , P(Aa) = 2p(1 − p) 和 P(aa) = (1 − p) 2 , 即零假设可等价地写成 H0 : P(AA) = p 2 , P(Aa) = 2p(1 − p), P(aa) = (1 − p) 2 . 在 H0 下, 3 个基因型的理论频数为 100 × pˆ 2 , 100 × 2 × pˆ 2 (1 − pˆ) 和 100×(1−pˆ) 2 , 其中 pˆ 等于估计的等位基因频率 0.5, 代入 χ 2 统计量表 达式, 得统计量的值等于 4. 该统计量的值大于自由度为 3−1−1 = 1 (恰好一个自由参数被估计) 的 χ 2 分布上 0.05 分位数 3.84, 故可在 0.05 的水平下认为未达到 Hardy-Weinberg 平衡态. 7.3.2 列联表的独立性和齐一性检验 (1) 独立性检验 下面考虑很常用的列联表. 列联表是一种按两个属性作双向分类 的表. 例如肝癌病人可以按所在医院 (属性 A) 和是否最终死亡 (属性 B) 分类. 目的是看不同医院的疗效是否不同. 又如婴儿可按喂养方 式 (属性 A, 分两个水平: 母乳喂养与人工喂养) 和小儿牙齿发育状况 Previous Next First Last Back Forward 8
(属性B,分两个水平:正常与异常)来分类.这两个例子中两个属性 都只有两个水平,相应的列联表称为“四格表”,一般地,如果第一个属 性有a个水平,第二个属性有b个水平,称为a×b表(见教材p268). 实际应用中,常见的一个问题是考察两个属性是否独立.即零假设是 Ho:属性A与属性B独立. 这是列联表的独立性检验问题, 假设样本量为n,第(亿,)格的频数为n.记 P,=P(属性A,B分别处于水平i,), (7.1) :=P(属性A有水平), (7.2) =P(属性B有水平) (7.3) 则零假设等价于 H0:p=u:U防i,j Previous Next First Last Back Forward 9
(属性 B, 分两个水平: 正常与异常) 来分类. 这两个例子中两个属性 都只有两个水平, 相应的列联表称为 “四格表”, 一般地, 如果第一个属 性有 a 个水平, 第二个属性有 b 个水平, 称为 a×b 表 (见教材 p268) . 实际应用中, 常见的一个问题是考察两个属性是否独立. 即零假设是 H0 : 属性 A 与属性 B 独立. 这是列联表的独立性检验问题. 假设样本量为 n, 第 (i, j) 格的频数为 nij . 记 pij = P(属性 A, B 分别处于水平i, j), (7.1) ui = P(属性 A 有水平i), (7.2) vi = P(属性 B 有水平j) (7.3) 则零假设等价于 H0 : pij = uivj ∀i, j Previous Next First Last Back Forward 9