两组两分类资料检验
两组两分类资料检验
内容 卡方检验入门 2>配对设计两样本率比较的x检验 3>行列表资料的分析 确切概率法
内容 1 卡方检验入门 2 配对设计两样本率比较的χ2检验 3 行列表资料的分析 4 确切概率法
检验分类资料服从某个分布 今设从总体A中随机抽取一个样本,样本量为n,其 资料分布如下: Y取值123 m合计 频数AA2A3… 某一个已知总体B的分布如下 Y取值123…m合计 频数π1π2π3 m 问:样本所在总体是否为总体B?
检验分类资料服从某个分布 ❖设从总体A中随机抽取一个样本,样本量为n,其 资料分布如下: Y 取值 1 2 3 ⋯ m 合计 频数 A1 A2 A3 ⋯ Am n 某一个已知总体 B 的分布如下 Y 取值 1 2 3 ⋯ m 合计 频数 1 2 3 ⋯ m 1 问:样本所在总体是否为总体 B?
检验分类资料服从某个分布 H:样本所在总体的分布与总体B的分布相同 H1:样本所在总体的分布与总体B的分布不同 a=0.05 在Ho为真情况下,Y=1,2,…,m对应样本量为n 的每个期望值为T;=兀ni=1,2,…,n 检验统计量x2=∑ 巛(A-7)2 当H为真时,检验统计量x2近似服从自由度为m-1的卡 方分布。即:当x2>x2osmn1,则拒绝Ho
检验分类资料服从某个分布 0 H :样本所在总体的分布与总体B的分布相同 1 H :样本所在总体的分布与总体B的分布不同 α = 0.05 在 H0为真情况下,Y=1,2,⋯,m 对应样本量为 n 的每个期望值为 1,2, , T n i n i i = = 检验统计量 2 2 1 ( ) m i i i i A T T = − = 当 H0为真时,检验统计量 2 近似服从自由度为m−1的卡 方分布。即:当 2 2 0.05, 1 m− ,则拒绝 H0
举例: 今某医生收治在某地50个患者,其血型分别如下: 血型A B AB 人数15 10 8 17 今已知该地区的一般人群的血型分布如下: 血型A AB 概率0250.5010.15 问题:患病人群的血型是否属于该地区一般人群 的血样分布
举例: ❖某医生收治在某地50个患者,其血型分别如下: ❖已知该地区的一般人群的血型分布如下: ❖问题:患病人群的血型是否属于该地区一般人群 的血样分布 血型 A B AB O 人数 15 10 8 17 血型 A B AB O 概率 0.25 0.5 0.1 0.15
实例 血型 A B AB 概率 0.250.50. 0.15 理论数T125 25 10 7.5 检验统计量x2=(15-12.5)4(0-252 12.5 25 2 (8-10)2(1 (17-75) =21.93 10 7.5 界值x20=7.81,x2>.81,拒绝H
实例 血型 A B AB O 概率 0.25 0.5 0.1 0.15 理论数 T 12.5 25 10 7.5 2 2 2 2 2 2 2 0.05 0 (15 12.5) (10 25) 12.5 25 (8 10) (17 7.5) 21.93 10 7.5 =7.81 H 7.81 − − = + − − + + = 检 验 统 计 量 界 值 , ,拒 绝
行列表资料的检验 今卡方检验是以卡方分布为基础的一种常用假设检 验方法,主要用于分类变量,它基本的无效假设 是 0 行分类变量与列分类变量无关联 nH1:行分类变量与列分类变量有关联 a0.052÷(4-7)2 统计量a7,其中A1是样本资料的 计数,T;是在H为真的情况下的理论数(期望 值)
行列表资料的检验 ❖卡方检验是以卡方分布为基础的一种常用假设检 验方法,主要用于分类变量,它基本的无效假设 是: ▪ H0:行分类变量与列分类变量无关联 ▪ H1:行分类变量与列分类变量有关联 ▪ =0.05 ▪ 统计量 ,其中Ai是样本资料的 计数,Ti是在H0为真的情况下的理论数(期望 值)。 2 2 1 ( ) k i i P i i A T T = − =
卡方检验 在H为真时,实际观察数与理论数之差A1一T 应该比较接近0。所以在H为真时,检验统计量 2(4-7)2 服从自由度为k-1的卡方分布 拒绝H。 C.1 上述卡方检验由此派生了不同应用背景的各种问 题的检验,特别最常用的是两个样本率的检验等 因为该原理的使用范围很广,但本次课程只学习用 于推断两个分类变量是否相互关联
卡方检验 ▪ 在H0为真时,实际观察数与理论数之差Ai-Ti 应该比较接近0。所以在H0为真时,检验统计量 服从自由度为k-1的卡方分布。 即: ,拒绝H0。 上述卡方检验由此派生了不同应用背景的各种问 题的检验,特别最常用的是两个样本率的检验等。 因为该原理的使用范围很广,但本次课程只学习用 于推断两个分类变量是否相互关联。 2 2 P v , 2 2 1 ( ) k i i P i i A T T = − =
方法原理 表6,2使用含氟牙膏与一般牙膏儿童的龋患率 牙膏类型患龋齿人数未患龋齿人数调查人数龋患率(%) 含氟牙膏70(7667)13012333 200 3500 般牙膏 45(38.33) 55(6167) 100 4500 计 115 185 300 38.33 更一般地,可将上述表格记为表63的一般形式,称之为四格表( fourfold table)。因为表 中a、b、c和d四个格子的数据是基本的,其余数据均可从这四个数据派生出来
方法原理 表 6.2 使用含氟牙膏与一般牙膏儿童的龋患率 牙膏类型 患龋齿人数 未患龋齿人数 调查人数 龋患率(%) 含氟牙膏 70(76.67) 130(123.33) 200 35.00 一般牙膏 45(38.33) 55(61.67) 100 45.00 合计 115 185 300 38.33 更一般地,可将上述表格记为表 6.3 的一般形式,称之为四格表(fourfold table)。因为表 中 a、b、c 和 d 四个格子的数据是基本的,其余数据均可从这四个数据派生出来
方法原理 理论频数 基于H成立,两样本所在总体无差别的前提下 计算出各单元格的理论频数来7c=e" 牙膏类型患龋齿人数未患龋齿人数 调查人数 龋患率(%) 含氟牙膏 70(7667) 130(1233) 35.00 般牙膏 45(3833) 55(6167) 100 45.00 合计 115 185 300 38.33
方法原理 ❖理论频数 ▪ 基于H0成立,两样本所在总体无差别的前提下 计算出各单元格的理论频数来 牙膏类型 患龋齿人数 未患龋齿人数 调查人数 龋患率(%) 含氟牙膏 70(76.67) 130(123.33) 200 35.00 一般牙膏 45(38.33) 55(61.67) 100 45.00 合计 115 185 300 38.33 n n n T R C RC =