◆ 方差分斯(ANOVA) 经”” Analysis of variance m(时论、等根.作业)》 大特精品球复用站-教学其一(、m) m=c=33-山3 0g2 F. 一、方麦分新的泰本思想 - 恶史开的分解 血用史异服内史动 差分斯也就是对支异曲争新。 F-.T4 主特人F
方差分析(ANOVA) Analysis of variance 预防医学系 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 问题? 1.各组测量值与其均数不相等的原因是什么? 2.三组均值各不相同的原因是什么? 3.能否用独立样本的 t 检验进行统计分析? 3 3 2 3 ( 3 1 ) 2 3 m C 每次比较时,α=0.05,作完n次比较,累积Ⅰ类错误 的概率为α' =1-(1-α)n 。 本题α'=1-(1- 0.05)3 =0.1426 是0.05的2.9倍. 因此,对多个样本均数的比较t检验能否用? 4 由英国统计学家R.A.Fisher首先提 出的一种统计方法,并以F命名方 差分析的统计量,所以方差分析又 称 F 检验。 将所研究的对象分为多个处理组,施加不同的干 预,施加的干预称为处理因素(factor),处理因 素至少有两个水平(level)。用这类资料的样本信 息来推断各处理组间多个总体均数是否存在差 别,常采用的统计分析方法为方差分析 (Analysis of Variance, ANOVA)。 方差分析 (ANOVA) 5 方差分析基本思想 基于变异分解的原理,在单因素方差分析中,整个 样本的变异可以看成由如下两部分组成: 总变异=随机变异 + 处理因素导致的变异 总变异=组内变异 + 组间变异 F= MS组间 MS组内 理论上F值应等于1。由于抽样误差的影响, F值一般不 会为1,而是接近1,但如果处理因素确有作用,则组间变 异会远大于组内均方, F值将明显大于1,大到多少才有统 计意义?可以通过F界值表作出统计推断。 6 一、方差分析的基本思想 SS总=SS组间+SS组内 υ总= υ组间+υ组内 假设两样本来自同一总体。 H0:μ1= μ2 = μ3 H0成立则理论上F值=1 若处理起作用,则组间变异会增大,F值>1 7 E T E MS MS F 组内 组间 组间变异 总变异 组内变异 总变异的分解 8 方差是描述变异的一种指标,方 差分析是一种假设检验的方法。方 差分析也就是对变异的分析。 是对总变异进行分析。看总变异 是由哪些部分组成的,这些部分间 的关系如何。 9
多一节方是分新的盖木悬海 女是本前点通喜林: 自 光全随机设计的方差分斯 二岩 两支米53 ss.-Sncr.-Ty 西-22x,- s,-ftr-r
第一节 方差分析的基本思想 根据研究目的和设计要求将总变异分解成几个部 分,通过F检验,来分析影响总变异的各因素的 效应及因素间的交互效应。 方差分析时,一般因素越多,总变异就被分解得 越细,误差部分就越小,从而提高了检验效率。 10 根据变异的来源,将全部观察值总的离均差平 方和及自由度分解为两个或多个部分,除随机 误差外,其余每个部分的变异可由某些特定因 素的作用加以解释。 通过比较不同来源变异的方差(也叫均方 MS),借助F分布做出统计推断,从而判断某 因素对观察指标有无影响。 11 方差分析应用条件: 1、各样本是相互独立的随机样本,均服从 正态分布; 2、各样本的总体方差相等,即方差齐性。 12 完全随机设计的方差分析 只研究一个因素(可有多个水平,如k个 水平) ,故称单因素设计。它是将每个试 验对象随机地分配到k个水平组(处理组) 中。 k个处理组样本含量最好相等,但也可以 不等。 14 三种变异: • 组内数据的变异 ——> 组内变异 • 三组之间数据的变异 ——> 组间变异 • 全部数据间的变异 ——> 总变异 15 组内变异(SSe) 组内各个观测值 与本 组内均值 之差的平方 和。反映了组内(同一 水平下)样本的随机波 动。 2 1 1 ( ) i k i n j SSe Xij X i Xij 30 40 50 60 70 80 90 100 110 甲 乙 丙 X甲 X乙 X丙 Xi Xij 16 组间变异(SSTR) 组内均值 与总均值 之差的平方和 2 1 SS n (X X ) i k i TR i 反映了: 处理因素各个水平组间的 差异,同时也包含了随机 误差。 Xi X 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X甲 X乙 X丙 17 总变异(SST) 全部测量值大小不 同,这种变异称为 总变异,以各测量 值Xij与总均数 间的差异度量。 Xij k i n j T ij i SS X X 1 1 2 ( ) 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X 18
+ 镇名空-可 -=代,-)+民- 2.盒网支+(5R) 3.氢内支升 三种“史界”之周的兴泰 一鱼肉尚值T器海佳了之县陆个中杯 血斯瑞业平比型 -立-时目 轻小时7 #88aa t 2 6支eaa影M+ 的寄之比=Fabe 与 r1=aE,的=a 用生将w-空化-r- 间均方 k-空w去 秀中:N一X培桃
方差分析基本思想 基于变异分解的原理,在单因素方差分析中,整个 样本的变异可以看成由如下两部分组成: 总变异=随机变异 + 处理因素导致的变异 总变异=组内变异 + 组间变异 F= MS组间 MS组内 理论上F值应等于1。由于抽样误差的影响, F值一般 不会为1,而是接近1,但如果处理因素确有作用,则组间 变异会远大于组内均方, F值将明显大于1,大到多少才 有统计意义?可以通过F界值表作出统计推断。 19 总变异的分解 每个观察值与总均数不同: 可以分解为: 观察值与组均数的差异: 组均数与总均数的差异: 即: x x ij ij i x x xi x x x (x x ) (x x) ij ij i i 20 总离均差平方和 ( 1) ( ) 2 1 1 2 S n SS x x k i n j ij i 总= 1. 总变异 X SS总反映:所有测量值之间总的变异程度 SS总=各测量值Xij与总均数 差值的平方和 全部观测值的方差 21 2.组间变异(SSTR) 组内均值 与总均值 之差的平方和 2 1 SS n (X X ) i k i TR i 反映了: 处理因素各个水平组间的 差异,同时也包含了随机 误差。 Xi X 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X甲 X乙 X丙 22 组内离均差平方和 总 组间 组内 - = SS SS SS x x n S k i i i k i n j ij i i 1 2 1 1 2 ( ) ( 1) m i 3. 组内变异 在同一处理组内,虽然每个受试对象接受的处理相 同,但测量值仍各不相同,这种变异称为组内变异。 SS组内仅仅反映了随机误差的影响。也称SS误差 23 三种“变异”之间的关系 24 SS总=SS组间+SS组内 ν总 =ν组间 +ν组内 组间变异 SS组间:处理因素 + 随机误差 组内变异 SS组内: 随机误差 均方(mean square,MS) 25 均方之比=F value 26 单因素方差分析的计算公式 变异来源 离均差平方和 SS 自由度 υ 均方 MS F 总变异 N-1 组间变异 k-1 组内变异 N-k ( 1) ( ) 2 1 1 2 S n SS x x k i n j ij i 总= k i SS ni xi x 1 2 组间 ( ) 组间 组间 SS组内 组内 SS 组内 组间 MS MS 其中: N ni , k为处理组数 k i SS ni Si 1 2 组内 ( 1) 27
F分市 ■ 方差分析的检验步骤 MS F P Aa652.F≥ 多小部失的数的西西比处 an年伞A这青高 95 名法性a厚 2沈 点
F分布 F分布有两个自由度 ,组间自由度和组内自 由度 ; F分布是一种偏态分布。 28 方差分析的检验步骤 ⒈ 提出检验假设,确定检验水准。 H0 : μ1= μ2= μ3 ; H1: μ1 ,μ2 ,μ3 不同或不全相同; α=0.05 ⒉ 根据公式计算SS、MS及F值 方差分析步骤 30 变异来源 SS ν MS F P 总变异 279.9861 29 处理组间 91.2247 2 45.6124 6.52 F0.05(2,27), ,P<0.05,差别有统计学意 义,按照0.05的显著性水准,拒绝H0,接受H1, 认为三种处理方式的测量值不同或不全相同. (学会理解:大于最大小于最小原理) P72-73 查表部分表述有误… 31 多个样本均数的两两比较 Multiple Comparison 方差分析的结果提供了各组均数间差别的总的信 息,但尚未提供各组间差别的具体信息,为了得到这 方面的信息,可进行多个样本均数间的两两比较。 两两比较的方法很多,有多重比较(multiple comparisons),线性对比(linear contrast),正交对比 (orthogonal contrasts)等。 常用的是多重比较,如 SNK(Students-NewmanKeuls)法、LSD法、Dunnett法、Bonfferoni 法。 33 SNK法 也称NK(Newman-Keuls)法,属多重极差检验 (multiple range test)。其检验统计量为q,故又 称q检验。 xA xB A B S x x q ( + ),( 时) ,( = = 时) 误差 误差 A B A B x x x x A B n n MS S MS S A B A B n n 1 1 2 n n n n 单因素方差分析时,MS误差=MS组内 34 H0:任两个对比组的总体均数相等,即μA= μB H1:任两个总体均数不等,即μA≠ μB α=0.05 2、选择检验方法,计算检验统计量 将三个样本均数由大到小排列编秩,注明原处理组 X秩次 处理组 37.83 1 1U 35.10 2 2U 33.62 30.5U (各组ni相等) 1、建立假设,确定检验水准 0.8361 10 6.9912 n MS误差 S A B x x 35 1与3组比较: 1与2组比较: 2与3组比较: 3.27 0.8361 37.83 35.1 1 2 1 2 = = Sx x x x q 5.04 0.8361 37.83 33.62 1 3 1 3 = = Sx x x x q 36 1.77 0.8361 35.1 33.62 1 2 2 3 = = Sx x x x q
酰业推面酷济 2294 ·"0 503 000 s 6e老闲 ”寺层余新陆基华区
三个样本均数两两比较的q检验 对比组 A与B 均数之差 q值 组数 a q界值 0.05 P 1与3 4.21 5.04 3 3.52 0.05 xA xB 利用大于最大小于最小的原理查近似q值 如:q0.05(3,27) 的值查不到,但其大小应介于3.58和3.49之间, 如果5.04>3.58,则一定大于查不到的q0.05(3,27) 3、确定P值,判断结果 计算各组q值并列两两比较的q检验计算表 37 P220 第1组与第2组比较:P0.05,不拒绝H0 ,差别无统计学意 义,尚不能认为2U与0.5U凝血活酶时间总体均数不相同。 做出推断结论 38 方差分析的使用条件 各处理组样本来自随机、独立的正态总体 ------- (D法、W法、卡方检验推断) 各处理组样本的总体方差相等 ------ Bartlett检验法 、Levene检验法 39 第四节 方差齐性检验 (选学) (Homogeneity of Variance Test) Bartlett检验法:正态分布资料 Levene检验法:非正态分布资料 40 小 结 方差分析的基本原理 完全随机设计的方差分析 多个样本均数间的两两比较----SNK法 41