2015/1/9 回回 课程设置 恋石何于大学 瀑财:覆论瀑:22净对 共月绿:10学财 方差分析(ANOVA) 联方式:预防医季卫生晚 Tel:2057153 Analysis of variance Baidu账七:yfaC讨论.米民、作业) 预防医学 wmv) 大R网雀/ m=C=33-1) =3 2 ◆次比秋时,a=0.05,作完n次比秋,系新I真增 的瓶率汤a'=1-1-a)n。 105 本周a'=1-1-0.059=0.1426是0.05始2.90. 同周? 国此,对多个坪来珀款的比献检脸意香用? 1.春血时量值与共的款不有学的原国是什a2 2三氢始值春不湘周的原国是什么7 3.色香用粒业群本的t格脸暖仔能计分新? 务分新ANO1VA) 方差分斯基本愿想 林特转+外 派文开=威机史开+处复圆素吾威的支升 奢果用的能计分新者债为者基分新 (Analysisof Variance.ANOVA). F-MSa4 晚计量, 所以王 不 计春义?丁以道此F界值表作出晚计雄断
2015/1/9 1 方差分析(ANOVA) Analysis of variance 预防医学系 2 课程设臵 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 例 6.1 三组大鼠 GSH 值(mg/gprot) 甲 乙 丙 合计 79.81 87.58 60.29 80.60 70.73 62.63 … … … 104.28 80.36 46.56 72.29 56.40 55.23 全部数据 ni 12 12 12 36 Xi 83.15 75.63 52.27 70.35 Si 12.30 11.07 10.85 17.35 问题? 1.各组测量值与其均数不相等的原因是什么? 2.三组均值各不相同的原因是什么? 3.能否用独立样本的 t 检验进行统计分析? 3 3 2 3(3 1) 2 3 m C 每次比较时,α=0.05,作完n次比较,累积Ⅰ类错误 的概率为α' =1-(1-α)n 。 本题α'=1-(1- 0.05)3 =0.1426 是0.05的2.9倍. 因此,对多个样本均数的比较t检验能否用? 4 由英国统计学家R.A.Fisher首先提 出的一种统计方法,并以F命名方 差分析的统计量,所以方差分析又 称 F 检验。 将所研究的对象分为多个处理组,施加不同的干 预,施加的干预称为处理因素(factor),处理因 素至少有两个水平(level)。用这类资料的样本信 息来推断各处理组间多个总体均数是否存在差别, 常采用的统计分析方法为方差分析 (Analysis of Variance, ANOVA)。 方差分析 (ANOVA) 5 方差分析基本思想 基于变异分解的原理,在单因素方差分析中,整个 样本的变异可以看成由如下两部分组成: 总变异=随机变异 + 处理因素导致的变异 总变异=组内变异 + 组间变异 F= MS组间 MS组内 理论上F值应等于1。由于抽样误差的影响, F值一般不 会为1,而是接近1,但如果处理因素确有作用,则组间变 异会远大于组内均方, F值将明显大于1,大到多少才有统 计意义?可以通过F界值表作出统计推断。 6
2015/1/9 一、方差分折的基本思想 口乐=5两+巧有 0悬=0a闲十0a★ 总变异的分解 ■银设两样本来自网一慈体。 口H0:1=g2=g3 血内支异 F=MSan-T+E S维州 E 收k大.Fa >方差是描述变异的一种指标, 第一节方差分析的基本思想 差分析是一种假设检脸的方法。方 差分斯也此是对变开的分斯。 会,通比「检脸,来分斯莎南唇史升的春国素的 故虚反国素用的支互故应。 是对意变异进行分斯。看总吏异 )女差会斯财,一服圆素通多,恶史开此被分解得 是由哪些部分组成的,这些部分间 是如,领差部分此是小,从而高丁妆。 的美条如何。 ,根据史弄的来绿,接查部观套值焉的喜的是平 方差分新盛用条件: 1、各样本是相互教立的威机样本,从 函是外,其◆◆个都分的变开可南基垂特龙圆 盖春分布) ★的作用加以解醉。 一2、春杯本的愿体方差湘等,即方是齐性。 MS),骨期F会专张出能计推断,从而判断米 周兼对观森指标者无影喻。 2
2015/1/9 2 一、方差分析的基本思想 SS总=SS组间+SS组内 υ总= υ组间+υ组内 假设两样本来自同一总体。 H0:μ1= μ2 = μ3 H0成立则理论上F值=1 若处理起作用,则组间变异会增大,F值>1 7 E T E MS MS F 组内 组间 组间变异 总变异 组内变异 总变异的分解 8 方差是描述变异的一种指标,方 差分析是一种假设检验的方法。方 差分析也就是对变异的分析。 是对总变异进行分析。看总变异 是由哪些部分组成的,这些部分间 的关系如何。 9 第一节 方差分析的基本思想 根据研究目的和设计要求将总变异分解成几个部 分,通过F检验,来分析影响总变异的各因素的 效应及因素间的交互效应。 方差分析时,一般因素越多,总变异就被分解得 越细,误差部分就越小,从而提高了检验效率。 10 根据变异的来源,将全部观察值总的离均差平 方和及自由度分解为两个或多个部分,除随机 误差外,其余每个部分的变异可由某些特定因 素的作用加以解释。 通过比较不同来源变异的方差(也叫均方 MS),借助F分布做出统计推断,从而判断某 因素对观察指标有无影响。 11 方差分析应用条件: 1、各样本是相互独立的随机样本,均服从 正态分布; 2、各样本的总体方差相等,即方差齐性。 12
2015/1/9 >只研究一个固兼(可者多个水平,知k个 水平),故称单图素设计。它是将备个比 脸对兼随机地分配到k个水平组(处夏触) 完全随机设计的方差分析 中。 >k个处题鱼样本舍量录好湘等,但也可以 不暮。 ■ 组内支开(SS,) ■血内各个观到值X,与本 瓶内均值了之差的平力 不。反映丁鱼内(同一 水平下)样本的威机被 12.轴 11.07 10. 17.5 8=2x,- 玉服之两版都的文补 金非成海用的支开—>薄史养 血司支弄(SSRJ 善支开(SS) 。血内均值X,与善均值刀之差的平方和 金师同量值大小不 同,这种史平备秀 善支升,以春则量 值内恶啪款 处程园素春个水平鱼闲的 善界,网时心包合丁随机 S,=22x,- 甲乙 满是
2015/1/9 3 完全随机设计的方差分析 只研究一个因素(可有多个水平,如k个 水平) ,故称单因素设计。它是将每个试 验对象随机地分配到k个水平组(处理组) 中。 k个处理组样本含量最好相等,但也可以 不等。 14 例 6.1 三组大鼠 GSH 值(mg/gprot) 甲 乙 丙 合计 79.81 87.58 60.29 80.60 70.73 62.63 … … … 104.28 80.36 46.56 72.29 56.40 55.23 全部数据 ni 12 12 12 36 Xi 83.15 75.63 52.27 70.35 Si 12.30 11.07 10.85 17.35 三种变异: • 组内数据的变异 ——> 组内变异 • 三组之间数据的变异 ——> 组间变异 • 全部数据间的变异 ——> 总变异 15 组内变异(SSe) 组内各个观测值 与本 组内均值 之差的平方 和。反映了组内(同一 水平下)样本的随机波 动。 2 1 1 ( ) i k i n j SSe Xij X i Xij 30 40 50 60 70 80 90 100 110 甲 乙 丙 X甲 X乙 X丙 Xi Xij 16 组间变异(SSTR) 组内均值 与总均值 之差的平方和 2 1 SS n (X X ) i k i TR i 反映了: 处理因素各个水平组间的 差异,同时也包含了随机 误差。 Xi X 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X甲 X乙 X丙 17 总变异(SST) 全部测量值大小不 同,这种变异称为 总变异,以各测量 值Xij与总均数 间的差异度量。 Xij k i n j T ij i SS X X 1 1 2 ( ) 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X 18
2015/1/9 方美分桥基本愿想 底麦异的分解 ,可以分解为: 感史开■鱼内史开。十血间史开 MSa 见豪值与血响教的差开: F=MSa 血均数与落物款的差异:无一下 :X)-=(g-)+(民- 计套义,可以通此F不值表作出能计推断。 1.总变异 2.组间变弄(SSTR) 墨高的业平九SS-2(x,-到 ■内的值,与卷值之差的平方不 =(m- n-2n化- 反映了: 处服同★春个水平血同的 巧=春测量值的恶期款了垂值的平方和 善异,同时也色台了威机 。 3.组内支异 三种“变异”之间的关集 瓢内嘉均业平克型 SSg=SS+SSa内 s22x,--2m-s Vg=Va网tVa内 =SS。SS 组问支异SS网:处理素+随机误差 组内变异SSa: 随机误 4
2015/1/9 4 方差分析基本思想 基于变异分解的原理,在单因素方差分析中,整个 样本的变异可以看成由如下两部分组成: 总变异=随机变异 + 处理因素导致的变异 总变异=组内变异 + 组间变异 F= MS组间 MS组内 理论上F值应等于1。由于抽样误差的影响, F值一般不 会为1,而是接近1,但如果处理因素确有作用,则组间变 异会远大于组内均方, F值将明显大于1,大到多少才有统 计意义?可以通过F界值表作出统计推断。 19 总变异的分解 每个观察值与总均数不同: 可以分解为: 观察值与组均数的差异: 组均数与总均数的差异: 即: x x ij xij xi xi x x x (x x ) (x x) ij ij i i 20 总离均差平方和 ( 1) ( ) 2 1 1 2 S n SS x x k i n j ij i 总= 1. 总变异 X SS总反映:所有测量值之间总的变异程度 SS总=各测量值Xij与总均数 差值的平方和 全部观测值的方差 21 2.组间变异(SSTR) 组内均值 与总均值 之差的平方和 2 1 SS n (X X ) i k i TR i 反映了: 处理因素各个水平组间的 差异,同时也包含了随机 误差。 Xi X 30 40 50 60 70 80 90 100 110 甲 乙 丙 X X甲 X乙 X丙 22 组内离均差平方和 总 组 间 组 内 - = SS SS SS x x n S k i i i k i n j ij i i 1 2 1 1 2 ( ) ( 1) m i 3. 组内变异 在同一处理组内,虽然每个受试对象接受的处理相 同,但测量值仍各不相同,这种变异称为组内变异。 SS组内仅仅反映了随机误差的影响。也称SS误差 23 三种“变异”之间的关系 24 SS总=SS组间+SS组内 ν总 =ν组间 +ν组内 组间变异 SS组间:处理因素 + 随机误差 组内变异 SS组内: 随机误差
2015/1/9 地卖军为织小有关 均苏之比=Fvalue 变异 知果各组样本的总体均相等(H:==m=), 还与其自由度有关,由于各部分自由度不相等, 即各处组的样木来自相同总体,无处壅因素的作用,则 因此各部分高均差平方和不能直接比较,须将 可变异同组内变异一样,只反映前机谈差作用的大小。塑间 各部分离均差平方和除以相应自由度,其比值 均方与组内均方的比值常为F能计量 称为均方差,简称均方(mean square,MS)。组 F= MS组 间均方和组内均方的计算公式为: S组内 片=V组间,=Y组内 F值接近于,就没有速由拒始山:反之,F值越大, 的理由越充分,戴建统计的建论正喇,当出成立时,F V组同 V组内 统计量服从F分布。 平圆素打基分新的计第公式 F F分布 卷支5522-到2N-7 ■F分布有两个自由度,组调自由度和组内自 由度 ■F分布是一种偏态分布。 本空区1受路 有-N-女 共中:N-∑m,为处理组数 ■ Pn8-1 1换出检脸版设,项走检脸水准: 方差分析的检验步豫 史米除SS v MS F P 悉变异279.986129 处理91.2247245.61246.52<0.05 188.7614276.9912
2015/1/9 5 均方(mean square,MS) 变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方(mean square,MS)。组 间均方和组内均方的计算公式为: SS MS 组间 组间 组间 SS MS 组内 组内 组内 25 均方之比=F value 如果各组样本的总体均数相等(H0: 1 2 … k ), 即各处理组的样本来自相同总体,无处理因素的作用,则组 间变异同组内变异一样,只反映随机误差作用的大小。组间 均方与组内均方的比值称为 F 统计量 MS F MS 组间 组内 1 组间 , 2 组内 F 值接近于 l,就没有理由拒绝 H0;反之,F 值越大,拒绝 H0 的理由越充分。数理统计的理论证明,当 H0 成立时,F 统计量服从 F 分布。 26 单因素方差分析的计算公式 变异来源 离均差平方和 SS 自由度 υ 均方 MS F 总变异 N-1 组间变异 k-1 组内变异 N-k ( 1) ( ) 2 1 1 2 S n SS x x k i n j ij i 总= k i SS ni xi x 1 2 组 间 ( ) 组间 组间 SS 组内 组内 SS 组内 组间 MS MS 其中: N ni , k为处理组数 k i SS ni Si 1 2 组 内 ( 1) 27 F分布 F分布有两个自由度 ,组间自由度和组内自 由度 ; F分布是一种偏态分布。 28 方差分析的检验步骤 ⒈ 提出检验假设,确定检验水准。 H0 : μ1= μ2= μ3 ; H1 : μ1 ,μ2 ,μ3 不同或不全相同; α=0.05 ⒉ 根据公式计算SS、MS及F值 方差分析步骤 30 变异来源 SS ν MS F P 总变异 279.9861 29 处理组间 91.2247 2 45.6124 6.52 <0.05 误差 188.7614 27 6.9912 P71 8-1
2015/1/9 又确走P,作出 ·分子自由度=k1=2,自由发=nk=27,界 值表(书业分折周)后502切-3.35, 6.52,F>605020,P0.05,基利者晚计拳老 义,典0.05的医水,,热H, 多个样本均数的两两比较 认为三种处理方式的侧量值不同或不金相周 Multiple Comparison (停春模导:大于表大小子囊小原) P2乃查表师分表建者高… SNK 恒南泰提酷春血闲基利的人休信嘉,为了桥列这方面 也张NK(Newman--Keub)清,属多重复姜检套 的信怎,可造行多个杯来的版闲的西而比根。 (multiple range tes)。其检◆晚计量为g故又 >此的多,者多比multiple 春9妆脸。 9=E- ontrast,正对比 (orthogonal contrasts) SE,- SNK(Students-Newman MS是,(a,=n,=时) Ss= Keul的法. s-+a,u时) 单因素方差分析时,MS厂MSa内 3比 #” g-民-到_-B783-336-504 5-4 0.8361 子特林才对 1与2血比校: ,注服原处夏血 点第” g=5-B785-327 0.8361 0.5U 2与3盒比秋: =0 S-= 92-0.8361 g-民-利_B536=17 0.8361 (体n等) S-西 6
2015/1/9 6 ⒊ 确定P值,作出判断 分子自由度=k-1=2,分母自由度=n-k=27,查F界 值表(方差分析用)F0.05(2,27)=3.35。 F=6.52,F > F0.05(2,27), ,P<0.05,差别有统计学意 义,按照0.05的显著性水准,拒绝H0,接受H1, 认为三种处理方式的测量值不同或不全相同. (学会理解:大于最大小于最小原理) P72-73 查表部分表述有误… 31 多个样本均数的两两比较 Multiple Comparison 方差分析的结果提供了各组均数间差别的总的信息, 但尚未提供各组间差别的具体信息,为了得到这方面 的信息,可进行多个样本均数间的两两比较。 两两比较的方法很多,有多重比较(multiple comparisons),线性对比(linear contrast),正交对比 (orthogonal contrasts)等。 常用的是多重比较,如 SNK(Students-NewmanKeuls)法、LSD法、Dunnett法、Bonfferoni 法。 33 SNK法 也称NK(Newman-Keuls)法,属多重极差检验 (multiple range test)。其检验统计量为q,故又 称q检验。 A B x x A B S x x q ( + ),( 时 ) ,( = = 时 ) 误 差 误 差 A B A B x x x x A B n n MS S MS S A B A B n n 1 1 2 n n n n 单因素方差分析时,MS误 差 =MS组 内 34 H0:任两个对比组的总体均数相等,即μA=μB H1:任两个总体均数不等,即μA≠μB α=0.05 2、选择检验方法,计算检验统计量 将三个样本均数由大到小排列编秩,注明原处理组 X 秩次 处理组 37.83 1 1U 35.10 2 2U 33.62 3 0.5U (各组ni相等) 1、建立假设,确定检验水准 0.8361 10 6.9912 n MS误差 S A B x x 35 1与3组比较: 1与2组比较: 2与3组比较: 3.27 0.8361 37.83 35.1 1 2 1 2 = = Sx x x x q 5.04 0.8361 37.83 33.62 1 3 1 3 = = Sx x x x q 36 1.77 0.8361 35.1 33.62 1 2 2 3 = = Sx x x x q
2015/1/9 ,定P,月 计算春血9值养列西两比根的q妆脸计养表 散出推断结论 三个样未均款局局比根的q检脸 ”第1鱼与第2鱼此敏:P0.05,表地%基到有电计季套又 对地为感火委9健血成 9K4 P 13 4.215.043 352 0.05 利周大子表大小子表小猫原题会远飘q使 方差分斯的使用条件 第四节方差齐性检脸(选学) (Homogeneity of Variance Test) ■各处理血杯本来自随机、教立的正态恶体 一一D法、W法、卡方检脸推新) ■Bartlett检脸齿:亚春分有脊样 ■Levene松脸法:来正毒分有膏料 Bartlett检脸 Levene检脸法 小结 ■方差分新的盖本原理 ■充食随机设计的方是分新 ■多个样本均款同的两两比一NK法 >
2015/1/9 7 三个样本均数两两比较的q检验 对比组 A与B 均数之差 q值 组数 a q界值 0.05 P 1与3 4.21 5.04 3 3.52 0.05 A B x x 利用大于最大小于最小的原理查近似q值 如:q0.05(3,27) 的值查不到,但其大小应介于3.58和3.49之间, 如果5.04>3.58,则一定大于查不到的q0.05(3,27) 3、确定P值,判断结果 计算各组q值并列两两比较的q检验计算表 37 P220 第1组与第2组比较:P0.05,不拒绝H0 ,差别无统计学意 义,尚不能认为2U与0.5U凝血活酶时间总体均数不相同。 做出推断结论 38 方差分析的使用条件 各处理组样本来自随机、独立的正态总体 ------- (D法、W法、卡方检验推断) 各处理组样本的总体方差相等 ------ Bartlett检验法 、Levene检验法 39 第四节 方差齐性检验 (选学) (Homogeneity of Variance Test) Bartlett检验法:正态分布资料 Levene检验法:非正态分布资料 40 小 结 方差分析的基本原理 完全随机设计的方差分析 多个样本均数间的两两比较----SNK法 41