SPSS第八课:征服一般线性模型 General Linear model菜单详解(下) (医学统计之星:张文彤) §8.4多元方差分析 所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应 变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程 度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量 8.4.1分析步骤 为了方便起见,我们这里直接利用SPSS自带的数据集 plastic.sav,假设 tear res、 gloss和 opacity都使反应橡胶质量的指标(不要笑,是假设),现 在要研究 extrusn和 additive对橡胶的质量影响如何,则应采用多元方差分析。 选择 Analyze==> General Linear model=> Multivariate,则弹出 Multivariate对话框,请注意,除了没有 random effect外,它的所有元素都 是和 univariate对话框相同的,里面的内容也相同,因此我们这里就不再重复 按照我们的分析要求,对话框操作步骤如下: 1. Analyze==>General Lineal model==>Multivariate 2. Dependent Variable框:选入 tear res、 gloss和 opacity 3. Fixed Factors框:选入 extrusn和 additive 4.单击OK 此处两个自变量均是二分类变量,故无需选择两两比较方法。 8.4.2结果解释 按上面的选择,分析结果如下 General Linear model
SPSS 第八课:征服一般线性模型 ――General Linear Model 菜单详解(下) (医学统计之星:张文彤) §8.4 多元方差分析 所谓的多元方差分析,就是说存在着不止一个应变量,而是两个以上的应 变量共同反映了自变量的影响程度。比如要研究某些因素对儿童生长的影响程 度,则身高、体重等都可以作为生长程度的测量因子,即都应作为应变量。 8.4.1 分析步骤 为了方便起见,我们这里直接利用 SPSS 自带的数据集 plastic.sav,假设 tear_res、gloss 和 opacity 都使反应橡胶质量的指标(不要笑,是假设),现 在要研究 extrusn 和 additive 对橡胶的质量影响如何,则应采用多元方差分析。 选择 Analyze==>General Linear Model==>Multivariate,则弹出 Multivariate 对话框,请注意,除了没有 random effect 外,它的所有元素都 是和 univariate 对话框相同的,里面的内容也相同,因此我们这里就不再重复 了。 按照我们的分析要求,对话框操作步骤如下: 1. Analyze==>General Lineal model==>Multivariate 2. Dependent Variable 框:选入 tear_res、gloss 和 opacity 3. Fixed Factors 框:选入 extrusn 和 additive 4. 单击 OK 此处两个自变量均是二分类变量,故无需选择两两比较方法。 8.4.2 结果解释 按上面的选择,分析结果如下: General Linear Model
Between-Subjects Factors Additive 1 Amount 这是引入模型的自变量的取值情况列表。 Multivariate Tests Effect Hypothesis df Error df Sig Intercept Pillais Trace 9995950.906 3.00014000000 Wilks'Lambda 0015950.906a 3.00014000000 Hotelling s Trace 1275.194 5950.906a 3.00014.000000 Roy ' s Largest Root 1275. 194 5950.906 3.00014000000 EXTRUSN Pillai's Trace 618 7.5543 3.00014.000003 3827554a 3.00014.000003 Hotelling's Trace 1.619 3.00014.000003 Roy's Largest Root 1.619 7.5542 3.00014.000003 ADDITIVE Pillai's Trace 477 4.256 3.00014.000025 Wilks'Lambda 523 3.00014000025 3.00014.000 Roy's Largest Root 4.256 3.00014.000025 EXTRUSN ADDITIVE Pillai's Trace. 223 1,339 3.000 14.000 302 Wilks Lambda 777 1339a 3.00014.000302 Hotelling's trace 2871.339 3.00014.00 b Design: Intercept+EXTRUSN+ADDITIVE+EXTRUSN*ADDITIVE 上表是针对模型中的自变量间及其交互作用所做的检验,采用的是四种多 元检验方法。一般他们的结果都是相同的,如果不同,一般以 Hotelling' s Trace 方法的结果为准。可见在所用的模型中, extrusn和 additive对结果变量是有 统计学意义的,但交互作用无统计学意义
这是引入模型的自变量的取值情况列表。 上表是针对模型中的自变量间及其交互作用所做的检验,采用的是四种多 元检验方法。一般他们的结果都是相同的,如果不同,一般以 Hotelling's Trace 方法的结果为准。可见在所用的模型中,extrusn 和 additive 对结果变量是有 统计学意义的,但交互作用无统计学意义
Tests of Between-Subjects Effects Type Ill Sum Dependent variable of Squares an square Corrected Mode Tear Resistance 25014 002 Gloss 2457b3 819 Opacity 9.282° 3.094 53 Interce Tear Resistance 920.724 920.7 8351.2430 1735384 173538410565.507000 309684 309684 76319000 EXTRUSN Tear Resistance 1.740 1.740 001 Gloss 1.301 1.301 7.918012 Opacity 421 104752 ADDITNVE Tear Resistance 760 898 Gloss 3.729 opacity 4.900 1.20828 EXTRUSN* ADDITIVE Tear Resistance 5.000E-04 5000E-04 0059 Gloss 3.315087 opacity 3.960 3.960 976338 Er Tear Resistance 1.764 16 2.628 opacity 64.924 4.058 Total Tear Resistance 924.990 Gloss 1740470 opacity 383890 Corrected Total Tear Resistance 4.265 Gloss 5.085 4.206 a R Squared =586 (Adjusted R Squared =.509) b R Squared=. 483(Adjusted R Squared= 386) C R Squared=. 1 25 (Adjusted R Squared =-.039) 上表实际上是四个一元方差分析表的合并,即分别考虑四个应变量时的方 差分析结果。上面的多元方差分析已经得知两自变量对应变量有影响,从现在的 分析表就可以更清楚的知道是对那些自变量影响较大。对照可知, extrusn和 additive对 tear resistance和 gloss都有较大影响,而他们的交互作用对 gloss 有影响,他们(及交互作用)对 Opacity都没有影响。 §8.5重复测量的方差分析 重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个 体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量 的方差分析模型来解决
上表实际上是四个一元方差分析表的合并,即分别考虑四个应变量时的方 差分析结果。上面的多元方差分析已经得知两自变量对应变量有影响,从现在的 分析表就可以更清楚的知道是对那些自变量影响较大。对照可知,extrusn 和 additive对tear resistance和gloss都有较大影响,而他们的交互作用对gloss 有影响,他们(及交互作用)对 Opacity 都没有影响。 §8.5 重复测量的方差分析 重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个 体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量 的方差分析模型来解决
8.5.1 Repeated measures对话框界面说明 实际上,如果对普通方差分析模型作出正确的设置,两者的分析结果是完 全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?我们通过下 面的例子来看看: 例8.3在数据集 anxity2.sav中判断: anxiety和 tension对实验结果 (即 triall trial4)有无影响:四次试验间有无差异:试验次数和两个变量有 无交互作用。 anxity2.sav和 anxity.sav实际上是同一个数据,但根据不同的分析目的 采用了不同的数据排列方式。如果采用 anxity.sav进行分析,我们可以分析四 次试验间有无差异的问题,但对另两个问题就无能为力了,因为用普通的方差分 析模型, anxity和 tension的影响被合并到了 subject中,根本就无法分解出 来进行分析,这时,我们就只能求助于重复测量的方差分析模型。 在菜单中选择 Analyze== General lineal model=> Repeated measures 系统首先会弹出一个重复测量因子定义对话框如下: Yithin-Subject Factor Name: factor1 Define Number of levels: eset Add Cancel Change Help Remove Measure >> 因为是重复测量的模型,应变量被重复测量了几次,分别存放在几个变量 中,所以我们这里要自行定义应变量。默认的名称为 factor1,我们将其改为 trail,下面的因素等级数填入4(因一共测量了四次)。单击Add钮,则该变量 被加入,我们就完成了模型设置的第一步:应变量名称和测量次数定义。单击 define,我们开始进行下一个步骤:具体重复测量变量定义及模型设置,对话框 如下:
8.5.1 Repeated measures 对话框界面说明 实际上,如果对普通方差分析模型作出正确的设置,两者的分析结果是完 全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?我们通过下 面的例子来看看: 例 8.3 在数据集 anxity2.sav 中判断:anxiety 和 tension 对实验结果 (即 trial1~trial4)有无影响;四次试验间有无差异;试验次数和两个变量有 无交互作用。 anxity2.sav 和 anxity.sav 实际上是同一个数据,但根据不同的分析目的 采用了不同的数据排列方式。如果采用 anxity.sav 进行分析,我们可以分析四 次试验间有无差异的问题,但对另两个问题就无能为力了,因为用普通的方差分 析模型,anxity 和 tension 的影响被合并到了 subject 中,根本就无法分解出 来进行分析,这时,我们就只能求助于重复测量的方差分析模型。 在菜单中选择 Analyze==>General Lineal model==>Repeated measures, 系统首先会弹出一个重复测量因子定义对话框如下: 因为是重复测量的模型,应变量被重复测量了几次,分别存放在几个变量 中,所以我们这里要自行定义应变量。默认的名称为 factor1,我们将其改为 trail,下面的因素等级数填入 4(因一共测量了四次)。单击 Add 钮,则该变量 被加入,我们就完成了模型设置的第一步:应变量名称和测量次数定义。单击 define,我们开始进行下一个步骤:具体重复测量变量定义及模型设置,对话框 如下:
Repeated Measures ◆ Subject (subject) Within-Subjects Variables (trial OK 参 Anxiety [anxiety 参 Tension[ tension ?凹 Paste O Trial 1 [triall] > Trial 2 [trial21 ?(3] eset 秒 Trial3[til3 4 e Trial 4 [ trial] Cancel Help Between-Subjects FactorIs) Covariates: Model Contrasts Plots… Post hoc…Save Options. 这个对话框和我们以前看到的方差分析对话框不太一样:它没有应变量框, 而是改为了组内效应框,实际上是一回事,上面我们定义了 trial有四次测量, 此处就给出了四个空让你填入相应代表四次测量的变量,选中 triall tria14 将其选入;然后要选择自变量了(这里又将其称为了 between subjects factor) 将剩下的三个都选入即可。最后,根据题意,不需要检验 anxIty与 tension的 交互作用对试验次数有无交互作用,所以要在 model中作相应设置,把那个东东 拉出来。 详细的操作步骤如下: 1. Analyze==>General Lineal mode l==>Repeated measures 2. Within-subject factor name框:键选入 trial 3. number of levels框:键入4 4.单击ADD钮 5.单击 DEFINE钮 6. Within-subject variables( trial)框:选入 triall trial4 7. between subjects factor框:选入 sub ject、 anxIty和 tension 8.单击 MODEL钮 9. Custom单选钮:选中
这个对话框和我们以前看到的方差分析对话框不太一样:它没有应变量框, 而是改为了组内效应框,实际上是一回事,上面我们定义了 trial 有四次测量, 此处就给出了四个空让你填入相应代表四次测量的变量,选中 trial1~trial4, 将其选入;然后要选择自变量了(这里又将其称为了 between subjects factor), 将剩下的三个都选入即可。最后,根据题意,不需要检验 anxity 与 tension 的 交互作用对试验次数有无交互作用,所以要在 model 中作相应设置,把那个东东 拉出来。 详细的操作步骤如下: 1. Analyze==>General Lineal model==>Repeated measures 2. Within-subject factor name 框:键选入 trial 3. number of levels 框:键入 4 4. 单击 ADD 钮 5. 单击 DEFINE 钮 6. Within-subject variables (trial)框:选入 trial1~trial4 7. between subjects factor 框:选入 subject、anxity 和 tension 8. 单击 MODEL 钮 9. Custom 单选钮:选中
10. Within- sub ject Model框:选入 trial 11. between subjects Model框:选入 anxity和 tension 12.单击 CONTINUE 13.单击OK D多请注意,这里没有选入变量 sub ject,因为它实际上在这里成为了一个记录 ID,要是将它选入,则什么都检验不了了。 8.5.2结果解释 本题的分析结果如下: General Linear model Within -Subjects Factors Measure MEASURE 1 Dependent TRAIL TRIAL1 TRIAL2 TRIAL4 上表给出了所定义的4次测量的变量名,在模型中它们都代表一个应变量 tria1,只是测量的次数不同而已 Between-Subjects Factors Anxiety 1 Tension 1 这是引入模型的其它自变量的情况列表
10. Within-subject Model 框:选入 trial 11. between subjects Model 框:选入 anxity 和 tension 12. 单击 CONTINUE 13.单击 OK 请注意,这里没有选入变量 subject,因为它实际上在这里成为了一个记录 ID,要是将它选入,则什么都检验不了了。 8.5.2 结果解释 本题的分析结果如下: General Linear Model 上表给出了所定义的 4 次测量的变量名,在模型中它们都代表一个应变量 trial,只是测量的次数不同而已。 这是引入模型的其它自变量的情况列表
Multivariate Tests Effect value Hypothesis df Error df Sig 97075.136a 3.0007.000000 03075.1364 3.0007000000 Hotelling's Trace 32. 201 75. 136 3.0007.000000 Roy's Largest Root 32. 201 75136a 3.0007000000 TRAIL ANXIETY Pillais Trace 5582.9494 3.0007000108 Wilks'Lambda 44229494 3.000 Hotelling's Trace 1,264 2.949 3.0007000108 Roy,'s Largest Root 1.264 2.949a 3.00070 108 TRAIL* TENSIoN Pillai's trace 3741.393 3.0007000322 wilks'Lambda 6261.3934 3.0007.000322 Hotelling’ sTrace 59713934 3.0007000322 Roys Largest root 5971.393a 7 322 a. Exact statistic esign: Intercept+ ANXIETY+TENSION Within Subjects Design: TRAIL 上表是针对所检验的结果变量 trial,以及他和另两个引入模型的自变量间 的交互作用是否存在统计学意义,采用的是四种多元检验方法。一般他们的结果 都是相同的,如果不同,我一般以 Hotelling' s Trace方法的结果为准。可见在 所用的模型中, trial的四次测量间的确是存在着统计学差异的,但它和另两个 变量间的交互作用无统计学意义 Mauchly's Test of Sphericity Measure: MEASURE 1 具 Within Subjects Effect Mauchly's w Chi-Square sig. e-Geisser Huynh-Feldt Lower-bound TRAlL 297 383 557 333 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix a May be used to adjust the degrees of freedom for the averaged tests of significance, Corrected tests are displayed in the Tests of Within-Subjects Effects table b Design: Intercept+ANXIETY+TENSION Within Subjects Design TRAIL 上表是球形检验,因为重复测量的方差分析模型要求所检验的应变量服从 种叫做球形分布的东东。上面可能有些内容不好懂,不过没关系,只要看到近 似卡方为9.383,自由度为5,P值为0.097就可以了。因此 trial是勉强服从 球形分布的,可以进行重复测量的方差分析
上表是针对所检验的结果变量 trial,以及他和另两个引入模型的自变量间 的交互作用是否存在统计学意义,采用的是四种多元检验方法。一般他们的结果 都是相同的,如果不同,我一般以 Hotelling's Trace 方法的结果为准。可见在 所用的模型中,trial 的四次测量间的确是存在着统计学差异的,但它和另两个 变量间的交互作用无统计学意义。 上表是球形检验,因为重复测量的方差分析模型要求所检验的应变量服从 一种叫做球形分布的东东。上面可能有些内容不好懂,不过没关系,只要看到近 似卡方为 9.383,自由度为 5,P 值为 0.097 就可以了。因此 trial 是勉强服从 球形分布的,可以进行重复测量的方差分析
Tests of Within-Subjects Effects Measure: MEASURE 1 Type Ill Sum Source of Squares df Mean Square TRAIL Sphericity Assumed 991.500 330500137,461 000 Greenhouse-Geisser 9915001.671 593.254137461000 Huynh-Feldt 991.5002464 402.449137461 Lower-bound 991.5001.000 991.500137.461 000 TRAIL#ANXIETY Sphericity Assumed 8.417 2.806 1.167341 84171.671 5.0361.167329 Huynh-Feldt 84172.464 34161.167338 Lower-bound 8.4171.000 8.417 1.167308 TRAIL TENSION Sphericity Assumed 12.167 4.056 1.687 Greenhouse-Geisser 12.1671.671 7.280 1.687219 Huynh-Feldt 12.1672.464 4.938 1.687204 Lower-bound 12.1671.000 12.167 1.687226 ErrorTRAIL Sphericity Assumed 64.917 2.404 Greenhouse-Geisser 6491715042 Huynh-Feldt 2.928 Lower-bound 64.917 7.213 上面又用方差分析的方法对组内因素进行了检验,注意第一种为球形分布 假设成立时的结果,就是我们所要看的。如果该假设不成立,则根据不同的情况 可能看下面三种检验结果之一,或放弃该检验方法。 Tests of Within-Subjects Contrasts Measure: MEASURE 1 Type l SI Source TRAIL of Squares df Mean Square TRAIL 984.150 984.150214.118000 Quadratic 6.750 6.750 TRAIL * ANXIETY Linear 1.667 1.667 363 562 Quadratic 3.000 3.000 1.670228 Cubic 3.750 3.750 4.571061 TRAIL TENSION Linear 0.417 10.417 Quadratic 8.333E-02 18.333E-02 046 Cubic 1.667 1.6672032188 Error(RAIL) 41.367 4.596 Quadratic 7.383
上面又用方差分析的方法对组内因素进行了检验,注意第一种为球形分布 假设成立时的结果,就是我们所要看的。如果该假设不成立,则根据不同的情况 可能看下面三种检验结果之一,或放弃该检验方法
上表是非常重要的一部分:各次重复测量间变化趋势的模型分析,这里要 求检验没有统计学意义,否则说明变化趋势不服从该曲线。以 trial为例,对 Linear的检验P值小于千分之一, Quadratic的P值略大于0.05。只有 Cubic 的P值在0.5附近,因此最佳的拟合曲线应为 Cubic(三次方曲线);但由于 共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上 的知识,最终的拟和曲线应为 Quadratic(二次方曲线)。 Tests of Between-Subjects Effects Measure: MEASURE Transformed variable Average TypeⅢsum Source Intercept 4800.000 4800.000265.710000 ANXIETY 10.083 10.083 558474 TENSION 8.333 8.333 461514 162583 18.065 上表为最后一张,为组间效应的方差分析结果,可见 anxiety和 tension 均无统计学意义。 最后,为了再确认一下几次测量间的变化趋势,我们另外用 plots子菜单 作出模型估计的四次测量均数值如下图 Estimated Marginal Means of MEaSURe 1 16 页GUE山 8642
上表是非常重要的一部分:各次重复测量间变化趋势的模型分析,这里要 求检验没有统计学意义,否则说明变化趋势不服从该曲线。以 trial 为例,对 Linear 的检验 P 值小于千分之一,Quadratic 的 P 值略大于 0.05。只有 Cubic 的 P 值在 0.5 附近,因此最佳的拟合曲线应为 Cubic(三次方曲线);但由于一 共才四次测量,三次方曲线显然太奢侈了,因此如果没有任何其它提示或专业上 的知识,最终的拟和曲线应为 Quadratic(二次方曲线)。 上表为最后一张,为组间效应的方差分析结果,可见 anxiety 和 tension 均无统计学意义。 最后,为了再确认一下几次测量间的变化趋势,我们另外用 plots 子菜单 作出模型估计的四次测量均数值如下图: