多因素统计分析方法介绍 探讨结果变量与多个因素之间的关系
多因素统计分析方法介绍 --探讨结果变量与多个因素之间的关系
两因素方差分析数据结构 data structure of two way analysis of variance 因素A 因素B1 2 Ⅹ…·XⅩ∴·XⅩ∴·X X…··X X…·Xx…·XX…·X X…·Xx…·X…·X X…·X X…··X
两因素方差分析数据结构 data structure of two way analysis of variance x x x x x x x x 3 x x x x x x x x 2 x x x x x x x x 1 x x x x x x x x 1 2 3 r B c A 因素 因素
配伍组设计资料方差分析的数据结构 因素A 编号123 XXX
配伍组设计资料方差分析的数据结构 x x x x 3 x x x x 2 x x x x 1 x x x x 1 2 3 n c A 编号 因素
两因素方差分析的非参数方法 Friedman,s two way analysis of variance 因子 配伍组 2 k 秩和(R) R R 然6+S[k-m(k+1)2=k的2分和 12
两因素方差分析的非参数方法 Friedman’s two way analysis of variance 因子 配伍组 1 2 k 1 2 : n 秩和(R) R1 R2 Rk ( ) ( ) 的 2 分布 1 2 1 2 ~ 1 1 12 R n k ν k - nk k H k j j − + = + = =
多重回归 Multiple Linear Regression 口模型 E()=a+/x B()=a+x+Bx2+…+Bx2 口参数估计方法 最小二乘法( Least Square Estimation) ■最大似然法( Maximum likelihood estimation)
多重回归 Multiple Linear Regression 模型 参数估计方法 ◼ 最小二乘法(Least Square Estimation) ◼ 最大似然法(Maximum Likelihood Estimation) ( ) ( ) p p E y x x x E y x = + + + + = + 1 1 2 2
关于模型选择的话题 口变量选择 向前法( Forward) 向后法( Backward) 逐步法( Stepwise) 口模型拟合优度( goodness of fit 口残差分析 口预后指数( prognostic index)
关于模型选择的话题 变量选择 ◼ 向前法(Forward) ◼ 向后法(Backward) ◼ 逐步法(Stepwise) 模型拟合优度(goodness of fit) 残差分析 预后指数(prognostic index)
LOGISTIC回归 口结果变量为2分类变量yes/no),其均数为一百分 构成。 口在多重回归中,解释变量的线性组合预测的是结 果变量的均数。在 Logistic回归中,解释变量的线 性组合预测的是结果变量的均数的一种变换 (ogt变换) 口 Logit变换 logit (P)=loge (p 口 Logistic回归模型 egt()2=a+x+x2+…+几nx2
LOGISTIC回归 结果变量为2分类变量(yes/no),其均数为一百分 构成。 在多重回归中,解释变量的线性组合预测的是结 果变量的均数。在Logistic回归中,解释变量的线 性组合预测的是结果变量的均数的一种变换—— (logit变换) Logit变换 Logistic回归模型 ( ) ( ) p p p e − = 1 logit log ( ) p p p = + x + x ++ x 1 1 2 2 logit
40岁以上男性高血压例 40岁以上男性高血压 吸烟肥胖打鼾人数有高血压的人数(%) 60 5(8%) 2(11% 00110011 000 (13%) 2 (0%) 187 35(19%) 85 13(15%) 0 51 15(29%) 23 8(35%)
40岁以上男性高血压例 40岁以上男性高血压 吸烟 肥胖 打鼾 人数 有高血压的人数(%) 0 0 0 60 5(8%) 1 0 0 17 2(11%) 0 1 0 8 1(13%) 1 1 0 2 0(0%) 0 0 1 187 35(19%) 1 0 1 85 13(15%) 0 1 1 51 15(29%) 1 1 1 23 8(35%)
40岁以上男性高血压例(续) 口模型 logit(p)=a+B smoking+B,obesity B, snoring 口结果 回归系数估计标准误 P值 截距 2.378 0.380 smoking 0.068 0.278 0.24 0.810 obesity 0.695 0.285 2.44 0.015 snoring 0.875 0.3982.190.028 口结果解释
40岁以上男性高血压例(续) 模型 结果 结果解释 logit (p) = + 1 smoking + 2 obesity + 3 snoring 回归系数估计 标准误 z P值 截距 -2.378 0.380 smoking -0.068 0.278 0.24 0.810 obesity 0.695 0.285 2.44 0.015 snoring 0.875 0.398 2.19 0.028
其他多变量统计方法 口判别分析 discriminant analysis 口聚类分析 cluster analysis 口因子分析 factor analysis
其他多变量统计方法 判别分析discriminant analysis 聚类分析cluster analysis 因子分析factor analysis