logistic回归分析 公共卫生学院
Logistic回归分析 公共卫生学院
前言 应变量为分类指标的资料 线性回归分析 应变量为连续计量资料
一、前言 • 应变量为分类指标的资料 • 线性回归分析: 应变量为连续计量资料
、 Logistic回归模型 Logistic回归的分类 二分类 多分类 条件 Logistic回归 非条件 Logistic回归
二、 Logistic回归模型 • Logistic回归的分类 二分类 多分类 条件Logistic回归 非条件Logistic回归
Logi变换 也称对数单位转换 logit p= In
• Logit变换 也称对数单位转换 logit P= ln 1 P P −
流行病学概念: 设P表示暴露因素X时个体发病的概率 则发病的概率P与未发病的概率1P之 比为优势(odds), logit P就是ods 的对数值
流行病学概念: 设P表示暴露因素X时个体发病的概率, 则发病的概率P与未发病的概率1-P 之 比为优势(odds), logit P就是odds 的对数值
Logistic回归模型 Logistic回归的 logit模型 logit P=bo+6x+b2x2+.+bkxk Logistic回归模型 (bo +6x1+62x2++bkXk) 1 (bo +6x1+62x2++bk Xk)
• Logistic回归模型 Logistic回归的logit模型 Logistic回归模型 0 1 1 2 2 logit P=b + + + + b x b x b xk k 0 1 1 2 2 0 1 1 2 2 ( ) ( ) 1 k k k k b b x b x b x b b x b x b x e P e + + ++ + + ++ = +
、参数估计 ·最大似然估计法 (Maximum likehood estimate) 似然函数:L=IP; 对数似然函数: lnL=∑(lnP)=nP1+nP2+…+lnPn 非线性迭代方法 Newton-Raphson法
三、参数估计 • 最大似然估计法 (Maximum likehood estimate) 似然函数:L=∏Pi 对数似然函数: lnL=∑(ln P)=ln P1+ln P2+…+ln Pn 非线性迭代方法—— Newton-Raphson法
四、参数检验 似然比检验( likehood ratio test 通过比较包含与不包含某一个或 几个待检验观察因素的两个模型的对 数似然函数变化来进行,其统计量为G (又称 Deviance) G=2(In Lp-In Lr 样本量较大时,G近似服从自由 度为待检验因素个数的x2分布
四、参数检验 • 似然比检验(likehood ratio test) 通过比较包含与不包含某一个或 几个待检验观察因素的两个模型的对 数似然函数变化来进行,其统计量为G (又称Deviance)。 G=-2(ln Lp -ln Lk ) 样本量较大时, G近似服从自由 度为待检验因素个数的2分布
比分检验( score test 以未包含某个或几个变量的模型为基础, 保留模型中参数的估计值,并假设新增加 的参数为零,计算似然函数的一价偏导数 (又称有效比分)及信息距阵,两者相乘 便得比分检验的统计量S。样本量较大时, S近似服从自由度为待检验因素个数的 x2分布
• 比分检验(score test) 以未包含某个或几个变量的模型为基础, 保留模型中参数的估计值,并假设新增加 的参数为零,计算似然函数的一价偏导数 (又称有效比分)及信息距阵,两者相乘 便得比分检验的统计量S 。样本量较大时, S近似服从自由度为待检验因素个数的 2分布
wald检验( wald test) 即广义的检验,统计量为u b u服从正态分布,即为标准正态离差。 Logistic回归系数的区间估计 b.+L·S
• Wald检验( wald test) 即广义的t检验,统计量为u u服从正态分布,即为标准正态离差。 Logistic回归系数的区间估计 i i b b u= s bi bi u S