第十六章 logistic回归分析 logistic回归为概率型非线性回归模型, 是研究分类观察结果(y)与一些影响因素 (x)之间关系的一种多变量分析方法
第十六章 logistic回归分析 logistic回归为概率型非线性回归模型, 是研究分类观察结果(y)与一些影响因素 (x)之间关系的一种多变量分析方法
问题提出: 医学研究中常研究某因素存在条件下某结果 是否发生?以及之间的关系如何? 因素(X) 疾病结果(Y) X1,x2,X3. ●●●C K 发生Y=1 不发生Y=0 例:暴露因素 冠心病结果 高血压史x1):有或无 有或无 高血脂史(x2):有或无 吸烟(x3):有或无
问题提出: 医学研究中常研究某因素存在条件下某结果 是否发生?以及之间的关系如何? 因素(X) 疾病结果(Y) x1,x2,x3…XK 发生 Y=1 不发生 Y=0 例:暴露因素 冠心病结果 高血压史(x1):有 或无 有 或 无 高血脂史(x2): 有 或 无 吸烟(x3): 有或无
研究问题可否用多元线性回归方法? y=a+bx+b2x2…bnxm 1.多元线性回归方法要求Y的取值为计量 的连续性随机变量。 2多元线性回归方程要求Y与X间关系为线 性关系。 3多元线性回归结果y不能回答“发生与 否 logistic归方法补充多元线性回归的不足
研究问题可否用多元线性回归方法? 1.多元线性回归方法要求Y 的取值为计量 的连续性随机变量。 2.多元线性回归方程要求Y与X间关系为线 性关系。 3.多元线性回归结果 不能回答“发生与 否” logistic回归方法补充多元线性回归的不足 Y ˆ 1 1 2 2 ˆ m m y a b x b x b x = + +
Logistic回归方法 该法研究是 当y取某值(如y=1)发生的概率(p)与某 暴露因素(x)的关系 p(=1/x)=f(x),即p=f(x) P(概率)的取值波动0~1范围。 基本原理:用一组观察数据拟合 Logistic模型, 揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系
Logistic回归方法 该法研究是 当 y 取某值(如y=1)发生的概率(p)与某 暴露因素(x)的关系。 P(概率)的取值波动0~1范围。 基本原理:用一组观察数据拟合Logistic模型, 揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系。 p y x f x f x ( 1/ ) ( ), ( ) = = = 即p
第 logistic回归 基本概念 1变量的取值 logistic A归要求应变量(Y)取值为分类变 量(两分类或多个分类) 出现阳性结果(发病、有效、死亡等) 出现阴性结果(未发病、无效、存活等) 自变量(X)称为危险因素或暴露因素,可为 连续变量、等级变量、分类变量 可有m个自变量X1,X2,…Xm
第一节 logistic回归 一、基本概念 1.变量的取值 logistic回归要求应变量(Y)取值为分类变 量(两分类或多个分类) 自变量(Xi)称为危险因素或暴露因素,可为 连续变量、等级变量、分类变量。 可有m个自变量X1, X2,… Xm = 出现阴性结果 未发病、无效、存活等) 出现阳性结果 发病、有效、死亡等) 0 ( 1 ( Y
2两值因变量的 logistic回归模型方程 个自变量与Y关系的回归模型 如:y:发生=1,未发生=0x:有=1,无=0, 记为p(y=1/x)表示某暴露因素状态下,结 果y=1的概率(P)模型。 Bo+Rx P(=1/x) 1+e+ 或 p(y=1/x) 1+exp[-(Bo+ Bx) 模型描述了应变量p与x的关系
2.两值因变量的logistic回归模型方程 ◼ 一个自变量与Y关系的回归模型 如:y:发生=1,未发生=0 x : 有=1,无=0, 记为p(y=1/x)表示某暴露因素状态下,结 果y=1的概率(P)模型。 1 exp[ ( )] 1 ( 1/ ) 0 x p y x + − + = = x x e e P y x + + + = = 0 0 1 ( 1/ ) 或 模型描述了应变量p与x的关系
P概率 p(y=1) 1+ expl-(B+Bx) Bo+B B为正值,x越 0.5 大,结果y=1发 生的可能性(p 越大 Z值 3-2-10 3 图16-1 Logistic归函数的几何图形
P概率 1 0.5 Z值 -3 -2 -1 0 1 2 3 图16-1 Logistic回归函数的几何图形 1 exp[ ( )] 1 ( 1) 0 x p y + − + = = z x = 0 + 1 Β为正值,x越 大,结果y=1发 生的可能性(p) 越大
几个 logistic回归模型方程 Bo+B P1=P(y=1/x=1)= 1 +eBo+px Bo+Bx P(y=0/x=1)=1 ,6+Bx P1 1+ P0=P(y=1/x=0)= 1+e′ P(y=0/x=0)=1 1+ph7 P
几个logistic回归模型方程 0 0 1 ( 1/ 1) 1 x x e p P y x e + + = = = = + 0 0 1 ( 0 / 1) 1 1 1 x x e P y x p e + + = = = − = − + 0 0 0 ( 1/ 0) 1 e p P y x e = = = = + 0 0 0 ( 0 / 0) 1 1 1 e P y x p e = = = − = − +
logistic回归模型方程的线性表达 对 logistic回归模型的概率(p)做ogi变换, logit(p)=In( 1-p 方程如下: 线形 y=log it(p)=Bo+x Y (-0o2E+oo) 关系 截距(常数) 回归系数
logistic回归模型方程的线性表达 对logistic回归模型的概率(p)做logit变换, log ( ) ln( ) 1 p it p p = − 0 1 1 y = log it( p) = + x 截距(常数) 回归系数 线形 Y~(-∞至+∞) 关系 方程如下:
在有多个危险因素(X)时 ■多个变量的 logistic回归模型方程的线性表达 公式162 P logit(p)=hn B0+B1X1+B22+…+BnXm 1-P 或 p(y=1/x,x2…xk) 1+e(0+Bx+…x)
在有多个危险因素(Xi)时 ◼ 多个变量的logistic回归模型方程的线性表达: X X m X m P P + + + + − = = 0 1 1 2 2 1 logit(p) ln 0 1 1 2 ( .... ) 1 ( 1/ , ) 1 k k k k x x p y x x x e − + + = = + 或 公式16-2