线性回归分析 公共卫生学院
线性回归分析 公共卫生学院
前言 ●回归分析的目的 设法找出变量间的依存(数量)关系,用函数关系 式表达出来
一 . 前言 ⚫回归分析的目的: 设法找出变量间的依存(数量)关系, 用函数关系 式表达出来
二、基本概念 应变量( dependent variable) 2、自变量( independent variable) 3、一元线性回归 直线回归方程的模型是:y=a+bx;+e 其中 (1)a是截距 (2)b是回归系数( regression coefficient)(回归直线的 斜率) 回归系数的统计学意义是:自变量每变化一个单位, 应变量平变化的单位数 (3)e;是残差
二、基本概念 1、应变量(dependent variable) 2、自变量(independent variable) 3、一元线性回归 直线回归方程的模型是:yi=a+bxi+ei 其中 (1)a是截距 (2)b是回归系数(regression coefficient)(回归直线的 斜率) 回归系数的统计学意义是:自变量每变化一个单位, 应变量平均变化的单位数. (3)ei是残差
因此直线回归方程的一般形式是: °其中y是应变量y的预测值或称估计值
因此直线回归方程的一般形式是: • 其中 是应变量y的预测值或称估计值。 ^ i y ^ y a bx i i = +
4、多元线性回归 多元线性回归方程模型为 yi=bo+b,X1i+b2X2i +.. +bnxnitei 其中 (1)b是常数项,是各自变量都等于0时,应变量的估计值。 有时,人们称它为本底值。 (2)b1,b2,…,bn是偏回归系数( pertial regression coefficient,其统计学意义是在其它所宥自变量不变 的情况 自变量每变化一个单位,应变量平均 雯花的单位数 如果所有参加分析的变量都是标准化的变量,这时b 就等子0,b1,"b2,…,bm就变成了标准化偏回归系 数,用符号b1,62,…,b;表示。 b: bits: s 由于b:没有量纲,因此可以相互比较大小,反映自变 量的柏对作用大小 3)e;是残差
4、多元线性回归 多元线性回归方程模型为: yi=b0+b1x1i+b2x2i+…+bnxni+ei 其中 (1) b0是常数项,是各自变量都等于0时,应变量的估计值。 有时,人们称它为本底值。 (2) b1,b2,…,bn是偏回归系数( pertial regression coefficient ),其统计学意义是在其它所有自变量不变 的情况下,某一自变量每变化一个单位,应变量平均 变化的单位数。 如果所有参加分析的变量都是标准化的变量,这时b0 就等于0, b1,b2,…,bn 就变成了标准化偏回归系 数,用符号b1 ‘ ,b2 ’ ,…,bn ‘表示。 bi ’= bi*sxi/sy 由于bi ’没有量纲,因此可以相互比较大小,反映自变 量的相对作用大小。 (3) ei是残差
多元线性回归方程的一般形式是: Vi=bo+bx+b2x2i+...+bx 其中的符号含义同前
多元线性回归方程的一般形式是: 其中的符号含义同前。 ^ i 0 1 1 2 2 i i n ni y b b x b x b x = + + + +
、理论假设 自变量x与应变量y之间存在线性关系 正态性:随机误差(即残差)e服从均值为0, 方差为∝2的正态分布; 等方差:对于所有的自变量x,残差e的条件方 差为σ2,且σ为常数; 独立性:在给定自变量x的条件下,残差e的条 件期望值为0(本假设又称零均值假设) 无自相关性:各随机误差项e互不相关;
三、理论假设 • 自变量x与应变量y之间存在线性关系; • 正态性:随机误差(即残差)e服从均值为 0, 方差为2的正态分布; • 等方差:对于所有的自变量x,残差e的条件方 差为2 ,且为常数; • 独立性:在给定自变量x的条件下,残差e的条 件期望值为0(本假设又称零均值假设); • 无自相关性:各随机误差项e互不相关;
残差e与自变量x不相关:随机误差项e与相 应的自变量x不相关; 无共线性:自变量x之间相互独立
• 残差e与自变量x不相关:随机误差项e与相 应的自变量x不相关; • 无共线性:自变量x之间相互独立.
四、回归方程的建立 散点图 奇异点( outliers) 最小二乘法( least square,LS) 残差平方和( sum of squares for residuals) 元线性回归: Q=∑0-y)2=∑D1-(a+bx) 多元线性回归: Q=∑0-y) ∑2-(b+bx1+b2x2+…+bnx
四、回归方程的建立 • 散点图 • 奇异点(ouliers) • 最小二乘法(least square, LS) • 残差平方和(sum of squares for residuals) = − = − + + + + = − = − + 2 0 1 1 2 2 2 2 2 ( ) [ ( )] ( ) [ ( )] i i i n n i i i i Q y y y b b x b x b x Q y y y a b x 多元线性回归: 一元线性回归:
元线性回归时,计算比较简单: b ∑(x )∑x:y-∑x∑y/n ∑(x-x) ∑x2-②∑x)2/n a=y-b.x= ∑y b ∑x 多元线性回归时,比较复杂,一般需要用计算机 处理
一元线性回归时,计算比较简单: 多元线性回归时,比较复杂,一般需要用计算机 处理。 n x b n y a y b x l l x x n x y x y n x x x x y y b xx xy = − = − = − − = − − − = ( ) / / ( ) ( ) ( ) 2 2 2