制作:D字传 第七章回归与相 regression and correlation 变量间关系问题:年龄~身高、肺活量~体重、药物剂量与 动物死亡率等 两个关系: (1)依存关系:应变量( dependent variable)Y随自变量( independent variable)X变化而变化 回归分析 (2)互依关系:应变量Y与自变量X/的彼此关系 相关分析 第一节直绲回归 第二节直线相关 三节 pearman级相关 生计管激研室2021-2-21
第四军医大学卫生统计学教研室 2021-2-21 制作:Dr.宇传华 变量间关系问题:年龄~身高、肺活量~体重、药物剂量与 动物死亡率等。 y 第一节 直线回归 第二节 直线相关 第三节 Spearman等级相关 两个关系: (1) 依存关系:应变量(dependent variable)Y随自变量(independent variable)X变化而变化。 —— 回归分析 (2) 互依关系: 应变量Y与自变量 X间的彼此关系 相关分析
Today:2021-2-21 奥例 例7-1某医生为了探讨缺碘地区母婴TSH水平的关系,应用免疫放射分析测定了160名孕 妇(孕周15-17w)及分娩时脐带血TSH水平(mU/L),现随机抽取10对数据如下,试求脐 带血TSH水平Y对母血TSH水平x的直线回归方程。 编号 3 4 母血TSH水平X1.211.301.391.421.471.561.681.721.982.10 脐带血TSH水平F3.904.504.204.834.164934.324.994.705.20 X:自变量( independent variable);通常也称为“解释变量”( exp l amatory variable) 只有一个自变量,称简单回归( simple regression); 多个自变量,称多元回归 multiple regression) y:因变量( (dependent var iable);通常也称为“反应变量”( response variable
Today: 2021-2-21
Today:2021-2-21 觉点图 1.0 1.6 母血TSH水平(mU/L)X 图7-1母血与新生儿脐带血TSH水平散点图
Today: 2021-2-21 X
Today:2021-2-21 第一节 幾回归 函数关系:确定。例如园周长与半径:y=2mr 回归关系:不确定。例如血压和年龄的关系,称为直线回 归( linear regression) 目的: 建立直线回归方程( linear regression equation
Today: 2021-2-21 函数关系: 确定。例如园周长与半径:y=2πr 。 回归关系:不确定。例如血压和年龄的关系,称为直线回 归(linear regression)。 目的: 建立直线回归方程( linear regression equation)
Today:2021-2-21 直线回归方程 般表达式: Y=a+bX a:截距( intercep),直线与Y轴交点的纵坐标。 b:斜率( slope),回归系数( regression coefficient)。 意义:X每改变一个单位,Y平均改变b个单位。 b>0,Y随X的增大而增大(减少而减少)—斜上; b<0,Y随X的增大而减小(减少而增加)—斜下; b=0,Y与X无直线关系 水平。 b丨越大,表示Y随X变化越快,直线越陡峭。 例7-资料的回归方程:Y=2.9943+09973X
Today: 2021-2-21 一般表达式: a:截距(intercept),直线与Y轴交点的纵坐标。 b:斜率(slope),回归系数(regression coefficient)。 意义:X每改变一个单位,Y平均改变b个单位。 b>0,Y随X的增大而增大(减少而减少)—— 斜上; b<0,Y随X的增大而减小(减少而增加)—— 斜下; b=0,Y与X无直线关系 —— 水平。 |b|越大,表示Y随X变化越快,直线越陡峭。 Y ˆ a bX 例7 1资料的回归方程: Y ˆ 2.9943 0.9973X
Today:2021-2-21 二、回归方程参数的计算 最小二乘法原则( east square method):使各散点到直 线的纵向距离的平方和最小。即使∑(-)最小 Q=2(-1)2=2(-1)2=∑y-(a+b∥ b >(X-X)(Y-Y)2XY-(2X(2Y)/n ∑(X-X)2 ∑X2-()/n XX a=Y-bX因为直线一定经过“均数
Today: 2021-2-21 最小二乘法原则(least square method):使各散点到直 线的纵向距离的平方和最小。即使 最小。 2 Y Yˆ XX XY l l X X n XY X Y n X X X X Y Y b / / ( ) ( )( ) 2 2 2 a Y bX n i i i n i i i Q Y Y Y Y Y a bX 1 2 1 2 2 ) ˆ ) ( ˆ (
Today:2021-2-21 觉点图 X 5.0 Y 4.0 0.00.20.40.60.81.01.21.41.61. 母血TSH水平(mU/L)X 图7-1母血与新生儿脐带血TSH水平散点图
Today: 2021-2-21 X X Y
Today:2021-2-21 回归参数计算的实例 编号母F 脐y P 3.901.464115.2047190b=m=xX-/x ∑Y2-(∑X)/n 304.501.690020.25005.8500 73.138-1583×4573/10 4.201.932117.64005.8380 258083-15832/10 424.832.016423.32896.8586 0.7474 =0.9973 1.474.162.160917.30566.1152 0.7494 1.564.932.433624.30497.6908ⅴ"=1583/10=1.583 68 4.322.822418.66247.2576 Y=∑Y/n=4573/10=4573 8 1.72 4.992.958424.90018.5828 91.984.703.920422.09009.3060a=Y-bX 5.204.410027.040010.9200=4.573-0.9973×1.583 合计15.8345.7325.8083210.731973.1380=2943 ∑X ∑y ∑F ∑F ∑XY 例7一资料的回归方程:Y=2.9943+0.9973X
Today: 2021-2-21 编号 母X 脐Y X 2 Y 2 XY 1 1.21 3.90 1.4641 15.2100 4.7190 2 1.30 4.50 1.6900 20.2500 5.8500 3 1.39 4.20 1.9321 17.6400 5.8380 4 1.42 4.83 2.0164 23.3289 6.8586 5 1.47 4.16 2.1609 17.3056 6.1152 6 1.56 4.93 2.4336 24.3049 7.6908 7 1.68 4.32 2.8224 18.6624 7.2576 8 1.72 4.99 2.9584 24.9001 8.5828 9 1.98 4.70 3.9204 22.0900 9.3060 10 2.10 5.20 4.4100 27.0400 10.9200 合计 15.83 45.73 25.8083 210.7319 73.1380 X Y X 2 Y 2 XY 0.9973 0.7494 0.7474 25.8083 15.83 /10 73.138 15.83 45.73/10 / / 2 2 2 X X n XY X Y n l l b XX XY Y Y/n45.73/104.573 2.9943 4.573 0.9973 1.583 a Y bX X X / n 15.83/101.583 例7 1资料的回归方程: Y ˆ 2.9943 0.9973X
Today:2021-2-21 三、回归系数的假设检验 b0原因:①由于抽样误差引起,总体回归系数/=0 ②存在回归关系,总体回归系数β≠0 (一)t检验;(二)方差分析 b 公式 ,D=n-2 S S S为回归系数的标准误Sb YX √xVx S为Y的剩余标准差扣除X的影响后Y的变异程度。 Y-Y ∑(-y)=∑(-y) n-2
Today: 2021-2-21 b≠0原因:① 由于抽样误差引起,总体回归系数β=0 ② 存在回归关系,总体回归系数β ≠0 公式 ,υ=n-2 b Sb b S b t = 0 Sb为回归系数的标准误 XX Y X X X Y X b l S S S . . 2 = SY.X为Y的剩余标准差——扣除X的影响后Y的变异程度。 2 ˆ 2 n Y Y sY X 2 2 2 2 ˆ X X X X Y Y Y Y = Y Y
Today:2021-2-21 ∑(-y)=∑(y-y) LX-X Xr-r 1.6086-0.7454=0.8632 编号母X脐F P xX(Y-1)2=∑2-()2/n=ly 3.90 464115.21004.7190=21073194573/10=16086 690020.25005.8500 ∑(x-xX-y 4.20 932117.64005.8380 X 4.832.016423.32896.8586 5 1.47 4.162.160917.30566.1152 [2XY-2X2r)/n)] 564.932.433624.30497.6908 ∑X2-(x)/n 4.322.822418.66247.2576 0.9973×0.7474=0.7454 8 1.724.992.958424.90018.5828 9 98 4.703.920422.09009.3060 5.204.40007.040010.90094人27 0.8632 10 2.10 合计15.8345.7325.8083210.731973.13801=-6 0.9973 0.3285/07494 ∑X ∑y ∑F ∑X tos28=2.3060P00s
Today: 2021-2-21 编号 母X 脐Y X 2 Y 2 XY 1 1.21 3.90 1.4641 15.2100 4.7190 2 1.30 4.50 1.6900 20.2500 5.8500 3 1.39 4.20 1.9321 17.6400 5.8380 4 1.42 4.83 2.0164 23.3289 6.8586 5 1.47 4.16 2.1609 17.3056 6.1152 6 1.56 4.93 2.4336 24.3049 7.6908 7 1.68 4.32 2.8224 18.6624 7.2576 8 1.72 4.99 2.9584 24.9001 8.5828 9 1.98 4.70 3.9204 22.0900 9.3060 10 2.10 5.20 4.4100 27.0400 10.9200 合计 15.83 45.73 25.8083 210.7319 73.1380 X Y X 2 Y 2 XY 0.9973 0.7474 0.7454 / [ / )] 2 2 2 2 2 2 2 XY XX XX XY bl b l X X n XY X Y n l l X X X X Y Y 210.7319 45.73 /10 1.6086 ( ) ( ) / 2 2 2 2 YY Y Y Y Y n l 1.6086 0.7454 0.8632 2 ˆ 2 2 2 X X X X Y Y Y Y = Y Y 2 . . 0.05/ 2,8 ˆ 0.8632 0.3285 2 10 2 0.9973 2.6284 / 0.3285/ 0.7494 2.3060 0.05 Y X Y X XX Y Y S n b t S l t P =