第九章 双变量回归与相关 Bivariate Regression Correlation
第九章 双变量回归与相关 Bivariate Regression & Correlation
第2、第3、第4章介绍计量资料单变量统计分布 特征或比较该变量的组间差别 P9例2-1计算101名成年女子血清总胆固 醇的平均指标与变异指标 P3例3-7比较阿卡波糖(试验组)与拜 糖苹(对照组)降低糖尿病人的空腹血糖值有 无差别。 P54例42比较安慰剂组、降血脂新药24g 组、降血脂新药48g组、降血脂新药72g组降低 患者的低密度脂蛋白含量有无差别
第2、第3、第4章介绍计量资料单变量统计分布 特征或比较该变量的组间差别: P.9 例2-1 计算101名成年女子血清总胆固 醇的平均指标与变异指标。 P.33 例3-7 比较阿卡波糖(试验组)与拜 糖苹(对照组)降低糖尿病人的空腹血糖值有 无差别。 P.54 例4-2 比较安慰剂组、降血脂新药2.4g 组、降血脂新药4.8g组、降血脂新药7.2g组降低 患者的低密度脂蛋白含量有无差别
在医学研究中常要分析变量间的关系:如 年龄与血压,药物剂量与动物死亡率,肺 活量与体重、胸围和肩宽等指标的关系
在医学研究中常要分析变量间的关系:如 年龄与血压,药物剂量与动物死亡率,肺 活量与体重、胸围和肩宽等指标的关系
第一节直线回归 直线回归的概念 “回归”是一个借用已久因而相沿成习的统计 学术语。返回原来的地方。 生物遗传学上的“回归”:英国统计学家 Pearson K(1857~1936)1903年搜集了1078个 家庭人员的身高、前臂长等指标的记录,发现 儿子身高(Y,英寸)与父亲身高(X,英寸) 存在线形关系:=3.7340516X,即高个子父 代的子
第一节 直线回归 一 、直线回归的概念 “回归”是一个借用已久因而相沿成习的统计 学术语。返回原来的地方。 生物遗传学上的“回归” :英国统计学家 Pearson K(1857~1936)1903年搜集了1078个 家庭人员的身高、前臂长等指标的记录,发现 儿子身高(Y,英寸)与父亲身高(X,英寸) 存在线形关系: =33.73+0.516 X ,即高个子父 代的子一 Y ˆ
代在成年之后的身高平均来说不是比其父代更高, 而是稍矮于其父代水平;而矮个子父代的子一代, 成年之后的身高平均来说不是比其父代更矮,而 是稍高于其父代水平。英国生物遗传学和统计学 家 Galton f(1822~1911)将这种趋向于种族稳 定的现象称之为“回归”。 天文学上的“回归”:地球绕太阳公转,在公转 的同时,本身还自转,本身自转的同时,地球的 轴心(假设)还来回摆动,由于地球轴心的来回 摆
代在成年之后的身高平均来说不是比其父代更高, 而是稍矮于其父代水平;而矮个子父代的子一代, 成年之后的身高平均来说不是比其父代更矮,而 是稍高于其父代水平。英国生物遗传学和统计学 家Galton F(1822~1911)将这种趋向于种族稳 定的现象称之为“回归” 。 天文学上的“回归” :地球绕太阳公转,在公转 的同时,本身还自转,本身自转的同时,地球的 轴心(假设)还来回摆动,由于地球轴心的来回 摆
动,太阳光垂直照射到地球上就有南、北两个 极限位置(南、北纬度23027),分别称为南、 北回归线,分别为我国农历的冬至与夏至。以 上现象称为太阳光对赤道的“回归”。 日常生活中的“回归”现象:穿军装…;智商高或低 的父代与子代.;1岁姜二狗,7岁姜二狗同学,20岁小姜同志, 30岁姜科长,40岁姜处长,50岁姜老,60岁老姜;70岁姜二狗。 目前“回归”已成为表示变量之间某种数量关 系的统计术语,并且衍生出“回归方程” “回归系数”等统计学概念
动,太阳光垂直照射到地球上就有南、北两个 极限位置(南、北纬度23027’),分别称为南、 北回归线,分别为我国农历的冬至与夏至。以 上现象称为太阳光对赤道的“回归” 。 日常生活中的“回归”现象:穿军装…;智商高或低 的父代与子代…;1岁姜二狗,7岁姜二狗同学,20岁小姜同志, 30岁姜科长,40岁姜处长,50岁姜老,60岁老姜;70岁姜二狗。 目前“回归”已成为表示变量之间某种数量关 系的统计术语,并且衍生出“回归方程” 、 “回归系数”等统计学概念
表918名正帝几童的年龄Y岁与脉胆酹含量m量h 编号123 5 8 年龄X 8 1012 刷吧含量Y354301309248256336318265
表9–1 8名正常儿童的年龄X(岁)与尿肌酐含量Y(mmol/24h) 编 号 1 2 3 4 5 6 7 8 年 龄X 13 11 9 6 8 10 12 7 尿肌酐含量Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
3.6 尿34 肌酐含 量 2.8 yi=abx 2.6 2,4 8 12 年龄(岁)X 8名儿童的年龄与其尿肌鼾合量
8名儿童的年龄与其尿肌酐含量 2.4 2.6 2.8 3 3.2 3.4 3.6 4 6 8 10 12 14 年龄(岁)X 尿 肌 酐 含 量 Y m ( m o l/ 2 4 h ) Y a bX
unix=a+Bx
y x Y X X
直线回归方程的求法 最小二乘法∑(Y-Y)2最小 b=lYr- 2(r-X(Y-Y) Lxx 2(X-X ∑XY-CXCY)/n58450 =0.1392 ∑X2-(2X)2/n 42 aY-bX=2.9838-0.1392×95=1.6617
二、直线回归方程的求法 2.9838 0.1392 9.5 1.6617 0.1392 42 5.8450 ( ) / ( )( )/ ( ) ( )( ) ) Y ˆ 2 2 2 2 a Y bX X X n XY X Y n X X X X Y Y l l b Y XX XY 最小二乘法 ( 最小