第十二章 线性回归分析
第十二章 线性回归分析
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1),(X2Y2),…,(Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本—直线回归、直线相关
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1 ,Y1), (X2 ,Y2), …, (Xn ,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关
历史背景: 英国人类学家 F Galton首次在《自然遗传》 书中,提出并阐明了“相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家 Karl Pearson对上千个家庭的身 高、臂长、推长(伸开大拇指与中指两端的最 大长度)做了测量,发现:
英国人类学家 F.Galton首次在《自然遗传》 一书中,提出并阐明了“相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家 Karl Pearson对上千个家庭的身 高、臂长、拃长(伸开大拇指与中指两端的最 大长度)做了测量,发现: 历史背景:
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关系:}=33.73+0.516X 也即高个子父代的子代在成年之后的身 高平均来说不是更高,而是稍矮于其父代水 平,而矮个子父代的子代的平均身高不是更 矮,而是稍高于其父代水平。aa将这种 趋向于种族稳定的现象称之“回归
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关系: 。 也即高个子父代的子代在成年之后的身 高平均来说不是更高,而是稍矮于其父代水 平,而矮个子父代的子代的平均身高不是更 矮,而是稍高于其父代水平。Galton将这种 趋向于种族稳定的现象称之“回归” 。 ˆ Y X = + 33.73 0.516
目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术语 并且衍生出“回归方程”“回归系数” 等统计学概念。如研究糖尿病人血糖 与其胰岛素水平的关系,研究儿童年 龄与体重的关系等
目前, “回归”已成为表示变量 之间某种数量依存关系的统计学术语, 并且衍生出“回归方程”“回归系数” 等统计学概念。如研究糖尿病人血糖 与其胰岛素水平的关系,研究儿童年 龄与体重的关系等
第一节两相关变量的散点图
第一节 两相关变量的散点图
、直线回归的概念 目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。X值和Y的均数的关系, 不同于一般数学上的X和Y的函数 关系
一、直线回归的概念 目的:研究应变量Y对自变量X的数量依 存关系。 特点:统计关系。 X值和Y的均数的关系, 不同于一般数学上的X 和Y的函数 关系
为了直观地说明两相关变量的线性 依存关系,用表12-1第(2)、(3) 列中大白鼠的进食量和体重增加量 的数据在坐标纸上描点,得图12-1所 示的散点图( scatter plot)
为了直观地说明两相关变量的线性 依存关系,用表12-1第(2)、(3) 列中大白鼠的进食量和体重增加量 的数据在坐标纸上描点,得图12-1所 示的散点图(scatter plot)
例12-1用某饲料喂养12只大白鼠, 得出大白鼠的进食量与体重增加量 如表12-1,试绘制其散点图
例12-1 用某饲料喂养12只大白鼠, 得出大白鼠的进食量与体重增加量 如表12-1,试绘制其散点图
表12-112只大白鼠的进食量(g)与体重增加量(g)测量结果 进食量(gy 体重增加量(g)Y Y (5) 305.7 23.6 9345249 556.96 7214.52 188.6 14.7 35569.96 216.09 2772.42 23456789 277.2 9 76839.84 368.64 5322.24 364.8 27.7 133079.04 767.29 10104.96 285.3 18.9 81396.09 357.21 5392.17 244.7 16.1 59878.09 259.21 3939.67 255.9 17.2 65484.81 295.84 4401.48 149.8 12.9 22440.04 166.41 1932.42 268.9 8.3 72307.2 334.89 4920.87 247.6 17.7 61305.76 313.29 4382.52 1688 13.7 28493.44 187.69 2312.56 200.6 15.6 40240.36 243.36 3129.36 合计 2957.9 215.6 5*3393) 558252 (Y) (Y)
表12-1 12只大白鼠的进食量(g)与体重增加量(g)测量结果 序号 进食量(g)X 体重增加量(g) Y 2 X 2 Y X Y (1) (2) (3) (4) (5) (6) 1 305.7 23.6 93452.49 556.96 7214.52 2 188.6 14.7 35569.96 216.09 2772.42 3 277.2 19.2 76839.84 368.64 5322.24 4 364.8 27.7 133079.04 767.29 10104.96 5 285.3 18.9 81396.09 357.21 5392.17 6 244.7 16.1 59878.09 259.21 3939.67 7 255.9 17.2 65484.81 295.84 4401.48 8 149.8 12.9 22440.04 166.41 1932.42 9 268.9 18.3 72307.21 334.89 4920.87 10 247.6 17.7 61305.76 313.29 4382.52 11 168.8 13.7 28493.44 187.69 2312.56 12 200.6 15.6 40240.36 243.36 3129.36 合计 2957.9 (ΣX) 215.6 (ΣY) 770487.13 ( ) 2 X 4066.9 ( ) 2 Y 55825.2 (ΣXY)