第二章 一元缆咝回归模
第二章 一元线性回归模型
最小二乘法产生的历史 ■最小二乘法最早称为回归分析法。由著 名的英国生物学家、统计学家道尔顿 ( F Galton)达尔文的表弟所创。 ■早年,道尔顿致力于化学和遗传学领域 的研究 他研究父亲们的身高与儿子们的身高之 间的关系时,建立了回归分析法
最小二乘法产生的历史 ◼ 最小二乘法最早称为回归分析法。由著 名的英国生物学家、统计学家道尔顿 (F.Gallton)——达尔文的表弟所创。 ◼ 早年,道尔顿致力于化学和遗传学领域 的研究。 ◼ 他研究父亲们的身高与儿子们的身高之 间的关系时,建立了回归分析法
最小二乘法的地位与作用 现在回归分析法已远非道尔顿的本意 已经成为探索变量之间关系最重要的方 法,用以找出变量之间关系的具体表现 形式 ■后来,回归分析法从其方法的数学原 理残差平方和最小(平方乃二乘也) 出发,改称为最小二乘法
最小二乘法的地位与作用 ◼ 现在回归分析法已远非道尔顿的本意 ◼ 已经成为探索变量之间关系最重要的方 法,用以找出变量之间关系的具体表现 形式。 ◼ 后来,回归分析法从其方法的数学原 理——残差平方和最小(平方乃二乘也) 出发,改称为最小二乘法
父亲们的身高与儿子们的身高之间 关系的研究 1889年 GAliton和他的朋友 K. Pearson收 集了上千个家庭的身高、臂长和腿长的 记录 企图寻找出儿子们身高与父亲们身高之 间关系的具体表现形式 下图是根据1078个家庭的调查所作的散 点图(略图)
父亲们的身高与儿子们的身高之间 关系的研究 ◼ 1889年F.Gallton和他的朋友K.Pearson收 集了上千个家庭的身高、臂长和腿长的 记录 ◼ 企图寻找出儿子们身高与父亲们身高之 间关系的具体表现形式 ◼ 下图是根据1078个家庭的调查所作的散 点图(略图)
儿子们身高向着平均身高“回归”,以保持种族的稳定 185 180 175 170 165 X 160 140150160170180190200
y x 160 165 170 175 180 185 140 150 160 170 180 190 200 Y X 儿子们身高向着平均身高“回归”,以保持种族的稳定
“回归”一词的由来 苁图土虽可看出,个子高的父亲确有生出个子 高的儿子的倾向,同样地,个子低的父亲确有 生出个子低的儿子的倾向。得到的具体规律如 下 y=a+bx+u y=8433+0.516x 如此以来,高的伸进了天,低的缩入了地。他 百思不得其解,同时又发现某人种的平均身高 是相当稳定的。最后得到结论:儿子们的身高 回复于全体男子的平均身高,即“回归” 见1889年 F Galton的论文《普用回归定律》。 后人将此种方法普遍用于寻找变量之间的规律
“回归”一词的由来 ◼ 从图上虽可看出,个子高的父亲确有生出个子 高的儿子的倾向,同样地,个子低的父亲确有 生出个子低的儿子的倾向。得到的具体规律如 下: ◼ 如此以来,高的伸进了天,低的缩入了地。他 百思不得其解,同时又发现某人种的平均身高 是相当稳定的。最后得到结论:儿子们的身高 回复于全体男子的平均身高,即“回归”—— 见1889年F.Gallton的论文《普用回归定律》。 ◼ 后人将此种方法普遍用于寻找变量之间的规律 y x y a bx u ˆ = 84.33+ 0.516 = + +
至要内容 元绡唑回归模到 ■模型参薮估计(最小二乘珐) 参数估计 ■株本利定系数与拟合优度检验 ■回归参薮怙计值的显著咝检验 假设检验 ■模型整体显著唑检验 元绡唑回归模型预刎
主要内容 ◼ 一元线性回归模型 ◼ 模型参数估计(最小二乘法) ◼ 样本判定系数与拟合优度检验 ◼ 回归参数估计值的显著性检验 ◼ 模型整体的显著性检验 ◼ 一元线性回归模型预测 参数估计 假设检验
元线性回归模型的概念 1回归模型 确定关系 (函数关系) 相关模型 相关关系 r=f(X)+u (随机关系) 回归模型 因果关系 r=f(X)+u (X的变化是Y的变化的原因)
一 . 一元线性回归模型的概念 1.回归模型 ◼ 确定关系 (函数关系) ◼ 相关关系 (随机关系) ◼ 因果关系 Y=f(X) 相关模型 回归模型 Y = f (X ) + Y = f (X ) + (X的变化是Y的变化的原因)
随机项μ的构成 ■模型中省略的变量 ■随机因素 ■测量误差 ■确定数学模型形式的误差
随机项μ的构成 ◼ 模型中省略的变量 ◼ 随机因素 ◼ 测量误差 ◼ 确定数学模型形式的误差
2线性回归模型 模型的基本形式 Y=B0+B1x1+B2X2+B3X3+……….Bx1+ 基本假设 解释变量ⅹ是确定性变量,不是随机变量:解释变量之间互不相 关 随机误差项具有0均值和同方差; 随机误差项不存在序列相关关系; 随机误差项与解释变量之间不相关; 随机误差项服从0均值、同方差的正态分布
2.线性回归模型 模型的基本形式 Y = β0+β1X1+β2X2+β3X3+………+βiXi+μi 基本假设 ◼ 解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相 关; ◼ 随机误差项具有0均值和同方差; ◼ 随机误差项不存在序列相关关系; ◼ 随机误差项与解释变量之间不相关; ◼ 随机误差项服从0均值、同方差的正态分布