第8章回归分析 本章教学目标: 了解回归分析在经济与管理中的广泛应用; 掌握回归分析的基本概念、基本原理及其分析应用 N的基本步骤; 熟练掌握使用软件求解回归方程及其运行输岀结果 的分析与使用; 能应用回归分析方法解决实际问题(分析各种变量 间的关系,进行预测和控制)
1 本章教学目标: 了解回归分析在经济与管理中的广泛应用; 掌握回归分析的基本概念、基本原理及其分析应用 的基本步骤; 熟练掌握使用软件求解回归方程及其运行输出结果 的分析与使用; 能应用回归分析方法解决实际问题(分析各种变量 间的关系,进行预测和控制) 第8章 回归分析
本章主要内容: §8.1回归分析概述 §82一元线性回归 §8.3曲线回归 §84多元线性回归 本章内容重点: 最小二乘法的原理;回归方程和回归系数的显著性 检验;多元线性回归及其预测和控制:软件的求解分 析
2 本章主要内容: §8.1 回归分析概述 §8.2 一元线性回归 §8.3 曲线回归 §8.4 多元线性回归 本章内容重点: 最小二乘法的原理;回归方程和回归系数的显著性 检验;多元线性回归及其预测和控制;软件的求解分 析
s8.1回归分析概述 在经济管理和其他领域中,人们经常需要研究两个 或多个变量(现象)之间的相互(因果)关系,并使用数 学模型来加以描述和解释。如: 商品销售量与价格间的关系; 产品的某些质量指标与某些控制因素之间的关系; 家庭消费支出与家庭收入间的关系等等。 回归分析就是对变量间存在的不确定关系进行分析 的统计方法 回归分析是使用得最为广泛的统计学分支,在质量 管理、市场营销、宏观经济管理等领域都有非常广泛 的应用。 本章介绍回归分析中最基本的内容
3 在经济管理和其他领域中,人们经常需要研究两个 或多个变量(现象)之间的相互(因果)关系,并使用数 学模型来加以描述和解释。如: 商品销售量与价格间的关系; 产品的某些质量指标与某些控制因素之间的关系; 家庭消费支出与家庭收入间的关系等等。 回归分析就是对变量间存在的不确定关系进行分析 的统计方法。 回归分析是使用得最为广泛的统计学分支,在质量 管理、市场营销、宏观经济管理等领域都有非常广泛 的应用。 本章介绍回归分析中最基本的内容。 §8.1 回归分析概述
质量控制应用案例 某钢厂生产的某种合金钢有两个重要的质量指标: N抗拉强度(kg/m)和延伸率(%) 该合金钢的质量标准要求:抗拉强度应大于 32kg/m;延仲率应大于338 根据冶金学的专业知识和实践经验,该合金钢的含 碳量是影响抗拉强度和延伸率的主要因素。其中含碳 量高,则抗拉强度也就会相应提高,但与此同时延伸 率则会降低。 为降低生产成本,提高产品质量和竞争能力,该厂 质量控制部门要求该种合金钢产品的上述两项质量指 标的合格率都应达到99%以上
4 某钢厂生产的某种合金钢有两个重要的质量指标: 抗拉强度(kg/mm2)和延伸率(%)。 该合金钢的质量标准要求:抗拉强度应大于 32kg/mm2;延伸率应大于33%。 根据冶金学的专业知识和实践经验,该合金钢的含 碳量是影响抗拉强度和延伸率的主要因素。其中含碳 量高,则抗拉强度也就会相应提高,但与此同时延伸 率则会降低。 为降低生产成本,提高产品质量和竞争能力,该厂 质量控制部门要求该种合金钢产品的上述两项质量指 标的合格率都应达到99%以上。 质量控制应用案例
如何制订含碳量的控制标准? 为达到以上质量控制要求,就需要制定该合 金钢冾炼中含碳量的工艺控制标准,也即要确 定在冶炼中应将含碳量控制在什么范围内,可 以有99%的把握使抗拉强度和延伸率这两项指 标都达到要求。 这是一个典型的产品质量控制问题,可以使 用回归分析方法求解
5 为达到以上质量控制要求,就需要制定该合 金钢冶炼中含碳量的工艺控制标准,也即要确 定在冶炼中应将含碳量控制在什么范围内,可 以有99%的把握使抗拉强度和延伸率这两项指 标都达到要求。 这是一个典型的产品质量控制问题,可以使 用回归分析方法求解。 如何制订含碳量的控制标准?
变量间的两类关系 1.确定性关系 也即函数关系,即 Y=f(X);Y=f(1,X2,…,X) 或F(x,1)=0;F(X1,X2…,Yn=0 例:价格不变时商品销售收入与销售量的关系。 Y 销售收入 O X Y与X间的确定性关系 销售量6
6 1. 确定性关系 ——也即函数关系,即 Y = ƒ(X) ; Y = ƒ(X1 , X2 , ···, Xp ) 或 F(X, Y) = 0; F(X1 , X2 , ···, Xp , Y) = 0 例:价格不变时商品销售收入与销售量的关系。 X 销 售 收 入 Y 销售量 O Y 与 X 间的确定性关系 一. 变量间的两类关系
2.非确定性关系 指变量间虽存在着相互影响和相互制约关系, 但由于许多无法预计和控制的因素的影响,使变量间 的关系呈现不确定性。即不能由一个或若干变量的值 精确地确定另一变量的值 但通过大量观察,可以发现非确定性关系的变量间 存在着某种统计规律性—称为相关关系或回归关系 家↑Y Y=botb,X 庭消费支出0 非确定性关系 家庭收入7
7 .. . . . . . . . . . . . . .. . . . . . . X 非确定性关系 家庭收入 O 家 Y 庭 消 费 支 出 Y = b0 + b1X 2. 非确定性关系 ——指变量间虽存在着相互影响和相互制约关系, 但由于许多无法预计和控制的因素的影响,使变量间 的关系呈现不确定性。 即不能由一个或若干变量的值 精确地确定另一变量的值。 但通过大量观察, 可以发现非确定性关系的变量间 存在着某种统计规律性——称为相关关系或回归关系
案例1】商品价格与消费量的关系 以三口之家为单位,某种食品在某年各月的家庭平 均月消费量Y(kg)与其价格Ⅹ(元/kg)间的调查数据如 下,试分析该食品家庭平均月消费量与价格间的关系 价格x;4040485460607.07276809010 消费量y303826282029192219121.16 4 Y=阝0+β1X 01234567891011128
8 以三口之家为单位,某种食品在某年各月的家庭平 均月消费量 Y (kg)与其价格 X (元/kg) 间的调查数据如 下,试分析该食品家庭平均月消费量与价格间的关系。 价格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消费量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 0 1 2 3 4 5 0 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 Y= 0+ 1X y x 【案例1】商品价格与消费量的关系
线性回归模型 由图可知,该食品家庭月平均消费量Y与价格X间基本呈 线性关系。这些点与直线 Y=Bo+ BX 间的偏差是由其他一些无法控制的因素和观察误差引起的。 因此可以建立Y与X之间关系的如下线性回归模型 Y=%0+ BX+8 (8.1-1)其中 X——解释变量(自变量) Y——被解释变量(因变量) 风,B1——模型中的未知参数 随机误差项
9 由图可知,该食品家庭月平均消费量 Y 与价格 X 间基本呈 线性关系。这些点与直线 Y = 0 + 1X 间的偏差是由其他一些无法控制的因素和观察误差引起的。 因此可以建立 Y 与 X 之间关系的如下线性回归模型 Y = 0 + 1X + (8.1-1)其中 X —— 解释变量(自变量) Y —— 被解释变量(因变量) 0 , 1 —— 模型中的未知参数 —— 随机误差项 二. 线性回归模型
随机误差项产生的原因 (1)模型中忽略的其他因素对Y的影响; (2)模型不准确所产生的偏差; (3)模型中包含了对Y无显著影响的变量 (4)对变量的观察误差 (5)其他随机因素的影响
10 随机误差项产生的原因 (1) 模型中忽略的其他因素对 Y 的影响; (2) 模型不准确所产生的偏差; (3) 模型中包含了对 Y 无显著影响的变量; (4) 对变量的观察误差; (5) 其他随机因素的影响