第四章回归分析 1=34.7728+878269X Y,=41.8075-31.6092X 33 32 Y2=Y2-d2 00.03760.0968
1 第四章 回归分析 32 0.0968 x 33 0 0.0376 y Y ˆ 1 = 34.7728+87.8269X 1 Y1 d1 Y = ˆ − Y ˆ 2 = 41.8075 −31.6092X 2 Y2 d2 Y = ˆ −
质量控制应用案例 某钢厂生产的某种合金钢有两个重要的质量指 标:抗拉强度(kg/mm2)和延伸率(%)。该合金钢的 质量标准要求:抗拉强度应大于32kg/mm2;延伸 率应大于33%。根据冶金学的专业理论知识和实 践经验知道,该合金钢的含碳量是影响抗拉强度 和延伸率的主要因素。其中含碳量高,则抗拉强 度也就会相应提高,但与此同时延伸率则会降低 为降低生产成本,提高产品质量和竞争能力,该 厂质量控制部门要求该种合金钢产品的上述两项 质量指标的合格率都应达到99%
2 质量控制应用案例 某钢厂生产的某种合金钢有两个重要的质量指 标:抗拉强度(kg/mm2 )和延伸率(%)。该合金钢的 质量标准要求:抗拉强度应大于32kg/mm2;延伸 率应大于33%。 根据冶金学的专业理论知识和实 践经验知道,该合金钢的含碳量是影响抗拉强度 和延伸率的主要因素。其中含碳量高,则抗拉强 度也就会相应提高,但与此同时延伸率则会降低。 为降低生产成本,提高产品质量和竞争能力,该 厂质量控制部门要求该种合金钢产品的上述两项 质量指标的合格率都应达到99%
如何制订含碳量的控制标准? 为达到以上质量控制要求,就需要重新修订该 合金钢冶炼中关于含碳量的工艺控制标准,也即 要确定在冶炼中应将含碳量控制在什么范围内, 可以有99%的把握使抗拉强度和延伸率这两项指 标都达到要求。 为分析该合金钢的抗拉强度和延伸率与含碳量 之间的关系,该厂质量管理科查阅了该合金钢的 质量检验纪录,在剔除了异常情况后,整理了该 合金钢的上述两项指标与含碳量的92炉实测数据, 以供分析(见所发案例)
3 如何制订含碳量的控制标准? 为达到以上质量控制要求,就需要重新修订该 合金钢冶炼中关于含碳量的工艺控制标准,也即 要确定在冶炼中应将含碳量控制在什么范围内, 可以有99%的把握使抗拉强度和延伸率这两项指 标都达到要求。 为分析该合金钢的抗拉强度和延伸率与含碳量 之间的关系,该厂质量管理科查阅了该合金钢的 质量检验纪录,在剔除了异常情况后,整理了该 合金钢的上述两项指标与含碳量的92炉实测数据, 以供分析(见所发案例)
§41回归分析概述 变量间的两类关系 1.确定性关系确定性关系也即函数关系,即 Y=f (X): Y-f(X1,X2 ., XpA 或F(X,Y=0;F(X1xX2,…,Xp;Y)=0 Y↑销 售收入 Cx 确定性关系 销售量4
4 §4.1 回归分析概述 一. 变量间的两类关系 1. 确定性关系 确定性关系也即函数关系,即 Y=ƒ (X) ; Y=ƒ (X1 ,X2 ,…,Xp ) 或 F(X,Y)=0; F(X1 ,X2 ,…,Xp;Y)=0 X 销 售 收 入 Y 0 确定性关系 销售量
2.非确定性关系(相关关系) 非确定性关系指变量间虽存在着制约关系,但由于许 多无法预计和控制的因素的影响,使变量间的关系呈现 不确定性,即不能由一个或若干变量的值精确地确定另 变量的值 通过大量观察或试验,可以发现非确定性关系的变量 间存在着某种统计规律性——称为相关关系或回归关系 家↑Y 庭消费支出 Y=b+b, X X 非确定性关系 家庭收入5
5 2. 非确定性关系 (相关关系) 非确定性关系指变量间虽存在着制约关系,但由于许 多无法预计和控制的因素的影响,使变量间的关系呈现 不确定性,即不能由一个或若干变量的值精确地确定另 一变量的值。 通过大量观察或试验,可以发现非确定性关系的变量 间存在着某种统计规律性——称为相关关系或回归关系。 .. . . . .. . . . . . . .. . . . . . . X 0 非确定性关系 家庭收入 家 Y 庭 消 费 支 出 Y=b0+b1X .
案例1商品价格与消费量的关系 以三口之家为单位,某种食品在某年各月的家庭平均 月消费量Y(kg)与其价格X(元kg)间的调查数据如下,试 分析该食品家庭平均月消费量与价格间的关系 匚价格x1404048546060707276809010 消费量y13038262820291921912116 Y=β+β1x 3456789101112
6 案例1 商品价格与消费量的关系 以三口之家为单位,某种食品在某年各月的家庭平均 月消费量Y(kg)与其价格X(元/kg)间的调查数据如下,试 分析该食品家庭平均月消费量与价格间的关系。 价格 x i 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消费量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 0 1 2 3 4 5 0 1 2 3 4 5 6 7 8 9 10 11 12 Y= 0+ 1X y x
二.线性回归模型 由图可知,该食品家庭月平均消费量Y与价格 Ⅹ间基本呈线性关系。这些点与直线 Y=β0+阝1x 间的偏差是由其他一些无法控制的因素和观察 误差引起的,故可以建立Y与Ⅹ之间关系的线性 回归模型如下; Y=β0+β1x+8 称Ⅹ为解释变量(自变量),Y为被解释变量(因 变量),βo、β1是模型中的未知参数,ε为随机误 差项(随机扰动项)
7 二. 线性回归模型 由图可知,该食品家庭月平均消费量Y与价格 X间基本呈线性关系。这些点与直线 Y= 0+ 1X 间的偏差是由其他一些无法控制的因素和观察 误差引起的,故可以建立Y与 X之间关系的线性 回归模型如下; Y= 0+ 1X+ (4.1-1) 称 X为解释变量(自变量),Y为被解释变量(因 变量), 0、1是模型中的未知参数, 为随机误 差项(随机扰动项)
随机误差项产生的原因 随机误差项产生的原因主要有以下几个方面: (1)模型中忽略的其他因素对Y的影响; (2)模型不准确所产生的偏差 (3)模型中包含了对Y无显著影响的变量 (4)对变量的观察误差; (5)其他随机因素的影响
8 随机误差项产生的原因 随机误差项产生的原因主要有以下几个方面: (1) 模型中忽略的其他因素对Y的影响; (2) 模型不准确所产生的偏差; (3) 模型中包含了对Y无显著影响的变量; (4) 对变量的观察误差; (5) 其他随机因素的影响
线性回归模型的数据结构 当X取不完全相同的值x1,x2,…,x时,得到Y 的一组相应的观察值y1y2…y,显然,每一对观 察值(y;,x)都应满足(4.1-1)式,故一元线性回归 模型的数据结构为: y/=β0+β1x;+£1;i=1,2,3,,N (4.1-2) 其中E;表示其他因素和试验误差对y影响的总 和
9 线性回归模型的数据结构 当X取不完全相同的值x1 , x2 , …, xN 时,得到Y 的一组相应的观察值y1 ,y2 ,…,yN,显然,每一对观 察值(yi,xi )都应满足(4.1-1)式,故一元线性回归 模型的数据结构为: yi= 0+ 1xi+ i ; i=1,2,3,…,N (4.1-2) 其中 i 表示其他因素和试验误差对yi影响的总 和
回归模型的经典假设条件 1.各ε;~N(O,a2),且相互独立; 2.解释变量是可以精确观察的普通变量(非随机变 量); 3.解释变量与随机误差项不相关(即解释变量与随 机误差项是各自独立对被解释变量产生影响的)。 称满足以上条件的回归模型为经典回归模型。本 章仅讨论经典回归模型。 但在经济领域中,经济变量间的关系通常是不会 完全满足上述条件的。例如家庭消费支出Y与家庭收 入X间的回归模型就不会是同方差的(见上述条件(1)
10 三. 回归模型的经典假设条件 1. 各 i ~N(0,2 ),且相互独立; 2. 解释变量是可以精确观察的普通变量(非随机变 量); 3. 解释变量与随机误差项不相关(即解释变量与随 机误差项是各自独立对被解释变量产生影响的)。 称满足以上条件的回归模型为经典回归模型。本 章仅讨论经典回归模型。 但在经济领域中,经济变量间的关系通常是不会 完全满足上述条件的。例如家庭消费支出Y与家庭收 入X间的回归模型就不会是同方差的(见上述条件(1))