数据残差图分析原理; 关于变量X和Y的一元线性回归模型: Y=a+bx+E, EN(O 取定可控变量X的一组值x1,x2,…,xm,对Y 做n次观察(试验),假定各次试验是相互独立的 记试验结果为H,Y2…,Yn,则 =a+bx;+E,(i=1,2,…,n 满足回归假定: )1,62,,6n相互独立; 2)具有相同分布:6i~N(0.02) 设Y对应于x1,x2,…n的n个观测值为: y1,y2,…,yn,记 yi 作为y,(=1,2,…,m)的估计值,其中ab分别为a和b 的估计 称
数据残差图分析原理; 关于变量 X 和 Y 的一元线性回归模型: Y = a + bx + , ε ~ N(0, σ2 ), 取定可控变量 X 的一组值 x x xn , , , 1 2 ,对 Y 做 n 次观察(试验),假定各次试验是相互独立的. 记试验结果为 Y1, Y2,…,Yn,则 Y a bx , (i 1,2, ,n) i = + i + i = 满足回归假定: 设 Y 对应于 x x xn , , , 1 2 的 n 个观测值为 : , , , , 1 2 n y y y 记 i a bxi y ˆ ˆ = ˆ + ,(i=1,2,…, n) 作为 yi,(i=1,2,…,n)的估计值,其中 a b ˆ ˆ , 分别为 a 和 b 的估计. 称 1) n , , , 1 2 相互独立; 2)具有相同分布: i ~N(0,σ2 )
=y-y,i=1,2 为残差.称 Ji i=1,2 为标准化残差 注:e,i=1,2;…,n是6,i=1,2,…n的样本值 由于i,i=1,2,…,n相互独立,并且ai~N(0,0 2),有 <2}=0.9545 有9545%的把握说,e的值在(2,2)区间内变动 以e为纵坐标,x为横坐标,将数据(x,e), i=-1,2,…,n绘在平面图内,所得图形称为标准化残差 图 0是未知参数,可用
ei = yi − y ˆ i , i = 1,2, ,n , 为残差.称 i n e y y e i i i , 1,2, , ˆ = − = = 为标准化残差. 由于 i ,i=1,2,…,n 相互独立,并且 i ~N(0,σ 2 ),有 2 = 0.9545, i P 有 95.45%的把握说,e *的值在(一 2, 2)区间内变动. 以 e *为纵坐标,xi为横坐标,将数据(xi,e *), i=1,2,…,n 绘在平面图内,所得图形称为标准化残差 图. σ是未知参数,可用 注:ei,i=1,2,…,n 是 i ,i=1,2,…,n 的样本值
∑n-an-6∑x 2 作为o的估计,仍记 Vi-vi 若数据点(xi,e),i=1,2,…,n在(-2,2) 区间内随机散布,则说明回归方程的拟合是良好的 反之,则说明方程对数据的拟 合有问题
2 ˆ ˆ ˆ 1 1 1 2 − − − = = = = n y a y b x y n i i i n i i n i i 作为σ的估计,仍记 ˆ ˆ * i i y y e − = 若数据点(xi,e *),i=1,2,…,n 在(一 2,2) 区间内随机散布,则说明回归方程的拟合是良好的. 反之,则说明方程对数据的拟 合有问题. 0 -2 2 e i * xi
例6.5.1生产费用与产量拟合优度分析 随机抽取了某一类企业中的10个企业,调查了 它们的产量和生产费用情况,取得数据如下表: 企业编号 2345 89 产量(千个x40424855657988100120 生产费用(千元)y150140160170150162185165190 建立经验回归方程为 y=134.7909+0.3978x, 计算出标准化残差(见P170表7.9),绘制生产费 用的标准化残差图图711.图中标准化残差e‘在横轴 上下随机散布,且位于(一2,2)区间内,可以认为方 程对数据的拟合是良好的
例 6.5.1 生产费用与产量拟合优度分析 随机抽取了某一类企业中的 10 个企业,调查了 它们的产量和生产费用情况, 取得数据如下表: 企业编号 1 2 3 4 5 6 7 8 9 10 产量(千个)X 40 42 48 55 65 79 88 100 120 140 生产费用(千元)Y 150 140 160 170 150 162 185 165 190 185 建立经验回归方程为 y ˆ = 134.7909+ 0.3978x, 计算出标准化残差(见 P170 表 7.9),绘制生产费 用的标准化残差图(图 7.11).图中标准化残差 e *在横轴 上下随机散布,且位于(一 2,2)区间内,可以认为方 程对数据的拟合是良好的