第四章多元线性回归模型 简单线性回归模型的推广
1 第四章 多元线性回归模型 简单线性回归模型的推广
第一节多元线性回归模型的概念 在许多实际问题中,我们所研究的因变量的变动 可能不仅与一个解释变量有关。因此,有必要考虑线 性模型的更一般形式,即多元线性回归模型: =Bo+B1X1+B2X21++X+u,t=1,2,…n 在这个模型中,Y由X1,X2,X3,…Xk所解释,有K+ 未知参数βo、β1、β2、….BK 这里,“斜率”β的含义是其它变量不变的情况 下,X;改变一个单位对因变量所产生的影响
2 第一节 多元线性回归模型的概念 在许多实际问题中,我们所研究的因变量的变动 可能不仅与一个解释变量有关。因此,有必要考虑线 性模型的更一般形式,即多元线性回归模型: t=1,2,…,n 在这个模型中,Y由X1 ,X2 ,X3 , …XK所解释,有K+1 个未知参数β0、β1、β2、…βK 。 这里, “斜率”βj的含义是其它变量不变的情况 下,Xj改变一个单位对因变量所产生的影响。 Yt X t X t βk Xkt ut β β β ... = 0 + 1 1 + 2 2 + + +
例1:Y=B0+B1X+B2P+u 其中,Y=在食品上的总支出 X=个人可支配收入 P=食品价格指数 用美国1959-1983年的数据,得到如下回归结果(括号中数 字为标准误差) Y=1167+0.112X-0.739P R2=0.99 (96)(0.003)(0.114) Y和X的计量单位为10亿美元(按1972不变价格计算) 食品价格平减指数 P ×100,(1972=100) 总消费支出价格平减指数
3 例1: 其中,Y=在食品上的总支出 X=个人可支配收入 P=食品价格指数 用美国1959-1983年的数据,得到如下回归结果(括号中数 字为标准误差): Y和X的计量单位为10亿美元 (按1972不变价格计算). Y =β0 +β1 X +β2 P + u (9.6) (0.003) (0.114) 116.7 0.112 0.739 0.99 ˆ 2 Y = + X − P R = ,( ) 总消费支出价格平减指数 食品价格平减指数 P = 100 1972 = 100
多元线性回归模型中斜率系数的含义 上例中斜率系数的含义说明如下: 价格不变的情况下,个人可支配收入每上升10 亿美元(1个 billion),食品消费支出增加1.12亿 元(0.112个 billion) 收入不变的情况下,价格指数每上升一个点 食品消费支出减少739亿元(0.739个 billion)
4 多元线性回归模型中斜率系数的含义 上例中斜率系数的含义说明如下: 价格不变的情况下,个人可支配收入每上升10 亿美元(1个billion),食品消费支出增加1.12亿 元(0.112个 billion)。 收入不变的情况下,价格指数每上升一个点, 食品消费支出减少7.39亿元(0.739个billion)
例2:C1=B1+2D1+B3L1+l1 其中,C=消费,D=居民可支配收入 居民拥有的流动资产水平 B2的含义是,在流动资产不变的情况下,可支配收入变动 个单位对消费额的影响。这是收入对消费额的直接影响。 收入变动对消费额的总影响=直接影响+间接影响 (间接影响:收入影响流动资产拥有量→影响消费额) 但在模型中这种间接影响应归因于流动资产,而不是收入 因而,β2只包括收入的直接影响 在下面的模型中:C1=a+BD+l12t=1,2,…,n 这里,β是可支配收入对消费额的总影响,显然β和β2的 含义是不同的
5 例2: 其中,Ct =消费,Dt =居民可支配收入 Lt =居民拥有的流动资产水平 β2的含义是,在流动资产不变的情况下,可支配收入变动 一个单位对消费额的影响。这是收入对消费额的直接影响。 收入变动对消费额的总影响=直接影响+间接影响。 (间接影响:收入影响流动资产拥有量→影响消费额) 但在模型中这种间接影响应归因于流动资产,而不是收入 ,因而,β2只包括收入的直接影响。 在下面的模型中: 这里,β是可支配收入对消费额的总影响,显然β和β2的 含义是不同的。 Ct =β1 +β2 Dt +β3 Lt +ut C D u t n t t t = + + , =1,2
回到一般模型 X=βo+B1X1+B2X2+…+PkXk+u1 即对于n组观测值,有 H1=o+B1X1+B2X21+B3x31+…+BkXk1+1 Y2=B0+B1X12+B2x2+B3X32+…+BkXK2+l2 Yn=Bo+B,Xmn+B2X2n+B3X3n+.+BkXKn+u
6 回到一般模型 t=1,2,… ,n 即对于n组观测值,有 Yt X t X t βk Xkt ut β β β ... = 0 + 1 1 + 2 2 + + + n n n n K Kn n K K K K Y X X X X u Y X X X X u Y X X X X u = + + + + + + = + + + + + + = + + + + + + β β β β ... β ...... β β β β ... β β β β β ... β 0 1 1 2 2 3 3 2 0 1 1 2 2 2 2 3 3 2 2 2 1 0 1 1 1 2 2 1 3 3 1 1 1
其矩阵形式为:y=XB+ 其中 Y, I X 11 B K2 Y B=B2 I
7 其矩阵形式为: 其中 = Yn Y Y Y ... 2 1 = n Kn K K X X X X X X X 1 ... ... ... ... ... 1 ... 1 ... 1 12 2 11 1 Y = X + u = = n K u u u u ... , ... 2 1 2 1 0
第二节多元线性回归模型的估计 多元线性回归模型的估计与双变量线性模型类似,仍采用 最小二乘法。当然,计算要复杂得多,通常要借助计算机 理论推导需借助矩阵代数。下面给出最小二乘法应用于多元 线性回归模型的假设条件、估计结果及所得到的估计量的性 质 假设条件 (1)E(u)=0,t=1,2,,n (2)E(u1u)=0,i (3)B(u2)=o2,t=1,2,,n (4)X1是非随机量,j=1,2,…kt=1,2,…n
8 第二节 多元线性回归模型的估计 多元线性回归模型的估计与双变量线性模型类似,仍采用 最小二乘法。当然,计算要复杂得多,通常要借助计算机。 理论推导需借助矩阵代数。下面给出最小二乘法应用于多元 线性回归模型的假设条件、估计结果及所得到的估计量的性 质。 一.假设条件 (1)E(ut )=0, t=1,2,…,n (2)E(ui uj )=0, i≠j (3)E(ut 2 )=σ2 , t=1,2,…,n (4)Xjt是非随机量, j=1,2, … k t=1,2, … n
除上面4条外,在多个解释变量的情况下,还有 两个条件需要满足 (5)(K+1)<n 即观测值的数目要大于待估计的参数的个数 (要有足够数量的数据来拟合回归线)。 (6)各解释变量之间不存在严格的线性关系
9 除上面4条外,在多个解释变量的情况下,还有 两个条件需要满足: (5)(K+1)< n; 即观测值的数目要大于待估计的参数的个数 (要有足够数量的数据来拟合回归线)。 (6)各解释变量之间不存在严格的线性关系
上述假设条件可用矩阵表示为以下四个条件 (1)E(u=Q (2)F()=31 由于 u Z, u,u 显然,E()=a 仅 E(u1)=0,i E(u2)=02,t=1,2,n 这两个条件成立时才成立,因此,此条件相当前面条件 (2),(3)两条,即各期扰动项互不相关,并具有常数方差
10 上述假设条件可用矩阵表示为以下四个条件: (1) E(u)=0 (2) 由于 显然, 仅当 E(ui uj )=0 , i≠j E(ut 2 ) = σ 2 , t=1,2,…,n 这两个条件成立时才成立,因此, 此条件相当前面条件 (2), (3)两条,即各期扰动项互不相关,并具有常数方差。 n E uu I , 2 ( ) = ( ) = = 2 1 2 2 2 2 1 2 1 2 1 2 1 1 2 2 1 ...... ................................. ...... ...... ... ... n n n n n n n u u u u u u u u u u u u u u u u u u u u u uu n E uu I 2 ( ) =