§33多元线性回归模型的统计检验 拟合优度检验 二、方程的显著性检验(F检验) 、变量的显著性检验(t检验) 四、参数的置信区间
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间
、拟合优度检验 1、可决系数与调整的可决系数 总离差平方和的分解 记TS8=z-1)2总离差平方和 ES=∑(1-1)2回归平方和 RS=∑(1-1)2剩余平方和 TSS=∑(Y-Y)2 =X(Y-Y1)+(Y-Y)2 ∑(-F1)2+2(x-Y)Y-Y)+X(Y1-Y)2
一、拟合优度检验 1、可决系数与调整的可决系数 则 2 2 2 2 ) ˆ ) ( ˆ )( ˆ ) 2 ( ˆ ( )) ˆ ) ( ˆ (( ( ) Y Y Y Y Y Y Y Y Y Y Y Y TSS Y Y i i i i i i i i i i = − + − − + − = − + − = − 总离差平方和的分解
由于∑(1-Y(x1-Y)=∑e(X-Y) B∑e+B∑e,X1+…+B∑e1X+∑e 所以有: TSS= ∑(-)+∑(-)=RS+ES 注意:一个有趣的现象 (x-y)=(-2)+(-) (x-y)≠{-)+6-) ∑(x-F)=∑(-)+∑⑧-F)
由于 − − = − ) ˆ ) ( ˆ )( ˆ (Yi Y Yi Y ei Yi Y = i + i i + + k i ki + i e e X e X Y e ˆ ˆ ˆ 0 1 1 =0 所以有: TSS Y Y Y Y RSS ESS = i − i + i − = + 2 2 ) ˆ ) ( ˆ ( 注意:一个有趣的现象 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2 2 2 2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y Y i i i i i i i i i i i i − = − + − − − + − − = − + −
可决系数 ESS Rss R ISS TSS 该统计量越接近于1,模型的拟合优度越高 问题: 在应用过程中发现,如果在模型中增加一个解 释变量,R2往往增大(Why?) 这就给人一个错觉:要使得模型拟合得好,只 要增加解释变量即可。 但是,现实情况往往是,由增加解释变量个数 引起的R2的增大与拟合好坏无关,R2需调整
可决系数 TSS RSS TSS ESS R = = 1− 2 该统计量越接近于1,模型的拟合优度越高。 问题: 在应用过程中发现,如果在模型中增加一个解 释变量, R2往往增大(Why?) 这就给人一个错觉:要使得模型拟合得好,只 要增加解释变量即可。 但是,现实情况往往是,由增加解释变量个数 引起的R2的增大与拟合好坏无关,R2需调整
调整的可决系数( adjusted coefficient of determination 在样本容量一定的情况下,增加解释变量必定 使得自由度减少,所以调整的思路是将残差平方 和与总离差平方和分别除以各自的自由度,以剔 除变量个数对拟合优度的影响: R2=1 RsS/n-k-1) TSS/n 其中:n-k-1为残差平方和的自由度,n-1为总体平 方和的自由度
调整的可决系数(adjusted coefficient of determination) 在样本容量一定的情况下,增加解释变量必定 使得自由度减少,所以调整的思路是:将残差平方 和与总离差平方和分别除以各自的自由度,以剔 除变量个数对拟合优度的影响: /( 1) /( 1) 1 2 − − − = − TSS n RSS n k R 其中:n-k-1为残差平方和的自由度,n-1为总体平 方和的自由度
R2与R2之间存在如下关系: R2=1-(1-?2)n-1 n-k-1 在中国居民消费支出的二元模型例中,R2=0.954 在中国居民消费支出的一元模型例中,R2=0.9927 问题:R2多大才算通过拟合优度检验?
1 1 1 (1 ) 2 2 − − − = − − n k n R R
2、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型 的拟合优度,常用的标准还有: 赤池信息准则( Akaike information criterion,AIC) e'e,2(k+ AC=In-t 施瓦茨准则( Schwarz criterion,SC) ee AC=In -+=In n 这两准则均要求仅当所增加的解释变量能够减少 AIC值或Ac值时才在原模型中增加该解释变量
*2、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型 的拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) n k n AIC 2( 1) ln + + = e e 施瓦茨准则(Schwarz criterion,SC) n n k n AC ln + ln = e e 这两准则均要求仅当所增加的解释变量能够减少 AIC值或AC值时才在原模型中增加该解释变量
Eviews的估计结果显示 中国居民消费一元例中: AIC=6.68C=683 中国居民消费二元例中 AIC=7.09 AC=7.19 从这点看,可以说前期人均居民消费 CONSP(-1)应 包括在模型中
Eviews的估计结果显示: 中国居民消费一元例中: AIC=6.68 AC=6.83 中国居民消费二元例中: AIC=7.09 AC=7.19 从这点看,可以说前期人均居民消费CONSP(-1)应 包括在模型中
二、方程的显著性检验(检验 方程的显著性检验,旨在对模型中被解释变 量与解释变量之间的线性关系在总体上是否显著 成立作出推断。 1、方程显著性的检验 即检验模型 Y;=β0+B1x1:+2X2+…+BXx+11=1,2,…,n 中的参数是否显著不为0。 可提出如下原假设与备择假设: H0:β串β1β2=….阝1=0 H1:β;不全为0
二、方程的显著性检验(F检验) 方程的显著性检验,旨在对模型中被解释变 量与解释变量之间的线性关系在总体上是否显著 成立作出推断。 1、方程显著性的F检验 即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n 中的参数j是否显著不为0。 可提出如下原假设与备择假设: H0: 0 =1 =2= =k=0 H1: j不全为0
F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS 由于回归平方和ESS=∑是解释变量X的联合体对被解 释变量Y的线性作用的结果,考虑比值 ESS/ RSS=∑∑e 如果这个比值较大,则ⅹ的联合体对Y的解释程度 高,可认为总体存在线性关系,反之总体上可能不存 在线性关系 因此可通过该比值的大小对总体线性关系进行推 断
F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS 由于回归平方和 = 2 ˆ i ESS y 是解释变量 X的联合体对被解 释变量 Y 的线性作用的结果,考虑比值 = 2 2 / ˆ i i ESS RSS y e 如果这个比值较大,则X的联合体对Y的解释程度 高,可认为总体存在线性关系,反之总体上可能不存 在线性关系。 因此,可通过该比值的大小对总体线性关系进行推 断