
§3.3多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model 一、拟合优度检验 二、方程的显著性检验(检验) 三、变量的显著性检验(t检验) 四、参数的置信区间
§3.3 多元线性回归模型的统计检验 Statistical Test of Multiple Linear Regression Model 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间

一、拟合优度检验 Goodness of Fit
一、拟合优度检验 Goodness of Fit

1、概念 ·拟合优度检验:对样本回归直线与样本观测值 之间拟合程度的检验。 ·问题:采用普通最小二乘估计方法,已经保证 了模型最好地拟合了样本观测值,为什么还要 检验拟合程度? ·如何检验:构造统计量 一统计量只能是相对量
1、概念 • 拟合优度检验:对样本回归直线与样本观测值 之间拟合程度的检验。 • 问题:采用普通最小二乘估计方法,已经保证 了模型最好地拟合了样本观测值,为什么还要 检验拟合程度? • 如何检验:构造统计量 – 统计量只能是相对量

2、可决系数与调整的可决系数 ·总离差平方和的分解 记 Ss=∑g,-)2总离差平方和 证明: ESS=∑,-T)2 回归平方和 该项等于0 RSS=∑,-)2剩余平方和 TSS =(Y-Y)2 =(Y,-)+(,-)2 =(Y-)2+2(Y-,-)+(-T)2 TSS=∑(化,-)2+∑(,-T)'=RsS+ESS
2、可决系数与调整的可决系数 2 2 2 2 ) ˆ ) ( ˆ )( ˆ ) 2 ( ˆ ( )) ˆ ) ( ˆ (( ( ) Y Y Y Y Y Y Y Y Y Y Y Y TSS Y Y i i i i i i i i i i = − + − − + − = − + − = − • 总离差平方和的分解 TSS Y Y Y Y RSS ESS = i − i + i − = + 2 2 ) ˆ ) ( ˆ ( 证明: 该项等于0

。可决系数(Coefficient of Determination) R2- ESS TSS TSS 该统计量越接近于1,模型的拟合优度越高。 ·从R2的表达式中发现,如果在模型中增加解释 变量,R2往往增大。 这就给人一个错觉:要使得模型拟合得好,只 要增加解释变量即可。 但是,由增加解释变量引起的R2的增大与拟合 好坏无关,所以R2需调整
• 可决系数( Coefficient of Determination ) TSS RSS TSS ESS R = = 1− 2 该统计量越接近于1,模型的拟合优度越高。 • 从R2的表达式中发现,如果在模型中增加解释 变量, R2往往增大。 这就给人一个错觉:要使得模型拟合得好,只 要增加解释变量即可。 但是,由增加解释变量引起的R2的增大与拟合 好坏无关,所以R 2需调整

·调整的可决系数(adjusted coefficient of determination R2=1-RSS /(n-k-1) TSS /n-1) 其中:n-k1为残差平方和的自由度,n-1为总体平 方和的自由度。 调整的可决系数多大才是合适的?
• 调整的可决系数(adjusted coefficient of determination) /( 1) /( 1) 1 2 − − − = − TSS n RSS n k R 其中:n-k-1为残差平方和的自由度,n-1为总体平 方和的自由度。 调整的可决系数多大才是合适的?

3、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion,AIC) AIC In e' e.2(k+l) n n 施瓦茨准则(Schwarz criterion,SC) SC=In n n 这两准则均要求仅当所增加的解释变量能够减少 AIC值或SC值时才在原模型中增加该解释变量
3、赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) n k n AIC 2( 1) ln + + = e e 施瓦茨准则(Schwarz criterion,SC) 这两准则均要求仅当所增加的解释变量能够减少 AIC值或SC值时才在原模型中增加该解释变量。 n n k n SC ln + ln = e e

地区城镇居民消费模型(k=2) File Edit Object View Proc Quick Options Window Help View Proc Object Print Name Freeze Estimate Forecast Stats Resids Dependent Variable:Y Method:Least Squares Date:10/01/15 Time:12:50 Sample:1 31 Included observations:31 Variable Coefficient Std.Error t-Statistic Prob. C 2599.145 827.3419 3.141561 0.0039 X1 0.486512 0.057588 8.448182 0.0000 2 0.601749 0.104244 5.772494 0.0000 R-squared 0.922460 Mean dependent var 17190.60 Adjusted R-squared 0.916921 S.D.dependent var 3963.845 S.E.of regression 1142.514 Akaike info criterion 17.01162 Sum squared resid 36549482 Schwarz criterion 17.15039 Log likelihood -260.6800 F-statistic 166.5516 Durbin-Watson stat 1.914732 Prob(F-statistic) 0.000000
地区城镇居民消费模型(k=2)

二、方程的显著性检验(F检验) Testing the Overall Significance of a Multiple Regression (the F test)
二、方程的显著性检验(F检验) Testing the Overall Significance of a Multiple Regression (the F test)

1、假设检验(Hypothesis Testing) ·所谓假设检验,就是事先对总体参数或总体分 布形式作出一个假设,然后利用样本信息来判 断原假设是否合理,即判断样本信息与原假设 是否有显著差异,从而决定是否接受或否定原 假设。 ·假设检验采用的逻辑推理方法是反证法。先假 定原假设正确,然后根据样本信息,观察由此 假设而导致的结果是否合理,从而判断是否接 受原假设。 ·判断结果合理与否,是基于“小概率事件不易 发生”这一原理的
1、假设检验(Hypothesis Testing) • 所谓假设检验,就是事先对总体参数或总体分 布形式作出一个假设,然后利用样本信息来判 断原假设是否合理,即判断样本信息与原假设 是否有显著差异,从而决定是否接受或否定原 假设。 • 假设检验采用的逻辑推理方法是反证法。先假 定原假设正确,然后根据样本信息,观察由此 假设而导致的结果是否合理,从而判断是否接 受原假设。 • 判断结果合理与否,是基于“小概率事件不易 发生”这一原理的