
§2.4一元线性回归模型的统计检验 Statistical Test of Simple Linear Regression Model 一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
§2.4 一元线性回归模型的统计检验 Statistical Test of Simple Linear Regression Model 一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间

说明 回归分析是要通过样本所估计的参数来代替总 体的真实参数,或者说是用样本回归线代替总 体回归线。 ·尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其 总体的参数真值,但在一次抽样中,估计值不 一定就等于该真值。 。 那么,在一次抽样中,参数的估计值与真值的 差异有多大,是否显著,这就需要进一步进行 统计检验。 主要包括拟合优度检验、变量的显著性检验及 参数的区间估计
说 明 • 回归分析是要通过样本所估计的参数来代替总 体的真实参数,或者说是用样本回归线代替总 体回归线。 • 尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其 总体的参数真值,但在一次抽样中,估计值不 一定就等于该真值。 • 那么,在一次抽样中,参数的估计值与真值的 差异有多大,是否显著,这就需要进一步进行 统计检验。 • 主要包括拟合优度检验、变量的显著性检验及 参数的区间估计

一、拟合优度检验 Goodness of Fit,Coefficient of Determination
一、拟合优度检验 Goodness of Fit, Coefficient of Determination

1、回答一个问题 。3 拟合优度检验:对样本回归直线与样本观测值 之间拟合程度的检验。 ·问题:采用普通最小二乘估计方法,已经保证 了模型最好地拟合了样本观测值,为什么还要 检验拟合程度?
1、回答一个问题 • 拟合优度检验:对样本回归直线与样本观测值 之间拟合程度的检验。 • 问题:采用普通最小二乘估计方法,已经保证 了模型最好地拟合了样本观测值,为什么还要 检验拟合程度?

2、总离差平方和的分解 立,=B。+BX, Y的i个观测值与样本均 =(P-) 值的离差 y=y,-Y=(Y,-)+(,-)=e,+ 离差分解为两 回归直线不能 由回归 部分之和 解释的部分 直线解 释的部 分
2、总离差平方和的分解 Yi 0 1 Xi ˆ = ˆ + ˆ ) ˆ y ˆ i = (Yi −Y i i i i i i i y Y Y Y Y Y Y ) e y ˆ ˆ ) ( ˆ = − = ( − + − = + Y的i个观测值与样本均 值的离差 由回归 直线解 释的部 分 回归直线不能 解释的部分 离差分解为两 部分之和

e:=来自残差 SRF =总离差 =来自回归 X ,=-)是样本回归拟合值与观测值的平均值之差,可 认为是由回归直线解释的部分; ,=(化-)是实际观测值与回归拟合值之差,是回归直线 不能解释的部分

对于所有样本点,则需考虑离差的平方和: ∑y=∑好+e+2∑,e =∑+∑e 记7S=∑y=∑(y-)2 总体平方和(Total Sum of Squares) ESS=∑=∑(-Y)2 回归平方和(Explained Sum of Squares) RSS=∑e=∑,-)2 残差平方和(Residual Sum of Squares
对于所有样本点,则需考虑离差的平方和: 记 = = − 2 2 TSS y (Y Y ) i i 总体平方和(Total Sum of Squares) = = − 2 2 ) ˆ ESS y ˆ i (Yi Y 回归平方和(Explained Sum of Squares) = = − 2 2 ) ˆ ( i Yi Yi RSS e 残差平方和(Residual Sum of Squares )

TSS-ESS+RSS Y的观测值围绕其均值的总离差(total variation) 可分解为两部分:一部分来自回归线(ES),另一 部分则来自随机势力RSS)。 在给定样本中,TSS不变, 如果实际观测点离样本回归线越近,则E$S在 TSS中占的比重越大,因此 拟合优度:回归平方和ESSN的总离差TSS
TSS=ESS+RSS Y的观测值围绕其均值的总离差(total variation) 可分解为两部分:一部分来自回归线(ESS),另一 部分则来自随机势力(RSS)。 在给定样本中,TSS不变, 如果实际观测点离样本回归线越近,则ESS在 TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS

3、可决系数R2统计量 ESS RSS R2 TSS TSS ·是一个非负的统计量。取值范围:[0,1] ·越接近1,说明实际观测点离回归线越近,拟合优 度越高。 。 随着抽样的不同而不同。为此,对可决系数的统 计可靠性也应进行检验,这将在第3章中进行
3、可决系数R2统计量 • 是一个非负的统计量。取值范围:[0,1] • 越接近1,说明实际观测点离回归线越近,拟合优 度越高。 • 随着抽样的不同而不同。为此,对可决系数的统 计可靠性也应进行检验,这将在第3章中进行。 TSS RSS TSS ESS R = = 1− 2

·例题 a想EVievs一[Equation:TITLED ■orkfi1e:WTITLED\ File Edit Object View Proc Quick Options Window Help View Proc Object Print Name Freeze Estimate Forecast Stats Resids Dependent Variable:Y Method:Least Squares Date:09/28/15Time:16:58 Sample:1 10 Included observations:10 Variable Coefficient Std.Error t-Statistic Prob C 142.4000 44.44673 3.203835 0.0125 0.670000 0.019189 34.91562 0.0000 R-squared 0.993481 Mean dependent var 1582.900 Adjusted R-squared 0.992666 S.D.dependent var 610.5512 S.E.of regression 52.28814 Akaike info criterion 10.92827 Sum squared resid 21872.40 Schwarz criterion 10.98879 Log likelihood 52.64136 F-statistic 1219.101 Durbin-Watson stat 1.677411 Prob(F-statistic) 0.000000
• 例题