§24多元线性回归模型的统计检验 拟和优度检验 总体平方和、回归平方和与残差平方和 1、总体平方和:TSs=∑(-)2大小反映y的变动度 (正比) 2、回归平方和:ESS=∑(-2大小反映x对y解 释作用的大小(正比) 3、残差平方和:RSS=∑(-)大小反映随机因素 对y的作用的大小(正比) (二)相互关系 1、前提:y与x1x2…xk之间的关系确为线性关系 数量关系:TSS=ESS+RSS(y的变动可以被全部分解 为解释变量与随机误差的作用) (三)测定拟合优度的统计量 1、判定系数(可决系数) (1)定义:R2 ESS TSS (2)含义:在Y每单位以平方和测度的变动中由解释变量做 出解释的比重 (3)取值范围:0≤R2≤1 (4)意义:R2越接近1表明拟合优度越高,R2越接近于零拟合 优度愈低。 如,p44例2-3-1中R2=0997,表明模型的拟合优度非常高,模型的
§2.4 多元线性回归模型的统计检验 一、 拟和优度检验 总体平方和、回归平方和与残差平方和 1、总体平方和:TSS= 2 ( ˆ ) i i y − y 大小反映 y 的变动度 (正比) 2、回归平方和: ESS= 2 (y ˆ y) i − 大小反映 x 对 y 解 释作用的大小(正比) 3、残差平方和: RSS= 2 ( ˆ ) i i y − y 大小反映随机因素 对 y 的作用的大小(正比) (二) 相互关系 1、 前提:y 与 x1,x2 … xk 之间的关系确为线性关系 数量关系:TSS = ESS + RSS(y 的变动可以被全部分解 为解释变量与随机误差的作用) (三)测定拟合优度的统计量 1、判定系数(可决系数) (1)定义:R2 = TSS RSS TSS ESS = 1− (2)含义:在 Y 每单位以平方和测度的变动中由解释变量做 出解释的比重 (3)取值范围:0≤R2≤1 (4)意义:R2越接近 1 表明拟合优度越高,R2越接近于零拟合 优度愈低。 如,p44 例 2-3-1 中 R2=0.9997,表明模型的拟合优度非常高,模型的
质量很好。 (5)评价: 优:直观、含义明确和方便 缺:①R2是解释变量的单调非降函数,导致为追求较高 的R2而增加解释变量 ②R2接近于1或者0的程度缺乏客观数量标准 1、校正的可决系数 (1)定义:R2=1 其中:S,=RS(n-k-1) S,=TSS/(n-1) a)意义与范围:与可决系数相同(可能小于零此时规定为0) b)优点:不再是K的非降函数 c)与可决系数的关系:同一组数据估计的模型R2≤R2 16-1 如:P44之例23-1R2=16-2-1×(-09979=09940.997=R2 二、方程显著性检验(F检验) (一)假设检验的一般问题 1、关于假设 (1)概念:关于总体分布、数字特征和相互关系的论断成为假 设,以H表示 如H总体服从正态分布 H总体的均值山=1000 H总体X与Y优相同的分布H总体Ⅹ与Y相互独立 (2)原假设与备择假设 者必居其一的假设中的一个称为原假设以H表示,另一
质量很好。 (5)评价: 优:直观、含义明确和方便 缺:○1 R2 是解释变量的单调非降函数,导致为追求较高 的 R2而增加解释变量; ○2 R2接近于 1 或者 0 的程度缺乏客观数量标准 1、校正的可决系数 (1)定义: t r S S R =1− 2 = 1 (1 ) 1 1 2 R n k n − − − − − 其中: S = RSS (n − k −1) r S = TSS (n −1) t a) 意义与范围: 与可决系数相同(可能小于零此时规定为 0) b) 优点:不再是 K 的非降函数 c) 与可决系数的关系:同一组数据估计的模型 2 2 R R 如:P44 之例 2-3-1 (1 0.9997) 16 2 1 16 1 1 2 − − − − R = − =0.9994<0.9997=R2 二、 方程显著性检验(F-检验) (一)假设检验的一般问题 1、关于假设 (1)概念:关于总体分布、数字特征和相互关系的论断成为假 设,以 H 表示 如 H 总体服从正态分布 H 总体的均值 = 10.00 H 总体 X 与 Y 优相同的分布 H 总体 X 与 Y 相互独立 (2)原假设与备择假设 二者必居其一的假设中的一个称为原假设以 H0 表示,另一
个称为备择假设以H1表示 如HoB=0 H1B≠0 (3)假设检验假设可能对也可能错,抽取样本并进行推理决定 假设真假的过程称为假设检验。 2、假设检验的原理与方法 (1)实际推断原理小概率事件(发生的概率部超过0.10)被 认为在一次试验中实际上不会发生。→小概率事件在一次试 验中没有发生是合理的,发生则是不合理的。 (2)假设检验的原理利用实际推断原理这一概率性质的反证 法,即事先假定假设Ho成立,如果导致小概率事件在一次 试验中发生→不合理→假设H不真;若小概率事件在一次 试验中没有发生,→合理,不能认为假设H不真。 (3)检验的方法寻找以合适的统计量T(不一定是T分布) 一有分布、能包含H、H成立条件下不含未知数→构造一 个小概率事件,把T的取值范围分割成不相重叠的两部分Ⅴ 和萨,使 P{T∈T}=a(a≤0.10) V-Ho的拒绝域—H0的接收域a—显著性水平 在H成立的条件下计算T的观察值t若te则表明H导 致小概率事件在一次试验中发生,不合理(实际推断原理), 从而认为H不真,即拒绝Ho;若tgV,没有导致小概率事件 在一次试验中发生,没有不合理,故而不能认为Ho不真即
个称为备择假设以 H1表示。 如 H0 = 0 H1 0 (3)假设检验 假设可能对也可能错,抽取样本并进行推理决定 假设真假的过程称为假设检验。 2、假设检验的原理与方法 (1)实际推断原理 小概率事件(发生的概率部超过 0.10)被 认为在一次试验中实际上不会发生。 小概率事件在一次试 验中没有发生是合理的,发生则是不合理的。 (2)假设检验的原理 利用实际推断原理这一概率性质的反证 法,即事先假定假设 H0 成立,如果导致小概率事件在一次 试验中发生 不合理 假设 H0不真;若小概率事件在一次 试验中没有发生, 合理,不能认为假设 H0不真。 (3)检验的方法 寻找以合适的统计量 T(不一定是 T 分布) —有分布、能包含 H0、H0成立条件下不含未知数 构造一 个小概率事件,把 T 的取值范围分割成不相重叠的两部分 V 和 V ,使: P{T V }= ( 0.10) V—H0的拒绝域 V — H0的接收域 —显著性水平 在 H0成立的条件下计算 T 的观察值 t,若t V 则表明H0导 致小概率事件在一次试验中发生,不合理(实际推断原理), 从而认为 H0不真,即拒绝 H0;若 t V,没有导致小概率事件 在一次试验中发生,没有不合理,故而不能认为 H0 不真即
接受H (4)假设检验与显著性水平 ①改变显著性水平a,就有可能改变检验的结论 ②显著性水平a的数值越小,拒绝H的说服力越强 ③计量经济学统计检验中一般取a≤005 (5)假设检验中的两类错误 第一类错误Ho本身为真,经检验却被拒绝,犯这类错 误的概率为a 第二类错误H0本身不真,经检验却被接受,犯这类错 误的概率为B (6)两类错误间的关系在样本容量不变的条件下,一个减小另 个必然增大(此消彼长) (7)处理方法事先确定a,然后找β最小(功效最大)的检验 方法一今后使用的方法均符合这一要求 (二)方程显著性的检验 1、F一检验 (1)假设H0B1=B2=…=B4=0分解释变量对y没有任何解释作用 H1B,B2B不全为零→解释变量中至少有一部分对y有 解释作用 (2)统计量 ESS/K F(k,n-k-1) RSS/(n-k-1) (3)决策规则
接受 H0。 (4)假设检验与显著性水平 ○1 改变显著性水平 ,就有可能改变检验的结论; ○2 显著性水平 的数值越小,拒绝 H0的说服力越强; ○3 计量经济学统计检验中一般取 0.05 (5)假设检验中的两类错误 第一类错误 H0 本身为真,经检验却被拒绝,犯这类错 误的概率为 第二类错误 H0 本身不真,经检验却被接受,犯这类错 误的概率为 (6)两类错误间的关系 在样本容量不变的条件下,一个减小另一 个必然增大(此消彼长) (7)处理方法 事先确定 ,然后找 最小(功效最大)的检验 方法—今后使用的方法均符合这一要求。 (二)方程显著性的检验 1、F—检验 (1)假设 H0 1 = 2 == K = 0 解释变量对 y 没有任何解释作用 H1 K , , 1 2 不全为零 解释变量中至少有一部分对y有 解释作用 (2)统计量 F = RSS (n − k −1) ESS K ~ F( k , n-k-1) (3)决策规则
若F≥F(k,n-k-1),则Ho不真,即解释变量对y的解释作用 显著→模型有效若F>670=Fo(2,13):模型是非常有效的 2、软件中F检验的输出格式 来源平方和自由度均方F值P值 df 回归 ESS K ESS÷KF 残差 RSS n-k-1 RSS 总和 TSS -1 (n-k-1) 决策规则若Po≤a(005),认为模型有效,若Po≥a(0.05), 模型无效 (三)F检验与可决系数的关系 (1)数量关系 F= ESS/k RSGn-k-)(-R2)k(与可决系数) R2大则F值大,R2小则F值小 (2)结论间的关系 二者所的结论一般是一致的,但有时会矛盾 三、变量显著性检验(t检验)
若 F≥ F (k,n-k-1),则 H0不真,即解释变量对 y 的解释作用 显著 模型有效 若 F< F (k,n-k-1),,则 H0为真,解释变 量对 y 的解释作用不显著 模型无效。 如 P44 例 2-3-1 中 F = 28682>>6.70=F0.01(2,13) 模型是非常有效的 2、软件中 F 检验的输出格式 来源 平方和 自由度 df 均方 F 值 P 值 回归 残差 总和 ESS RSS TSS K n-k-1 n-1 ESS÷K RSS ÷ (n-k-1) F0 P0 决策规则 若 P0≤ (0.05),认为模型有效,若 P0≥ (0.05), 模型无效 (三)F 检验与可决系数的关系 (1)数量关系 F = R k n k R RSS n k ESS k (1 ) ( 1) ( 1) 2 2 − − − = − − (与可决系数) R2大则 F 值大,R2小则 F 值小 (2)结论间的关系 二者所的结论一般是一致的,但有时会矛盾。 三、变量显著性检验(t 检验)
(一)必要性 1、必要性模型通过F检验(模型有效)仅只表示解释变量作为 一个整体以线性模型的形式对y的解释作用是显著 的,并不能说明每个解释变量都是必需的,从而需要 判断每一个解释变量的作用是否显著。 2、前提模型通过F检验 (二)方法 1、假设Ho:B=0 H1:β 2、检验统计量 ~1(n-k-1)(Ho为真) 其中B-B的OLS估计量Sn=√G2-B的标准误(愈小愈好) 0 cn(xx)主对角现第1个元素 3、决策规则 若|t≥t2(n-k-1),则认为x对y的解释作用显著;否 则不显著。 例p4例2-3-1中 t=32.363 t 5.701 取a=001,查t分布表得tm2(n-k-1)=10013)=3012,可见 所有回归系数的t统计量的绝对值均大于该临界值,故而GDP(X1) 和上年消费额(X2)对消费额都有显著解释作用,均应予以保留
(一)必要性 1、必要性 模型通过 F 检验(模型有效)仅只表示解释变量作为 一个整体以线性模型的形式对 y 的解释作用是显著 的,并不能说明每个解释变量都是必需的,从而需要 判断每一个解释变量的作用是否显著。 2、前提 模型通过 F 检验 (二)方法 1、假设 H0 : = 0, j H1 : j 0 2、检验统计量 t = ~ ( 1) ˆ ˆ t n − k − s j j (H0 为真) 其中 j ˆ — j 的 OLS 估计量 j S = 2 ˆ jj c — j ˆ 的标准误(愈小愈好) 2 ˆ = 1 2 − − n k ei jj c —( 1 ) − X X T 主对角现第 j+1 个元素 3、决策规则 若 | t| ≥ ( 1) t 2 n − k − ,则认为 xj 对 y 的解释作用显著;否 则不显著。 例 p44 例 2-3-1 中 | t 1 | = 32.363 | t 2 | = 5.701 取 = 0.01, 查 t 分布表得 t 2 (n − k −1) = t .0005(13) = 3.012 ,可见 所有回归系数的 t 统计量的绝对值均大于该临界值,故而 GDP(X1) 和上年消费额(X2)对消费额都有显著解释作用,均应予以保留
§2.5多元线性回归模型的置信区间 参数的置信区间 (一)回归系数的置信区间 、使用的统计量 B-B t(n-k-1) 2、置信度为(1-a)的置信区间:(B,-5n,B+S) 3、P4例2-3-1中的回归系数的99置信区间 查表得tm2(n-k-1)=t0133012 从回归计算结果中可得 B=540.52=79.081 B 0.4809 0.0149 B2=0.1985 S:=0.0348 可计算得,B,B2的置信度99%的置信区间分别为 (302.33 33778.71) (04360 0.5258) (00937 0.3033) (二)置信区间的意义 以95%的置信度为例,它表明重复估计的区间中约有 95%的区间包含有参数的真值;同一置信度之下,区间长 度越短越好。 上例中,B1得置信区间的长度d=0.0898在三个区间中 最短表明其稳定性最好,质量最高
§2.5 多元线性回归模型的置信区间 一、参数的置信区间 (一)回归系数的置信区间 1、使用的统计量 ~ ( 1) ˆ − − − = t n k S t J j j 2、置信度为(1- )的置信区间:( j j j − t S j + S ˆ , ˆ 2 ) 3、P44 例 2-3-1 中的回归系数的 99%置信区间 查表得 t 2 (n − k −1) = t 0.005 (13)3.012 从回归计算结果中可得: 540.52 ˆ 0 = 79.081 0 ˆ = S 0.4809 ˆ 1 = 0.0149 1 ˆ = S 0.1985 ˆ 2 = 0.0348 2 ˆ = S 可计算得 0 1 2 , , 的置信度 99%的置信区间分别为: (302.33 , 33778.71) (0.4360 , 0.5258) (0.0937 , 0.3033) (二)置信区间的意义 以 95%的置信度为例,它表明重复估计的区间中约有 95%的区间包含有参数的真值;同一置信度之下,区间长 度越短越好。 上例中, 1 得置信区间的长度 d=0.0898 在三个区间中 最短表明其稳定性最好,质量最高
被解释变量预测值的置信区间 (一)被解释变量的预测值及预测误差的方差 、Y的预测值 设模型=AB经检验是有效的,对所确定(方法 不限)的样本以外的解释变量的观测值X0=(1x10,x20, xo),Y的预测值被定义为: 如P4例2-3-1中假设1997年GDP=7466282(亿元),上期 消费额40172(亿元)那么1997年的消费额的预测值为 540.52 =074628240172)04809=44231(亿元) 0.1985 2、预测误差及其方差 (1)预测误差 eo =yo-yo (2)误差的方差Var(e)=o2(+X0(xx)x) (3)误差的标准误6=6√+X0(xx)xo (二)yo的置信度为(1-a)置信区间 1、统计量 t(n-k-1) 2、置信区间(0-1mo。,+n。) 3、该置信区间的特性X接近x=(1x,x2…,x)时区间 较短,X0离ξ越远,区间越长
二、被解释变量预测值的置信区间 (一)被解释变量的预测值及预测误差的方差 1、Y 的预测值 设模型 Y ˆ = XB ˆ 经检验是有效的,对所确定(方法 不限)的样本以外的解释变量的观测值 X0 =(1,x10,x20,… xk0) ,Y 的预测值被定义为: 0 y ˆ = X0 B ˆ 如 P44 例 2-3-1 中假设 1997 年 GDP=74662.82(亿元),上期 消费额 40172(亿元)那么 1997 年的消费额的预测值为 ( ) = 0.1985 0.4809 540.52 yˆ 0 1,74662.82,40172 =44420.31(亿元) 2、预测误差及其方差 (1)预测误差 0 0 0 e = y − y ˆ (2)误差的方差 Var( 0 e ) = (1 ( ) ) 0 1 0 2 T T X X X X − + (3) 误差的标准误 0 1 0 ˆ ˆ 1 ( ) 0 T T e X X X X − = + (二)y0 的置信度为(1- )置信区间 1、统计量 t = ~ ( 1) ˆ ˆ 0 0 0 − − − t n k y y e 2、置信区间 ( 0 0 ˆ ˆ , ˆ ˆ 0 2 e 0 2 e y − t y + t ) 3、该置信区间的特性 X0 接近 (1, , , , ) 1 2 k X = x x x 时区间 较短,X0 离 X 越远,区间越长
§2.6异方差性 含义及产生的机理 1、含义:异方差的含义指线性回归模型 y=Bo+B,xu+B2x Boxx +u 中基本假设同方差Ⅴar(A)=σ2,i=12,…n的违背,即 (1)Var(A)=an2,1=12…n(随机误差项的方差不完全相同); (2)模型的其它基本假设不变。 2、产生机理: (1)模型设立时忽略的因素对被解释变量影响随解释变 量取值的不同而不同 (2)使用截面数据的模型中随机误差项包含的内容随解 释变量取值不同而改变。 例如:以绝对收入理论建立的模型 C1=B+B1l1+1 中使用截面数据(将消费者按收入水平不同进行分组),随 收入水平提高,人的消费行为的不可预知性增强,随机误差 项的分布范围扩大,从而Var()逐渐增大,不再保持不变。 二、常见形式 1、Var(μ)=∫(x1,x2…x)2(如在一元线性回归模型 y=+Bx+1中Va()=0%) 2、不规律(较少见)
§2.6 异方差性 一、 含义及产生的机理 1、含义:异方差的含义指线性回归模型 i i i k ki i y = 0 + 1 x1 + 2 x2 ++ x + 中基本假设同方差 Var( ) i = 2 ,i = 1,2, n 的违背,即 (1)Var( 2 ) i = i , i = 1,2, n (随机误差项的方差不完全相同); (2)模型的其它基本假设不变。 2、产生机理: (1)模型设立时忽略的因素对被解释变量影响随解释变 量取值的不同而不同; (2)使用截面数据的模型中随机误差项包含的内容随解 释变量取值不同而改变。 例如:以绝对收入理论建立的模型 i i i C = 0 + 1 I + i = 1,2, n 中使用截面数据(将消费者按收入水平不同进行分组),随 收入水平提高,人的消费行为的不可预知性增强,随机误差 项的分布范围扩大,从而 Var( ) i 逐渐增大,不再保持不变。 二、 常见形式 1、Var( 2 1 2 ) ( , ) i i i ki = f x x x (如在一元线性回归模型 i i i y = 0 + 1 x + 中 Var( i i x 2 ) = ) 2、不规律(较少见)
三、异方差的后果 指模型中存在异方差,但估计之前没有发觉,依然使用 OLS或ML估计参数所导致的不良后果 1、B=(xx)2(xY)虽然仍为无偏的,但却不再是有效的 (方差不是最小的,参数变动范围更大,稳定性降低); 2、变量显著性检验和方程显著性检验的功效下降甚至 失效(高估误差项方差,T统计量分母被反常扩大,导致T 值减小,增加接受原假设的概率,将有效的解释变量误判为 不显著的:残差扩大,回归平方和ESS减小F=ES非 RSS/(n 正常缩小增加接受“方程作用不显著”的概率); 3、模型的预测功能失效(预测误差的方差增大,导致 区间长度在置信度不变的条件下增加,预测的精度下降)。 四、异方差的检验(检测、侦察或诊断) 1、图示法(残差诊断图)一国外有称非正式方法 步骤:直接用OLS估计模型参数,计算残差e=y-j的 平方作为误差项方差的近似→以x为横坐标,e2为纵坐 标作散点图→判断,若图形规律则说明有异方差;否则没 有 评价:直观,简便; 缺乏客观标准 2、Park检验
三、 异方差的后果 指模型中存在异方差,但估计之前没有发觉,依然使用 OLS 或 ML 估计参数所导致的不良后果: 1、 ( ) ( ) ˆ 1 B X X X Y T − T = 虽然仍为无偏的,但却不再是有效的 (方差不是最小的,参数变动范围更大,稳定性降低); 2、变量显著性检验和方程显著性检验的功效下降甚至 失效(高估误差项方差,T 统计量分母被反常扩大,导致 T 值减小,增加接受原假设的概率,将有效的解释变量误判为 不显著的;残差扩大,回归平方和 ESS 减小,F= RSS (n − k −1) ESS k 非 正常缩小增加接受“方程作用不显著”的概率); 3、模型的预测功能失效(预测误差的方差增大,导致 区间长度在置信度不变的条件下增加,预测的精度下降)。 四、 异方差的检验(检测、侦察或诊断) 1、图示法(残差诊断图)—国外有称非正式方法 步骤:直接用 OLS 估计模型参数,计算残差 ei = i i y − y ˆ 的 平方作为误差项方差的近似 → 以 xj 为横坐标,ei 2 为纵坐 标作散点图 → 判断,若图形规律则说明有异方差;否则没 有。 评价:直观,简便; 缺乏客观标准 2、Park 检验