第五章古典线性回归模型
1 第五章 古典线性回归模型
问题的提出 数据背后存在着某种规律性 最小二乘保证了3条性质——残差和=0,残差与自变量 无关、残差与拟合值无关 ·关于数据生成过程的初步假定——一数据生成过程=确定 性部分+非确定性部分 样本一般说来总会反映一些总体的性质,于是对非确 定性部分——随机扰动项——作出类似于最小二乘残 差的假设 ∑L,= Cov u=Cov(y ii =0p;p ∑(-)-2)2∑(6一或-动 ∑b,x
2 问题的提出 • 数据背后存在着某种规律性 • 最小二乘保证了3条性质——残差和=0,残差与自变量 无关、残差与拟合值无关 • 关于数据生成过程的初步假定——数据生成过程=确定 性部分+非确定性部分 • 样本一般说来总会反映一些总体的性质,于是对非确 定性部分——随机扰动项——作出类似于最小二乘残 差的假设 ( )( ) ( )( ) = = + = + − − = − − = = = = = k j i j i j i i i i i i j j i i i i j i i y y u y b x x x u y u x u y u u a u y u x u y u Cov Cov i i ij i 1 , , ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 0 ˆ ˆ ˆ ( , ) ( , ) 0 0
数据背后存在着某种规律性 现实世界中本身存在着经济规律,正是 这些经济规律的作用,通过现实经济生 活又显现出一些复杂现象来。这些现象 既有某种确定性(规律性的一面),有 具有某种不确定性(随机性的一面)。 ·计量经济学研究假定现实数据中存在某 种规律性——一数据背后存在一个数据产 生的过程,即经济现象后面存在规律性。 挖掘数据后面的规律乃是计量经济学的 己任
3 数据背后存在着某种规律性 • 现实世界中本身存在着经济规律,正是 这些经济规律的作用,通过现实经济生 活又显现出一些复杂现象来。这些现象 既有某种确定性(规律性的一面),有 具有某种不确定性(随机性的一面)。 • 计量经济学研究假定现实数据中存在某 种规律性——数据背后存在一个数据产 生的过程,即经济现象后面存在规律性。 • 挖掘数据后面的规律乃是计量经济学的 己任
最小二乘保证了4条性质 1、残差和=0 2、残差与自变量不相关 3、残差与因变量拟合值不相关 4、因变量实际值与拟合值的均值相等 即: 0 2.COVI G;2/=0 3.COV 2/=0 4=∑y=∑y+∑
4 最小二乘保证了4条性质 • 1、残差和=0 • 2、残差与自变量不相关 • 3、残差与因变量拟合值不相关 • 4、因变量实际值与拟合值的均值相等 • 即: ( ) ( ) = = + = = = y y u y u x u u i i i i i i i i y y COV COV ˆ ˆ ˆ ˆ ˆ ˆ ˆ 4. 3. , 0 2. , 0 1. 0
解决问题的思路 数据生成过程〓确定性部分+非确定性部 分 ·关于数据生成过程的初步假定—一提出 线性模型 ·从总体与样本的关系看残差与随机扰动 项的关系 对非确定性部分——一随机扰动项—一作 出6项假设
5 解决问题的思路 • 数据生成过程=确定性部分+非确定性部 分 • 关于数据生成过程的初步假定——提出 线性模型 • 从总体与样本的关系看残差与随机扰动 项的关系 • 对非确定性部分——随机扰动项——作 出6项假设
关于数据生成过程的初步假定 虽然数据并不一定满足最小二乘估计直 线这些性质,但仍可依据对现实的抽象, 假定背后有一个数据生成的过程 °y;=a+b1x1+b2x2+b3x3+…+bk (i=1,2 仅仅是一个初步假定(假定:数据生成 过程=确定性部分+非确定性部分),还 须进一步对u作出假定
6 关于数据生成过程的初步假定 • 虽然数据并不一定满足最小二乘估计直 线这些性质,但仍可依据对现实的抽象, 假定背后有一个数据生成的过程 • yi=a+b1xi1+b2xi2+b3xi3++bkxik+ui • (i=1,2, ,n) • 仅仅是一个初步假定(假定:数据生成 过程=确定性部分+非确定性部分),还 须进一步对ui作出假定
从总体与样本的关系看残差与随机扰动项 最小二乘估计直线有4条性质。性质中 的残差是一个样本的残差 从总体与样本的关系看,数据是总体的 个子集,自然u;也是u;的一个子集, 而u;是总体的随机扰动项 样本一般说来总会反映一些总体的性质, 于是对随机扰动项作出类似最小二乘估 计残差的假设。 从而完成了数据生成过程的假设
7 从总体与样本的关系看残差与随机扰动项 • 最小二乘估计直线有4条性质。性质中 的残差是一个样本的残差。 • 从总体与样本的关系看,数据是总体的 一个子集,自然u^i也是ui的一个子集, 而ui是总体的随机扰动项。 • 样本一般说来总会反映一些总体的性质, 于是对随机扰动项作出类似最小二乘估 计残差的假设。 • 从而完成了数据生成过程的假设
第一节有关随机扰动项u;的古典模型假设 ·随机扰动项u;是一个有关总体属性的随机变量, 下面对u;的分布,依据最小二乘估计得到的残 差(样本)的性质作出类似的假设: 假设1随机扰动项■;垂直波动 假设2残差分布均值为零 假设3随机扰动项方差一定 假设4随机扰动项(误差)相互独立 假设5所有X都是可观察的并且独立于u 一假设6数据产生过程是线性的
8 第一节 有关随机扰动项ui的古典模型假设 • 随机扰动项ui是一个有关总体属性的随机变量, 下面对ui的分布,依据最小二乘估计得到的残 差(样本)的性质作出类似的假设: – 假设1 随机扰动项ui垂直波动 – 假设2 残差分布均值为零 – 假设3 随机扰动项方差一定 – 假设4 随机扰动项(误差)相互独立 – 假设5 所有xi都是可观察的并且独立于ui – 假设6 数据产生过程是线性的
假设1随机扰动项u;垂直波动 (Vertical Error Jumps 样本数据点只沿着y;的方向在真实直线附 近垂直跳动,即这种波动围绕真实直线上 下波动。对于每一个x,y;总是垂直变动, 没有横向偏移。这也就是说观察到的x;是 准确无误的,实际中的x;没有丝毫偏差 而对应于x;的y;却存在垂直的偏差。 误差变量模型——x;存在随机偏差 ( Errorsin variable mode)(第十五章中讨 论)
9 假设1 随机扰动项ui垂直波动 (Vertical Error Jumps) • 样本数据点只沿着yi的方向在真实直线附 近垂直跳动,即这种波动围绕真实直线上 下波动。对于每一个xi,yi总是垂直变动, 没有横向偏移。这也就是说观察到的xi是 准确无误的,实际中的xi没有丝毫偏差, 而对应于xi的yi却存在垂直的偏差。 • 误差变量模型——xi存在随机偏差 (Errorsin Variable Model)(第十五章中讨 论)
古典线性模型中只有因变量存在垂直波动 Y A B XI 2 X3 x4 5 6
10 古典线性模型中只有因变量存在垂直波动 Y X A B x1 x2 x3 x4 x5 x6