Chapter 1 回归分析的性质 主讲:彭红枫 武汉大学经济与管理学院金融系 CopY Wuhan University htcHongfeng Peng 2006
Chapter 1 回归分析的性质 主讲:彭红枫 武汉大学经济与管理学院金融系 Copyright© Hongfeng Peng 2006 Wuhan University
11回归 回归是计量经济学的主要工具 回归是研究一个因变量对一个或多个自变 量的依赖关系的过程,其用意在于通过后 者的设定去估计或预测前者的均值(总体 均值)。 “回归”最早是由英国统计学家 Galton (1886)提出,见P3。 2021/220 Hongfeng Peng Department of Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 2 1.1 回归 • 回归是计量经济学的主要工具 – 回归是研究一个因变量对一个或多个自变 量的依赖关系的过程,其用意在于通过后 者的设定去估计或预测前者的均值(总体 均值)。 – “回归”最早是由英国统计学家Galton (1886)提出,见P3
在一篇论文中, Galton发现 虽然有一个趋势,父母高,儿女也高;父 母矮,儿女也矮,但给定父母的身高,儿 女辈的平均身高却趋向于或者“回归”到 全体人口的平均身高 换言之,尽管父母双亲都异常高或异常矮, 而儿女的身高则有走向人口总体平均身高 的趋势 -- Galton的普遍回归定律 2021/220 Hongfeng Peng Department of Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 3 • 在一篇论文中, Galton发现: – 虽然有一个趋势,父母高,儿女也高;父 母矮,儿女也矮,但给定父母的身高,儿 女辈的平均身高却趋向于或者“回归”到 全体人口的平均身高。 – 换言之,尽管父母双亲都异常高或异常矮, 而儿女的身高则有走向人口总体平均身高 的趋势。 • -- Galton的普遍回归定律
1.2几个相关概念 。统计关系与确定性关系 在回归分析中我们考虑的是一种统计依赖 关系,即我们处理的变量是随机的 在确定性关系中,我们处理的变量不是随 机的; 2021/220 Hongfeng Peng Department of Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 4 1.2 几个相关概念 • 统计关系与确定性关系 – 在回归分析中,我们考虑的是一种统计依赖 关系,即我们处理的变量是随机的; – 在确定性关系中,我们处理的变量不是随 机的;
统计关系与确定性关系 一个例子(牛顿的引力定律) 1m7 f=k ♂·上式为一确定性关系,非计量经济学研 究范畴,但k的测量有误差,则原确定 性关系就变成了一个统计关系式,此时, 引力就只能根据给定的k、m及r近似地 加以预测,F也就变成了随机变量。 2021/220 Hongfeng Peng Department of 5 Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 5 统计关系与确定性关系 • 一个例子(牛顿的引力定律) • 上式为一确定性关系,非计量经济学研 究范畴,但k的测量有误差,则原确定 性关系就变成了一个统计关系式,此时, 引力就只能根据给定的k、m及r近似地 加以预测,F也就变成了随机变量。 1 2 2 m m F k r =
回归与因果关系 回归分析研究一个变量对另一些变量的 依赖关系,但这并不一定意味着变量间 的因果关系。因为回归是一种统计关系, 而因果关系来自于统计学之外的各种理 论 要谈因果关系,必须先有先验的或理论 上的思考; ·例子:降雨量与农作物产量 2021/220 Hongfeng Peng Department of Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 6 回归与因果关系 • 回归分析研究一个变量对另一些变量的 依赖关系,但这并不一定意味着变量间 的因果关系。因为回归是一种统计关系, 而因果关系来自于统计学之外的各种理 论。 • 要谈因果关系,必须先有先验的或理论 上的思考; • 例子:降雨量与农作物产量
回归与相关 目的不同 相关分析是测度两个变量之间的线性关联度 回归分析是试图根据其他变量的设定值来估计或 预测某一变量的平均值。 变量之间的关系不同 相关分析中,两个变量是对称的,都是随机的 回归分析中,因变量是随机的,自变量是在重复 抽样中固定取值的。 2021/220 Hongfeng Peng Department of 7 Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 7 回归与相关 • 目的不同 – 相关分析是测度两个变量之间的线性关联度; – 回归分析是试图根据其他变量的设定值来估计或 预测某一变量的平均值。 • 变量之间的关系不同 – 相关分析中,两个变量是对称的,都是随机的 – 回归分析中,因变量是随机的,自变量是在重复 抽样中固定取值的
1.3数据类型 横截面数据( cross-sectional data) 个或多个变量在同一时点上收集的数据 时间序列数据( time series data) 变量在不同时间取值的一组观测值。 混合数据( pooled data) 不同时间的横截面数据的混合 混合数据中,最近流行的一类为面板数据( panel data) 特点:不同年份的横截面数据混合且每年样本点相同 2021/220 Hongfeng Peng Department of Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 8 1.3 数据类型 • 横截面数据(cross-sectional data) – 一个或多个变量在同一时点上收集的数据。 • 时间序列数据(time series data) – 变量在不同时间取值的一组观测值。 • 混合数据(pooled data) – 不同时间的横截面数据的混合 – 混合数据中,最近流行的一类为面板数据(panel data) • 特点:不同年份的横截面数据混合且每年样本点相同
14术语与符号 因变量:被解释变量、预测子、回归子 响应变量、被控变量、内生变量 自变量:解释变量、预测元、回归元 刺激变量、控制变量、外生变量 下标的使用惯例: 横截面数据一一i 时间序列数据 2021/220 Hongfeng Peng Department of 9 Finance, wuhan Univers ity
2021/2/20 Hongfeng Peng Department of Finance, Wuhan University 9 1.4 术语与符号 • 因变量:被解释变量、预测子、回归子、 响应变量、被控变量、内生变量 • 自变量:解释变量、预测元、回归元、 刺激变量、控制变量、外生变量 • 下标的使用惯例: – 横截面数据-- i – 时间序列数据-- t