正在加载图片...
有以下几条①: (1)e与任何一个自变量x都不相关,并且它的平均数为0。 (2)关于e的另一个假设是,对应不同自变量值x;的各e;有不变的方差, (3)关于e;还有一假设是,在各个观测自变量点x;上的误差e之间无关。 (4)最后一个假设条件是,c;是正态分布的。 以上的前三个假设经常被称为高斯一马尔可夫假设条件,因为它们即为高 斯一马尔可夫定理中的条件。这个定理说明,在这一套假设条件下,OLS估计 即为对于y的所有线性无偏估计中是最好的,即最有效( efficient),或者说具 有最小的抽样方差,被称为BLUE,以代表最佳的线性无偏估计( the best linear, unbiased estimator)②。其中,假设(2)和假设(3)通常分别被称为“一 致分布”( homoscedasticity和“序列独立”( series independent)。 加上第4个假设条件后,那么回归系数的估计bk就是正态分布的。b的抽 样方差可以计算,并且它们的分布已知。由此,可做假设检验,可建立置信区 间,以及其他统计推断工作。 当以虚拟编码的二分定性变量(即变量只能取值为0和1)为因变量的常规 回归时,OLS估计就开始产生问题了。 OLS回归模型不限制自变量的取值,只限制它们之间不能是其他的线性组 合。它们可以为连续的间距等级(如一个公司的净利润),也可以只取正值或零 值(如一个党所得到的选票比例),也可以是整数(如某个家庭的子女数),也可 以是虚拟变量(如男性赋值1.女性赋值0)。既然对α和b以及e都没有限制, 那么当然对因变量y便不存在限制。y可以从负无穷至正无穷中自由选择任何 值。但是如果在实际观察中,只允许y取两个值(如0和1),那么关于因变量 是连续的这一基本假设便十分严重地违反了,这应该引起我们特别的注意。 如果因变量y只能取两个观测值,那么在其他不变的情况下,对于任何给 定的xo值,c0本身只能取得两个值。为了简明,仅以简单OLS回归为例。令 本章中,小写英文字母代表样本统计量( sample statistic),大写英文字母代表总体参 数( population parameter)。参见 Moscr CA. and Graham Kalton(1979) Survey Methods in So cial Investigation, Second Edition. London: Heinemann Educational books 这两个概念是与抽样调查相联系的.而我们一般则是通过抽样统计来推断总体参数。 e DE Ardrich and Nelson(1984)Linear Probability, Logit and Probit Models. sage Publ cation
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有