有以下几条①: (1)e与任何一个自变量x都不相关,并且它的平均数为0。

点击下载：21世纪社会学系列教材：《高等SPSS》教学资源（PDF电子书）第六章 logistic回归

正在加载图片...

有以下几条①: (1)e与任何一个自变量x都不相关,并且它的平均数为0。 (2)关于e的另一个假设是,对应不同自变量值x;的各e;有不变的方差, (3)关于e;还有一假设是,在各个观测自变量点x;上的误差e之间无关。 (4)最后一个假设条件是,c;是正态分布的。以上的前三个假设经常被称为高斯一马尔可夫假设条件,因为它们即为高斯一马尔可夫定理中的条件。这个定理说明,在这一套假设条件下,OLS估计即为对于y的所有线性无偏估计中是最好的,即最有效( efficient),或者说具有最小的抽样方差,被称为BLUE,以代表最佳的线性无偏估计( the best linear, unbiased estimator)②。其中,假设(2)和假设(3)通常分别被称为“一致分布”( homoscedasticity和“序列独立”( series independent)。加上第4个假设条件后,那么回归系数的估计bk就是正态分布的。b的抽样方差可以计算,并且它们的分布已知。由此,可做假设检验,可建立置信区间,以及其他统计推断工作。当以虚拟编码的二分定性变量(即变量只能取值为0和1)为因变量的常规回归时,OLS估计就开始产生问题了。 OLS回归模型不限制自变量的取值,只限制它们之间不能是其他的线性组合。它们可以为连续的间距等级(如一个公司的净利润),也可以只取正值或零值(如一个党所得到的选票比例),也可以是整数(如某个家庭的子女数),也可以是虚拟变量(如男性赋值1.女性赋值0)。既然对α和b以及e都没有限制, 那么当然对因变量y便不存在限制。y可以从负无穷至正无穷中自由选择任何值。但是如果在实际观察中,只允许y取两个值(如0和1),那么关于因变量是连续的这一基本假设便十分严重地违反了,这应该引起我们特别的注意。如果因变量y只能取两个观测值,那么在其他不变的情况下,对于任何给定的xo值,c0本身只能取得两个值。为了简明,仅以简单OLS回归为例。令本章中,小写英文字母代表样本统计量( sample statistic),大写英文字母代表总体参数( population parameter)。参见 Moscr CA. and Graham Kalton(1979) Survey Methods in So cial Investigation, Second Edition. London: Heinemann Educational books 这两个概念是与抽样调查相联系的.而我们一般则是通过抽样统计来推断总体参数。 e DE Ardrich and Nelson(1984)Linear Probability, Logit and Probit Models. sage Publ cation

<<向上翻页向下翻页>>

点击下载：21世纪社会学系列教材：《高等SPSS》教学资源（PDF电子书）第六章 logistic回归