正在加载图片...
分析。 例1研究的背景情况是,中国几千年社会发展中形成了重男轻女的旧风俗, 并且认为只有儿子才能延续家系香火。这一点在计划生育工作中感觉十分深刻 现在的研究任务是,根据调查数据检验这种情况是否在事实上存在,并定量描述 育龄夫妇所生育的第一个孩子的性别对后续生育决策的影响。例1涉及两个分类 变量,第一个是已经生育了一个孩子的父母是否领取独生子女证。我们将领取独 生子女证(编码为1)作为已经决定不再生育的标识,而未领取独生子女证(编 码为2)则标志着尚未决定停止生育或已经决定继续生育第二个变量是第一次 生育的孩子的性别,男孩编码为1,女孩编码为2。 表7-1 例1观测频数交互表 观测频数 B.初育孩子的性别 1.男孩2.女孩行合计 领证 212 365 2.未领证156 144 400 是否领取独生子女证列合计 367 总计:765 本来按照我们的研究目的,初育孩子的性别应该明确作为自变量,是否领证 应明确作为因变量。但是,对数线性模型本身实际上并不是对变量值的分析,而 是对交互频数的分析,因此就其本来意义是没有因变量、自变量之分的。在对数 线性模型中所有变量都称为因素( factor)。所以,在例1的观测频数交互表中用 A和B来标注这两个因素。另外,在对数线性模型的公式标注上用不同英文字母 表示因素也比较明确和方便。尽管对于变量的称谓不同,标注方式不同,但完全 不妨碍研究中有隐含的因果假设,也不妨碍开展因果分析。实际上,当我们明确 提出因果假设以后,对数线性模型反而可以更为简化和明确化。当然,这些内容 都要放在读者充分理解对数线性模型的基本形式和基本性质以后再加以介绍。 例1观测频数交互表(表7-1)是一个标准格式的二维交互表。中间全封 闭的四个方格中即为观测的交互频数,其他开放方格中是因素编码标注或是各种 合计。比如,第一个孩子是女孩而又领取了独生子女证的有153对夫妇,而第 个孩子是女孩未领证的有214对。于是,合计为367对夫妇有女孩。另外,加上 有男孩的夫妇合计398对,共计为765对夫妇。同样,这一样本规模可以从领证 合计加上未领证合计计算出来 应该指出,频数交互表并不是原始数据的简单罗列,而是原始数据经过初步汇 总加工的结果。我们把这些具体操作问题先放在一边,直接从交互表数据来建立
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有