定性数据的建模 列联表及列联表分析 对数线性模型的基本理论和方法 3 对数线性模型的SPSS实现 4 Logistic回归基本狸论和方法 5 LogistIc回归步骤以及SPSS实现
定性数据的建模 列联表及列联表分析 对数线性模型的基本理论和方法 对数线性模型的SPSS实现 Logistic回归基本理论和方法 Logistic回归步骤以及SPSS实现 ▪ 1 ▪ 2 ▪ 3 ▪ 4 ▪ 5
列联表及列联表分析 o研究两个属性变量之问是否有联糸 o研究步骤: 0通过问卷调查或统计资料获得属性 变量的信息 ②整理问卷或统计资料获得列联表教据 通过统计假设检验两个属性变量是 否具有独立性
列联表及列联表分析 研究两个属性变量之间是否有联系 研究步骤: 通过问卷调查或统计资料获得属性 变量的信息 整理问卷或统计资料获得列联表数据 通过统计假设检验两个属性变量是 否具有独立性
频数列联表 A B 合计 A1 ny 12 A2 22 A3 合计
频数列联表 A1 A B 合计 合计 A2 A3 B1 B2 11 n n12 21 n22 n 32 n 31 n n2• 1• n •2 n•1 n n3• n
女性人口学研究 婚姻结婚一次 教育 结婚多次 合计 大学 550 61 611 大学以下 681 144 825 合计 1231 205 1436
女性人口学研究 教育 婚姻 合计 合计 大学 大学以下 结婚一次 结婚多次 550 61 681 144 611 825 1231 205 1436
频率列联表 事件A1发生的概率 B B 合计 事件A与B同 时发生的概萃 BppP P12 21 22 ppp A3 PPp 合计 ●2 事件B,发生的概率
事件 发生的概率 A 事件 与 同 时发生的概率 频率列联表 A1 B1 A1 A1 B 合计 合计 A2 A3 B1 B2 11 p 12 p 21 p22 p p32 p31 p2• 1• p •2 p •1 p p3• 1 事件 B1 发生的概率
统计假设与检验 o零假设:属性变量A与B相互独立 ○检验统计量及其分布:n足够大 x2=n2∑ (Pn-p,P.,) x2[(-1)J-1) O决策规则: C 对给定的显著性水干,若 x2>2[(-1)J-1) 则拒绝委假设 xn[(-1)(J-1)
统计假设与检验 零假设:属性变量A与B相互独立 检验统计量及其分布:n足够大 ~ 决策规则: 对给定的显著性水平 , 若 则拒绝零假设. = = • • − • • = I i J j i j ij i j p p p p p n 1 1 2 2 ( ) [( 1)( 1)] 2 I − J − [( 1)( 1)] 2 2 I − J − [( 1)( 1)] 2 I − J −
检验统计量的计算 (P-P,P,)2、(mn-nn.,/m)2 (550-1231×611/436)2,(61-205×611436)2 1231×611/1436 205×611/1436 (681-1231×825/1436)2(144-205×825/1436)2 1231×825/1436 205×825/1436
检验统计量的计算 = = • • • • = = • • • • − = − = I i J j i j i j i j I i J j i j i j i j n n n n n n n p p p p p n 1 1 2 1 1 2 2 ( ) ( ) 205 825 1436 (144 205 825 1436) 1231 825 1436 (681 1231 825 1436) 205 611 1436 (61 205 611 1436) 1231 611 1436 (550 1231 611 1436) 2 2 2 2 − + − + − + − =
o委假设:婚姻状态与教育水平没有关糸 ○检验统计量及其分布:n足够大 /n) x=∑∠ 16.01 o决策规则:对给定的显著性水平0.05 16.01>x05(1)=384 则拒绝季假设,即婚姻状态与教育水平 有关联
零假设:婚姻状态与教育水平没有关系 检验统计量及其分布:n足够大 决策规则:对给定的显著性水平0.05 则拒绝零假设,即婚姻状态与教育水平 有关联. 16.01 (1) 3.84 2 0.0 5 2 = = 16.01 ( ) 2 1 2 1 2 2 = − == = • • • • i j i j i j i j n n n n n n n
对数线性模型的基本理论和方法 o研究两个属性变量之间的关联方式 o研究方法:双因素方差分析
对数线性模型的基本理论和方法 研究两个属性变量之间的关联方式 研究方法:双因素方差分析
频率的分解 频率对数表 A B 均值 12 71 22 ● 32 均值 7 ●2 7
频率的分解 A A1 B 均值 均值 A2 A3 B1 B2 11 12 21 22 32 31 2• 1• •1 •2 3• •• 频率对数表 ( ln ) ij = pij