第二章多元线性回归 multiple linear regression) 第一节相关和回归 第二节一元线性回归模型 第三节多元线性回归模型 第四节方程的解释能力 第五节回归方程的检验和回归系数的推断统计 第六节多重共线性及其解决方案 第七节虚拟变量的应用 第八节计算机应用 第九节研究实例 参见郭志刚主编,《社会统计分析方法SPSS软件应用》第二章, 中国人民大学出版社1999
第二章 多元线性回归 (multiple linear regression) 第一节 相关和回归 第二节 一元线性回归模型 第三节 多元线性回归模型 第四节 方程的解释能力 第五节 回归方程的检验和回归系数的推断统计 第六节 多重共线性及其解决方案 第七节 虚拟变量的应用 第八节 计算机应用 第九节 研究实例 参见郭志刚主编,《社会统计分析方法—SPSS软件应用》第二章, 中国人民大学出版社1999
第一节相关和回归 ■一、相关统计量 ■用一个数值表示两个变量间的相关程度 (无单位度量)(-1~+1)
第一节 相关和回归 ◼ 一、相关统计量 ◼ 用一个数值表示两个变量间的相关程度 (无单位度量)(-1~+1)
解读 X与y的相关系数为06,x与z的相关系数为 0.3
解读 ◼ X与y的相关系数为0.6,x与z的相关系数为 0.3
■答案: ■只能说明与y相关程度高于×与z的相关程 度,但不能说前者是后者的两倍
◼ 答案: ◼ 只能说明x与y相关程度高于x与z的相关程 度,但不能说前者是后者的两倍
二、计算相关的思路 定距:数量上的“共变” ■定类、定序:“连同发生”—隐含根据 个变量去预测或估计另一个变量的意思 ■人们正是根据预测的准确程度来界定定类或 定序变量之间的关系的消减误差比例
◼ 二、计算相关的思路 ◼ 定距:数量上的“共变” ◼ 定类、定序:“连同发生”——隐含根据一 个变量去预测或估计另一个变量的意思 ◼ 人们正是根据预测的准确程度来界定定类或 定序变量之间的关系的——消减误差比例
■三、相关测量逻辑展示 无法显示该图片 (一) Lambda相关测量法 基本逻辑:以一个定类变项的值来预测另一个定类变项 的值时,如果以众值作为预测准则,可以减少多少误差 ■公式: (对称) ∑m+∑m,-(M+M 2n-M+Mo (不对称2=EE2=m=M)n2m2mM E1 (不对称)2=E-E2=(m=M)(-∑m)∑m-M E1 M
◼ 三、相关测量逻辑展示 ◼ (一)Lambda相关测量法 ◼ 基本逻辑:以一个定类变项的值来预测另一个定类变项 的值时,如果以众值作为预测准则,可以减少多少误差 ◼ 公式: M m M M M m M m M M M m M M m m M M y y y x x x 1 1 2 x y y y y y y 1 1 2 y x y x y x y ( ) n ( ) ( ) ( ) n ( ) ( ) 2n ( ) − − = − − − − = − = − − = − − − − = − = − + + − + = n n n n n n E E E E E E (不对称) (不对称) ( ) ( ) 对称
练习:根据下表数据计算 Clambda 志愿 性别 男 女 数 快乐家庭 10 30 40 理想工作 40 10 50 增广见闻 10 0 10 总数 60 40 100
练习:根据下表数据计算lambda 志愿 性别 男 女 总数 快乐家庭 10 30 40 理想工作 40 10 50 增广见闻 10 0 10 总数 60 40 100
(不对称)2.=EE2 E (n-M)-(n-∑m) (n-M (100-50)-[100-(40+30)50-30 0.4 (100-50 50 (2) ∑m,M,(40+30)-5020 0.4 n-M (100-5050
0.4 50 20 (100 50) (40 30) 50 n (2) 0.4 50 50 30 (100 50) (100 50) [100 (40 30)] ( ) ( ) ( ) (1) M m M M M m y y y y y y 1 1 2 y = = − + − = − − = = − = − − − − + = − − − − = − = n n n E E E (不对称)
思考并运算:如果数据有如下变化 lambda值会发生什么变化呢? 志愿 性别 男 女 总数 快乐家庭 10 10 20 理想工作 40 30 70 增广见闻 10 0 10 总数 60 40 100
思考并运算:如果数据有如下变化, lambda值会发生什么变化呢? 志愿 性别 男 女 总数 快乐家庭 10 10 20 理想工作 40 30 70 增广见闻 10 0 10 总数 60 40 100
■存在的问题: 口1、 Lambda系数以众值为预测准则,不理 会众值以外的次数分布,对数据利用率低。 ■2、因为上述计算方式,如果全部众值集中 在条件次数表的同一列或同一行中,则 Lambda系数会等于0,相关失去意义
◼ 存在的问题: ◼ 1、Lambda系数以众值为预测准则,不理 会众值以外的次数分布,对数据利用率低。 ◼ 2、因为上述计算方式,如果全部众值集中 在条件次数表的同一列或同一行中,则 Lambda系数会等于0,相关失去意义