第二章多元线性回归 multiple linear regression) 第一节相关和回归 第二节一元线性回归模型 第三节多元线性回归模型 第四节方程的解释能力 第五节回归方程的检验和回归系数的推断统计 第六节虚拟变量的应用 第七节多重共线性及其解决方案 第八节计算机应用 第九节研究实例 参见郭志刚主编,《社会统计分析方法_SPS9件应用》第二章, 中国人民大学出版社1999
第二章 多元线性回归 (multiple linear regression) 第一节 相关和回归 第二节 一元线性回归模型 第三节 多元线性回归模型 第四节 方程的解释能力 第五节 回归方程的检验和回归系数的推断统计 第六节 虚拟变量的应用 第七节 多重共线性及其解决方案 第八节 计算机应用 第九节 研究实例 参见郭志刚主编,《社会统计分析方法—SPSS软件应用》第二章, 中国人民大学出版社1999
第一节相关和回归 相关统计量 ■用一个数值表示两个变量间的相关程度 (无单位度量)(-1~+1)
第一节 相关和回归 ◼ 一、相关统计量 ◼ 用一个数值表示两个变量间的相关程度 (无单位度量)(-1~+1)
解读 ■X与y的相关系数为0.6,x与z的相关系数为 0.3
解读 ◼ X与y的相关系数为0.6,x与z的相关系数为 0.3
■答案: ■只能说明ⅹ与y相关程度高于ⅹ与z的相关程 度,但不能说前者是后者的两倍
◼ 答案: ◼ 只能说明x与y相关程度高于x与z的相关程 度,但不能说前者是后者的两倍
二、计算相关的思路 ■定距:数量上的“共变” 定类、定序:“连同发生”—隐含根据一 个变量去预测或估计另一个变量的意思 ■人们正是根据预测的准确程度来界定定类或 定序变量之间的关系的消减误差比例
◼ 二、计算相关的思路 ◼ 定距:数量上的“共变” ◼ 定类、定序:“连同发生”——隐含根据一 个变量去预测或估计另一个变量的意思 ◼ 人们正是根据预测的准确程度来界定定类或 定序变量之间的关系的——消减误差比例
■三、相关测量逻辑展示 无法显示该图片 (一) Lambda相关测量法 ■基本逻辑:以一个定类变项的值来预测另一个定类变项 的值时,如果以众值作为预测准则,可以减少多少误差 公式: (对称)= ∠m+∑m-M+M 2nM+M (不对称2E1-E2=(n-M)-(-2m)2mM E (n (不对称)2=E1E2=(-M)(∑m)∑m-M E n-M
◼ 三、相关测量逻辑展示 ◼ (一)Lambda相关测量法 ◼ 基本逻辑:以一个定类变项的值来预测另一个定类变项 的值时,如果以众值作为预测准则,可以减少多少误差 ◼ 公式: M m M M M m M m M M M m M M m m M M y y y x x x 1 1 2 x y y y y y y 1 1 2 y x y x y x y ( ) n ( ) ( ) ( ) n ( ) ( ) 2n ( ) − − = − − − − = − = − − = − − − − = − = − + + − + = n n n n n n E E E E E E (不对称) (不对称) ( ) ( ) 对称
练习:根据下表数据计算| ambda 志愿 性别 男 女 总数 快乐家庭 10 30 40 理想工作 40 10 50 增广见闻 10 0 10 总数 60 40 100
练习:根据下表数据计算lambda 志愿 性别 男 女 总数 快乐家庭 10 30 40 理想工作 40 10 50 增广见闻 10 0 10 总数 60 40 100
(不对称)2=E-E2 El (n-M)-(n-∑m) (n-M (100-50)-[100-(40+30]50-30 =0.4 (100-50) 50 (2)=2m,-My (40+30)-5020 0.4 n-M (100-50)50
0.4 50 20 (100 50) (40 30) 50 n (2) 0.4 50 50 30 (100 50) (100 50) [100 (40 30)] ( ) ( ) ( ) (1) M m M M M m y y y y y y 1 1 2 y = = − + − = − − = = − = − − − − + = − − − − = − = n n n E E E (不对称)
思考并运算:如果数据有如下变化, lambda值会发生什么变化呢? 志愿 性别 男 女 总数 快乐家庭 10 10 20 理想工作 40 30 70 增广见闻 10 0 10 总数 60 40 100
思考并运算:如果数据有如下变化, lambda值会发生什么变化呢? 志愿 性别 男 女 总数 快乐家庭 10 10 20 理想工作 40 30 70 增广见闻 10 0 10 总数 60 40 100
■存在的问题: ■1、 Lambda系数以众值为预测准则,不理 会众值以外的次数分布,对数据利用率低 2、因为上述计算方式,如果全部众值集中 在条件次数表的同一列或同一行中,则 Lambda系数会等于0,相关失去意义
◼ 存在的问题: ◼ 1、Lambda系数以众值为预测准则,不理 会众值以外的次数分布,对数据利用率低。 ◼ 2、因为上述计算方式,如果全部众值集中 在条件次数表的同一列或同一行中,则 Lambda系数会等于0,相关失去意义