第七章对应分析
zf 第七章 对应分析
对应分析的重点 令1、什么是对应分析? 令2、理解对应分析的基本思想 3、对应分析的基本步骤 ◆4、结合SPSS软件进行案例分析 2021/2/22 2 cxt
2021/2/22 2 cxt 对应分析的重点 ❖ 1、什么是对应分析? ❖ 2、理解对应分析的基本思想 ❖ 3、对应分析的基本步骤 ❖ 4、结合SPSS软件进行案例分析
7.1交叉列联表 描述属性变量(定类或定序尺度变量)的各种状态 或是相关关系。 例:研讨患肺癌与吸烟是否有关? 是否吸烟 是否 吸烟不吸烟合计 患肺癌 患肺癌 60 63 未患肺癌 32 43 计 92 14 106 2021/2/22
2021/2/22 3 cxt 7.1 交叉列联表 描述属性变量(定类或定序尺度变量)的各种状态 或是相关关系。 例:研讨患肺癌与吸烟是否有关? 是否吸烟 是 否 患肺癌 吸 烟 不吸烟 合 计 患肺癌 6 0 3 6 3 未患肺癌 3 2 1 1 4 3 合 计 9 2 1 4 106
口当属性变量A和B的状态较多时,很难透过列联表作出 判断 口怎样简化列联表的结构? 利用降维的思想。如因子分析和主成分分析。但因子分 析的缺陷是在于无法同时进行R型因子分析和Q型因子 分析。 口怎么办? 2021/2/22 4 cxt
2021/2/22 4 cxt 当属性变量A和B的状态较多时,很难透过列联表作出 判断。 怎样简化列联表的结构? 利用降维的思想。如因子分析和主成分分析。但因子分 析的缺陷是在于无法同时进行R型因子分析和Q型因子 分析。 怎么办?
**7.2对应分析的基本理论 令1、什么是对应分析? 对应分析是利用“降维”的方法,以两变量的交叉 列联表为研究对象,通过图形的方式,直接揭示变量之 间以及变量的不同类别之间的联系,特别适合于多分类 属性变量研究的一种多元统计分析方法。 冷2、对应分析的基本思想: 首先,编制两品质型变量的交叉列联表,将交叉列联表中的每个数据 单元看成两变量在相应类别上的对应点; 然后,对应分析将变量及变量之间的联系同时反映在一张二维或 三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点 较分散; 最后,通过观察对应分布图就能直观地把握变量类别之间的联 系 2021/2/22 5 cxt
2021/2/22 5 cxt ***7.2 对应分析的基本理论 ❖ 1、什么是对应分析? 对应分析是利用“降维”的方法,以两变量的交叉 列联表为研究对象,通过图形的方式,直接揭示变量之 间以及变量的不同类别之间的联系,特别适合于多分类 属性变量研究的一种多元统计分析方法。 ❖ 2、对应分析的基本思想: 首先,编制两品质型变量的交叉列联表,将交叉列联表中的每个数据 单元看成两变量在相应类别上的对应点; 然后,对应分析将变量及变量之间的联系同时反映在一张二维或 三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点 较分散; 最后,通过观察对应分布图就能直观地把握变量类别之间的联 系.
今3、对应分析的一大特点: 可以在一张二维图上同时表示出两类属性变量的各种状 态,以直观描述原始数据结构。 中对应分析的关键问题是: ●如何将多个类别点表示在低维空间中,以便于直接观察 如何确定各类别点的坐标,以易于鉴别类别间联系的强弱 2021/2/22 6 cxt
2021/2/22 6 cxt ❖ 3、对应分析的一大特点: 可以在一张二维图上同时表示出两类属性变量的各种状 态,以直观描述原始数据结构。 ❖ 对应分析的关键问题是: ⚫ 如何将多个类别点表示在低维空间中,以便于直接观察 ⚫ 如何确定各类别点的坐标,以易于鉴别类别间联系的强弱
7.3对应分析的基本步骤 ◆1、编制交叉列联表并计算概率矩阵P ◇2、根据P矩阵确定数据点坐标 ◇3、行变量和列变量的分类降维处理 2021/2/22 cxt
2021/2/22 7 cxt 7.3对应分析的基本步骤 ❖ 1、编制交叉列联表并计算概率矩阵P ❖ 2、根据P矩阵确定数据点坐标 ❖ 3、行变量和列变量的分类降维处理
7.4对应分析的基本操作和案例 ◆1、对应分析的基本操作: 2021/2/22 8
2021/2/22 8 cxt 7.4 对应分析的基本操作和案例 ❖ 1、对应分析的基本操作:
第8章典型相关分析 2021/2/22
2021/2/22 9 cxt 第8章 典型相关分析
口现实中:如鸡蛋、猪肉的价格(作为第一组变量)和 相应产品的销量(第二组变量)有相关关系。如投资性 变量(劳力投入、财力投入、固定资产投资等)与国民 收入(工农业收入、建筑业收入、等)具有相关关系。 口如何研究两组变量之间的相关关系? 设两组变量用X1X2…以及Y1Y2…Yp表示。 (1)分别研究X和Y之间的相关关系,列出相关系数表。 其缺陷:当两组变量较多时,处理较烦琐,不易抓住问 题的实质。(2)果用主成分分析的方法,每组变量分 别提取主成分,再通过主成分之间的关系反映两组变量 之间的关系。 2021/2/22 10 cxt
2021/2/22 10 cxt 现实中: 如鸡蛋、猪肉的价格(作为第一组变量)和 相应产品的销量(第二组变量)有相关关系。如投资性 变量(劳力投入、财力投入、固定资产投资等)与国民 收入(工农业收入、建筑业收入、等)具有相关关系。 如何研究两组变量之间的相关关系? 设两组变量用X1 ,X2….,XP以及Y1 ,Y2…YP表示。 (1)分别研究Xi和Yj之间的相关关系,列出相关系数表。 其缺陷:当两组变量较多时,处理较烦琐,不易抓住问 题的实质。(2)采用主成分分析的方法,每组变量分 别提取主成分,再通过主成分之间的关系反映两组变量 之间的关系