正在加载图片...
(4)第四步是计算因子值。因子值是各个因子在每个案例上的得分值,有了 因子值可以在其他的分析中使用这些因子 因子分析的目的是简化数据或者找出基本的数据结构,因此使用因子分析的 前提条件是观测变量之间应该有较强的相关关系。如果变量之间的相关程度很小 的话,他们不可能共享公因子。所以,计算出相关矩阵后,在进行下面的步骤之 前应该对相关矩阵进行检验,如果相关矩阵中的大部分相关系数都小于0.3,则 不适合做因子分析。SPSS软件提供了三个统计量帮助判断观测数据是否适合做 因子分析。 (1)反映象相关矩阵(Anti- image correlation matrix)。其元素等于负的偏相 关系数。偏相关是控制其他变量不变,一个自变量对因变量的独特解释作用。如 果数据中确实存在公因子,变量之间的偏相关系数应该很小,因为它与其他变量 重叠的解释影响被扣除掉了。所以如果反映象相关矩阵中很多元素的值比较大的 话,应该考虑该观测数据可能不适合做因子分析。 (2)巴特利特球体检验( Bartlett test of sphericity)。该统计量从检验整个相 关矩阵出发,其零假设为相关矩阵是单位阵,如果不能拒绝该假设的话,应该重 新考虑因子分析的使用。 (3)KMO( Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度。该测度 从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,其值的变化 范围从0到1。当所有变量之间的偏相关系数的平方和,远远小于简单相关系数 的平方和时,KMO值接近1,KMO值较小时,表明观测变量不适合做因子分 析。通常按以下标准解释该指标值的大小:0.9以上,非常好;0.8以上,好 0.7,一般:0.6,差:0.5,很差:0.5以下,不能接受① 例1·生育率的影响因素分析。生育率受社会、经济、文化、计划生育政策 等很多因素影响,但是这些因素对生育率的影响并不是完全独立的,而是交织在 起的,如果直接用选定的变量对生育率进行多元回归分析,最终结果往往只能 保留二三个变量,其他变量的信息就丢失了。因此,我们首先对自变量进行因子 分析,找岀基本的数据结构,用新生成的因子再对生育率进行分析。这样,一方 面克服了自变量之间高度相关的缺陷,另一方面,又保留了这些变量的信息 选择的变量有:人均国民收入、城镇人口比例、初中以上文化程度的人口比 例、多孩率、综合节育率。表3-2给出的是1990年中国30个省、自治区、直 Joseph F Hair, JR etc.(1995) Multivariate Data Analysis with Readings, +1h Edition. Prentice-Hall International, Inc,: 374
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有