正在加载图片...
表4-5 原始数据2 受教育年限 年收入 年收入 案例 (年) (万元) (元) 20000 B 16 1.5 15000 10000 表4-6 变量取不同单位时的距离测度比较 距离 (万元) (元) A-B 6.02 5000 10000 10.01 000 为了克服变量测量单位的影响,在计算相似测度之前,一般对变量要做标准 化处理,通常是把变量变成均值为零、方差为1的标准化变量。常用的聚类分析 软件中都有这项功能,可以自动完成。 聚类方法 有很多种聚类方法,应用最广泛的有两类:层次聚类法( Hierarchical Cl Procedures)和迭代聚类法( Iterative Partitioning Procedures)。下面我们对每 类方法分别加以介绍。 1.层次聚类法 有两种层次聚类法:聚集法( Agglomerative Method)和分解法( Divisive Method)。聚集法是首先把每个案例各自看成一类,先把距离最近的两类合并 然后重新计算类与类之间的距离,再把距离最近的两类合并,每一步减少一类, 这个过程一直持续到所有的案例归为一类为止。分解法和聚集法的过程相反,首 先把所有的案例归为一类,然后把最不相似的案例分为两类,每一步增加一类, 直到每个案例都自成一类为止。分解法和聚集法相似,只是过程相反。所以,这 125
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有