正在加载图片...
相似的归为其他类。直到把所有的样品(或指标)聚合完毕 令相似样本或指标的集合称为类。 聚类分析的类型有: 对样本分类,称为Q型聚类分析 对变量分类,称为R型聚类分析 Q型聚类是对样本进行聚类,它使具有相似性特征的样本聚集在一起,使差异性大的 样本分高开来 R型聚类是对变量进行聚类,它使具有相似性的变量豪集在一起,差异性大的变量分 高开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数, 达到变量降维的目的。 2、聚类分析的方法: 系统聚类(层次聚类 非系统聚类(非层次聚类) 系统聚类法包括:凝聚方式聚类、分解方式聚类 令非系统聚类法包括:模糊聚类法、K一均值法(快速聚类法)等等 常用距离 (1)、明考夫斯基距离( Minkowski distance) 明氏距离有三种特殊形式 (1a)、绝对距离( Block距离):当q=1时 d(1)=∑|xk-xk (1b)欧氏距离( Euclidean distance):q=2时 k k=1 (1c)切比雪夫距离当a=∞时 d, (oo)=maxlxik-xjkl ◆当各变量的单位不同或测量值范围相差很大时,不应直接采用明氏距离,而应先对 各变量的数据作标准化处理然后用标准化后的数据计算距离常用的标准化处理: i=1,2, j=1,2,…,p 其中x x为第j个变量的样本均值 为第j个变量的样本方差。 6/136/13 相似的归为其他类。直到把所有的样品(或指标)聚合完毕. ❖ 相似样本或指标的集合称为类。 ❖ 1、聚类分析的类型有: 对样本分类,称为 Q 型聚类分析 对变量分类,称为 R 型聚类分析 Q 型聚类是对样本进行聚类,它使具有相似性特征的样本聚集在一起,使差异性大的 样本分离开来。 R 型聚类是对变量进行聚类,它使具有相似性的变量聚集在一起,差异性大的变量分 离开来,可在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数, 达到变量降维的目的。 ❖ 2、聚类分析的方法: 系统聚类(层次聚类) 非系统聚类(非层次聚类) ❖ 系统聚类法包括:凝聚方式聚类、分解方式聚类 ❖ 非系统聚类法包括:模糊聚类法、K-均值法(快速聚类法)等等 ❖ 常用距离: (1)、明考夫斯基距离(Minkowski distance) 明氏距离有三种特殊形式: (1a)、绝对距离(Block 距离):当 q=1 时 (1b)欧氏距离(Euclidean distance):当 q=2 时 (1c)切比雪夫距离:当 时 ik jk k p ij d  = x − x 1  ( ) max ❖ 当各变量的单位不同或测量值范围相差很大时,不应直接采用明氏距离,而应先对 各变量的数据作标准化处理,然后用标准化后的数据计算距离。常用的标准化处理: 其中 为第 j 个变量的样本均值; 为第 j 个变量的样本方差。 g p k g ij ik jk d x x 1 1 ( | | ) = = − ( ) = = − p k dij xik xjk 1 1 ( ) 2 1 1 2 2 ( )       =  − = p k ij i k j k d x x q = * 1,2, , 1,2, , ij j ij jj x x x i n j p s − − = = = 1 1 n j ij i x x n − = =  2 1 1 ( ) 1 n jj ij j i s x x n − = = − − 
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有