正在加载图片...
3)计算未被作为聚类中心的各样本与Z1,Z2之间的距离,以其中的最小值作为该样本 的距离: d=|X-Z,j=12,取d=min[41d2]=1…N 4)若:d=maxd>T,则相应的样本X作为第三个聚类中心,Z3=X,然后转 5);否则,转6) 5)设存在k个聚类中心,计算未被作为聚类中心的各样本到各聚类中心的最小距离: d=min[d1…dk],然后寻找其中的最大值:d=maxd,如果d>T,则 Z1=X,转5);否则,转6); 6)按照最小距离原则,将所有样本分到个类别中。 例2.2-2 二、合并法(系统聚类法, Hierarchical Clustering Method) 系统聚类法的思路是首先以每一个样本自成一类,然后按照距离准则逐步合并,类别数由 多到少,直到达到合适的类别数为止。 这里,我们在合并两个类别时,需要依据类与类之间的距离度量,首先我们来定义类与 类之间的相似性度量。 1.最短距离法: 设只和9,是两个聚类,两类之间的距离定义为:D=mm((xyx)x为 类的第l个样本,X(为9,类的第k个样本。D为第9类中所有样本与第Ω2,类中所有样 本之间的最小值 2.最长距离法 与最短距离法相似,两类之间的距离定义:D=m((xx2),x为2类 的第l个样本,X为92,类的第k个样本。D为第9类中所有样本与第,类中所有样本 之间的最小值。 3.类平均距离法 两类之间的距离定义为:Dn=NN ∑d(x9,x),n和几分别为92、9,聚 类中的样本数。 系统聚类算法:设有X1X2,…XNN个样本待分类 第一步:建立N个初始类别,g20,g29)…Ω29,其中ΩP={X}。计算距离矩阵 D=(D),其中D,为g与99之间的距离:14 3) 计算未被作为聚类中心的各样本与 1 2 Z Z, 之间的距离,以其中的最小值作为该样本 的距离: , 1,2 ij i j d j = − = X Z ,取 d d d i N i i i = = min , , 1, ,  1 2  ; 4) 若: 1 max l i i N d d T   =  ,则相应的样本 Xl 作为第三个聚类中心, Z X 3 = l ,然后转 5);否则,转 6); 5) 设存在 k 个聚类中心,计算未被作为聚类中心的各样本到各聚类中心的最小距离: d d d i i ik = min , ,  1  ,然后寻找其中的最大值: 1 max l i i N d d   = ,如果 l d T  ,则 Z X k l +1 = ,转 5);否则,转 6); 6) 按照最小距离原则,将所有样本分到个类别中。 例 2.2-2 二、合并法(系统聚类法,Hierarchical Clustering Method) 系统聚类法的思路是首先以每一个样本自成一类,然后按照距离准则逐步合并,类别数由 多到少,直到达到合适的类别数为止。 这里,我们在合并两个类别时,需要依据类与类之间的距离度量,首先我们来定义类与 类之间的相似性度量。 1. 最短距离法: 设 i 和  j 是两个聚类,两类之间的距离定义为: ( ) ( ) min , ( ( )) i j D d ij l k = X X , (i) Xl 为 i 类的第 l 个样本, ( j) Xk 为  j 类的第 k 个样本。 Dij 为第 i 类中所有样本与第  j 类中所有样 本之间的最小值。 2. 最长距离法: 与最短距离法相似,两类之间的距离定义为: ( ) ( ) max , ( ( )) i j D d ij l k = X X , (i) Xl 为 i 类 的第 l 个样本, ( j) Xk 为  j 类的第 k 个样本。 Dij 为第 i 类中所有样本与第  j 类中所有样本 之间的最小值。 3. 类平均距离法: 两类之间的距离定义为: ( ) ( ) ( ) 1 2 , i j ij l k i j D d N N =  X X , i n 和 j n 分别为 i 、 j 聚 类中的样本数。 系统聚类算法:设有 1 2 , , , X X XN N 个样本待分类, 第一步:建立 N 个初始类别, (0 0 0 ) ( ) ( ) 1 2 , , ,   N ,其中 ( )   0  = i i X 。计算距离矩阵: ( ) ( ) 0 D = Dij ,其中 Dij 为 (0) i 与 (0) j 之间的距离;
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有