正在加载图片...
mn D,keG dy) ∈G 即两类之间的距离等于两类最近样品之间的距离,这样定义类间距离的方法即称为最短距离 (二)、系统聚类最短距高法的步骤 例1.1980年北京农业大学在研究高营养玉米奥帕克-2杂交种(简称O2玉米杂交种) 中,对12个O2杂交种玉米和两个普通玉米杂交种(对照)共14个杂交种玉米观测了10 项指标,得观测数据如表9.。现在应用最短距离法对14个玉米杂交种进行分类。为了消除 指标量纲的影响,先对表91中的数据利用公式(93)和(94)进行离差标准化处理,然 后再进行分类,步骤如下 1.选择欧氏距离计算两两样品间的距离得初始距离阵D0如表9.2,由于是对称阵,所以 只列出是三角阵。这时的D=d即类GA与类G1间的距离为样品k与样品/间的距离 2.找出D0中最小的元素,设为D,则将G,与G,合并为一类,记作G,则类 G=,G},即类G中的样品就是类G与G中全部样品之和。表92中最小的元素为 1.98,它是2号与6号两品种间的距离,因此首先将这两类合并为一新类称为G15(因原来 14个样品自成为一类已有14类),且D15={G2,G6}={26} 3计算新类G与其它类G,的距离Dx,则有 min dg min dy Dnk∈G{= min,,k∈G}=mpn,D (912) 即在合并的两类中找出与其它类间的最短距离作为新类与其它类间的距离。这样将D中第 i、j行,第i、j列用上式合并成一新行新列,新行新列对应于Gn,这时所得距离矩阵记 作D1。公式(9.12)为计算新类G与原来类G的距离的递推公式。 本例即计算新类G15与G1、G3、G4、G5、G、Gn、G、G、G0、G1、G12 G13及类G14之间的距离。例如G5与G5的距离D355,根据最短距离法,应为d25与d6中 的较小者,而d23=3.04,d65=3.53,所以D53=3.04。G15与G1的距离D1sn应为d21与dDij =  kl  j i d l G k G   min (9.11) 即两类之间的距离等于两类最近样品之间的距离,这样定义类间距离的方法即称为最短距离 法。 (二)、系统聚类最短距离法的步骤 例 1. 1980 年北京农业大学在研究高营养玉米奥帕克-2 杂交种(简称 O2 玉米杂交种) 中,对 12 个 O2 杂交种玉米和两个普通玉米杂交种(对照)共 14 个杂交种玉米观测了 10 项指标,得观测数据如表 9.1。现在应用最短距离法对 14 个玉米杂交种进行分类。为了消除 指标量纲的影响,先对表 9.1 中的数据利用公式(9.3)和(9.4)进行离差标准化处理,然 后再进行分类,步骤如下: 1.选择欧氏距离计算两两样品间的距离得初始距离阵 D0 如表 9.2,由于是对称阵,所以 只列出是三角阵。这时的 DKL = dkl 即类 Gk 与类 Gl 间的距离为样品 k 与样品 l 间的距离。 2.找出 D0 中最小的元素,设为 Dij ,则将 Gi 与 Gj 合并为一类,记作 Gr ,则类 Gr = Gi ,G j ,即类 Gr 中的样品就是类 Gi 与 Gj 中全部样品之和。表 9.2 中最小的元素为 1.98,它是 2 号与 6 号两品种间的距离,因此首先将这两类合并为一新类称为 G15 (因原来 14 个样品自成为一类已有 14 类),且 D15 = G2 ,G6 = 2,6。 3.计算新类 Gr 与其它类 Gs 的距离 Drs ,则有 Drs =                =    s j kl s i kl kl s r l G k G d l G k G d d l G k G min , min min min = min Dis , Djs (9.12) 即在合并的两类中找出与其它类间的最短距离作为新类与其它类间的距离。这样将 D0 中第 i 、 j 行,第 i 、 j 列用上式合并成一新行新列,新行新列对应于 Gr ,这时所得距离矩阵记 作 D1。公式(9.12)为计算新类 Gr 与原来类 Gs 的距离的递推公式。 本例即计算新类 G15 与 G1、G3 、G4 、G5 、G6 、G7 、G8 、G9 、G10 、 G11、 G12 、 G13 及类 G14 之间的距离。例如 G15 与 G5 的距离 15 5 D , ,根据最短距离法,应为 d25 与 d65 中 的较小者,而 d25 =3.04,d65 =3.53,所以 15 5 D , =3.04。G15 与 G1 的距离 15 1 D , 应为 21 d 与 61 d
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有