正在加载图片...
式。不过这里我们仍然对已有的有限数据进行分析 由于系数空间内不同的种有分离,可以用系数空间内的欧氏 距离 进行聚类分析 另外,我们考虑到式(1),即Δ-分析和a-A分析中 从每个标本的数据抽提得到的特征是一个定义在0,1上的连续函 数f1(x):[0,1→R(其中p为标本总编号),所以考虑用如下的 距离定义描述两个标本的几何差异: Haus dorff-Resicovtch Dimension dpq=l ifp(x)-fg(x)Idx 图六正态假设下推断的石松、真蕨两大类群的D总体分布 仍然沿用前图的颜色方案。可以看到,两推断总 (dr≥0(p,q; 体分布没有显著差异。 以上的dp满足(mdp=d学(YPq 人工神经网络分类器的分类分析 (md +d 2 dp(vp, q, r). 除了统计分析外,所得分类指标分离程度的好坏还能直观地 因此dp是严格意义上的距离函数 用诸如人工神经网络等学习算法在相同技术参数下用同一组数据 我们将由距离公式(6进行聚类分析的方法称为欧氏系数空 训练相同次数后的分类表现(成功率)来衡量。简单的神经网络间法(ESOC, Euclidean Space of Coefficients):将由距离公式 就可以完成我们所要进行的分类56。 (刁)计算的方法称为形状匹配法(SF, Shape-Fitting) 我们采用两层前传的简单网络,输入层具有与系数空间维数 图七是我们进行聚类分析的结果。我们用如下的符号: 相同数目的输入单元,隐藏层神经元数为固定值,输出层神经元 Iree(数据来源的分析方法,距离方法,构树方法) 数为3,也就是OU数目,代表三大类群。网络中所有神经元都来表征一个树谱图的参数和技术特征 是略有改动的 McCulloch-Pitt形式神经元。初始连接权重矩阵由 [01? 均匀分布的随机函数生成。用一种方法所得的所有系数列数据对 该网络进行训练,采用结合了模拟退火算法进行最速下降法求极 值的 Back-Propagation算法进行权重矩阵优化(具体的网络、算 法技术细节见附录八)。 对于1-i分析、△1-分析和△41-△分析,训练 次后,发现该网络在某些初始值下已能正确识别过半数的标本 而其它分离不充分的分析方法的训练效果不佳 结果与讨论 数量形态分类 从以上各种分析我们可以得出结论:现代蕨类植物三大类群 的孢子体维管轴几何形态发生具有可区分的差异。更进一步,我 们发现尤其与主茎轴有关的形态发生规律(4-i、L2-1和 Δ+41-L)差别显著性更高。此外,真蕨类中诸多种属也有分 离,但由于我们采集的数据有限,未能进行更细致的分类 对于我们提出的一种新的分析方式D分析,虽然没有发 现两大类群的D值显著差异,但某些迹象与我们的观察一致。比 如说,两种卷柏的D均值比真蕨D均值略大,实际上我们看到的 [01? 柏往往形态更细致复杂,因此其分维数大是不奇怪的。由此 我们认为,两大类群的D值总体是不同的总体,只是由于我们数 据量有限而无法发现其差别。当然,D值作为分类指标就不令人 满意了,因为它可能要求大规模样本,敏感性太低 更为细致的聚类分析 如果进一步深入到三大类群中的科属的几何形态分类,恐怕 我们得到的数据量不够:很多种只采过一个标本,无法通过平均 求得其在系数空间内较为准确的位置。但我们相信,如果数据量 足够的话,就很可能可以得到类群内更为精细的几何形态差别模图六 正态假设下推断的石松、真蕨两大类群的 D 总体分布 仍然沿用前图的颜色方案。可以看到,两推断总 体分布没有显著差异。 人工神经网络分类器的分类分析 除了统计分析外,所得分类指标分离程度的好坏还能直观地 用诸如人工神经网络等学习算法在相同技术参数下用同一组数据 训练相同次数后的分类表现(成功率)来衡量。简单的神经网络 就可以完成我们所要进行的分类[5, 6]。 我们采用两层前传的简单网络,输入层具有与系数空间维数 相同数目的输入单元,隐藏层神经元数为固定值,输出层神经元 数为 3,也就是 OTU 数目,代表三大类群。网络中所有神经元都 是略有改动的 McCulloch-Pitts 形式神经元。初始连接权重矩阵由 均匀分布的随机函数生成。用一种方法所得的所有系数列数据对 该网络进行训练,采用结合了模拟退火算法进行最速下降法求极 值的 Back-Propagation 算法进行权重矩阵优化(具体的网络、算 法技术细节见附录八)。 对于 分析、 分析和 分析,训练 一次后,发现该网络在某些初始值下已能正确识别过半数的标本; 而其它分离不充分的分析方法的训练效果不佳。 结果与讨论 数量形态分类 从以上各种分析我们可以得出结论:现代蕨类植物三大类群 的孢子体维管轴几何形态发生具有可区分的差异。更进一步,我 们发现尤其与主茎轴有关的形态发生规律( 、 和 )差别显著性更高。此外,真蕨类中诸多种属也有分 离,但由于我们采集的数据有限,未能进行更细致的分类。 对于我们提出的一种新的分析方式— — D 分析,虽然没有发 现两大类群的 D 值显著差异,但某些迹象与我们的观察一致。比 如说,两种卷柏的 D 均值比真蕨 D 均值略大,实际上我们看到的 卷柏往往形态更细致复杂,因此其分维数大是不奇怪的。由此, 我们认为,两大类群的 D 值总体是不同的总体,只是由于我们数 据量有限而无法发现其差别。当然,D 值作为分类指标就不令人 满意了,因为它可能要求大规模样本,敏感性太低。 更为细致的聚类分析 如果进一步深入到三大类群中的科属的几何形态分类,恐怕 我们得到的数据量不够:很多种只采过一个标本,无法通过平均 求得其在系数空间内较为准确的位置。但我们相信,如果数据量 足够的话,就很可能可以得到类群内更为精细的几何形态差别模 式。不过这里我们仍然对已有的有限数据进行分析。 由于系数空间内不同的种有分离,可以用系数空间内的欧氏 距离 (6) 进行聚类分析。 另外,我们考虑到式(1),即 分析和 分析中 从每个标本的数据抽提得到的特征是一个定义在[0, 1]上的连续函 数 (其中 p 为标本总编号),所以考虑用如下的 距离定义描述两个标本的几何差异: (7) 以上的 满足 (8) 因此 是严格意义上的距离函数。 我们将由距离公式(6)进行聚类分析的方法称为欧氏系数空 间法(ESOC,Euclidean Space of Coefficients);将由距离公式 (7)计算的方法称为形状匹配法(SF,Shape-Fitting)。 图七是我们进行聚类分析的结果。我们用如下的符号: Tree(数据来源的分析方法, 距离方法, 构树方法) 来表征一个树谱图的参数和技术特征
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有