正在加载图片...
基于单个同源基因差异构建的系统发生树称为基因树( gene tree,这比称作物种树 ( species tree)更为合理。因为这种树代表的仅仅是单个基因的进化历史,而不是它所在物 种的进化历史。物种树一般最好是通过综合多个基因数据的分析结果而产生。基因树和物种 树之间的差异是很重要的,例如,假设只用HLA的等位基因来构建物种树,许多人将与大 猩猩分在一起,而不是和其他人分在一起。 813距高和特征 用于构建系统发生树的分子数据分成两类:(1)距离( distances)数据,常用距离矩 阵描述,表示两个数据集之间所有两两差异:(2)特征( characters数据,表示分子所具有 的特征 分子系统发生分析的目的是探讨物种之间的进化关系,其分析的对象往往是一组同源的 序列。这些序列取自于不同生物基因组的共同位点。序列比对是进行同源分析的一种基本手 段,是进行系统发生分析的基础,一般采用基于两两比对渐进的多重序列比对方法,如 Clustalw程序。通过序列的比对,可以分析序列之间的差异,计算序列之间的距离。 无论是DNA序列,还是蛋白质序列,都是由特定字母表中的字符组成的。计算序列之 间距离的一个前提条件是要有一个字符替换模型,替换模型影响序列多重比对的结果,影响 系统发生树的构造结果。在具体的分析过程中,需要选择一个合理的字符替换模型,参见第 3章的各种打分模型或代价、距离模型 距离(或者相似度)是反映序列之间关系的一种度量,是建立系统发生树时所常用的 类数据。在计算距离之前,首先进行序列比对,然后累加每个比对位置的得分。可以应用第 3章介绍的关于序列比较方法,直接计算序列之间的距离。如果在进行序列比较时使用的是 打分函数或相似性度量函数,则需要将相似度(或者得分)转换成距离。令S(ij是序列 和序列j各个比对位置得分的加权和,一种归一化的距离计算公式为 d(,)=1-、(a,0-s,(3 (6-1) Sa(2,-S,(,基于单个同源基因差异构建的系统发生树称为基因树(gene tree),这比称作物种树 (species tree)更为合理。因为这种树代表的仅仅是单个基因的进化历史,而不是它所在物 种的进化历史。物种树一般最好是通过综合多个基因数据的分析结果而产生。基因树和物种 树之间的差异是很重要的,例如,假设只用 HLA 的等位基因来构建物种树,许多人将与大 猩猩分在一起,而不是和其他人分在一起。 8.1.3 距离和特征 用于构建系统发生树的分子数据分成两类:(1)距离(distances)数据,常用距离矩 阵描述,表示两个数据集之间所有两两差异;(2)特征(characters)数据,表示分子所具有 的特征。 分子系统发生分析的目的是探讨物种之间的进化关系,其分析的对象往往是一组同源的 序列。这些序列取自于不同生物基因组的共同位点。序列比对是进行同源分析的一种基本手 段,是进行系统发生分析的基础,一般采用基于两两比对渐进的多重序列比对方法,如 ClustalW 程序。通过序列的比对,可以分析序列之间的差异,计算序列之间的距离。 无论是 DNA 序列,还是蛋白质序列,都是由特定字母表中的字符组成的。计算序列之 间距离的一个前提条件是要有一个字符替换模型,替换模型影响序列多重比对的结果,影响 系统发生树的构造结果。在具体的分析过程中,需要选择一个合理的字符替换模型,参见第 3 章的各种打分模型或代价、距离模型。 距离(或者相似度)是反映序列之间关系的一种度量,是建立系统发生树时所常用的一 类数据。在计算距离之前,首先进行序列比对,然后累加每个比对位置的得分。可以应用第 3 章介绍的关于序列比较方法,直接计算序列之间的距离。如果在进行序列比较时使用的是 打分函数或相似性度量函数,则需要将相似度(或者得分)转换成距离。令 S(i,j)是序列 i 和序列 j 各个比对位置得分的加权和,一种归一化的距离计算公式为:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有