正在加载图片...
Ala(A),Val(V,Leu(L,Ile(①),Met(M)疏水性,带支链白色 Phe (f), Tyr(Y), Trp(W) 疏水性,带苯环紫色 Pro(P), Gly(G) 侧链结构特殊棕色 Cys(C) 能形成二硫键 黄色 *表中采用的分组方法和用来区分不同组别的颜色与模型构件和三维图形软件 中所用方法一致 多序列比对程序的另一个重要用途是定量估计序列间的关系,并由此推断它们在进化 中的亲缘关系。可以通过计算完全匹配的残基数目或计算完全匹配残基和相似残基的数目得 到这种定量关系。这一方法除了可以大略了解序列间的亲缘关系外,也可用来评估比对质量 如果序列的相似性值低于预料值,那么有可能是序列间亲缘关系较远,也可能是比对中有错 误之处。 现有的软件包用的基本上是可用鼠标点击的窗口界面,其中序列编辑器位于窗口中央。 这样的软件包将在第十章中详细介绍。 在第79节中,我们将会看到,那些长度相仿且相似性程度较高的序列,采用自动比对 方法将会得到相当满意的结果;而当序列长度相差较大而相似性程度较低时,采用自动方法 得出的结果则不很理想。此时,手工序列编辑器就接显得十分有用。通过手工调整,可使结 果变得接近实际。此外,采用多种不同的方法进行分析,再将结果综合,是一种行之有效的 方法。为更好地理解多序列比对的原理和规则,应该尽可能学会手工比对的方法,并把比对 结果与计算机自动比对得到的结果加以比较 57同步法 同步法实质是把给定的所有序列同时进行比对,而不是两两比对或分组进行比对。其 基本思想是将一个二维的动态规划矩阵(见第6章)扩展到三维或多维。矩阵的维数反映了 参与比对的序列数。这类方法对于计算机的系统资源要求较高,通常是进行少量的较短的序 列的比对 58步进法 这类方法中最常用的就是 Clustal,它是由Feng和 Doolittle于1987年提出的(Feng和 Doolittle,1987)。由于对于实际的数据利用多维的动态规划矩阵来进行序列的比对不太现 实,因此大多数实用的多序列比对程序采用启发式算法,以降低运算复杂度。 Clustal的基 本思想是基于相似序列通常具有进化相关性这一假设。比对过程中,先对所有的序列进行两 两比对并计算它们的相似性分数值,然后根据相似性分数值将它们分成若干组,并在每组之 间进行比对,计算相似性分数值。根据相似性分数值继续分组比对,直到得到最终比对结果 比对过程中,相似性程度较高的序列先进行比对,而距离较远的序列添加在后面。作为程序 的一部分, Clusal可以输出用于构建进化树的数据。 Clustal程序有许多版本, Clustalw( Thompson等,194),根据对亲缘关系较近的序列 间空位情况,确定如何在亲缘关系较远的序列之间插入空位。同样,相似性较高的序列比对 结果中的残基突变信息,可用于改变某个特殊位置空位罚分值的大小,推测该位点的序列变 异性 Clustal是免费软件,很容易从互联网上下载,和其它软件一起,广泛用于序列分析 Clustal所支持的数据格式包括EMBL/ SWISSPROT、NBRF/PR、 Pearson/ FastA、 GCG/MSF, 以及 Clusia本身定义的格式。它的输出格式可以是 Clustal格式,也可以是可用于GDE、 Phylip、GCG等软件的格式 图7.1列出肾上腺素能糖蛋白偶连受体( G-protein d receptors,简称 GPCRs)序 列比对部分结果。比对采用缺省参数,输出格式采用GC 格式。这些序列具有高度的 相似性而且长度相仿,其结果十分理想。图中可以明显地看出有两个空位插入区域,一个是 由于两个A2AA受体相对其它序列有GPQ和GQQ三个残基的插入造成(图中上部分右侧);Ala (A), Val (V), Leu (L), Ile (I), Met (M) 疏水性,带支链 白色 Phe (F), Tyr (Y), Trp (W) 疏水性,带苯环 紫色 Pro (P), Gly (G) 侧链结构特殊 棕色 Cys (C) 能形成二硫键 黄色 * 表中采用的分组方法和用来区分不同组别的颜色与模型构件和三维图形软件 中所用方法一致 多序列比对程序的另一个重要用途是定量估计序列间的关系,并由此推断它们在进化 中的亲缘关系。可以通过计算完全匹配的残基数目或计算完全匹配残基和相似残基的数目得 到这种定量关系。这一方法除了可以大略了解序列间的亲缘关系外,也可用来评估比对质量。 如果序列的相似性值低于预料值,那么有可能是序列间亲缘关系较远,也可能是比对中有错 误之处。 现有的软件包用的基本上是可用鼠标点击的窗口界面,其中序列编辑器位于窗口中央。 这样的软件包将在第十章中详细介绍。 在第 7.9 节中,我们将会看到,那些长度相仿且相似性程度较高的序列,采用自动比对 方法将会得到相当满意的结果;而当序列长度相差较大而相似性程度较低时,采用自动方法 得出的结果则不很理想。此时,手工序列编辑器就接显得十分有用。通过手工调整,可使结 果变得接近实际。此外,采用多种不同的方法进行分析,再将结果综合,是一种行之有效的 方法。为更好地理解多序列比对的原理和规则,应该尽可能学会手工比对的方法,并把比对 结果与计算机自动比对得到的结果加以比较。 5.7 同步法 同步法实质是把给定的所有序列同时进行比对,而不是两两比对或分组进行比对。其 基本思想是将一个二维的动态规划矩阵(见第 6 章)扩展到三维或多维。矩阵的维数反映了 参与比对的序列数。这类方法对于计算机的系统资源要求较高,通常是进行少量的较短的序 列的比对。 5.8 步进法 这类方法中最常用的就是 Clustal,它是由 Feng 和 Doolittle 于 1987 年提出的(Feng 和 Doolittle,1987)。由于对于实际的数据利用多维的动态规划矩阵来进行序列的比对不太现 实,因此大多数实用的多序列比对程序采用启发式算法,以降低运算复杂度。Clustal 的基 本思想是基于相似序列通常具有进化相关性这一假设。比对过程中,先对所有的序列进行两 两比对并计算它们的相似性分数值,然后根据相似性分数值将它们分成若干组,并在每组之 间进行比对,计算相似性分数值。根据相似性分数值继续分组比对,直到得到最终比对结果。 比对过程中,相似性程度较高的序列先进行比对,而距离较远的序列添加在后面。作为程序 的一部分,Clusal 可以输出用于构建进化树的数据。 Clustal 程序有许多版本,ClustalW(Thompson 等,1994),根据对亲缘关系较近的序列 间空位情况,确定如何在亲缘关系较远的序列之间插入空位。同样,相似性较高的序列比对 结果中的残基突变信息,可用于改变某个特殊位置空位罚分值的大小,推测该位点的序列变 异性。 Clustal 是免费软件,很容易从互联网上下载,和其它软件一起,广泛用于序列分析。 Clustal 所支持的数据格式包括 EMBL/SWISSPROT、NBRF/PIR、Pearson/FastA、GCG/MSF, 以及 Clustal 本身定义的格式。它的输出格式可以是 Clustal 格式,也可以是可用于 GDE、 Phylip、GCG 等软件的格式。 图 7.1 列出肾上腺素能糖蛋白偶连受体(G-protein copupled receptors,简称 GPCRs)序 列比对部分结果。比对采用缺省参数,输出格式采用 GCG/MSF 格式。这些序列具有高度的 相似性而且长度相仿,其结果十分理想。图中可以明显地看出有两个空位插入区域,一个是 由于两个 A2AA 受体相对其它序列有 GPQ 和 GQQ 三个残基的插入造成(图中上部分右侧);
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有