正在加载图片...
自动比对方法而可能产生的错误。下一章将详细介绍如何利用多序列比对的产生的信息来描 述基因家族的特性,并继续探讨手工方法和自动方法的优劣性。 511本章小结 对一个基因家族成组序列的分析需要高清该基因家族不同成员之间的关系 多序列分析可用来揭示基因家族的保守性 ◇◆与双序列比对一样,多序列比对基于某个模型。比对结果没有绝对正确或绝 对错误之分,而只能说比对模型是否可以比较准确地反映了生物数据的特性 基于序列和基于结构的序列比对模型都不够完善,因为两者都不能完全反映 所有层次的生物学信息。这两种方法各自有一定的应用范围,两者都非万应灵药。 ◇今多序列比对可以看作一张二维表,表中每一行代表一个序列,每一列代表 个残基的位置。比对前残基在序列中的位置为绝对位置,而比对后残基在序列中的 位置称相对位置 ◇◆多序列比对所需要的时间随序列个数增加而指数增长。不少多序列比对程序 采用启发式算法以降低计算复杂性,并得到并非最优但却较好的结果。 ◇◇手动比对经常被认为带有主观性,但计算机自动比对结果几乎都需要手工调 整。序列编辑程序是必不可少的工具。 对所有序列同时进行比对的计算量极大,因此只能用于不长的序列片段。 ◇今步进式多序列比对方法根据亲源树的分支对序列两两比对。相似性程度高的 先比对,相似性程度低的后加入。通过分析可能的进化关系,这种方法可以处理一 定规模的数据量 ◇◆从互联网上可供使用的数据库很多,其中有些由计算机程序自动产生,有 经过人工处理 ☆ 使用由程序自动比对产生的数据库时应注意,特别是当序列的相似性程度较 低的情况下更需谨慎,因为这些比对结果中有大量的空位插入,甚至可能误配。 ◇◇基于多序列比对的数据库搜索程序正在不断开发。PSI- BLAST是将双序列比 对和多序列比对结合在一起的叠代式数据库搜索程序。尽管它的运行速度较快,但 却有叠代本身固有的缺点,有时会得不到好的结果 512进一步阅读指南 Altschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ, Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res 1997Sepl;25(17):3389-402 Holm L, Unification of protein families. Curr Opin Struct Biol. 1998 Jun: 8(3): 372-9 Feng DF, Doolittle Re, Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 1987, 25(4): 351-60 Feng DE, Doolittle RE, Progressive alignment of amino acid sequences and construction of phylogenetic trees from them. Methods Enzymol. 1996: 266: 368-82 Thompson JD, Higgins DG Gibson TJ, CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 1994 Nov 11: 22(22): 4673-80自动比对方法而可能产生的错误。下一章将详细介绍如何利用多序列比对的产生的信息来描 述基因家族的特性,并继续探讨手工方法和自动方法的优劣性。 5.11 本章小结 对一个基因家族成组序列的分析需要高清该基因家族不同成员之间的关系。 多序列分析可用来揭示基因家族的保守性。 与双序列比对一样,多序列比对基于某个模型。比对结果没有绝对正确或绝 对错误之分,而只能说比对模型是否可以比较准确地反映了生物数据的特性。 基于序列和基于结构的序列比对模型都不够完善,因为两者都不能完全反映 所有层次的生物学信息。这两种方法各自有一定的应用范围,两者都非万应灵药。 多序列比对可以看作一张二维表,表中每一行代表一个序列,每一列代表一 个残基的位置。比对前残基在序列中的位置为绝对位置, 而比对后残基在序列中的 位置称相对位置。 多序列比对所需要的时间随序列个数增加而指数增长。不少多序列比对程序 采用启发式算法以降低计算复杂性,并得到并非最优但却较好的结果。 手动比对经常被认为带有主观性,但计算机自动比对结果几乎都需要手工调 整。序列编辑程序是必不可少的工具。 对所有序列同时进行比对的计算量极大,因此只能用于不长的序列片段。 步进式多序列比对方法根据亲源树的分支对序列两两比对。相似性程度高的 先比对,相似性程度低的后加入。通过分析可能的进化关系,这种方法可以处理一 定规模的数据量。 从互联网上可供使用的数据库很多,其中有些由计算机程序自动产生,有的 经过人工处理。 使用由程序自动比对产生的数据库时应注意,特别是当序列的相似性程度较 低的情况下更需谨慎,因为这些比对结果中有大量的空位插入,甚至可能误配。 基于多序列比对的数据库搜索程序正在不断开发。PSI-BLAST 是将双序列比 对和多序列比对结合在一起的叠代式数据库搜索程序。尽管它的运行速度较快,但 却有叠代本身固有的缺点,有时会得不到好的结果。 5.12 进一步阅读指南 Altschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ., Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 1997 Sep 1;25(17):3389-402. Holm L., Unification of protein families. Curr Opin Struct Biol. 1998 Jun;8(3):372-9. Feng DF, Doolittle RF., Progressive sequence alignment as a prerequisite to correct phylogenetic trees. J Mol Evol. 1987;25(4):351-60. Feng DF, Doolittle RF., Progressive alignment of amino acid sequences and construction of phylogenetic trees from them. Methods Enzymol. 1996;266:368-82. Thompson JD, Higgins DG, Gibson TJ., CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 1994 Nov 11;22(22):4673-80.
<<向上翻页
©2008-现在 cucdc.com 高等教育资讯网 版权所有