第八章多序列比对的实际应用 页码,1/ 第八章多序列比对的实际应用 Andreas d Baxevanis Genome Technology Branch National human genome research /nsti tude Nationa nsti tutes of heal th Bethesda Maryl and 在寻找基因和致力于发现新蛋白的努力中,人们习惯于把新的序列同已知功能的蛋白序列作 比对。由于这些比对通常都希望能够推测新蛋白的功能,不管它们是双重比对还是多序列比 对,都可以回答大量的其它的生物学问题。举例来说,面对一堆搜集的比对序列,人们会研 究隐含于蛋白之中的系统发生的关系,以便于更好地理解蛋白的进化。人们并不只是着眼于 某一个蛋白,而是研究一个家族中的相关蛋白,看看进化压力和生物秩序如何结合起来创造 出新的具有虽然不同但是功能相关的蛋白。研究完多序列比对中的高度保守区域,我们可以 对蛋白质的整个结构进行预测,并且猜测这些保守区域对于维持三维结构的重要性 显然,分析一群相关蛋白质时,很有必要了解比对的正确构成。发展用于多序列比对的程序 是一个很有活力的研究领域,绝大多数方法都是基于渐进比对( progress/vea/! gnment)的 概念。渐进比对的思想依赖于使用者用作比对的蛋白质序列之间确实存在的生物学上的或者 更准确地说是系统发生学上的相互关联。不同算法从不同方面解决这一问题,但是当比对的 序列大大地超过两个时(双重比对),对于计算的挑战就会很令人生畏。在实际操作中,算 法会在计算速度和获得最佳比对之间寻求平衡,常常会接受足够相近的比对。不管最终使用 的是什么方法,使用者都必须审视结果的比对,因为再次基础上作一些手工修改是十分必要 的,尤其是对保守的区域 由于本书偏重于方法而不是原理,这里只讨论一小部分现成的程序。我们从两个多序列比对 的方法开始,接下去是一系列的利用蛋白质家族中已知的模体或是式样的方法,最后讨论两 个具有赠送的方法,因为绝大多数公开的算法不能达到出版物的数量。在本章结尾部分将会 列出更详细的多序列比对的算法。 渐进比对方法 CLUSTAL W CLUSTAL算算法是一个最广泛使用的多序列比对程序,在任何主要的计算机平台上都可以免费 使用。这个程序基于渐进比对的思想,得到一系列序列的输入,对于每两个序列进行双重比 对并且计算结果。基于这些比较,计算得到一个距离矩阵,反映了每对序列 Bioinformatics: A Practical Gui de to the Anal ysis of genes and Proteins Edi ted by A D. Baxevani s and B.E. E. Ouel lette I SBN 0-471-191965. pages 172-188. Copyri ght c 1998 Wiley Li ss. Inc file://E:wcb生物信息学(中译本)\第八章多序列比对的实际应用.htm 2005-1-18ܿゴᑣ߫↨ᇍⱘᅲ䰙ᑨ⫼ Andreas D.Baxevanis Genome Technology Branch National Human Genome Research Institude National Institutes of Health Bethesda.Maryland ᇏᡒ㟈Ѣথ⦄ᮄ㲟ⱑⱘࡾЁˈҎӀдᛃѢᡞᮄⱘᑣ߫ৠᏆⶹࡳ㛑ⱘ㲟ⱑᑣ߫ ↨ᇍDŽ⬅Ѣ䖭ѯ↨ᇍ䗮ᐌ䛑Ꮰᳯ㛑⌟ᮄ㲟ⱑⱘࡳ㛑ˈϡㅵᅗӀᰃঠ䞡↨ᇍ䖬ᰃᑣ߫↨ ᇍˈ䛑ৃҹಲㄨ䞣ⱘ݊ᅗⱘ⫳⠽ᄺ䯂乬DŽВ՟ᴹ䇈ˈ䴶ᇍϔේ᧰䲚ⱘ↨ᇍᑣ߫ˈҎӀӮⷨ お䱤Ѣ㲟ⱑПЁⱘ㋏㒳থ⫳ⱘ݇㋏ˈҹ֓Ѣདഄ⧚㾷㲟ⱑⱘ䖯࣪DŽҎӀᑊϡাᰃⴔⴐѢ ᶤϔϾ㲟ⱑˈ㗠ᰃⷨおϔϾᆊᮣЁⱘⳌ݇㲟ⱑˈⳟⳟ䖯࣪य़⫳⠽⾽ᑣབԩ㒧ড়䍋ᴹ߯䗴 ߎᮄⱘ᳝㱑✊ϡৠԚᰃࡳ㛑Ⳍ݇ⱘ㲟ⱑDŽⷨおᅠᑣ߫↨ᇍЁⱘ催ᑺֱᅜऎඳˈ៥Ӏৃҹ ᇍ㲟ⱑ䋼ⱘᭈϾ㒧ᵘ䖯㸠乘⌟ˈᑊϨ⣰⌟䖭ѯֱᅜऎඳᇍѢ㓈ᣕϝ㓈㒧ᵘⱘ䞡㽕ᗻDŽ ᰒ✊ˈߚᵤϔ㕸Ⳍ݇㲟ⱑ䋼ᯊˈᕜ᳝ᖙ㽕њ㾷↨ᇍⱘℷ⹂ᵘ៤DŽথሩ⫼Ѣᑣ߫↨ᇍⱘᑣ ᰃϔϾᕜ᳝⌏ⱘⷨお乚ඳˈ㒱᭄ᮍ⊩䛑ᰃѢ⏤䖯↨ᇍ˄progressive alignment˅ⱘ ὖᗉDŽ⏤䖯↨ᇍⱘᗱᛇձ䌪ѢՓ⫼㗙⫼↨ᇍⱘ㲟ⱑ䋼ᑣ߫П䯈⹂ᅲᄬⱘ⫳⠽ᄺϞⱘ㗙 ޚഄ⹂䇈ᰃ㋏㒳থ⫳ᄺϞⱘⳌѦ݇㘨DŽϡৠㅫ⊩Ңϡৠᮍ䴶㾷އ䖭ϔ䯂乬ˈԚᰃᔧ↨ᇍⱘ ᑣ߫ഄ䍙䖛ϸϾᯊ˄ঠ䞡↨ᇍ˅ˈᇍѢ䅵ㅫⱘᣥህӮᕜҸҎ⫳⬣DŽᅲ䰙᪡Ёˈㅫ ⊩Ӯ䅵ㅫ䗳ᑺ㦋ᕫ᳔Շ↨ᇍП䯈ᇏ∖ᑇ㸵ˈᐌᐌӮফ䎇Ⳍ䖥ⱘ↨ᇍDŽϡㅵ᳔㒜Փ⫼ ⱘᰃҔМᮍ⊩ˈՓ⫼㗙䛑ᖙ乏ᅵ㾚㒧ᵰⱘ↨ᇍˈЎݡ⸔ϞϔѯᎹׂᬍᰃकߚᖙ㽕 ⱘˈᇸ݊ᰃᇍֱᅜⱘऎඳDŽ ⬅Ѣᴀкأ䞡Ѣᮍ⊩㗠ϡᰃॳ⧚ˈ䖭䞠া䅼䆎ϔᇣ䚼ߚ⦃៤ⱘᑣDŽ៥ӀҢϸϾᑣ߫↨ᇍ ⱘᮍ⊩ᓔྟˈϟএᰃϔ㋏߫ⱘ߽⫼㲟ⱑ䋼ᆊᮣЁᏆⶹⱘԧᰃᓣḋⱘᮍ⊩ˈ᳔ৢ䅼䆎ϸ Ͼ᳝䌴䗕ⱘᮍ⊩ˈЎ㒱᭄݀ᓔⱘㅫ⊩ϡ㛑䖒ߎࠄ⠜⠽ⱘ᭄䞣DŽᴀゴ㒧ሒ䚼ߚᇚӮ ߫ߎ䆺㒚ⱘᑣ߫↨ᇍⱘㅫ⊩DŽ ⏤䖯↨ᇍᮍ⊩ CLUSTAL W CLUSTAL Wㅫ⊩ᰃϔϾ᳔ᑓ⊯Փ⫼ⱘᑣ߫↨ᇍᑣˈӏԩЏ㽕ⱘ䅵ㅫᴎᑇৄϞ䛑ৃҹܡ䌍 Փ⫼DŽ䖭ϾᑣѢ⏤䖯↨ᇍⱘᗱᛇˈᕫࠄϔ㋏߫ᑣ߫ⱘ䕧ܹˈᇍѢ↣ϸϾᑣ߫䖯㸠ঠ䞡↨ ᇍᑊϨ䅵ㅫ㒧ᵰDŽѢ䖭ѯ↨䕗ˈ䅵ㅫᕫࠄϔϾ䎱⾏ⶽ䰉ˈডњ↣ᇍᑣ߫ Bioinformatics: A Practical Guide to the Analysis of genes and Proteins Edited by A.D. Baxevanis and B.E.E. Ouellette ISBN 0-471-191965. pages 172-188. Copyright © 1998 Wiley – Liss. Inc. ܿゴᑣ߫↨ᇍⱘᅲ䰙ᑨ⫼ 义ⷕˈ1/11 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ܿゴᑣ߫↨ᇍⱘᅲ䰙ᑨ⫼.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com