正在加载图片...
第七章序列比对和数据库搜索 页码,1/2 第七章:序列比对和数据库搜索 gory D. Schuler Nati onal Center for Biotechnol ogy I nformati on Nati onal Li brary of Medi ci ne. Nati onal Insti tutes of Heal th Bethesda. Maryl and 引言 在生物学的研究中,有一个常用的方法,就是通过比较分析获取有用的信息和知识。达尔文正 是研究比较了 gal pagos finches同其它一些物种的形态学特征,从而提出了自然选择学说 今天,我们对基因和蛋白质序列进行比较,从本质上来讲是同达尔文一样,进行同样的分 析,只不过更加精细,更加详尽。在这个意义上,我们从核酸以及氨基酸的层次去分析序列 的相同点和不同点,以期能够推测它们的结构、功能以及进化上的联系。最常用的比较方法 是序列比对,它为两个或更多个序列的残基之间的相互关系提供了一个非常明确的图谱。在 这一章,我们只讨论一下双重比对,即只比较两个序列,至于较多的序列即多序列比对,将 在第八章介绍。 七十年代以来,DMA测序方法的飞速发展,极大地引发了序列信息量的扩增,从而使可供比较 的序列数量呈现爆炸式增长。分子生物学家应该意识到,将未知序列同整个数据库中的已知 序列进行比较分析已经成为他们手中一个强有力的研究手段。在过去的三十年里,即使不提 及计算机的应用,序列比较的各种算法也已经发展得越来越迅速,也越来越成熟,已经能够 跟上序列数据库增长的步伐。今天,我们已经拥有一些小的模式物种的基因组的全序列,还 拥有人类基因序列的一些较大的样品,我们己经进入比较基因组时代,也就是说,对两个物 种进行全基因组序列比较已经不再是一个梦想。 序列比对的进化基础 进行序列比对的目的之一是让人们能够判断两个序列之间是否具有足够的相似性,从而判定 二者之间是否具有同源性。值得注意的是,相似性和同源性虽然在某种程度上具有一致性, 但它们是完全不同的两个概念。相似性是指一种很直接的数量关系,比如部分相同或相似的 百分比或其它一些合适的度量,而同源性是指从一些数据中推断出的两个基因在进化上曾具 有共同祖先的结论,它是质的判断。基因之间要么同源,要么不同源,绝不象相似性那样具 有多或少的数量关系。如图7.1所示,比较家鼠和小龙虾的同源的胰蛋白酶序列,发现它们具 有41%的相似性 由于受到研究进化关系这一目的的影响,大多数比对方法很自然地都希望能够在某种程度上 建立起分子进化的模型。我们通常都假定同源序列是从某一共同祖先不断变化而来,但事实 上,我们无法得知这个祖先序列到底是什么样子,除非能够从化石中获得它的DNA,我们所能 够做到的只是从现存物种中,探求真相。从祖先序列以来所发生的变化包括取代、插入以及 缺失。在理想情况下,同源基因或蛋白质序列在相互比较时,残基之间相互对应,从而使取 代的情况很明显地表现出来。在某些位置,一个序列中拥有某些残基而另一个序 BioinformaticS: A Practi cal Gui de to the Anal ysis of Genes and proteins Edi ted by A D. Baxevani s and B F.F. Ouel lette I SBN0-471-19196-5 pages 145-171. Copyri ghto 1998 Wiley-Liss. Inc file://E:wcb生物信息学(中译本)\第七章序列比对和数据库搜索.htm 2005-1-18㄀ϗゴ˖ᑣ߫↨ᇍ੠᭄᥂ᑧ᧰㋶ Gregory D.Schuler National Center for Biotechnology Information National Library of Medicine. National Institutes of Health Bethesda. Maryland ᓩ㿔 ೼⫳⠽ᄺⱘⷨおЁ᳝ϔϾᐌ⫼ⱘᮍ⊩ህᰃ䗮䖛↨䕗ߚᵤ㦋প᳝⫼ⱘֵᙃ੠ⶹ䆚DŽ䖒ᇨ᭛ℷ ᰃⷨお↨䕗њgalapagos finchesৠ݊ᅗϔѯ⠽⾡ⱘᔶᗕᄺ⡍ᕕˈҢ㗠ᦤߎњ㞾✊䗝ᢽᄺ䇈DŽ Ҟ໽ˈ៥Ӏᇍ෎಴੠㲟ⱑ䋼ᑣ߫䖯㸠↨䕗ˈҢᴀ䋼Ϟᴹ䆆ᰃৠ䖒ᇨ᭛ϔḋˈ䖯㸠ৠḋⱘߚ ᵤˈাϡ䖛᳈ࡴ㊒㒚ˈ᳈ࡴ䆺ሑDŽ೼䖭ϾᛣНϞˈ៥ӀҢḌ䝌ҹঞ⇼෎䝌ⱘሖ⃵এߚᵤᑣ߫ ⱘⳌৠ⚍੠ϡৠ⚍ˈҹᳳ㛑໳᥼⌟ᅗӀⱘ㒧ᵘǃࡳ㛑ҹঞ䖯࣪Ϟⱘ㘨㋏DŽ᳔ᐌ⫼ⱘ↨䕗ᮍ⊩ ᰃᑣ߫↨ᇍˈᅗЎϸϾ៪᳈໮Ͼᑣ߫ⱘ⅟෎П䯈ⱘⳌѦ݇㋏ᦤկњϔϾ䴲ᐌᯢ⹂ⱘ೒䈅DŽ೼ 䖭ϔゴˈ៥Ӏা䅼䆎ϔϟঠ䞡↨ᇍˈेা↨䕗ϸϾᑣ߫ˈ㟇Ѣ䕗໮ⱘᑣ߫े໮ᑣ߫↨ᇍˈᇚ ೼㄀ܿゴҟ㒡DŽ ϗकᑈҷҹᴹˈDNA⌟ᑣᮍ⊩ⱘ亲䗳থሩˈᵕ໻ഄᓩথњᑣֵ߫ᙃ䞣ⱘᠽ๲ˈҢ㗠Փৃկ↨䕗 ⱘᑣ᭄߫䞣ਜ⦄⟚⚌ᓣ๲䭓DŽߚᄤ⫳⠽ᄺᆊᑨ䆹ᛣ䆚ࠄˈᇚ᳾ⶹᑣ߫ৠᭈϾ᭄᥂ᑧЁⱘᏆⶹ ᑣ߫䖯㸠↨䕗ߚᵤᏆ㒣៤ЎҪӀ᠟ЁϔϾᔎ᳝࡯ⱘⷨお᠟↉DŽ೼䖛এⱘϝकᑈ䞠ˈेՓϡᦤ ঞ䅵ㅫᴎⱘᑨ⫼ˈᑣ߫↨䕗ⱘ৘⾡ㅫ⊩гᏆ㒣থሩᕫ䍞ᴹ䍞䖙䗳ˈг䍞ᴹ䍞៤❳ˈᏆ㒣㛑໳ 䎳Ϟᑣ᭄߫᥂ᑧ๲䭓ⱘℹӤDŽҞ໽ˈ៥ӀᏆ㒣ᢹ᳝ϔѯᇣⱘ῵ᓣ⠽⾡ⱘ෎಴㒘ⱘܼᑣ߫ˈ䖬 ᢹ᳝Ҏ㉏෎಴ᑣ߫ⱘϔѯ䕗໻ⱘḋકˈ៥ӀᏆ㒣䖯ܹ↨䕗෎಴㒘ᯊҷˈгህᰃ䇈ˈᇍϸϾ⠽ ⾡䖯㸠ܼ෎಴㒘ᑣ߫↨䕗Ꮖ㒣ϡݡᰃϔϾṺᛇDŽ ᑣ߫↨ᇍⱘ䖯࣪⸔෎ 䖯㸠ᑣ߫↨ᇍⱘⳂⱘПϔᰃ䅽ҎӀ㛑໳߸ᮁϸϾᑣ߫П䯈ᰃ৺݋᳝䎇໳ⱘⳌԐᗻˈҢ㗠߸ᅮ Ѡ㗙П䯈ᰃ৺݋᳝ৠ⑤ᗻDŽؐᕫ⊼ᛣⱘᰃˈⳌԐᗻ੠ৠ⑤ᗻ㱑✊೼ᶤ⾡⿟ᑺϞ݋᳝ϔ㟈ᗻˈ ԚᅗӀᰃᅠܼϡৠⱘϸϾὖᗉDŽⳌԐᗻᰃᣛϔ⾡ᕜⳈ᥹ⱘ᭄䞣݇㋏ˈ↨བ䚼ߚⳌৠ៪ⳌԐⱘ ⱒߚ݊៪↨ᅗϔѯড়䗖ⱘᑺ䞣ˈ㗠ৠ⑤ᗻᰃᣛҢϔѯ᭄᥂Ё᥼ᮁߎⱘϸϾ෎಴೼䖯࣪Ϟ᳒݋ ᳝݅ৠ⼪ܜⱘ㒧䆎ˈᅗᰃ䋼ⱘ߸ᮁDŽ෎಴П䯈㽕Мৠ⑤ˈ㽕Мϡৠ⑤ˈ㒱ϡ䈵ⳌԐᗻ䙷ḋ݋ ᳝໮៪ᇥⱘ᭄䞣݇㋏DŽབ೒7.1᠔⼎ˈ↨䕗ᆊ哴੠ᇣ啭㱒ⱘৠ⑤ⱘ㛄㲟ⱑ䝊ᑣ߫ˈথ⦄ᅗӀ݋ ᳝41%ⱘⳌԐᗻDŽ ⬅Ѣফࠄⷨお䖯࣪LTD݇䖭ϔⳂⱘⱘᕅડˈ໻໮᭄↨ᇍᮍ⊩ᕜ㞾✊ഄ䛑Ꮰᳯ㛑໳೼ᶤ⾡⿟ᑺϞ ᓎゟ䍋ߚᄤ䖯࣪ⱘ῵ൟDŽ៥Ӏ䗮ᐌ䛑؛ᅮৠ⑤ᑣ߫ᰃҢᶤϔ݅ৠ⼪ܜϡᮁব࣪㗠ᴹˈԚџᅲ Ϟˈ៥Ӏ᮴⊩ᕫⶹ䖭Ͼ⼪ܜᑣ߫ࠄᑩᰃҔМḋᄤˈ䰸䴲㛑໳Ң࣪⷇Ё㦋ᕫᅗⱘDNAˈ៥Ӏ᠔㛑 ໳ࠄخⱘাᰃҢ⦄ᄬ⠽⾡Ёˈ᥶∖ⳳⳌDŽҢ⼪ܜᑣ߫ҹᴹ᠔থ⫳ⱘবࣙ࣪ᣀপҷǃᦦܹҹঞ 㔎༅DŽ೼⧚ᛇᚙމϟˈৠ⑤෎಴៪㲟ⱑ䋼ᑣ߫೼ⳌѦ↨䕗ᯊˈ⅟෎П䯈ⳌѦᇍᑨˈҢ㗠Փপ ҷⱘᚙމᕜᯢᰒഄ㸼⦄ߎᴹDŽ೼ᶤѯԡ㕂ˈϔϾᑣ߫Ёᢹ᳝ᶤѯ⅟෎㗠঺ϔϾᑣ Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins Edited by A.D.Baxevanis and B.F.F.Ouellette ISBN 0-471-19196-5.pages 145-171. Copyright© 1998 Wiley-Liss. Inc. ㄀ϗゴᑣ߫↨ᇍ੠᭄᥂ᑧ᧰㋶ 义ⷕˈ1/28 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀ϗゴᑣ߫↨ᇍ੠᭄᥂ᑧ᧰㋶.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有