第九章系统发育分析 页码,4/3 当我们假定计算机程序能够进行正确的比对的时候,我们才会实行完全的计算机处理。之所 以还提倡进行手工比对(比如, Thompson et al.,1994),是因为现在的比对算法和程序还 不能满足系统发育分析的需要。 系统发育标准 许多计算机多重比对程序(比如 CLUSTAL, PileUp, ALI GN in ProPack)根据明确的系统发育 标准(一个前导树)进行比对,这个前导树是由双重比对得到的。但是SAM( Hughey et al 1996)和 MACAW( Lawrence et al.,1993)程序在进行多重比对时并不引入明确的系统发育 标准,虽然这些程序也可以模拟系统发育过程操作参数。 如果在进行系统发育分析的时候,比对中引入了前导树,那么通过这个比对推导出的进化树 逻辑上应该同前导树的拓扑结构相同。由 CLUSTALI比对得到的前导树(如图9.1)将会被转化 成 PHYLIP树的文件格式,然后输入到画树程序中,这些画树程序包括 TreeTool( x wi ndows) TreeDraw(Maci ntosh), PHYLODENDRON (Maci ntos), TREEVI EW(Maci ntosh, Mi crosof Wi ndows)或者PAUP(图9.1; Maci tosh, Mi crosoft wi ndows)的画树工具。按道理,我们应 该回过头来为 CLUSTAL比对再指定一个前导树,但是在实际操作中我们并不会这么做。有些程 序(比如 TreeAl i gn and MALI GN)为了得到优化的比对和系统发育树,程序本身就设计了交 叉(同步)递归优化的算法。理论上,能够解决比对-系统发育难题的同步优化算法或者 配套算法应该是存在的,但是递归算法必须冒一定的风险,它很可能会导致一个错误的或者 不完整的结果( Thorne and ki shi no,1992)。因此,根据比对结果建立进化树之后,必须 考虑另外的可能性,也就是说,如果根据其它的比对结果得到一个并不是最优化的进化树, 这个次优化的进化树是不是更能够满足研究的需要。 比对参数评估 在比对中会出现一些序列区域,其长度是可变的,如何处理这些区域中inde状态的位点是最 重要,这取决于进化模型的所有要素(比如,包括核苷酸转换/颠换速率),而且相关的参数 在前导树与比对推导的进化树中应该保持一致。比对参数应该随着进化的分叉动态变化 ( Thompson et al.,1994),只有这样才能保证碱基错配的几率能够满足序列趋异的需要; 比对参数应该随时调整( Thompson et al.1994, Hughey et al.,1996),以防止引入过 多的近似序列而导致比对序列的信息量不足,可以通过降低近似序列的比对分值权重来防止 这种情况。 CULSTAL程序兼顾了这两种情况(参数动态变化),而SAM程序引入了序列权重。 利用基本结构或者高级结构进行比对 根据二级或者三级序列结构进行比对,比起直接利用一级序列进行比对的可信度要好,因为 在同源性评估中,人们一直认为复杂结构的保守性高于简单特征(核苷酸,氨基酸)的同源 保守性,而且,立足于复杂结构的比对程序还可以搜索到一些特殊的关联位点,这些位点是 进化的功能区域。实际上,基于系统发育的结构多重比对并没有将问题简化,也就是说,序 列比对必须服从结构进化,而结构进化则同系统发育保持一致。有一个探索式的手工程序 (如图9.2),是用来对核糖体DNA进行结构比对的( Gutell et al.,1994),这个程序要考 察相关取代的样式,但是相关性必须通过系统发育树中的多个独立的补偿性突变推导得到 (cf. harvey and pagel 1991) 数学优化 有些比对程序(比如, MACAW,SAM)根据一个统计模型进行优化,但是这些统计同系统发育 模型的关系并不清楚。仅仅根据一个系统发育模型是没有办法比较多重比对方法的优劣的。 总结:对于系统发育分析,最好的比对程序是什么呢? file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18ᔧ៥Ӏ؛ᅮ䅵ㅫᴎᑣ㛑䖯㸠ℷ⹂ⱘ↨ᇍⱘᯊˈ៥ӀᠡӮᅲ㸠ᅠܼⱘ䅵ㅫᴎ໘⧚DŽП᠔ ҹ䖬ᦤ䖯㸠Ꮉ↨ᇍ˄↨བˈThompson et al., 1994˅ˈᰃЎ⦄ⱘ↨ᇍㅫ⊩ᑣ䖬 ϡ㛑⒵䎇㋏㒳থ㚆ߚᵤⱘ䳔㽕DŽ ޚᷛ㒳থ㚆㋏ 䆌䅵ㅫᴎ䞡↨ᇍᑣ˄↨བCLUSTAL, PileUp,ALIGN in ProPack˅ḍᯢ⹂ⱘ㋏㒳থ㚆 ᷛޚ˄ϔϾࠡᇐᷥ˅䖯㸠↨ᇍˈ䖭Ͼࠡᇐᷥᰃ⬅ঠ䞡↨ᇍᕫࠄⱘDŽԚᰃSAM˄Hughey et al., 1996˅MACAW˄Lawrence et al., 1993˅ᑣ䖯㸠䞡↨ᇍᯊᑊϡᓩܹᯢ⹂ⱘ㋏㒳থ㚆 ᷛޚˈ㱑✊䖭ѯᑣгৃҹᢳ㋏㒳থ㚆䖛᪡খ᭄DŽ བᵰ䖯㸠㋏㒳থ㚆ߚᵤⱘᯊ↨ˈᇍЁᓩܹњࠡᇐᷥˈ䙷М䗮䖛䖭Ͼ↨ᇍᇐߎⱘ䖯࣪ᷥ 䘏䕥Ϟᑨ䆹ৠࠡᇐᷥⱘᢧᠥ㒧ᵘⳌৠDŽ⬅CLUSTAL↨ᇍᕫࠄⱘࠡᇐᷥ˄བ9.1˅ᇚӮ㹿䕀࣪ ៤PHYLIPᷥⱘ᭛ӊḐᓣˈ✊ৢ䕧ܹࠄᷥ⬏ᑣЁˈ䖭ѯ⬏ᷥᑣࣙᣀTreeTool(X windows), TreeDraw(Macintosh), PHYLODENDRON(Macintosh), TREEVIEW(Macintosh, Microsoft Windows) 㗙PAUP( 9.1˗Macintosh, Microsoft Windows)ⱘ⬏ᷥᎹDŽᣝ䘧⧚ˈ៥Ӏᑨ 䆹ಲ䖛༈ᴹЎCLUSTAL↨ᇍݡᣛᅮϔϾࠡᇐᷥˈԚᰃᅲ䰙᪡Ё៥ӀᑊϡӮ䖭МخDŽ᳝ѯ ᑣ˄↨བTreeAlign and MALIGN˅ЎњᕫࠄӬ࣪ⱘ↨ᇍ㋏㒳থ㚆ᷥˈᑣᴀ䑿ህ䆒䅵њѸ ঝ˄ৠℹ˅䗦ᔦӬ࣪ⱘㅫ⊩DŽ⧚䆎Ϟˈ㛑㾷އ↨ᇍ----㋏㒳থ㚆䲒乬ⱘৠℹӬ࣪ㅫ⊩㗙 䜡༫ㅫ⊩ᑨ䆹ᰃᄬⱘˈԚᰃ䗦ᔦㅫ⊩ᖙ乏ݦϔᅮⱘ亢䰽ˈᅗᕜৃ㛑Ӯᇐ㟈ϔϾ䫭䇃ⱘ㗙 ϡᅠᭈⱘ㒧ᵰ˄Thorne and Kishino, 1992˅DŽℸˈḍ↨ᇍ㒧ᵰᓎゟ䖯࣪ᷥПৢˈᖙ乏 㗗㰥ⱘৃ㛑ᗻˈгህᰃ䇈ˈབᵰḍ݊ᅗⱘ↨ᇍ㒧ᵰᕫࠄϔϾᑊϡᰃ᳔Ӭ࣪ⱘ䖯࣪ˈᷥ 䖭ϾӬ࣪ⱘ䖯࣪ᷥᰃϡᰃ㛑⒵䎇ⷨおⱘ䳔㽕DŽ ↨ᇍখ᭄䆘Ԅ ↨ᇍЁӮߎ⦃ϔѯᑣ߫ऎඳˈ݊䭓ᑺᰃৃবⱘˈབԩ໘⧚䖭ѯऎඳЁindel⢊ᗕⱘԡ⚍ᰃ᳔ 䞡㽕ˈ䖭পއѢ䖯࣪ൟⱘ᠔᳝㽕㋴˄↨བˈࣙᣀḌ㣋䝌䕀ᤶ乴ᤶ䗳⥛˅ˈ㗠ϨⳌ݇ⱘখ᭄ ࠡᇐᷥϢ↨ᇍᇐⱘ䖯࣪ᷥЁᑨ䆹ֱᣕϔ㟈DŽ↨ᇍখ᭄ᑨ䆹䱣ⴔ䖯࣪ⱘߚঝࡼᗕব࣪ ˄Thompson et al., 1994˅ˈা᳝䖭ḋᠡ㛑ֱ䆕⺅䫭䜡ⱘ⥛㛑⒵䎇ᑣ߫䍟ᓖⱘ䳔㽕˗ ↨ᇍখ᭄ᑨ䆹䱣ᯊ䇗ᭈ˄Thompson et al., 1994, Hughey et al., 1996˅ˈҹ䰆ℶᓩܹ䖛 ⱘ䖥Ԑᑣ߫㗠ᇐ㟈↨ᇍᑣ߫ⱘֵᙃ䞣ϡ䎇ˈৃҹ䗮䖛䰡Ԣ䖥Ԑᑣ߫ⱘ↨ᇍߚؐᴗ䞡ᴹ䰆ℶ 䖭⾡ᚙމDŽCULSTALᑣݐ乒њ䖭ϸ⾡ᚙމ˄খ᭄ࡼᗕব࣪ˈ˅㗠SAMᑣᓩܹњᑣ߫ᴗ䞡DŽ ߽⫼ᴀ㒧ᵘ㗙催㑻㒧ᵘ䖯㸠↨ᇍ ḍѠ㑻㗙ϝ㑻ᑣ߫㒧ᵘ䖯㸠↨ᇍˈ↨䍋Ⳉ߽⫼ϔ㑻ᑣ߫䖯㸠↨ᇍⱘৃֵᑺ㽕དˈЎ ৠ⑤ᗻ䆘ԄЁˈҎӀϔⳈ䅸Ўᴖ㒧ᵘⱘֱᅜᗻ催Ѣㅔऩ⡍ᕕ˄Ḍ㣋䝌ˈ⇼䝌˅ⱘৠ⑤ ֱᅜᗻˈ㗠Ϩˈゟ䎇Ѣᴖ㒧ᵘⱘ↨ᇍᑣ䖬ৃҹ᧰㋶ࠄϔѯ⡍⅞ⱘ݇㘨ԡ⚍ˈ䖭ѯԡ⚍ᰃ 䖯࣪ⱘࡳ㛑ऎඳDŽᅲ䰙ϞˈѢ㋏㒳থ㚆ⱘ㒧ᵘ䞡↨ᇍᑊ≵᳝ᇚ䯂乬ㅔ࣪ˈгህᰃ䇈ˈᑣ ߫↨ᇍᖙ乏᳡Ң㒧ᵘ䖯࣪ˈ㗠㒧ᵘ䖯࣪߭ৠ㋏㒳থ㚆ֱᣕϔ㟈DŽ᳝ϔϾ㋶ᓣⱘᎹᑣ ˄བ9.2˅ˈᰃ⫼ᴹᇍḌ㊪ԧDNA䖯㸠㒧ᵘ↨ᇍⱘ˄Gutell et al., 1994˅ˈ䖭Ͼᑣ㽕㗗 ᆳⳌ݇পҷⱘḋᓣˈԚᰃⳌ݇ᗻᖙ乏䗮䖛㋏㒳থ㚆ᷥЁⱘϾ⣀ゟⱘ㸹ٓᗻさবᇐᕫࠄ ˄cf. Harvey and Pagel, 1991˅DŽ ᭄࣪ᄺӬ ᳝ѯ↨ᇍᑣ˄↨བˈMACAW, SAM˅ḍϔϾ㒳䅵ൟ䖯㸠Ӭ࣪ˈԚᰃ䖭ѯ㒳䅵ৠ㋏㒳থ㚆 ൟⱘ݇㋏ᑊϡ⏙ἮDŽҙҙḍϔϾ㋏㒳থ㚆ൟᰃ≵᳝ࡲ↨⫣䕗䞡↨ᇍᮍ⊩ⱘӬࡷⱘDŽ ᘏ㒧˖ᇍѢ㋏㒳থ㚆ߚᵤˈ᳔དⱘ↨ᇍᑣᰃҔМਸ਼˛ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ4/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com