第九章系统发育分析 页码,11/32 凃了在所有的分析步骤中都会用到特征符数据以外,基于特征符的建树方法毫无共同之处。 这就使得我们能够评估一个比对中每一个碱基位点对其它所有的碱基位点的依赖性。最常用 的基于特征符的建树方法是最大节约方法和最大似然方法 最大节约方法(MP, Maximum Parsimony) 最大节约方法是一种优化标准,这个标准遵循“奥卡姆剃刀原则(0cam' s razor)”:对 数据最好的解释也是最简单的,而最简单的所需要的特别假定也最少。在实际应用中,M进 化树是最短的�也是变化最少的进化树,根据定义,这个进化树的平行变化最少,或者说 是同形性最低。MP中有一些变量与特征符状态改变的可行方向不尽相符( Swofford et al. 1996a) 为了能够包容取代偏好,MP必须加权;比如,颠换的变换相对于转换(见上文)被加权。进 行加权的最简单的方法就是建立一个加权步骤方阵,在这个方阵里,权重用速率的倒数,这 个速率是由上面描述的ML方法评估得到的。步骤方阵加权可能会极大地减慢MP的计算速度。 如果比对内部的位点确实存在这速率差异,那么MP方法就会执行得很不好( Hue senbeck, 1995)。对于这个问题,还没有什么很好的解决方法。有一个方法,就是对数据集进行修 改,使得最终分析的数据集中只包括那些内部差异性很小的位点,这些位点是由前面提到的 似然分析方法判断得到的。更常见的情况是,MP分析只简单地屏蔽掉那些高度同形的可疑位 点(比如说,某些序列比对中的第三个编码位点)。另外一个方法是根据引导树中所能观察 到的位点变化倾向,对位点进行循环加权。这个“连续逼近”方法在PAUP中会自动简化,但 是这个方法的出错的倾向程度取决于引导树的出错程度。 MP分析期望能够产生大量的(有时候是成千上万个)具有相同分值的进化树。因为这些进化 树之间的优化程度相同,所以只有所有进化树都严格一致的分组才算是得到数据的支持。距 离建树方法和M建树方法期望得到一个最简单的最好的进化树,是因为这些方法的算法中包 括了除法和小数,而MP建树方法只是计算离散的步长。对于一个给定的数据集,存在着比最 佳的进化树差不了多少的M进化树或者M进化树,如果这些进化树严格一致的话,很可能会 产生同MP一致进化树多少有些可比性的分解。不幸的是,MP的使用者传统上都会给出严格 致的进化树(有时候是进化树的一致性,其中有一个或者两个步骤不太好),而ME和M用户 通常就不会这样做 现在已经开发了大量的进化树统计量值来描述一个MP进化树。除了进化树的长度外,这些统 计量包括各种各样的比例,用以描述同形的数量,比如稠度指数,或者一个进化树中一个特 征符改变状态的平均次数( Swofford,1990)。尽管在MP分析中仍然经常报告这些指数,但 是已经证明这些指数受到许多人为因素的干扰,比如被分析的分类群的数量。 模拟研究( Huel senbeck,1995)已经表明,如果从世系分歧开始的序列进化的数量远大于世 系分离的分歧数量(比如,一个进化树中,终端的树枝很长,而内部节间的树枝很短),MP 的效果同M一样差,比M还要更差。这种情况会造成“长树枝效应”��长树枝可能会 被人工连接,因为累积的非同源的相似性的数量超过了因为真实的相关性而保留的同源相似 性的数量( Swofford et al.,1996a)。在这种情况下,特征符加权会改善MP的执行效果 (Huel senbeck. 1995) 最大似然方法(ML, Maximum likelihood) M对系统发育问题进行了彻底搜査。M期望能够搜寻出一种进化模型(包括对进化树本身进 行搜索),使得这个模型所能产生的数据与观察到的数据最相似。 实际上,ML是从比对的每一个碱基位点衍生出来的。给定一个特定的进化树和观察到的全部 的碱基频率,我们可以计算出似然值,具体方法是要计算一个位点遵循一个特定取代过程时 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18䰸њ᠔᳝ⱘߚᵤℹ偸Ё䛑Ӯ⫼ࠄ⡍ᕕヺ᭄ҹˈѢ⡍ᕕヺⱘᓎᷥᮍ⊩↿᮴݅ৠП໘DŽ 䖭ህՓᕫ៥Ӏ㛑䆘ԄϔϾ↨ᇍЁ↣ϔϾ⺅ԡ⚍ᇍ݊ᅗ᠔᳝ⱘ⺅ԡ⚍ⱘձ䌪ᗻDŽ᳔ᐌ⫼ ⱘѢ⡍ᕕヺⱘᓎᷥᮍ⊩ᰃ᳔㡖㑺ᮍ⊩᳔Ԑ✊ᮍ⊩DŽ ᳔㡖㑺ᮍ⊩˄MPˈMaximum Parsimony˅ ᳔㡖㑺ᮍ⊩ᰃϔ⾡Ӭ࣪ᷛޚˈ䖭Ͼᷛޚ䙉ᕾĀ༹वྚࠗߔ˄߭ॳOccam’s razor˅ā˖ᇍ ᳔᭄དⱘ㾷䞞гᰃ᳔ㅔऩⱘˈ㗠᳔ㅔऩⱘ᠔䳔㽕ⱘ⡍؛߿ᅮг᳔ᇥDŽᅲ䰙ᑨ⫼ЁˈMP䖯 ࣪ᷥᰃ᳔ⷁⱘ�гᰃব᳔࣪ᇥⱘ䖯࣪ˈᷥḍᅮНˈ䖭Ͼ䖯࣪ᷥⱘᑇ㸠ব᳔࣪ᇥˈ㗙䇈 ᰃৠᔶᗻ᳔ԢDŽMPЁ᳝ϔѯব䞣Ϣ⡍ᕕヺ⢊ᗕᬍবⱘৃ㸠ᮍϡሑⳌヺ˄Swofford et al., 1996a˅DŽ Ўњ㛑ࣙᆍপҷأདˈMPᖙ乏ࡴᴗ˗↨བˈ乴ᤶⱘবᤶⳌᇍѢ䕀ᤶ˄㾕Ϟ᭛˅㹿ࡴᴗDŽ䖯 㸠ࡴᴗⱘ᳔ㅔऩⱘᮍ⊩ህᰃᓎゟϔϾࡴᴗℹ偸ᮍ䰉ˈ䖭Ͼᮍ䰉䞠ˈᴗ䞡⫼䗳⥛ⱘצ᭄ˈ䖭 Ͼ䗳⥛ᰃ⬅Ϟ䴶ᦣ䗄ⱘMLᮍ⊩䆘ԄᕫࠄⱘDŽℹ偸ᮍ䰉ࡴᴗৃ㛑Ӯᵕഄޣ᜶MPⱘ䅵ㅫ䗳ᑺDŽ བᵰ↨ᇍݙ䚼ⱘԡ⚍⹂ᅲᄬ䖭䗳⥛Ꮒᓖˈ䙷МMPᮍ⊩ህӮᠻ㸠ᕫᕜϡད˄Huelsenbeck, 1995˅DŽᇍѢ䖭Ͼ䯂乬ˈ䖬≵᳝ҔМᕜདⱘ㾷އᮍ⊩DŽ᳝ϔϾᮍ⊩ˈህᰃᇍ᭄䲚䖯㸠ׂ ᬍˈՓᕫ᳔㒜ߚᵤⱘ᭄䲚Ёাࣙᣀ䙷ѯݙ䚼Ꮒᓖᗻᕜᇣⱘԡ⚍ˈ䖭ѯԡ⚍ᰃ⬅ࠡ䴶ᦤࠄⱘ Ԑ✊ߚᵤᮍ⊩߸ᮁᕫࠄⱘDŽᐌ㾕ⱘᚙމᰃˈMPߚᵤাㅔऩഄሣ㬑ᥝ䙷ѯ催ᑺৠᔶⱘৃ⭥ԡ ⚍˄↨བ䇈ˈᶤѯᑣ߫↨ᇍЁⱘϝϾ㓪ⷕԡ⚍˅DŽϔϾᮍ⊩ᰃḍᓩᇐᷥЁ᠔㛑㾖ᆳ ࠄⱘԡ⚍ব࣪ˈؒᇍԡ⚍䖯㸠ᕾ⦃ࡴᴗDŽ䖭ϾĀ䖲㓁䘐䖥āᮍ⊩PAUPЁӮ㞾ࡼㅔ࣪ˈԚ ᰃ䖭Ͼᮍ⊩ⱘߎ䫭ⱘؒᑺপއѢᓩᇐᷥⱘߎ䫭ᑺDŽ MPߚᵤᳳᳯ㛑ѻ⫳䞣ⱘ˄᳝ᯊᰃ៤गϞϛϾ˅᳝Ⳍৠߚؐⱘ䖯࣪ᷥDŽЎ䖭ѯ䖯࣪ ᷥП䯈ⱘӬ࣪ᑺⳌৠˈ᠔ҹা᳝᠔᳝䖯࣪ᷥ䛑ϹḐϔ㟈ⱘߚ㒘ᠡㅫᰃᕫࠄ᭄ⱘᬃᣕDŽ䎱 ⾏ᓎᷥᮍ⊩MLᓎᷥᮍ⊩ᳳᳯᕫࠄϔϾ᳔ㅔऩⱘ᳔དⱘ䖯࣪ˈᷥᰃЎ䖭ѯᮍ⊩ⱘㅫ⊩Ёࣙ ᣀњ䰸⊩ᇣ᭄ˈ㗠MPᓎᷥᮍ⊩াᰃ䅵ㅫ⾏ᬷⱘℹ䭓DŽᇍѢϔϾ㒭ᅮⱘ᭄䲚ˈᄬⴔ↨᳔ Շⱘ䖯࣪ᷥᏂϡњᇥⱘME䖯࣪ᷥ㗙ML䖯࣪ˈᷥབᵰ䖭ѯ䖯࣪ᷥϹḐϔ㟈ⱘ䆱ˈᕜৃ㛑Ӯ ѻ⫳ৠMPϔ㟈䖯࣪ᷥᇥ᳝ѯৃ↨ᗻⱘߚ㾷DŽϡᑌⱘᰃˈMPⱘՓ⫼㗙Ӵ㒳Ϟ䛑Ӯ㒭ߎϹḐϔ 㟈ⱘ䖯࣪ᯊ᳝˄ᷥᰃ䖯࣪ᷥⱘϔ㟈ᗻˈ݊Ё᳝ϔϾ㗙ϸϾℹ偸ϡད˅ˈ㗠MEML⫼᠋ 䗮ᐌህϡӮ䖭ḋخDŽ ⦄Ꮖ㒣ᓔথњ䞣ⱘ䖯࣪ᷥ㒳䅵䞣ؐᴹᦣ䗄ϔϾMP䖯࣪ᷥDŽ䰸њ䖯࣪ᷥⱘ䭓ᑺˈ䖭ѯ㒳 䅵䞣ࣙᣀ⾡ḋⱘ↨՟ˈ⫼ҹᦣ䗄ৠᔶⱘ᭄䞣ˈ↨བ⿴ᑺᣛ᭄ˈ㗙ϔϾ䖯࣪ᷥЁϔϾ⡍ ᕕヺᬍব⢊ᗕⱘᑇഛ᭄˄Swofford, 1990˅DŽሑㅵMPߚᵤЁҡ✊㒣ᐌਞ䖭ѯᣛ᭄ˈԚ ᰃᏆ㒣䆕ᯢ䖭ѯᣛ᭄ফࠄ䆌ҎЎ㋴ⱘᑆᡄˈ↨བ㹿ߚᵤⱘߚ㉏㕸ⱘ᭄䞣DŽ ᢳⷨお˄Huelsenbeck, 1995˅Ꮖ㒣㸼ᯢˈབᵰҢϪ㋏ߚFAXᓔྟⱘᑣ߫䖯࣪ⱘ᭄䞣䖰ѢϪ ㋏ߚ行ⱘߚFAX᭄䞣˄↨བˈϔϾ䖯࣪ᷥЁˈ㒜ッⱘᷥᵱᕜ䭓ˈ㗠ݙ䚼㡖䯈ⱘᷥᵱᕜⷁ˅ˈMP ⱘᬜᵰৠMEϔḋᏂˈ↨ML䖬㽕ᏂDŽ䖭⾡ᚙމӮ䗴៤Ā䭓ᷥᵱᬜᑨ”��䭓ᷥᵱৃ㛑Ӯ 㹿ҎᎹ䖲ˈЎ㌃⿃ⱘ䴲ৠ⑤ⱘⳌԐᗻⱘ᭄䞣䍙䖛њЎⳳᅲⱘⳌ݇ᗻ㗠ֱ⬭ⱘৠ⑤ⳌԐ ᗻⱘ᭄䞣˄Swofford et al., 1996a˅DŽ䖭⾡ᚙމϟˈ⡍ᕕヺࡴᴗӮᬍMPⱘᠻ㸠ᬜᵰ ˄Huelsenbeck, 1995˅DŽ ᳔Ԑ✊ᮍ⊩˄ML, Maximum Likelihood˅ MLᇍ㋏㒳থ㚆䯂乬䖯㸠њᕏᑩ᧰ᶹDŽMLᳳᳯ㛑᧰ᇏߎϔ⾡䖯࣪˄ൟࣙᣀᇍ䖯࣪ᷥᴀ䑿䖯 㸠᧰㋶˅ˈՓᕫ䖭Ͼൟ᠔㛑ѻ⫳ⱘ᭄Ϣ㾖ᆳࠄⱘ᳔᭄ⳌԐDŽ ᅲ䰙ϞˈMLᰃҢ↨ᇍⱘ↣ϔϾ⺅ԡ⚍㸡⫳ߎᴹⱘDŽ㒭ᅮϔϾ⡍ᅮⱘ䖯࣪ᷥ㾖ᆳࠄⱘܼ䚼 ⱘ⺅乥⥛ˈ៥Ӏৃҹ䅵ㅫߎԐ✊ؐˈԧᮍ⊩ᰃ㽕䅵ㅫϔϾԡ⚍䙉ᕾϔϾ⡍ᅮপҷ䖛ᯊ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ11/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com