正在加载图片...
第九章系统发育分析 页码,13/37 体的数目主要依赖于分类群的数量、优化标准(比如说,MP要比M快得多)、参数设定(比 如说,不加权的MP要比加权的快得多;预置了少量参数的M要比预置大量参数或者对参数进 行同步优化要快得多)、计算机硬件以及计算机软件(对软件的依赖性较小;但是某些算法 要比其它算法快;某些软件允许多线程;某些软件限制内存里的进化树的数量和种类)。搜 索程序还会受到数据结构的影响:如果数据解析得很糟糕,那么将会得到较多的“近乎优 化”的进化树,这些进化树必须重新评估以确定其中最优化的进化树 树枝交换算法不断修整由初始步骤所建立的进化树( Swofford et al.,1996a)。这个算法 的范围很广,既可以产生所有可能的单一进化树(穷举算法),也可以只评估次要的修改。 有两种搜索方法保证可以找到最优化的进化树:穷举法和树枝&#;跳跃法(BB)( Swofford etal.,1996a)。对于一个很大的数据集,这两种方法都很不实用。对分类群数量的限制主 要取决于数据结构和计算机速度,但是对于超过20个分类群的数据集,BB方法很少会得到应 用。穷举法要根据优化标准,对每一个可能的进化树进行评估。BB方法提供一个逻辑方法, 以确定那些进化树是值得评估的,而另一些进化树是可以简单地屏蔽掉的。因此BB方法通常 要比穷举法快得多 绝大多数分析方法都使用“启发式”的搜索( Swofford et a.,1996a)。启发式现搜索出 相近的次优化的进化树家族(“岛屿”),然后从中得到优化解(“山顶”)。不同的算法 用不同程度的精确性搜索这些岛屿和山顶。最彻底也是最慢的程序(TBR, tree bi secti on reconnect on,进化树对分重接)先把进化树在每一个内部树枝处劈开,然后以任意方式将 劈开的碎片重新组合起来( Swofford et a.,1996a)。最快的算法只是检査一下相邻终端 的不太重要的重新组合,因此倾向于找到最近的岛屿的山顶。 有许多不同的软件会执行进化树的搜索算法。PAUP允许对搜索选项进行全范围的设置,从最 肤浅的到最详尽的;而且,对于一个简单的定制搜索,它允许使用不同算法的任意组合,其 中每一个算法都有多个可供用户定义的参数,同时还提供评估搜索过程和中途修改搜索进程 的方法。PAUP还可以对进化树岛屿了如指掌,掌握岛屿被命中的次数 要想改善搜索效率和进化树的优化,可以尝试大量不同的策略。比如说,有些分析方法要耗 费大量的机时和精力才能找到岛屿;要到达同样的效果,我们可以先制造各种各样的“起 始”进化树,这些起始进化树满足一个初始标准,然后用PAUP将这些起始进化树排列成岛 屿,最后用更加彻底的算法进行评估。 降低搜索代价的一个最好方法就是对数据集进行剪除。比方说,从数据集本身或者从预置的 搜索中,我们可能会很明显地知道一个由五个终端组成的聚集是不可分解的,并且这些终端 的排列并不影响剩下的拓扑结构,而且对这些终端进行分解并不符合数据分析的目的;这 时,如果在分析中除去这个聚集中的四个终端,将会把搜索任务简化几个量级。 每一种分析都是独一无二的。影响对优化搜索策略(数据量,数据结构,时间量,硬件,分 析目的)进行选择的因素太复杂,使得我们无法推荐一个简单可行的处方。因此进行搜索的 用户必须对他的数据非常熟悉:;他们的脑海里必须要有明确的目标,了解各种各样的搜索程 序,了解他们的硬件设备和软件的能力;他们必须能够发展他们自己的协议。 建立并搜索进化树的其它方法 上述方法在当前的应用中是最广泛的。当然我们还可能会在别处注意到,还有大量的建立和 搜索进化树的其它方法( Swofford et al.1996a:Li,1997)。这些方法包括 Wagner距离 方法和亲近方法(距离转化方法);包括Lake的不变式方法(一个基于特征符的方法,它选 择的拓扑结构包含一个意义重大的正数以支持颠换);包括 Hadamard结合方法(一个精细的 代数方阵方法,对距离数据或者观察到的特征符进行修正);包括裂解方法(这个方法决定 在数据中应该支持哪一个基于距离的可选的拓扑结构)。四重奏迷惑( Quartet puzzl i ng file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18ԧⱘ᭄ⳂЏ㽕ձ䌪Ѣߚ㉏㕸ⱘ᭄䞣ǃӬ࣪ᷛޚ↨˄བ䇈ˈMP㽕↨MLᖿᕫ໮˅ǃখ᭄䆒ᅮ˄↨ བ䇈ˈϡࡴᴗⱘMP㽕↨ࡴᴗⱘᖿᕫ໮˗乘㕂њᇥ䞣খ᭄ⱘML㽕↨乘㕂໻䞣খ᭄៪㗙ᇍখ᭄䖯 㸠ৠℹӬ࣪㽕ᖿᕫ໮˅ǃ䅵ㅫᴎ⹀ӊҹঞ䅵ㅫᴎ䕃ӊ˄ᇍ䕃ӊⱘձ䌪ᗻ䕗ᇣ˗Ԛᰃᶤѯㅫ⊩ 㽕↨݊ᅗㅫ⊩ᖿ˗ᶤѯ䕃ӊܕ䆌໮㒓⿟˗ᶤѯ䕃ӊ䰤ݙࠊᄬ䞠ⱘ䖯࣪ᷥⱘ᭄䞣੠⾡㉏˅DŽ᧰ ㋶⿟ᑣ䖬Ӯফࠄ᭄᥂㒧ᵘⱘᕅડ˖བᵰ᭄᥂㾷ᵤᕫᕜ㊳㊩ˈ䙷МᇚӮᕫࠄ䕗໮ⱘĀ䖥ТӬ ࣪āⱘ䖯࣪ˈᷥ䖭ѯ䖯࣪ᷥᖙ乏䞡ᮄ䆘Ԅҹ⹂ᅮ݊Ё᳔Ӭ࣪ⱘ䖯࣪ᷥDŽ ᷥᵱѸᤶㅫ⊩ϡᮁׂᭈ⬅߱ྟℹ偸᠔ᓎゟⱘ䖯࣪˄ᷥSwofford et al., 1996a˅DŽ䖭Ͼㅫ⊩ ⱘ㣗ೈᕜᑓˈ᮶ৃҹѻ⫳᠔᳝ৃ㛑ⱘऩϔ䖯࣪˄ᷥかВㅫ⊩˅ˈгৃҹা䆘Ԅ⃵㽕ⱘׂᬍDŽ ᳝ϸ⾡᧰㋶ᮍ⊩ֱ䆕ৃҹᡒࠄ᳔Ӭ࣪ⱘ䖯࣪˖ᷥかВ⊩੠ᷥᵱ�䏇䎗⊩˄BB˅˄Swofford et al., 1996a˅DŽᇍѢϔϾᕜ໻ⱘ᭄᥂䲚ˈ䖭ϸ⾡ᮍ⊩䛑ᕜϡᅲ⫼DŽᇍߚ㉏㕸᭄䞣ⱘ䰤ࠊЏ 㽕পއѢ᭄᥂㒧ᵘ੠䅵ㅫᴎ䗳ᑺˈԚᰃᇍѢ䍙䖛20Ͼߚ㉏㕸ⱘ᭄᥂䲚ˈBBᮍ⊩ᕜᇥӮᕫࠄᑨ ⫼DŽかВ⊩㽕ḍ᥂Ӭ࣪ᷛޚˈᇍ↣ϔϾৃ㛑ⱘ䖯࣪ᷥ䖯㸠䆘ԄDŽBBᮍ⊩ᦤկϔϾ䘏䕥ᮍ⊩ˈ ҹ⹂ᅮ䙷ѯ䖯࣪ᷥᰃؐᕫ䆘Ԅⱘˈ㗠঺ϔѯ䖯࣪ᷥᰃৃҹㅔऩഄሣ㬑ᥝⱘDŽ಴ℸBBᮍ⊩䗮ᐌ 㽕↨かВ⊩ᖿᕫ໮DŽ 㒱໻໮᭄ߚᵤᮍ⊩䛑Փ⫼Āਃথᓣāⱘ᧰㋶˄Swofford et al., 1996a˅DŽਃথᓣ⦄᧰㋶ߎ Ⳍ䖥ⱘ⃵Ӭ࣪ⱘ䖯࣪ᷥᆊᮣ˄Āቯቓā˅ˈ✊ৢҢЁᕫࠄӬ࣪㾷˄Āቅ乊ā˅DŽϡৠⱘㅫ⊩ ⫼ϡৠ⿟ᑺⱘ㊒⹂ᗻ᧰㋶䖭ѯቯቓ੠ቅ乊DŽ᳔ᕏᑩгᰃ᳔᜶ⱘ⿟ᑣ˄TBRˈtree bisection￾reconnectionˈ䖯࣪ᷥᇍߚ䞡᥹˅ܜᡞ䖯࣪↣೼ᷥϔϾݙ䚼ᷥᵱ໘࡜ᓔˈ✊ৢҹӏᛣᮍᓣᇚ ࡜ᓔⱘ⹢⠛䞡ᮄ㒘ড়䍋ᴹ˄Swofford et al., 1996a˅DŽ᳔ᖿⱘㅫ⊩াᰃẔᶹϔϟⳌ䚏㒜ッ ⱘϡ໾䞡㽕ⱘ䞡ᮄ㒘ড়ˈ಴ℸؒ৥Ѣᡒࠄ᳔䖥ⱘቯቓⱘቅ乊DŽ ᳝䆌໮ϡৠⱘ䕃ӊӮᠻ㸠䖯࣪ᷥⱘ᧰㋶ㅫ⊩DŽPAUPܕ䆌ᇍ᧰㋶䗝乍䖯㸠ܼ㣗ೈⱘ䆒㕂ˈҢ᳔ 㙸⌙ⱘࠄ᳔䆺ሑⱘ˗㗠ϨˈᇍѢϔϾㅔऩⱘᅮࠊ᧰㋶ˈᅗܕ䆌Փ⫼ϡৠㅫ⊩ⱘӏᛣ㒘ড়ˈ݊ Ё↣ϔϾㅫ⊩䛑᳝໮Ͼৃկ⫼᠋ᅮНⱘখ᭄ˈৠᯊ䖬ᦤկ䆘Ԅ᧰㋶䖛⿟੠Ё䗨ׂᬍ᧰㋶䖯⿟ ⱘᮍ⊩DŽPAUP䖬ৃҹᇍ䖯࣪ᷥቯቓњབᣛᥠˈᥠᦵቯቓ㹿ੑЁⱘ⃵᭄DŽ 㽕ᛇᬍ୘᧰㋶ᬜ⥛੠䖯࣪ᷥⱘӬ࣪ৃˈҹᇱ䆩໻䞣ϡৠⱘㄪ⬹DŽ↨བ䇈ˈ᳝ѯߚᵤᮍ⊩㽕㗫 䌍໻䞣ⱘᴎᯊ੠㊒࡯ᠡ㛑ᡒࠄቯቓ˗㽕ࠄ䖒ৠḋⱘᬜᵰˈ៥Ӏৃҹࠊܜ䗴৘⾡৘ḋⱘĀ䍋 ྟā䖯࣪ˈᷥ䖭ѯ䍋ྟ䖯࣪ᷥ⒵䎇ϔϾ߱ྟᷛޚ⫼ৢ✊ˈPAUPᇚ䖭ѯ䍋ྟ䖯࣪ᷥᥦ߫៤ቯ ቓˈ᳔ৢ⫼᳈ࡴᕏᑩⱘㅫ⊩䖯㸠䆘ԄDŽ 䰡Ԣ᧰㋶ҷӋⱘϔϾ᳔དᮍ⊩ህᰃᇍ᭄᥂䲚䖯㸠࠾䰸DŽ↨ᮍ䇈ˈҢ᭄᥂䲚ᴀ䑿៪㗙Ң乘㕂ⱘ ᧰㋶Ёˈ៥Ӏৃ㛑Ӯᕜᯢᰒഄⶹ䘧ϔϾ⬅ѨϾ㒜ッ㒘៤ⱘ㘮䲚ᰃϡৃߚ㾷ⱘˈᑊϨ䖭ѯ㒜ッ ⱘᥦ߫ᑊϡᕅડ࠽ϟⱘᢧᠥ㒧ᵘˈ㗠Ϩᇍ䖭ѯ㒜ッ䖯㸠ߚ㾷ᑊϡヺড়᭄᥂ߚᵤⱘⳂⱘ˗䖭 ᯊˈབᵰ೼ߚᵤЁ䰸এ䖭Ͼ㘮䲚ЁⱘಯϾ㒜ッˈᇚӮᡞ᧰㋶ӏࡵㅔ޴࣪Ͼ䞣㑻DŽ ↣ϔ⾡ߚᵤ䛑ᰃ⣀ϔ᮴ѠⱘDŽᕅડᇍӬ࣪᧰㋶ㄪ⬹˄᭄᥂䞣ˈ᭄᥂㒧ᵘˈᯊ䯈䞣ˈ⹀ӊˈߚ ᵤⳂⱘ˅䖯㸠䗝ᢽⱘ಴㋴໾໡ᴖˈՓᕫ៥Ӏ᮴⊩᥼㤤ϔϾㅔऩৃ㸠ⱘ໘ᮍDŽ಴ℸ䖯㸠᧰㋶ⱘ ⫼᠋ᖙ乏ᇍҪⱘ᭄᥂䴲ᐌ❳ᙝ˗ҪӀⱘ㛥⍋䞠ᖙ乏㽕᳝ᯢ⹂ⱘⳂᷛˈњ㾷৘⾡৘ḋⱘ᧰㋶⿟ ᑣˈњ㾷ҪӀⱘ⹀ӊ䆒໛੠䕃ӊⱘ㛑࡯˗ҪӀᖙ乏㛑໳থሩҪӀ㞾Ꮕⱘण䆂DŽ ᓎゟᑊ᧰㋶䖯࣪ᷥⱘ݊ᅗᮍ⊩ Ϟ䗄ᮍ⊩೼ᔧࠡⱘᑨ⫼Ёᰃ᳔ᑓ⊯ⱘDŽᔧ✊៥Ӏ䖬ৃ㛑Ӯ೼߿໘⊼ᛣࠄˈ䖬᳝໻䞣ⱘᓎゟ੠ ᧰㋶䖯࣪ᷥⱘ݊ᅗᮍ⊩˄Swofford et al., 1996a; Li, 1997˅DŽ䖭ѯᮍ⊩ࣙᣀWagner䎱⾏ ᮍ⊩੠҆䖥ᮍ⊩˄䎱⾏䕀࣪ᮍ⊩˅˗ࣙᣀLakeⱘϡবᓣᮍ⊩˄ϔϾ෎Ѣ⡍ᕕヺⱘᮍ⊩ˈᅗ䗝 ᢽⱘᢧᠥ㒧ᵘࣙ৿ϔϾᛣН䞡໻ⱘℷ᭄ҹᬃᣕ乴ᤶ˅˗ࣙᣀHadamard㒧ড়ᮍ⊩˄ϔϾ㊒㒚ⱘ ҷ᭄ᮍ䰉ᮍ⊩ˈᇍ䎱⾏᭄᥂៪㗙㾖ᆳࠄⱘ⡍ᕕヺ䖯㸠ׂℷ˅˗ࣙᣀ㺖㾷ᮍ⊩˄䖭Ͼᮍ⊩އᅮ ೼᭄᥂Ёᑨ䆹ᬃᣕાϔϾ෎Ѣ䎱⾏ⱘৃ䗝ⱘᢧᠥ㒧ᵘ˅DŽಯ䞡༣䗋ᚥ˄Quartet puzzling˅ ㄀бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ13/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有