第九章系统发育分析 页码,9/32 1.基于算法的和基于标准的。基于算法的建树方法根据一系列的步骤得到一个进化树;而 基于标准的建树方法则是根据一些优化的功能对可选的进化树进行评估。相邻连接方法 (NJ)是一个纯粹的基于算法的建树方法,这个方法只得到一个进化树,这个进化树拥 有令人满意的性质,它的距离附加值接近或者是非常优化的(见下);而一个基于标准 的距离建树方法将会根据进化树的附加值优化的标准,对所有可能的进化树(不管这些 进化树是否产生)进行评估 2.基于距离的和基于特征符的。历史上的和现有的许多关于系统发育的讨论描述了各种各 样的基于距离的和基于特征符的建树方法的效用(比如, Sai tou,1996: 1997) 距离建树方法根据一些尺度计算出双重序列的距离,然后抛开真实数据,只是根据固定 的距离建立进化树;而基于特征符的建树方法在建立进化树时,优化了每一个特征符的 真实数据模式的分布,于是双重序列的距离不再固定,而是取决于进化树的拓扑结构 最常用的基于特征符的建树方法包括MP和ML。 距离建树方法 距离建树方法根据双重序列比对的差异程度(距离)建立进化树。如果所有的起源分歧事件 都很精确地记录在序列中( Swofford et al.,19%6a),那么距离建树方法将会重构真实的 进化树。然而,当序列突变达到饱和时,分歧程度就会达到上限。一对分歧序列的其中之 在某个特定位点发生突变后,后续的突变不管发生在哪一条序列,都不会再造成更多的差 异。实际上,后续的变异很可能会使得前一个位点恢复成相等的状态,从而屏蔽掉前一个突 变,因此,绝大多数基于距离的建树方法都会针对这样“不可见”的替换进行修正。在实际 操作中,使用的速率方阵都会很有效地假定:在所观察的相等的碱基对中,实际上存在 比例的位点,这些位点经受了多次突变,而且,随着整个序列差异程度的增加,这些位点的 比例也在增加。有些程序(至少是随意地)会计算出不正确的距离进行,比方说,MEGA程序 ( Kumar et al.,1994)只针对密码子和氨基酸数据会计算出错误的距离:除非序列的整体 差异程度很小,这个程序实质上将会保证给出错误的结果 双重序列差异使用最大似然方法的取代速率计算得到。最常用的距离建树程序使用的模型局 限于时间可逆模型,只包含很有限的几个取代模型;但是PAUP4.0基本上会测试时间可逆模 型的所有变化,包括用最大似然方法从数据中评估得到的实际模型,以及针对非静态数据的 log�det距离建树方法所得到的模型 与最大似然方法相比,距离建树方法的计算强度很小,但是可以使用序列进化的相同模型, 这是它们最主要的优点。这个方法的缺点是屏蔽了真实的特征符数据。最常用的距离建树方 法是“不加权配对组算术方法”( UPGMA, unwei ghted pai r group method wi th ari thetic mean)、相邻连接方法(NJ, nei gabor joi ni ng)和对距离进化树的附加值进行优化的方 法,包括最小进化方法(ME, mi ni mum evol uti on)。有些方法被不止一个系统发育软件包引 用,但是在使用时不一定会使用相同的指定参数和(或)进化树优化特征(比如,树枝交换 �,8�见下)。 不加权配对组算术方法( UPGMA, unweighted pair group method with arithmetic mean) UPGMA是一种聚类或者说是分类方法��它按照配对序列的最大相似性和连接配对的平均 值的标准将进化树的树枝连接起来。它还不是一种严格的进化距离建树方法(Li,1997) 只有当序列分歧是基于一个分子钟或者近似等于原始的序列差异性的时候,我们才会期望 UPGMA会产生一个拥有真实的树枝长度的准确的拓扑结构( ul trametric; Swofford et al. 1996a)。正如前面讨论的那样,在实际问题中很少会遇到这种情况 相邻连接方法(NJ, neighbor joining) file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-181. Ѣㅫ⊩ⱘѢᷛޚⱘDŽѢㅫ⊩ⱘᓎᷥᮍ⊩ḍϔ㋏߫ⱘℹ偸ᕫࠄϔϾ䖯࣪˗ᷥ㗠 Ѣᷛޚⱘᓎᷥᮍ⊩߭ᰃḍϔѯӬ࣪ⱘࡳ㛑ᇍৃ䗝ⱘ䖯࣪ᷥ䖯㸠䆘ԄDŽⳌ䚏䖲ᮍ⊩ ˄NJ˅ᰃϔϾ㒃㊍ⱘѢㅫ⊩ⱘᓎᷥᮍ⊩ˈ䖭Ͼᮍ⊩াᕫࠄϔϾ䖯࣪ˈᷥ䖭Ͼ䖯࣪ᷥᢹ ᳝ҸҎ⒵ᛣⱘᗻ䋼ˈᅗⱘ䎱⾏䰘ࡴؐ䖥㗙ᰃ䴲ᐌӬ࣪ⱘ˄㾕ϟ˅˗㗠ϔϾѢᷛޚ ⱘ䎱⾏ᓎᷥᮍ⊩ᇚӮḍ䖯࣪ᷥⱘ䰘ࡴؐӬ࣪ⱘᷛޚˈᇍ᠔᳝ৃ㛑ⱘ䖯࣪˄ᷥϡㅵ䖭ѯ 䖯࣪ᷥᰃ৺ѻ⫳˅䖯㸠䆘ԄDŽ 2. Ѣ䎱⾏ⱘѢ⡍ᕕヺⱘDŽग़Ϟⱘ⦄᳝ⱘ䆌݇Ѣ㋏㒳থ㚆ⱘ䅼䆎ᦣ䗄њ⾡ ḋⱘѢ䎱⾏ⱘѢ⡍ᕕヺⱘᓎᷥᮍ⊩ⱘᬜ⫼˄↨བˈSaitou, 1996: Li, 1997˅DŽ 䎱⾏ᓎᷥᮍ⊩ḍϔѯሎᑺ䅵ㅫߎঠ䞡ᑣ߫ⱘ䎱⾏ˈ✊ৢᡯᓔⳳᅲ᭄ˈাᰃḍᅮ ⱘ䎱⾏ᓎゟ䖯࣪˗ᷥ㗠Ѣ⡍ᕕヺⱘᓎᷥᮍ⊩ᓎゟ䖯࣪ˈᯊᷥӬ࣪њ↣ϔϾ⡍ᕕヺⱘ ⳳᅲ᭄ᓣⱘߚᏗˈѢᰃঠ䞡ᑣ߫ⱘ䎱⾏ϡݡᅮˈ㗠ᰃপއѢ䖯࣪ᷥⱘᢧᠥ㒧ᵘDŽ ᳔ᐌ⫼ⱘѢ⡍ᕕヺⱘᓎᷥᮍ⊩ࣙᣀMPMLDŽ 䎱⾏ᓎᷥᮍ⊩ 䎱⾏ᓎᷥᮍ⊩ḍঠ䞡ᑣ߫↨ᇍⱘᏂᓖᑺ˄䎱⾏˅ᓎゟ䖯࣪ᷥDŽབᵰ᠔᳝ⱘ䍋⑤ߚFAXџӊ 䛑ᕜ㊒⹂ഄ䆄ᔩᑣ߫Ё˄Swofford et al., 1996a˅ˈ䙷М䎱⾏ᓎᷥᮍ⊩ᇚӮ䞡ᵘⳳᅲⱘ 䖯࣪ᷥDŽ✊㗠ˈᔧᑣ߫さব䖒ࠄ佅ᯊˈߚFAXᑺህӮ䖒ࠄϞ䰤DŽϔᇍߚFAXᑣ߫ⱘ݊ЁПϔ ᶤϾ⡍ᅮԡ⚍থ⫳さবৢˈৢ㓁ⱘさবϡㅵথ⫳ાϔᴵᑣ߫ˈ䛑ϡӮݡ䗴៤ⱘᏂ ᓖDŽᅲ䰙Ϟˈৢ㓁ⱘবᓖᕜৃ㛑ӮՓᕫࠡϔϾԡ⚍ᘶ៤Ⳍㄝⱘ⢊ᗕˈҢ㗠ሣ㬑ᥝࠡϔϾさ বˈℸˈ㒱᭄Ѣ䎱⾏ⱘᓎᷥᮍ⊩䛑Ӯ䩜ᇍ䖭ḋĀϡৃ㾕āⱘ᳓ᤶ䖯㸠ׂℷDŽᅲ䰙 ᪡ЁˈՓ⫼ⱘ䗳⥛ᮍ䰉䛑Ӯᕜ᳝ᬜഄ؛ᅮ˖᠔㾖ᆳⱘⳌㄝⱘ⺅ᇍЁˈᅲ䰙Ϟᄬϔᅮ ↨՟ⱘԡ⚍ˈ䖭ѯԡ⚍㒣ফњさবˈ㗠Ϩˈ䱣ⴔᭈϾᑣ߫Ꮒᓖᑺⱘࡴˈ䖭ѯԡ⚍ⱘ ↨՟гࡴDŽ᳝ѯᑣ˄㟇ᇥᰃ䱣ᛣഄ˅Ӯ䅵ㅫߎϡℷ⹂ⱘ䎱⾏䖯㸠ˈ↨ᮍ䇈ˈMEGAᑣ ˄Kumar et al., 1994˅া䩜ᇍᆚⷕᄤ⇼䝌᭄Ӯ䅵ㅫߎ䫭䇃ⱘ䎱⾏˗䰸䴲ᑣ߫ⱘᭈԧ Ꮒᓖᑺᕜᇣˈ䖭Ͼᑣᅲ䋼ϞᇚӮֱ䆕㒭ߎ䫭䇃ⱘ㒧ᵰDŽ ঠ䞡ᑣ߫ᏂᓖՓ⫼᳔Ԑ✊ᮍ⊩ⱘপҷ䗳⥛䅵ㅫᕫࠄDŽ᳔ᐌ⫼ⱘ䎱⾏ᓎᷥᑣՓ⫼ⱘൟሔ 䰤Ѣᯊ䯈ৃ䗚ൟˈাࣙᕜ᳝䰤ⱘϾপҷൟ˗ԚᰃPAUP 4.0 ᴀϞӮ⌟䆩ᯊ䯈ৃ䗚 ൟⱘ᠔᳝ব࣪ˈࣙᣀ⫼᳔Ԑ✊ᮍ⊩Ң᭄Ё䆘Ԅᕫࠄⱘᅲ䰙ൟˈҹঞ䩜ᇍ䴲䴭ᗕ᭄ⱘ log�det䎱⾏ᓎᷥᮍ⊩᠔ᕫࠄⱘൟDŽ Ϣ᳔Ԑ✊ᮍ⊩Ⳍ↨ˈ䎱⾏ᓎᷥᮍ⊩ⱘ䅵ㅫᔎᑺᕜᇣˈԚᰃৃҹՓ⫼ᑣ߫䖯࣪ⱘⳌৠൟˈ 䖭ᰃᅗӀ᳔Џ㽕ⱘӬ⚍DŽ䖭Ͼᮍ⊩ⱘ㔎⚍ᰃሣ㬑њⳳᅲⱘ⡍ᕕヺ᭄DŽ᳔ᐌ⫼ⱘ䎱⾏ᓎᷥᮍ ⊩ᰃĀϡࡴᴗ䜡ᇍ㒘ㅫᴃᮍ⊩ā˄UPGMAˈunweighted pair group method with arithmetic mean˅ǃⳌ䚏䖲ᮍ⊩˄NJˈneighbor joining˅ᇍ䎱⾏䖯࣪ᷥⱘ䰘ࡴؐ䖯㸠Ӭ࣪ⱘᮍ ⊩ˈࣙᣀ᳔ᇣ䖯࣪ᮍ⊩˄MEˈminimum evolution˅DŽ᳝ѯᮍ⊩㹿ϡℶϔϾ㋏㒳থ㚆䕃ӊࣙᓩ ⫼ˈԚᰃՓ⫼ᯊϡϔᅮӮՓ⫼Ⳍৠⱘᣛᅮখ᭄˄˅䖯࣪ᷥӬ࣪⡍ᕕ˄↨བˈᷥᵱѸᤶ ��㾕ϟ˅DŽ ϡࡴᴗ䜡ᇍ㒘ㅫᴃᮍ⊩˄UPGMAˈunweighted pair group method with arithmetic mean˅ UPGMAᰃϔ⾡㘮㉏㗙䇈ᰃߚ㉏ᮍ⊩��ᅗᣝ✻䜡ᇍᑣ߫ⱘ᳔ⳌԐᗻ䖲䜡ᇍⱘᑇഛ ؐⱘᷛޚᇚ䖯࣪ᷥⱘᷥᵱ䖲䍋ᴹDŽᅗ䖬ϡᰃϔ⾡ϹḐⱘ䖯࣪䎱⾏ᓎᷥᮍ⊩˄Li, 1997˅DŽ া᳝ᔧᑣ߫ߚFAXᰃѢϔϾߚᄤ䩳㗙䖥ԐㄝѢॳྟⱘᑣ߫Ꮒᓖᗻⱘᯊˈ៥ӀᠡӮᳳᳯ UPGMAӮѻ⫳ϔϾᢹ᳝ⳳᅲⱘᷥᵱ䭓ᑺⱘޚ⹂ⱘᢧᠥ㒧ᵘ˄ultrametric; Swofford et al., 1996a˅DŽℷབࠡ䴶䅼䆎ⱘ䙷ḋˈᅲ䰙䯂乬ЁᕜᇥӮ䘛ࠄ䖭⾡ᚙމDŽ Ⳍ䚏䖲ᮍ⊩˄NJˈneighbor joining˅ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ9/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com