第九章系统发育分析 页码,12/3 所得到的变化模式的概率;似然值就是把在这个特定的取代过程中每一个可能的取代的再现 的概率进行加和。所有位点的似然值相乘就得到了整个进化树的似然值(也就是说,数据集 的概率给出了进化树和进化过程)。大家可以想象一下,对于一个特定的进化树,数据集的 似然值在某些位点偏低,而另外一些位点偏高。如果进化树比较好,那么大多数位点的似然 值都会较髙,因此整个似然值较高:如果进化树不太好,似然值就会比较低。如果数据集中 没有系统发育的信号,所有随机的进化树的似然值上都会相差无几 取代模型应该得到优化,以适应观察到的数据的需要。比方说,如果存在着转化的偏好(其 明显表现为有大量的位点只包含嘌呤或者只包含嘧啶),那么,如果计算数据的似然值时所 采用的模型没有考虑偏好的话,其效果显然不如采用考虑了偏好的模型。同样地,如果有 部分位点确实只包含一种碱基,而另外一部分位点以相同的概率包含各种碱基,那么,如果 计算数据的似然值时所采用的模型假定所有位点的进化都平等的话,其效果显然不如采用考 虑了位点内部的速率差异的模型。对于一个特定的进化树,改变取代参数就意味着将改变与 之相关联的数据集的似然值;因此,在某一个取代模型下,进化树可以取得很高的似然值, 但是,在另一个取代模型下,进化树所取得的似然值就可能会很低 因为M要耗费大量的计算机机时,所以对于一个给定的数据集,想要在优化取代模型和进化 树的同时进行完全的搜索几乎是不可实现的。值得推荐的是一个很经济的探索式的程序 ( Adachi and Hasegawa,1996; Swofford et al.1996a)。在这一点上,可能最好的节约 时间的方法是前面所说的对取代模型的M评估(图9.7)。这个程序可以反复进行,搜索到较 好的M进化树,然后重新对参数进行评估,然后搜索更好的进化树。 随着算法、计算机和对系统发育的认识的进步,M标准在分子系统发育分析中也变得越来越 流行。在模拟研究中,如果对由相同的模型产生的数据进行数据分析的话,M做得总是比ME 和MP要好( Huel senbeck,1995)。在所有的方法中,M的计算强度最大,所以在某些情况 下,它总是无法实现;而且,同样的模拟研究表明在许多情况下,ME和M方法同M方法的执 行效果一样好(或者一样差)。 距离方法、节约方法和最大似然方法的差异 距离方阵方法简单的计算两个序列的差异数量。这个数量被看作进化距离,而其准确大小依 赖于进化模型的选择。然后运行一个聚类算法,从最相似(也就是说,两者之间的距离最 短)的序列开始,通过距离值方阵计算出实际的进化树,或者通过将总的树枝长度最小化而 优化出进化树 用最大节约方法搜索进化树的原理是要求用最小的改变来解释所要研究的分类群之间的观察 到的差异。 用于系统发育推论的最大似然方法评估所选定的进化模型能够产生实际观察到的数据的可能 性。进化模型可能只是简单地假定所有核苷酸(或者氨基酸)之间相互转变的概率一样。程 序会把所有可能的核苷酸轮流置于进化树的内部节点上,并且计算每一个这样的序列产生实 际数据的可能性(如果两个姐妹分类群都有核苷酸”A″,那么,如果假定原先的核苷酸是 C”,得到现在的”A"的可能性比起假定原先就是“A"的可能性要小得多)。所有可能的 再现(不仅仅是比较可能的再现)的几率被加总,产生一个特定位点的似然值,然后这个数 据集的所有比对位点的似然值的加和就是整个进化树的似然值。 进化树搜索 即使是对于一个只有50个序列的系统来说,单一的系统发育进化树的数量也会随着分类群数 量的增长而按照指数规律增长,从而变为一个天文数字( Swofford et a.,1996a;Li 1997)。由于计算能力的限制,现在一般只允许对很小一部分的可能的进化树进行搜索。具 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18᠔ᕫࠄⱘব࣪ᓣⱘὖ⥛˗Ԑ✊ؐህᰃᡞ䖭Ͼ⡍ᅮⱘপҷ䖛Ё↣ϔϾৃ㛑ⱘপҷⱘݡ⦃ ⱘὖ⥛䖯㸠ࡴDŽ᠔᳝ԡ⚍ⱘԐ✊ؐⳌЬህᕫࠄњᭈϾ䖯࣪ᷥⱘԐ✊ؐ˄гህᰃ䇈ˈ᭄䲚 ⱘὖ⥛㒭ߎњ䖯࣪ᷥ䖯࣪䖛˅DŽᆊৃҹᛇ䈵ϔϟˈᇍѢϔϾ⡍ᅮⱘ䖯࣪ˈ᭄ᷥ䲚ⱘ Ԑ✊ؐᶤѯԡ⚍أԢˈ㗠ϔѯԡ⚍أ催DŽབᵰ䖯࣪↨ᷥ䕗དˈ䙷М᭄ԡ⚍ⱘԐ✊ ؐ䛑Ӯ䕗催ˈℸᭈϾԐ✊ؐ䕗催˗བᵰ䖯࣪ᷥϡདˈԐ✊ؐህӮ↨䕗ԢDŽབᵰ᭄䲚Ё ≵᳝㋏㒳থ㚆ⱘֵোˈ᠔᳝䱣ᴎⱘ䖯࣪ᷥⱘԐ✊ؐϞ䛑ӮⳌᏂ᮴DŽ পҷൟᑨ䆹ᕫࠄӬ࣪ˈҹ䗖ᑨ㾖ᆳࠄⱘ᭄ⱘ䳔㽕DŽ↨ᮍ䇈ˈབᵰᄬⴔ䕀࣪ⱘأད˄݊ ᯢᰒ㸼⦄Ў᳝䞣ⱘԡ⚍াࣙਸ㗙াࣙˈ˅䙷Мˈབᵰ䅵ㅫ᭄ⱘԐ✊ؐᯊ᠔ 䞛⫼ⱘൟ≵᳝㗗㰥أདⱘ䆱ˈ݊ᬜᵰᰒ✊ϡབ䞛⫼㗗㰥њأདⱘൟDŽৠḋഄˈབᵰ᳝ϔ 䚼ߚԡ⚍⹂ᅲাࣙϔ⾡⺅ˈ㗠ϔ䚼ߚԡ⚍ҹⳌৠⱘὖ⥛ࣙˈ⺅辵䙷Мˈབᵰ 䅵ㅫ᭄ⱘԐ✊ؐᯊ᠔䞛⫼ⱘൟ؛ᅮ᠔᳝ԡ⚍ⱘ䖯࣪䛑ᑇㄝⱘ䆱ˈ݊ᬜᵰᰒ✊ϡབ䞛⫼㗗 㰥њԡ⚍ݙ䚼ⱘ䗳⥛ᏂᓖⱘൟDŽᇍѢϔϾ⡍ᅮⱘ䖯࣪ˈᷥᬍবপҷখ᭄ህᛣੇⴔᇚᬍবϢ ПⳌ݇㘨ⱘ᭄䲚ⱘԐ✊ؐ˗ℸˈᶤϔϾপҷൟϟˈ䖯࣪ৃᷥҹপᕫᕜ催ⱘԐ✊ؐˈ ԚᰃˈϔϾপҷൟϟˈ䖯࣪ᷥ᠔পᕫⱘԐ✊ؐህৃ㛑ӮᕜԢDŽ ЎML㽕㗫䌍䞣ⱘ䅵ㅫᴎᴎᯊˈ᠔ҹᇍѢϔϾ㒭ᅮⱘ᭄䲚ˈᛇ㽕Ӭ࣪পҷൟ䖯࣪ ᷥⱘৠᯊ䖯㸠ᅠܼⱘ᧰㋶Тᰃϡৃᅲ⦄ⱘDŽؐᕫ㤤ⱘᰃϔϾᕜ㒣⌢ⱘ㋶ᓣⱘᑣ ˄Adachi and Hasegawa, 1996; Swofford et al., 1996a˅DŽ䖭ϔ⚍Ϟˈৃ㛑᳔དⱘ㡖㑺 ᯊ䯈ⱘᮍ⊩ᰃࠡ䴶᠔䇈ⱘᇍপҷൟⱘML䆘Ԅ˄9.7˅DŽ䖭Ͼᑣৃҹড䖯㸠ˈ᧰㋶ࠄ䕗 དⱘML䖯࣪ৢ✊ˈᷥ䞡ᮄᇍখ᭄䖯㸠䆘Ԅˈ✊ৢ᧰㋶དⱘ䖯࣪ᷥDŽ 䱣ⴔㅫ⊩ǃ䅵ㅫᴎᇍ㋏㒳থ㚆ⱘ䅸䆚ⱘ䖯ℹˈMLᷛޚߚᄤ㋏㒳থ㚆ߚᵤЁгবᕫ䍞ᴹ䍞 ⌕㸠DŽᢳⷨおЁˈབᵰᇍ⬅Ⳍৠⱘൟѻ⫳ⱘ᭄䖯㸠᭄ߚᵤⱘ䆱ˈMLخᕫᘏᰃ↨ME MP㽕ད˄Huelsenbeck, 1995˅DŽ᠔᳝ⱘᮍ⊩ЁˈMLⱘ䅵ㅫᔎᑺ᳔ˈ᠔ҹᶤѯᚙމ ϟˈᅗᘏᰃ᮴⊩ᅲ⦄˗㗠Ϩˈৠḋⱘᢳⷨお㸼ᯢ䆌ᚙމϟˈMEMPᮍ⊩ৠMLᮍ⊩ⱘᠻ 㸠ᬜᵰϔḋད˄㗙ϔḋᏂ˅DŽ 䎱⾏ᮍ⊩ǃ㡖㑺ᮍ⊩᳔Ԑ✊ᮍ⊩ⱘᏂᓖ 䎱⾏ᮍ䰉ᮍ⊩ㅔऩⱘ䅵ㅫϸϾᑣ߫ⱘᏂᓖ᭄䞣DŽ䖭Ͼ᭄䞣㹿ⳟ䖯࣪䎱⾏ˈ㗠݊ޚ⹂ᇣձ 䌪Ѣ䖯࣪ൟⱘ䗝ᢽDŽ✊ৢ䖤㸠ϔϾ㘮㉏ㅫ⊩ˈҢ᳔ⳌԐ˄гህᰃ䇈ˈϸ㗙П䯈ⱘ䎱⾏᳔ ⷁ˅ⱘᑣ߫ᓔྟˈ䗮䖛䎱⾏ؐᮍ䰉䅵ㅫߎᅲ䰙ⱘ䖯࣪ˈᷥ㗙䗮䖛ᇚᘏⱘᷥᵱ䭓ᑺ᳔ᇣ࣪㗠 Ӭߎ࣪䖯࣪ᷥDŽ ⫼᳔㡖㑺ᮍ⊩᧰㋶䖯࣪ᷥⱘॳ⧚ᰃ㽕∖⫼᳔ᇣⱘᬍবᴹ㾷䞞᠔㽕ⷨおⱘߚ㉏㕸П䯈ⱘ㾖ᆳ ⱘᏂᓖDŽࠄ ⫼Ѣ㋏㒳থ㚆䆎ⱘ᳔Ԑ✊ᮍ⊩䆘Ԅ᠔䗝ᅮⱘ䖯࣪ൟ㛑ѻ⫳ᅲ䰙㾖ᆳࠄⱘ᭄ⱘৃ㛑 ᗻDŽ䖯࣪ৃൟ㛑াᰃㅔऩഄ؛ᅮ᠔᳝Ḍ㣋䝌˄㗙⇼䝌˅П䯈ⳌѦ䕀বⱘὖ⥛ϔḋDŽ ᑣӮᡞ᠔᳝ৃ㛑ⱘḌ㣋䝌䕂⌕㕂Ѣ䖯࣪ᷥⱘݙ䚼㡖⚍ϞˈᑊϨ䅵ㅫ↣ϔϾ䖭ḋⱘᑣ߫ѻ⫳ᅲ 䰙᭄ⱘৃ㛑ᗻ˄བᵰϸϾྤྍߚ㉏㕸䛑᳝Ḍ㣋䝌“A”ˈ䙷Мˈབᵰ؛ᅮॳܜⱘḌ㣋䝌ᰃ “C”ˈᕫࠄ⦃ⱘ“A”ⱘৃ㛑ᗻ↨䍋؛ᅮॳܜህᰃ“A”ⱘৃ㛑ᗻ㽕ᇣᕫ˅DŽ᠔᳝ৃ㛑ⱘ ݡ˄⦃ϡҙҙᰃ↨䕗ৃ㛑ⱘݡ˅⦃ⱘ⥛㹿ࡴᘏˈѻ⫳ϔϾ⡍ᅮԡ⚍ⱘԐ✊ؐˈ✊ৢ䖭Ͼ᭄ 䲚ⱘ᠔᳝↨ᇍԡ⚍ⱘԐ✊ؐⱘࡴህᰃᭈϾ䖯࣪ᷥⱘԐ✊ؐDŽ 䖯࣪᧰ᷥ㋶ ेՓᰃᇍѢϔϾা᳝50Ͼᑣ߫ⱘ㋏㒳ᴹ䇈ˈऩϔⱘ㋏㒳থ㚆䖯࣪ᷥⱘ᭄䞣гӮ䱣ⴔߚ㉏㕸᭄ 䞣ⱘ䭓㗠ᣝ✻ᣛ᭄㾘ᕟ䭓ˈҢ㗠বЎϔϾ᭛᭄ᄫ˄Swofford et al., 1996a; Li, 1997˅DŽ⬅Ѣ䅵ㅫ㛑ⱘ䰤ࠊ⦃ˈϔ㠀াܕ䆌ᇍᕜᇣϔ䚼ߚⱘৃ㛑ⱘ䖯࣪ᷥ䖯㸠᧰㋶DŽ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ12/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com