第九章系统发育分析 页码,27/32 碱基比对的碱基分布;列表示菠菜中,同铁锈真菌的特定碱基比对的碱基分布;对角线元素 是两个序列中碱基位点相同的数目。注意铁锈真菌中有AT碱基偏向:铁锈真菌中有83(10+ 36+25+12)个位点是A或者T,它们对应的菠菜序列的位点是G和C;想比较而言,铁锈真菌 中只有47(6+22+13+6)个位点是G和C,其对应的菠菜序列的位点是A和T。因为这两个 序列的绝大多数位点都相同,并且因为变异受到限制,所以对这两个序列(全序列)进行简 单的碱基频率的比较时,这个偏向并不明显。注意,很明显,转换的数目(13+36+25+ 22=96)同颠换的数目(6+4+10+6+8+12+5+6=57)相比,极为巨大;而 C�T转换占到58/153(153是总数)。这些数据可以通过PAUP或者MEGA程序得到。 图9.7 用PAUP对一个核苷酸取代模型进行估值的策略。这里显示的是PAUP的输出结果,有些输出为 了简单起见,被略去了。输入的命令由粗体特征符表示,并且被写在括号里。这个程序的命 令行版本需要在命令行中输入命令,但是同样的命令还可以通过菜单界面给出。PAUP程序执 行后,并且执行了数据文件以后[ paup>exe18 s paup],程序将会以较快的速度建立一个 进化树��在这种情况下,柳搜索(PAUP中默认的最优化标准)将会使用程序的默认设 置。在输出结果中显示了全部的搜索设置(这里被截短了)。在这个情况下,一共找到了36 个同等节约的进化树。最优化标准变为似然方法[ paup> set cri=1],设置也改变了,开 始使用六个取代类型,并且对位点内部的速率差异进行gmma和不变式的混合修正;对于取代 速率方阵, gamma形状参数和不变位点的比例将通过数据和进化树进行估值[paup>ls nst=6rma= est ra= ga sha= est pi=est]。命令se?显示了当前的似然方法的设置(这里 被截短了)。命令 set tcom将会压缩输出的进化树,以节约空间。我们通过描述存储的进 化树对似然方法的参数值进行估值,在这里使用的是16号进化树(同样的拓扑结构出现在 Hershkovi tz and lewi s,1996)。一个选项把进化树的输出指向一个种族,这将显示树枝长 度[ paup>desc16/pl=ph]。当然,也可以选择把进化树的输出屏蔽掉[paup>desc 16/pl=no]。输出结果还将显示似然方法的参数值、进化树的分值和其它一些信息,在这里 这些信息没有被显示出来。R方阵是图95中所示的一般形式的方阵的一个实例;它包括了似 然方法的设置中要用到的相对的速率参数。可以输入命令,把似然方法的设置改变回较早时 的数值(把这些数值设置为对刚才描述的进化树有效的数值[paup> I se rma= pre sha=pre pi=prej),将会激活参数的估值。于是这些数值将会为M建树搜索服务。同样地,这些数 值可以插入到相似的距离方法的参数设置中,为距离方法建树搜索服务 图98 星型分解图。本图显示了诸如相邻连接方法之类的建树算法的工作方式。最相近的两个终端 被连接起来,并在它们和剩余的终端之间插入一个树枝。然后,这个新的树枝得到修整,使 得这个树枝的数值是两个原始值的平均数,并产生一个只包含n-1个终端的星型图。这个过程 将反复进行,直到最后只剩下一个终端为止。 图99 测试数据中的系统发育信号的偏差实验:一个PAUP输出(命令行在括弧内用粗体字体显 示)。这个程序的命令行版本需要在命令行中输入命令,但是同样的命令还可以通过菜单界 面给出。这个实验使用的样本同图97中的一样,都是18S「DNA数据集,并且假定优化标准是 MP标准。对M而言不提供信息的特征符已经被删除,因为如果数据中这些特征符的比例较高 的话,将会对结果产生误导。所有的进化树分值的全部输出会非常冗长;因此这个实验命令 提供了一个选项,可以输出一个包含20个分类的柱状图(20是默认值)。默认的复制数目是 1000,在这里已经大大增加了。对33个分类群所作的g1统计非常重要:其数值比拥有25个分 类群和500个特征符( Hi llis and fuel senbeck,1992)的系统临界值(-0.09:p=0.01)还要 小很多(负数);对于拥有更多的分类群和特征符的系统,还没有给出临界值,但是可想而 知,这些值必将更加小(负数)。这个MP进化树的分值是2315分(比较图9.7),比起500个 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18⺅↨ᇍⱘ⺅ߚᏗ˗߫㸼⼎㦴㦰Ёˈৠ䪕䫜ⳳ㦠ⱘ⡍ᅮ⺅↨ᇍⱘ⺅ߚᏗ˗ᇍ㾦㒓ܗ㋴ ᰃϸϾᑣ߫Ё⺅ԡ⚍Ⳍৠⱘ᭄ⳂDŽ⊼ᛣ䪕䫜ⳳ㦠Ё᳝AT⺅أ˖䪕䫜ⳳ㦠Ё᳝83˄10 + 36 +25 + 12˅Ͼԡ⚍ᰃ$㗙7ˈᅗӀᇍᑨⱘ㦴㦰ᑣ߫ⱘԡ⚍ᰃ*&˗ᛇ↨䕗㗠㿔ˈ䪕䫜ⳳ㦠 Ёা᳝47˄6 + 22 + 13 + 6˅Ͼԡ⚍ᰃ*&ˈ݊ᇍᑨⱘ㦴㦰ᑣ߫ⱘԡ⚍ᰃ$7DŽЎ䖭ϸϾ ᑣ߫ⱘ㒱᭄ԡ⚍䛑ⳌৠˈᑊϨЎবᓖফࠄ䰤ࠊˈ᠔ҹᇍ䖭ϸϾᑣ߫˄ܼᑣ߫˅䖯㸠ㅔ ऩⱘ⺅乥⥛ⱘ↨䕗ᯊˈ䖭ϾأᑊϡᯢᰒDŽ⊼ᛣˈᕜᯢᰒˈ䕀ᤶⱘ᭄Ⳃ˄13 + 36 + 25 + 22 = 96˅ৠ乴ᤶⱘ᭄Ⳃ˄6 + 4 + 10 + 6 + 8 + 12 + 5 + 6 = 57˅Ⳍ↨ˈᵕЎᎼ˗㗠 C�T䕀ᤶऴࠄ58/153˄153ᰃᘏ᭄˅DŽ䖭ѯ᭄ৃҹ䗮䖛PAUP㗙MEGAᑣᕫࠄDŽ 9.7 ⫼PAUPᇍϔϾḌ㣋䝌পҷൟ䖯㸠Ԅؐⱘㄪ⬹DŽ䖭䞠ᰒ⼎ⱘᰃPAUPⱘ䕧ߎ㒧ᵰˈ᳝ѯ䕧ߎЎ њㅔऩ䍋㾕ˈ㹿⬹এњDŽ䕧ܹⱘੑҸ⬅㉫ԧ⡍ᕕヺ㸼⼎ˈᑊϨ㹿ݭᣀো䞠DŽ䖭Ͼᑣⱘੑ Ҹ㸠⠜ᴀ䳔㽕ੑҸ㸠Ё䕧ܹੑҸˈԚᰃৠḋⱘੑҸ䖬ৃҹ䗮䖛㦰ऩ⬠䴶㒭ߎDŽPAUPᑣᠻ 㸠ৢˈᑊϨᠻ㸠њ᭄᭛ӊҹৢ [ paup>exe 18s.paup ]ˈᑣᇚӮҹ䕗ᖿⱘ䗳ᑺᓎゟϔϾ 䖯࣪#&ᷥ0;�䖭⾡ᚙމϟˈMP᧰㋶˄PAUPЁ咬䅸ⱘ᳔Ӭ࣪ᷛޚ˅ᇚӮՓ⫼ᑣⱘ咬䅸䆒 㕂DŽ䕧ߎ㒧ᵰЁᰒ⼎њܼ䚼ⱘ᧰㋶䆒㕂˄䖭䞠㹿ⷁњ˅DŽ䖭Ͼᚙމϟˈϔ݅ᡒࠄњ36 Ͼৠㄝ㡖㑺ⱘ䖯࣪ᷥDŽ᳔Ӭ࣪ᷛޚবЎԐ✊ᮍ⊩ [ paup> set cri=1 ]ˈ䆒㕂гᬍবњˈᓔ ྟՓ⫼݁Ͼপҷ㉏ൟˈᑊϨᇍԡ⚍ݙ䚼ⱘ䗳⥛Ꮒᓖ䖯㸠gammaϡবᓣⱘ⏋ড়ׂℷ˗ᇍѢপҷ 䗳⥛ᮍ䰉ˈgammaᔶ⢊খ᭄ϡবԡ⚍ⱘ↨՟ᇚ䗮䖛᭄䖯࣪ᷥ䖯㸠Ԅؐ [ paup> lse nst=6 rma=est ra=ga sha=est pi=est ]DŽੑҸ lse ? ᰒ⼎њᔧࠡⱘԐ✊ᮍ⊩ⱘ䆒㕂˄䖭䞠 㹿ⷁњ˅DŽੑҸ set tcom ᇚӮय़㓽䕧ߎⱘ䖯࣪ˈᷥҹ㡖㑺ぎ䯈DŽ៥Ӏ䗮䖛ᦣ䗄ᄬټⱘ䖯 ࣪ᷥᇍԐ✊ᮍ⊩ⱘখ᭄ؐ䖯㸠Ԅؐˈ䖭䞠Փ⫼ⱘᰃ16ো䖯࣪˄ᷥৠḋⱘᢧᠥ㒧ᵘߎ⦃ Hershkovitz and Lewis, 1996˅DŽϔϾ䗝乍ᡞ䖯࣪ᷥⱘ䕧ߎᣛϔϾ⾡ᮣˈ䖭ᇚᰒ⼎ᷥᵱ䭓 ᑺ [ paup>desc 16 /pl=ph ]DŽᔧ✊ˈгৃҹ䗝ᢽᡞ䖯࣪ᷥⱘ䕧ߎሣ㬑ᥝ [ paup>desc 16 /pl=no ]DŽ䕧ߎ㒧ᵰ䖬ᇚᰒ⼎Ԑ✊ᮍ⊩ⱘখ᭄ؐǃ䖯࣪ᷥⱘߚ݊ؐᅗϔѯֵᙃˈ䖭䞠 䖭ѯֵᙃ≵᳝㹿ᰒ⼎ߎᴹDŽ5ᮍ䰉ᰃ9.5Ё᠔⼎ⱘϔ㠀ᔶᓣⱘᮍ䰉ⱘϔϾᅲ՟˗ᅗࣙᣀњԐ ✊ᮍ⊩ⱘ䆒㕂Ё㽕⫼ࠄⱘⳌᇍⱘ䗳⥛খ᭄DŽৃҹ䕧ܹੑҸˈᡞԐ✊ᮍ⊩ⱘ䆒㕂ᬍবಲ䕗ᮽᯊ ⱘ᭄ؐ˄ᡞ䖭ѯ᭄ؐ䆒㕂Ўᇍ߮ᠡᦣ䗄ⱘ䖯᳝࣪ᷥᬜⱘ᭄ؐ [ paup> lse rma=pre sha=pre pi=pre ]˅ˈᇚӮ▔⌏খ᭄ⱘԄؐDŽѢᰃ䖭ѯ᭄ؐᇚӮЎMLᓎᷥ᧰㋶᳡ࡵDŽৠḋഄˈ䖭ѯ᭄ ؐৃҹᦦܹࠄⳌԐⱘ䎱⾏ᮍ⊩ⱘখ᭄䆒㕂ЁˈЎ䎱⾏ᮍ⊩ᓎᷥ᧰㋶᳡ࡵDŽ 9.8 ᯳ൟߚ㾷DŽᴀᰒ⼎њ䇌བⳌ䚏䖲ᮍ⊩П㉏ⱘᓎᷥㅫ⊩ⱘᎹᮍᓣDŽ᳔Ⳍ䖥ⱘϸϾ㒜ッ 㹿䖲䍋ᴹˈᑊᅗӀ࠽ԭⱘ㒜ッП䯈ᦦܹϔϾᷥᵱDŽ✊ৢˈ䖭ϾᮄⱘᷥᵱᕫࠄׂᭈˈՓ ᕫ䖭Ͼᷥᵱⱘ᭄ؐᰃϸϾॳྟؐⱘᑇഛ᭄ˈᑊѻ⫳ϔϾাࣙn-1Ͼ㒜ッⱘ᯳ൟDŽ䖭Ͼ䖛 ᇚড䖯㸠ˈⳈࠄৢ᳔া࠽ϟϔϾ㒜ッЎℶDŽ 9.9 ⌟䆩᭄Ёⱘ㋏㒳থ㚆ֵোⱘأᏂᅲ偠˖ϔϾPAUP䕧ߎੑ˄Ҹ㸠ᣀᓻݙ⫼㉫ԧᄫԧᰒ ⼎˅DŽ䖭ϾᑣⱘੑҸ㸠⠜ᴀ䳔㽕ੑҸ㸠Ё䕧ܹੑҸˈԚᰃৠḋⱘੑҸ䖬ৃҹ䗮䖛㦰ऩ⬠ 䴶㒭ߎDŽ䖭Ͼᅲ偠Փ⫼ⱘḋᴀৠ9.7Ёⱘϔḋˈ䛑ᰃ18S rDNA᭄䲚ˈᑊϨ؛ᅮӬ࣪ᷛޚᰃ MPᷛޚDŽᇍMP㗠㿔ϡᦤկֵᙃⱘ⡍ᕕヺᏆ㒣㹿ߴ䰸ˈЎབᵰ᭄Ё䖭ѯ⡍ᕕヺⱘ↨՟䕗催 ⱘ䆱ˈᇚӮᇍ㒧ᵰѻ⫳䇃ᇐDŽ᠔᳝ⱘ䖯࣪ᷥߚؐⱘܼ䚼䕧ߎӮ䴲ᐌݫ䭓˗ℸ䖭Ͼᅲ偠ੑҸ ᦤկњϔϾ䗝乍ˈৃҹ䕧ߎϔϾࣙ20Ͼߚ㉏ⱘ᷅⢊˄20ᰃ咬䅸ؐ˅DŽ咬䅸ⱘࠊ᭄Ⳃᰃ 1000ˈ䖭䞠Ꮖ㒣ࡴњDŽᇍ33Ͼߚ㉏㕸᠔ⱘg1㒳䅵䴲ᐌ䞡㽕˖᭄݊ؐ↨ᢹ᳝25Ͼߚ ㉏㕸500Ͼ⡍ᕕヺ˄Hillis and Huelsenbeck, 1992˅ⱘ㋏㒳Ј⬠ؐ(-0.09; p=0.01)䖬㽕 ᇣᕜ˄䋳᭄˅˗ᇍѢᢹ᳝ⱘߚ㉏㕸⡍ᕕヺⱘ㋏㒳ˈ䖬≵᳝㒭ߎЈ⬠ؐˈԚᰃৃᛇ㗠 ⶹˈ䖭ѯؐᖙᇚࡴᇣ˄䋳᭄˅DŽ䖭ϾMP䖯࣪ᷥⱘߚؐᰃ2315ߚ↨˄䕗9.7˅ˈ↨䍋500Ͼ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ27/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com