正在加载图片...
第九章系统发育分析 页码,22/32 定,因此必须在每一次会话中手工指定这些假定;取代模型的范围和空位处理方法以及丢 失的数据都是有限的,并且程序不能评估参数数值;似然方法不允许加权;不能UPAC核苷酸 的模糊密码;使用M方法时不允许进行自引导分析;进化树图形很简单,并且不能保存进化 树文件。虽然ME6A可以通过密码子数据和氨基酸数据建立距离进化树,但是使用的取代模型 太简单,对于绝大多数数据集而言,不能产生可靠的进化树。MEGA同其它程序一样,也没有 包括一些有用的特点( Lewis and lewi s,1995):空位和空位大小频率,密码子的用法和氨 基酸频率。 MOLPHY MOLPHY( Adachi and Hasegawa,1996)是一个共享的软件包(见本章结尾的列表),可以进 行M分析以及核苷酸序列或者氨基酸序列的统计。 MOLPHY在Sun0S和HP900/700系统上经过 测试。在实际使用时需要对Unix文件操作有一定的了解。 MOLPHY的用途包括 NEXUS,MEGA和 PHYL!P文件格式之间的数据文件的格式转换,还包括从EMBL或者 Gene Bank的核苷酸序列文件 中提取编码区域。其中的M程序同 PHYLIP中的M程序很相似,但是前者的氨基酸取代模型的 范围很广,而且有很多选项能够进行快速的启发式的搜索,其中包括一个选项能够使用“本 地自引导”分析(也就是说,进行一个子树的自引导分析,条件是假定这个进化树的剩余部 分是正确的)以搜索更好的M进化树。输出结果包括树枝长度评估以及标准偏差。分析分离 的密码子位置是可能的。 MOPHY使用PAUP中提供的核苷酸取代模型的一个子集,尽管它允许使 用者自行指定参数数值。现在使用的 MOLPHY缺少一个自引导选项,也不能包容位点内部的速 率差异性 PA PAML( Yang et al.,199)是一个共享软件包(见本章结尾的列表),能够进行M模型的建 立和进化树的建立,能够进行 Bayesi an进化树的建立,能够进行模拟实验,能够进行基于似 然方法的进化树的分析,能够进行进化树评估以及数据和进化树的统计。这个软件包已经在 laci tosh68K和 POwerpC计算机上编译通过,还有一个非编译的Unx版本( GNU gCc或者Sun ANS丨C)。对于密码子数据和氨基酸数据,这个程序提供了最详细的和最灵活的参数指定和 评估方案。对于核苷酸数据( BASEML和 BASEMLG),取代模型的范围同PAP的一样广泛,可能 包括了所有值得考虑的模型。PAML执行不额外的模型:相邻位点的速率相关性(自动离散 &#0: gamma模型)和一个多基因模型,这个模型允许对每一个基因指定取代模型。后者对于分 析来自于不同基因(在不同约束下进化)的混合数据非常有用。下列步骤可能很有用:受限 用PAUP进行M进化树的建立,然后转向PAML,评估是否加入这些参数以改善似然值。PAML还 包括一个在非静态条件下(序列之间的碱基频率变化很大)建立进化树的似然方法,但是对 于超过四个序列的系统,这个方法被认为是不实用的。C0D0ML程序对于评估密码子频率、每 一个密码子位置上的碱基频率以及每一个(非)同义位点上的(非)同义取代的数目非常有 用。一个受到限制的PAML特色是能够从数据集中把包含一个空位的所有位点或者丢失的数据 分值(不允许存在 I UPAC模糊密码)排除出去。当分类群数目增加时,一个给定位点至少要达 到的似然分值也随之增加;因此这个限制要冒一定的风险,很可能会把很有用的数据也切除 掉。同时,PAML中的进化树搜索算法也受到 MOLPHY中采用的不严格的星型分解方法的限制。 因此,必须采用多重搜索。 一些简单的实际的考虑 1.不管听起来多么荒谬,到目前为止,在进行系统发生的推断分析中,最重要的因素不是 进行系统发生推断所采用的方法,而是输入数据的质量。数据选择的重要行以及尤其是 比对过程的重要性都不能过高估计。即使是最复杂的系统发生推断方法都不能校正输入 数据的错误。 2.从尽可能多的角度观察数据。使用三种主要方法(距离方法,最大节约方法,最大似然 方法)中的每一个,然后比较它们所建立的进化树的一致性。同时,要清醒地意识到我 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18؛ᅮˈ಴ℸᖙ乏೼↣ϔ⃵Ӯ䆱Ё᠟Ꮉᣛᅮ䖭ѯ؛ᅮ˗পҷ῵ൟⱘ㣗ೈ੠ぎԡ໘⧚ᮍ⊩ҹঞ϶ ༅ⱘ᭄᥂䛑ᰃ᳝䰤ⱘˈᑊϨ⿟ᑣϡ㛑䆘Ԅখ᭄᭄ؐ˗Ԑ✊ᮍ⊩ϡܕ䆌ࡴᴗ˗ϡ㛑IUPACḌ㣋䝌 ⱘ῵㊞ᆚⷕ˗Փ⫼MPᮍ⊩ᯊϡܕ䆌䖯㸠㞾ᓩᇐߚᵤ˗䖯࣪೒ᷥᔶᕜㅔऩˈᑊϨϡ㛑ֱᄬ䖯࣪ ᷥ᭛ӊDŽ㱑✊MEGAৃҹ䗮䖛ᆚⷕᄤ᭄᥂੠⇼෎䝌᭄᥂ᓎゟ䎱⾏䖯࣪ˈᷥԚᰃՓ⫼ⱘপҷ῵ൟ ໾ㅔऩˈᇍѢ㒱໻໮᭄᭄᥂䲚㗠㿔ˈϡ㛑ѻ⫳ৃ䴴ⱘ䖯࣪ᷥDŽMEGAৠ݊ᅗ⿟ᑣϔḋˈг≵᳝ ࣙᣀϔѯ᳝⫼ⱘ⡍⚍˄Lewis and Lewis, 1995˅˖ぎԡ੠ぎԡ໻ᇣ乥⥛ˈᆚⷕᄤⱘ⫼⊩੠⇼ ෎䝌乥⥛DŽ MOLPHY MOLPHY˄Adachi and Hasegawa, 1996˅ᰃϔϾ݅ѿⱘ䕃ӊࣙ˄㾕ᴀゴ㒧ሒⱘ߫㸼˅ˈৃҹ䖯 㸠MLߚᵤҹঞḌ㣋䝌ᑣ߫៪㗙⇼෎䝌ᑣ߫ⱘ㒳䅵DŽMOLPHY೼Sun OS੠HP9000/700㋏㒳Ϟ㒣䖛 ⌟䆩DŽ೼ᅲ䰙Փ⫼ᯊ䳔㽕ᇍUnix᭛ӊ᪡԰᳝ϔᅮⱘњ㾷DŽMOLPHYⱘ⫼䗨ࣙᣀNEXUS, MEGA੠ PHYLIP᭛ӊḐᓣП䯈ⱘ᭄᥂᭛ӊⱘḐᓣ䕀ᤶˈ䖬ࣙᣀҢEMBL៪㗙GeneBankⱘḌ㣋䝌ᑣ߫᭛ӊ Ёᦤপ㓪ⷕऎඳDŽ݊ЁⱘML⿟ᑣৠPHYLIPЁⱘML⿟ᑣᕜⳌԐˈԚᰃࠡ㗙ⱘ⇼෎䝌পҷ῵ൟⱘ 㣗ೈᕜᑓˈ㗠Ϩ᳝ᕜ໮䗝乍㛑໳䖯㸠ᖿ䗳ⱘਃথᓣⱘ᧰㋶ˈ݊ЁࣙᣀϔϾ䗝乍㛑໳Փ⫼Āᴀ ഄ㞾ᓩᇐāߚᵤ˄гህᰃ䇈ˈ䖯㸠ϔϾᄤᷥⱘ㞾ᓩᇐߚᵤˈᴵӊᰃ؛ᅮ䖭Ͼ䖯࣪ᷥⱘ࠽ԭ䚼 ߚᰃℷ⹂ⱘ˅ҹ᧰㋶᳈དⱘML䖯࣪ᷥDŽ䕧ߎ㒧ᵰࣙᣀᷥᵱ䭓ᑺ䆘ԄҹঞᷛأޚᏂDŽߚᵤߚ行 ⱘᆚⷕᄤԡ㕂ᰃৃ㛑ⱘDŽMOPHYՓ⫼PAUPЁᦤկⱘḌ㣋䝌পҷ῵ൟⱘϔϾᄤ䲚ˈሑㅵᅗܕ䆌Փ ⫼㗙㞾㸠ᣛᅮখ᭄᭄ؐDŽ⦄೼Փ⫼ⱘMOLPHY㔎ᇥϔϾ㞾ᓩᇐ䗝乍ˈгϡ㛑ࣙᆍԡ⚍ݙ䚼ⱘ䗳 ⥛ᏂᓖᗻDŽ PAML PAML˄Yang et al., 1996˅ᰃϔϾ݅ѿ䕃ӊࣙ˄㾕ᴀゴ㒧ሒⱘ߫㸼˅ˈ㛑໳䖯㸠ML῵ൟⱘᓎ ゟ੠䖯࣪ᷥⱘᓎゟˈ㛑໳䖯㸠Bayesian䖯࣪ᷥⱘᓎゟˈ㛑໳䖯㸠῵ᢳᅲ偠ˈ㛑໳䖯㸠෎ѢԐ ✊ᮍ⊩ⱘ䖯࣪ᷥⱘߚᵤˈ㛑໳䖯㸠䖯࣪ᷥ䆘Ԅҹঞ᭄᥂੠䖯࣪ᷥⱘ㒳䅵DŽ䖭Ͼ䕃ӊࣙᏆ㒣೼ Macintosh 68K੠PowerPC䅵ㅫᴎϞ㓪䆥䗮䖛ˈ䖬᳝ϔϾ䴲㓪䆥ⱘUnix⠜ᴀ˄GNU gcc៪㗙Sun ANSI C˅DŽᇍѢᆚⷕᄤ᭄᥂੠⇼෎䝌᭄᥂ˈ䖭Ͼ⿟ᑣᦤկњ᳔䆺㒚ⱘ੠᳔♉⌏ⱘখ᭄ᣛᅮ੠ 䆘ԄᮍḜDŽᇍѢḌ㣋䝌᭄᥂˄BASEML੠BASEMLG˅ˈপҷ῵ൟⱘ㣗ೈৠPAUPⱘϔḋᑓ⊯ˈৃ㛑 ࣙᣀњ᠔᳝ؐᕫ㗗㰥ⱘ῵ൟDŽPAMLᠻ㸠ϡ乱໪ⱘ῵ൟ˖Ⳍ䚏ԡ⚍ⱘ䗳⥛Ⳍ݇ᗻ˄㞾ࡼᬷ行 �gamma῵ൟ˅੠ϔϾ໮෎಴῵ൟˈ䖭Ͼ῵ൟܕ䆌ᇍ↣ϔϾ෎಴ᣛᅮপҷ῵ൟDŽৢ㗙ᇍѢߚ ᵤᴹ㞾Ѣϡৠ෎಴˄೼ϡৠ㑺ᴳϟ䖯࣪˅ⱘ⏋ড়᭄᥂䴲ᐌ᳝⫼DŽϟ߫ℹ偸ৃ㛑ᕜ᳝⫼˖ফ䰤 ⫼PAUP䖯㸠ML䖯࣪ᷥⱘᓎゟˈ✊ৢ䕀৥PAMLˈ䆘Ԅᰃ৺ࡴܹ䖭ѯখ᭄ҹᬍ୘Ԑ✊ؐDŽPAML䖬 ࣙᣀϔϾ೼䴲䴭ᗕᴵӊϟ˄ᑣ߫П䯈ⱘ⺅෎乥⥛ব࣪ᕜ໻˅ᓎゟ䖯࣪ᷥⱘԐ✊ᮍ⊩ˈԚᰃᇍ Ѣ䍙䖛ಯϾᑣ߫ⱘ㋏㒳ˈ䖭Ͼᮍ⊩㹿䅸Ўᰃϡᅲ⫼ⱘDŽCODONML⿟ᑣᇍѢ䆘Ԅᆚⷕᄤ乥⥛ǃ↣ ϔϾᆚⷕᄤԡ㕂Ϟⱘ⺅෎乥⥛ҹঞ↣ϔϾ˄䴲˅ৠНԡ⚍Ϟⱘ˄䴲˅ৠНপҷⱘ᭄Ⳃ䴲ᐌ᳝ ⫼DŽϔϾফࠄ䰤ࠊⱘPAML⡍㡆ᰃ㛑໳Ң᭄᥂䲚Ёᡞࣙ৿ϔϾぎԡⱘ᠔᳝ԡ⚍៪㗙϶༅ⱘ᭄᥂ ߚ˄ؐϡܕ䆌ᄬ೼IUPAC῵㊞ᆚⷕ˅ᥦ䰸ߎএDŽᔧߚ㉏㕸᭄Ⳃ๲ࡴˈᯊϔϾ㒭ᅮԡ⚍㟇ᇥ㽕䖒 ࠄⱘԐ✊ߚؐг䱣П๲ࡴ಴˗ℸ䖭Ͼ䰤ࠊ㽕ݦϔᅮⱘ亢䰽ˈᕜৃ㛑Ӯᡞᕜ᳝⫼ⱘ᭄᥂гߛ䰸 ᥝDŽৠᯊˈPAMLЁⱘ䖯࣪᧰ᷥ㋶ㅫ⊩гফࠄMOLPHYЁ䞛⫼ⱘϡϹḐⱘ᯳ൟߚ㾷ᮍ⊩ⱘ䰤ࠊDŽ ಴ℸˈᖙ乏䞛⫼໮䞡᧰㋶DŽ ϔѯㅔऩⱘᅲ䰙ⱘ㗗㰥 1. ϡㅵ਀䍋ᴹ໮М㤦䈀ˈࠄⳂࠡЎℶˈ೼䖯㸠㋏㒳থ⫳ⱘ᥼ᮁߚᵤЁˈ᳔䞡㽕ⱘ಴㋴ϡᰃ 䖯㸠㋏㒳থ⫳᥼ᮁ᠔䞛⫼ⱘᮍ⊩ˈ㗠ᰃ䕧᭄ܹ᥂ⱘ䋼䞣DŽ᭄᥂䗝ᢽⱘ䞡㽕㸠ҹঞᇸ݊ᰃ ↨ᇍ䖛⿟ⱘ䞡㽕ᗻ䛑ϡ㛑䖛催Ԅ䅵DŽेՓᰃ᳔໡ᴖⱘ㋏㒳থ⫳᥼ᮁᮍ⊩䛑ϡ㛑᷵ℷ䕧ܹ ᭄᥂ⱘ䫭䇃DŽ 2. Ңሑৃ㛑໮ⱘ㾦ᑺ㾖ᆳ᭄᥂DŽՓ⫼ϝ⾡Џ㽕ᮍ⊩˄䎱⾏ᮍ⊩ˈ᳔໻㡖㑺ᮍ⊩ˈ᳔໻Ԑ✊ ᮍ⊩˅Ёⱘ↣ϔϾˈ✊ৢ↨䕗ᅗӀ᠔ᓎゟⱘ䖯࣪ᷥⱘϔ㟈ᗻDŽৠᯊˈ㽕⏙䝦ഄᛣ䆚ࠄ៥ ㄀бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ22/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有