第九章系统发育分析 页码,5/32 对于一个给定的系统发育问题,如果预先不知道其中的系统发育关系,就很难知道最适用的 比对方法(cf. Morri son and ellis,1997)。一般来说,我们并不赞成直接把计算机比对 结果提交给建树程序,因为建树程序不能发现比对的错误;尤其是那些包含在比对程序包中 (比如, CLUSTAL and tree in ProPack)的建树程序,特别要注意这一点( Feng and Dooli ttle,1996),因为在这些程序包中的建树程序更加不严格。我们必须通过分子结构 �功能和碱基取代过程作出一些假定,并且结合另外一些独立的系统发育证据,对整个比 对进行考察。 从比对中提取系统发育数据集 在某些比对中,比对长度是可变的,这时,系统发育数据集同比对就不会完全吻合;即使在 些长度不变的比对中,数据集也可能同比对结果不一致--举一个很简单的例子,有时候我 们只需要处理第一个和第二个密码子位点,就不需要全部的比对结果,这个话题我们在后面 讨论取代模型的时候还会涉及到 如果比对中出现可变长度,我们通常会根据比对的不确定性程度和处理inde状态的原则这两 个标准对比对结果进行取舍,从中选择所需的系统发育数据集;其中针对 i ndel状态的处理方 法取决于建树方法以及从比对结果中发掘出的系统发育信息,最极端的方法是把包括空位在 内的所有 i ndel位点从比对中清除出去,在分析时不加考虑(cf. Swofford et al.,1996a),这 个方法的好处是可以把序列的变化包容在取代模型中,而不需要特别的模型来处理 i ndel状 态,但是它的缺点也很明显:inde区域的系统发育信息完全被忽略了, 在提取数据集时保留inde区域但是忽略所有的空位分值,将会保留包括空位在内的位点碱基 变化信息。某些长度可变区域在部分序列或者全部序列中很难对准,在这种情况下,这些难 以对准的碱基的分值应该清零;这个方法存在很大的缺陷,M和M建树方法会不加考虑地把 这些清零的或者被忽略的分值理解为零分歧,但是实际上隐藏在这些分值下面的实际的数据 (不管是空位还是难以对准的碱基),一般来说,反映出的分歧度都很大。PAUP4.0中的距 离建树方法(将在下文描述)允许通过非空位区域外推得到空位区域的距离。 最大节约(MP;见下)是允许把可比对的空位合并,并将其视为特征符的唯一方法;可以通 过两种方式达到目的:作为一个附加的特征符状态(第五种核酸碱基或者第二十一种氨基 酸),或者作为一套独立于碱基取代的特征符集。当空位占据了不止一个位点的时候,前一 个方法行不通,因为每一个空位位点都会被统计为一次独立的特征符状态变化。当比对的 列的局部出现很好的可比对的空位的时候,后一种方法非常有用。我们可以把一套空位特征 符附加到比对序列数据集中,也可以用额外的碱基程序在适当的位置对空位计分,但是在计 分的时候,空位位点中只有一个作为空位计分,其余的将会被忽略。PAUP将会执行这个方 法。 对于某些比对而言,比对程序会忽略所有的空位分值或者忽略所有低于预设值的空位分值 但是,还没有任何一种程序会忽略单个序列的单个位点。如果比对在序列组内部相当明确, 但是处身其中时却不太清楚,此时必须对比对做“手术”,确保同序列组相关的明确的信息 被保留,而除去模糊的信息。 图9.3给出了一个比对“手术”的例子。在空位区域,我们必须作出决定:在可供选择的比对 中,哪一个更加合理,尤其重要的是,哪一个更加适合于建立进化树分析。如果手工解决比 对的不确定性,就必须考虑系统发育关系、取代过程(比如,转换和颠换)和碱基组成;在 这个阶段,用系统发育证据解决不确定性非常合理。在倾向于变长的序列区域,关系非常疏 远的序列和序列组的比对就可以侧向展开(就是说,引入人工空位,并且忽略分值),最终 的结果使得只有关系很近的序列区域对准在一起。某些序列中的某些位点虽然对准了,但是 并不确定,他们的分值可以在计分时忽略;这个方法的优点是可以保留同这些序列相关的明 确信息,缺点是最大节约和最大似然的建树方法会把这些“缺失”的分值看做是零分歧 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18ᇍѢϔϾ㒭ᅮⱘ㋏㒳থ㚆䯂乬ˈབᵰ乘ܜϡⶹ䘧݊Ёⱘ㋏㒳থ㚆݇㋏ˈህᕜ䲒ⶹ䘧᳔䗖⫼ⱘ ↨ᇍᮍ⊩˄cf. Morrison and Ellis, 1997˅DŽϔ㠀ᴹ䇈ˈ៥Ӏᑊϡ䌲៤Ⳉᡞ䅵ㅫᴎ↨ᇍ 㒧ᵰᦤѸ㒭ᓎᷥᑣˈЎᓎᷥᑣϡ㛑থ⦄↨ᇍⱘ䫭䇃˗ᇸ݊ᰃ䙷ѯࣙ↨ᇍᑣࣙЁ ˄↨བˈCLUSTAL and TREE in ProPack˅ⱘᓎᷥᑣˈ⡍߿㽕⊼ᛣ䖭ϔ⚍˄Feng and Doolittle, 1996˅ˈЎ䖭ѯᑣࣙЁⱘᓎᷥᑣࡴϡϹḐDŽ៥Ӏᖙ乏䗮䖛ߚᄤ㒧ᵘ �ࡳ㛑⺅পҷ䖛ߎϔѯ؛ᅮˈᑊϨ㒧ড়ϔѯ⣀ゟⱘ㋏㒳থ㚆䆕ˈᇍᭈϾ↨ ᇍ䖯㸠㗗ᆳDŽ Ң↨ᇍЁᦤপ㋏㒳থ㚆᭄䲚 ᶤѯ↨ᇍЁˈ↨ᇍ䭓ᑺᰃৃবⱘˈ䖭ᯊˈ㋏㒳থ㚆᭄䲚ৠ↨ᇍህϡӮᅠܼਏড়˗ेՓ ϔѯ䭓ᑺϡবⱘ↨ᇍЁˈ᭄䲚гৃ㛑ৠ↨ᇍ㒧ᵰϡϔ㟈--ВϔϾᕜㅔऩⱘ՟ᄤˈ᳝ᯊ៥ Ӏা䳔㽕໘⧚ϔϾѠϾᆚⷕᄤԡ⚍ˈህϡ䳔㽕ܼ䚼ⱘ↨ᇍ㒧ᵰˈ䖭Ͼ䆱乬៥Ӏৢ䴶 䅼䆎পҷൟⱘᯊ䖬Ӯ⍝ঞࠄDŽ བᵰ↨ᇍЁߎৃ⦃ব䭓ᑺˈ៥Ӏ䗮ᐌӮḍ↨ᇍⱘϡ⹂ᅮᗻᑺ໘⧚indel⢊ᗕⱘॳ߭䖭ϸ Ͼᷛޚᇍ↨ᇍ㒧ᵰ䖯㸠প㟡ˈҢЁ䗝ᢽ᠔䳔ⱘ㋏㒳থ㚆᭄䲚˗݊Ё䩜ᇍindel⢊ᗕⱘ໘⧚ᮍ ⊩পއѢᓎᷥᮍ⊩ҹঞҢ↨ᇍ㒧ᵰЁথᥬߎⱘ㋏㒳থ㚆ֵᙃˈ᳔ᵕッⱘᮍ⊩ᰃᡞࣙᣀぎԡ ݙⱘ᠔᳝indelԡ⚍Ң↨ᇍЁ⏙䰸ߎএˈߚᵤᯊϡࡴ㗗㰥˄cf. Swofford et al., 1996a˅ˈ䖭 Ͼᮍ⊩ⱘད໘ᰃৃҹᡞᑣ߫ⱘবࣙ࣪ᆍপҷൟЁˈ㗠ϡ䳔㽕⡍߿ⱘൟᴹ໘⧚indel⢊ ᗕˈԚᰃᅗⱘ㔎⚍гᕜᯢᰒ˖indelऎඳⱘ㋏㒳থ㚆ֵᙃᅠܼ㹿ᗑ⬹њDŽ ᦤপ᭄䲚ᯊֱ⬭indelऎඳԚᰃᗑ⬹᠔᳝ⱘぎԡߚˈؐᇚӮֱ⬭ࣙᣀぎԡݙⱘԡ⚍⺅ বֵ࣪ᙃDŽᶤѯ䭓ᑺৃবऎඳ䚼ߚᑣ߫㗙ܼ䚼ᑣ߫Ёᕜ䲒ᇍޚˈ䖭⾡ᚙމϟˈ䖭ѯ䲒 ҹᇍޚⱘ⺅ⱘߚؐᑨ䆹⏙䳊˗䖭Ͼᮍ⊩ᄬᕜⱘ㔎䱋ˈMPMLᓎᷥᮍ⊩Ӯϡࡴ㗗㰥ഄᡞ 䖭ѯ⏙䳊ⱘ㗙㹿ᗑ⬹ⱘߚ⧛ؐ㾷Ў䳊ߚˈFAXԚᰃᅲ䰙Ϟ䱤㮣䖭ѯߚؐϟ䴶ⱘᅲ䰙ⱘ᭄ ˄ϡㅵᰃぎԡ䖬ᰃ䲒ҹᇍޚⱘ⺅˅ˈϔ㠀ᴹ䇈ˈডߎⱘߚFAXᑺ䛑ᕜDŽPAUP 4.0Ёⱘ䎱 ⾏ᓎᷥᮍ⊩˄ᇚϟ᭛ᦣ䗄˅ܕ䆌䗮䖛䴲ぎԡऎඳᕫࠄぎԡऎඳⱘ䎱⾏DŽ ᳔㡖㑺˄MP˗㾕ϟ˅ᰃܕ䆌ᡞৃ↨ᇍⱘぎԡড়ᑊˈᑊᇚ݊㾚Ў⡍ᕕヺⱘଃϔᮍ⊩˗ৃҹ䗮 䖛ϸ⾡ᮍᓣ䖒ࠄⳂⱘ˖ЎϔϾ䰘ࡴⱘ⡍ᕕヺ⢊ᗕ˄Ѩ⾡Ḍ䝌⺅㗙Ѡकϔ⾡⇼ 䝌˅ˈ㗙Ўϔ༫⣀ゟѢ⺅পҷⱘ⡍ᕕヺ䲚DŽᔧぎԡऴњϡℶϔϾԡ⚍ⱘᯊࠡˈϔ Ͼᮍ⊩㸠ϡ䗮ˈЎ↣ϔϾぎԡԡ⚍䛑Ӯ㹿㒳䅵Ўϔ⣀ゟⱘ⡍ᕕヺ⢊ᗕব࣪DŽᔧ↨ᇍⱘᑣ ߫ⱘሔ䚼ߎ⦃ᕜདⱘৃ↨ᇍⱘぎԡⱘᯊৢˈϔ⾡ᮍ⊩䴲ᐌ᳝⫼DŽ៥Ӏৃҹᡞϔ༫ぎԡ⡍ᕕ ヺ䰘ࠄࡴ↨ᇍᑣ᭄߫䲚Ёˈгৃҹ⫼乱ⱘ⺅ᑣ䗖ᔧⱘԡ㕂ᇍぎԡ䅵ߚˈԚᰃ䅵 ߚⱘᯊˈぎԡԡ⚍Ёা᳝ϔϾЎぎԡ䅵ߚԭ݊ˈⱘᇚӮ㹿ᗑ⬹DŽPAUPᇚӮᠻ㸠䖭Ͼᮍ ⊩DŽ ᇍѢᶤѯ↨ᇍ㗠㿔ˈ↨ᇍᑣӮᗑ⬹᠔᳝ⱘぎԡߚؐ㗙ᗑ⬹᠔᳝ԢѢ乘䆒ؐⱘぎԡߚ˗ؐ Ԛᰃˈ䖬≵᳝ӏԩϔ⾡ᑣӮᗑ⬹ऩϾᑣ߫ⱘऩϾԡ⚍DŽབᵰ↨ᇍᑣ߫㒘ݙ䚼Ⳍᔧᯢ⹂ˈ Ԛᰃ໘䑿݊Ёᯊैϡ⏙Ἦˈℸᯊᖙ乏ᇍ↨ᇍخĀᴃāˈ⹂ֱৠᑣ߫㒘Ⳍ݇ⱘᯢ⹂ⱘֵᙃ 㹿ֱ⬭ˈ㗠䰸এ㊞ⱘֵᙃDŽ 9.3㒭ߎњϔϾ↨ᇍĀᴃāⱘ՟ᄤDŽぎԡऎඳˈ៥Ӏᖙ乏އߎᅮ˖ৃկ䗝ᢽⱘ↨ᇍ ЁˈાϔϾࡴড়⧚ˈᇸ݊䞡㽕ⱘᰃˈાϔϾࡴ䗖ড়Ѣᓎゟ䖯࣪ᷥߚᵤDŽབᵰᎹ㾷އ↨ ᇍⱘϡ⹂ᅮᗻˈህᖙ乏㗗㰥㋏㒳থ㚆݇㋏ǃপҷ䖛˄↨བˈ䕀ᤶ乴ᤶ˅⺅㒘៤˗ 䖭Ͼ䰊↉ˈ⫼㋏㒳থ㚆䆕㾷އϡ⹂ᅮᗻ䴲ᐌড়⧚DŽؒѢব䭓ⱘᑣ߫ऎඳˈ݇㋏䴲ᐌ⭣ 䖰ⱘᑣ߫ᑣ߫㒘ⱘ↨ᇍህৃҹջሩᓔ˄ህᰃ䇈ˈᓩܹҎᎹぎԡˈᑊϨᗑ⬹ߚ᳔ˈ˅ؐ㒜 ⱘ㒧ᵰՓᕫা᳝݇㋏ᕜ䖥ⱘᑣ߫ऎඳᇍޚϔ䍋DŽᶤѯᑣ߫Ёⱘᶤѯԡ⚍㱑✊ᇍޚњˈԚᰃ ᑊϡ⹂ᅮˈҪӀⱘߚৃؐҹ䅵ߚᯊᗑ⬹˗䖭Ͼᮍ⊩ⱘӬ⚍ᰃৃҹֱ⬭ৠ䖭ѯᑣ߫Ⳍ݇ⱘᯢ ⹂ֵᙃˈ㔎⚍ᰃ᳔㡖㑺᳔Ԑ✊ⱘᓎᷥᮍ⊩Ӯᡞ䖭ѯĀ㔎༅āⱘߚؐⳟخᰃ䳊ߚFAXDŽ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ5/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com