第九章系统发育分析 页码,2/3 这个假定很可能会被推翻。因此,如果所观察的序列并非是严格遗传的话,大多数系统发育 方法就会得到错误的结果。 系统发育方法中固有的模型会导致一些额外的假定: 1.序列有指定的来源并且正确无误( Hel big and Sei bol d,1996; Hershkovi tz and Lewis, 1996: Sol tis et al. 1997) 2.序列是同源的(也就是说,所有的序列都起源于同一祖先序列);这些序列不是 paral og°( paral og指的是一个祖先序列通过复制等方法在基因组中产生的歧化序 列)的混合物。 3.序列比对中,不同序列的同一个位点都是同源的 4.在接受分析的一个序列组中,序列之间的系统发育史是相同的(比如,序列组中不存在 核序列与细胞器序列的混合)。 5.样本足以解决感兴趣的问题 6.样本序列之间的差异代表了感兴趣的宽组 7.样本序列之间的差异包含了足以解决感兴趣的问题的系统发育信号 还有一些假定,在某些方法中是默认的,但是在另外一些方法中是可以修正的 8.样本序列是随机进化的。 9.序列中的所有位点的进化都是随机的。 10.序列中的每一个位点的进化都是独立的 许多公开发表的系统发育分析结果的错误通常都是因为违反了上述假定,特别令人恼火的是 现有的方法并不能察觉对基本假定的违反。每一个序列组都必须根据上述基本假定进行评 估,并且同分析过程相协调。下面我们将会描述分析过程。 系统发育数据分析:比对,建立取代模型,建立进化树以及进 化树评估 对DNA序列进行系统发育分析的四个主要步骤是比对,建立取代模型,建立进化树以及进化树 评估。一般来说,执行这四个步骤的计算机程序都是相互独立的,但是他们都是进行系统发 育分析的有机部分 当前的讨论主要集中在分析DNA序列的方法上,这些方法基本上(不全是)仍然是通过碱基和 密码子的替代来考察序列的差异;这个方法同样应用于对蛋白质序列的分析,但是由于氨基 酸的生物化学多样性,我们必须引入更多的数学参数。因此,下面讨论的适用于核苷酸碱基 的方法同样适用于氨基酸和密码子,而关于蛋白质的一些特殊问题和程序会在别的地方得到 讨论( Fel sensei n,1996)。 因为建树的标准在一定程度上依赖比对和取代模型,因此一开始就应该介绍这些方法,这些 介绍非常必要。三种主要的建树方法分别是距离、最大节约( maxi mum parsi mony,MP)和最 大似然( maxi mum ike i hood,ML)。距离树考察数据组中所有序列的两两比对结果,通过 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18䖭Ͼ؛ᅮᕜৃ㛑Ӯ㹿㗏DŽℸˈབᵰ᠔㾖ᆳⱘᑣ߫ᑊ䴲ᰃϹḐ䘫Ӵⱘ䆱ˈ᭄㋏㒳থ㚆 ᮍ⊩ህӮᕫࠄ䫭䇃ⱘ㒧ᵰDŽ ㋏㒳থ㚆ᮍ⊩Ё᳝ⱘൟӮᇐ㟈ϔѯ乱ⱘ؛ᅮ˖ 1. ᑣ᳝߫ᣛᅮⱘᴹ⑤ᑊϨℷ⹂᮴䇃˄Helbig and Seibold, 1996; Hershkovitz and Lewis, 1996; Soltis et al., 1997˅DŽ 2. ᑣ߫ᰃৠ⑤ⱘ˄гህᰃ䇈ˈ᠔᳝ⱘᑣ߫䛑䍋⑤Ѣৠϔ⼪ܜᑣ߫˅˗䖭ѯᑣ߫ϡᰃ “paralog“˄paralogᣛⱘᰃϔϾ⼪ܜᑣ߫䗮䖛ࠊㄝᮍ⊩㒘Ёѻ⫳ⱘ℻࣪ᑣ ߫˅ⱘ⏋ড়⠽DŽ 3. ᑣ߫↨ᇍЁˈϡৠᑣ߫ⱘৠϔϾԡ⚍䛑ᰃৠ⑤ⱘDŽ 4. ফߚᵤⱘϔϾᑣ߫㒘Ёˈᑣ߫П䯈ⱘ㋏㒳থ㚆ᰃⳌৠⱘ˄↨བˈᑣ߫㒘Ёϡᄬ Ḍᑣ߫Ϣ㒚㚲఼ᑣ߫ⱘ⏋ড়˅DŽ 5. ḋᴀ䎇ҹ㾷އ݈ᛳ䍷ⱘ䯂乬DŽ 6. ḋᴀᑣ߫П䯈ⱘᏂᓖҷ㸼њᛳ݈䍷ⱘᆑ㒘DŽ 7. ḋᴀᑣ߫П䯈ⱘᏂᓖࣙњ䎇ҹ㾷އ݈ᛳ䍷ⱘ䯂乬ⱘ㋏㒳থ㚆ֵোDŽ 䖬᳝ϔѯ؛ᅮˈᶤѯᮍ⊩Ёᰃ咬䅸ⱘˈԚᰃϔѯᮍ⊩Ёᰃৃҹׂℷⱘ˖ 8. ḋᴀᑣ߫ᰃ䱣ᴎ䖯࣪ⱘDŽ 9. ᑣ߫Ёⱘ᠔᳝ԡ⚍ⱘ䖯࣪䛑ᰃ䱣ᴎⱘDŽ 10. ᑣ߫Ёⱘ↣ϔϾԡ⚍ⱘ䖯࣪䛑ᰃ⣀ゟⱘDŽ 䆌݀ᓔথ㸼ⱘ㋏㒳থ㚆ߚᵤ㒧ᵰⱘ䫭䇃䗮ᐌ䛑ᰃЎ䖱ডњϞ䗄؛ᅮˈ⡍߿ҸҎᙐ☿ⱘᰃ ⦄᳝ⱘᮍ⊩ᑊϡ㛑ᆳ㾝ᇍᴀ؛ᅮⱘ䖱ডDŽ↣ϔϾᑣ߫㒘䛑ᖙ乏ḍϞ䗄ᴀ؛ᅮ䖯㸠䆘 ԄˈᑊϨৠߚᵤ䖛Ⳍण䇗DŽϟ䴶៥ӀᇚӮᦣ䗄ߚᵤ䖛DŽ ㋏㒳থ㚆᭄ߚᵤ˖↨ᇍˈᓎゟপҷൟˈᓎゟ䖯࣪ᷥҹঞ䖯 䆘Ԅᷥ࣪ ᇍDNAᑣ߫䖯㸠㋏㒳থ㚆ߚᵤⱘಯϾЏ㽕ℹ偸ᰃ↨ᇍˈᓎゟপҷൟˈᓎゟ䖯࣪ᷥҹঞ䖯࣪ᷥ 䆘ԄDŽϔ㠀ᴹ䇈ˈᠻ㸠䖭ಯϾℹ偸ⱘ䅵ㅫᴎᑣ䛑ᰃⳌѦ⣀ゟⱘˈԚᰃҪӀ䛑ᰃ䖯㸠㋏㒳থ 㚆ߚᵤⱘ᳝ᴎ䚼ߚDŽ ᔧࠡⱘ䅼䆎Џ㽕䲚ЁߚᵤDNAᑣ߫ⱘᮍ⊩Ϟˈ䖭ѯᮍ⊩ᴀϞ˄ϡܼᰃ˅ҡ✊ᰃ䗮䖛⺅ ᆚⷕᄤⱘ᳓ҷᴹ㗗ᆳᑣ߫ⱘᏂᓖ˗䖭Ͼᮍ⊩ৠḋᑨ⫼Ѣᇍ㲟ⱑ䋼ᑣ߫ⱘߚᵤˈԚᰃ⬅Ѣ⇼ 䝌ⱘ⫳⠽࣪ᄺḋᗻˈ៥Ӏᖙ乏ᓩܹⱘ᭄ᄺখ᭄DŽℸˈϟ䴶䅼䆎ⱘ䗖⫼ѢḌ㣋䝌⺅ ⱘᮍ⊩ৠḋ䗖⫼Ѣ⇼䝌ᆚⷕᄤˈ㗠݇Ѣ㲟ⱑ䋼ⱘϔѯ⡍⅞䯂乬ᑣӮ߿ⱘഄᮍᕫࠄ 䅼䆎˄Felsenstein, 1996˅DŽ ЎᓎᷥⱘᷛޚϔᅮᑺϞձ䌪↨ᇍপҷൟˈℸϔᓔྟህᑨ䆹ҟ㒡䖭ѯᮍ⊩ˈ䖭ѯ ҟ㒡䴲ᐌᖙ㽕DŽϝ⾡Џ㽕ⱘᓎᷥᮍ⊩߿ߚᰃ䎱⾏ǃ᳔㡖㑺˄maximum parsimony, MP˅᳔ Ԑ✊˄maximum likelihoodˈML˅DŽ䎱⾏ᷥ㗗ᆳ᭄㒘Ё᠔᳝ᑣ߫ⱘϸϸ↨ᇍ㒧ᵰˈ䗮䖛 бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ2/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com