第九章系统发育分析 页码,7/3 降至最低值,而力求把那些主要差异是转换的序列集中在一起。 任何一种“时间可逆”的核苷酸取代模型都可以用图9.5所示的方阵刻画,只是其中一个速率 和其它速率的差异;在任意组合中,最多可以达到只有六个参数,其中每一个速率参数都是 独立的( Swofford et al.,19%6a;Li,1997)。如果平衡的碱基频率不相等,则需要额外 的参数:如果平衡的碱基频率不相等,但是却假定这些频率相等,那么系统发育进化树的最 终结果将会出错(Li,1997)。 侧线( paral inear)(Lake,1994)和“log�det”( Lockhart et al.,1994)做了一些 修正(见 Swofford et a.,1996a)来满足非静态环境的需要;这个方法只适用于距离进化 树的建立;在这个方法中,对于每一个序列匹配,各种类型和变化方向的原始取代的数目都 会计算在一个4×4的方阵中(如图9.6)。每个方阵都会有一个代数行列式,这个行列式的 og值是评估序列差异性的一个要素,因此被称为“Iog�:det”。对那些拥有各种各样的碱 基频率的序列进行双重比较,就会得到各种各样的方阵,也就会得到各种各样的行列式值 因此,在评估序列两两之间的距离的时候,就要受到序列两两之间的行列式值的影响,而且 序列两两之间的比较允许适用不同的取代模型,因此沿着系统发育进化树的不同树枝,将会 产生多元化。Log&#o;det尤其对位点之间的速率差异(见下文)敏感,因此,碱基频率的偏 向可能只存在于那些承受变化的位点 位点内速率差异模型 除了取代模型的多元化以外,一个序列中各个不同位点之间取代速率的差异也会对建立进化 树的结果产生很深远的影响( Swofford et a.,1996a);关于位点之间的速率差异(或者 叫做位点异质性),有一个最明显的例子,就是在一个编码序列中,三联体编码的位点差 异:在三联体编码中,第三个编码位点比另外两个位点更加容易发生变化;正是出于这个原 因,许多系统发育分析方法在分析编码序列时,都会把第三个编码位点排除在外;但是在某 些情况下,速率差异模型会更加敏锐(比如,对应于蛋白质或者rRNA的保守序列) 对位点差异的取代速率进行估值的方法有非参数化模型(W.M. Yang et a.,1996),不变 式模型和gama分布模型( Swofford et al.1996a)。非参数化方法源于特异位点的相对速 率的范畴;这个方法可以在MP建树方法中使用,只要根据相对的变异频率对特异位点进行简 单加权就可以了,当然进行加权时需要有关于真实进化树的预备知识;这个方法同样也可以 适用于M建树方法,但是在计算上被认为是不切实际的(W.M. Yang et al.,1996)。不 式模型对一定比例的位点进行估值,这些位点并不能自由变化;剩余的位点假定为等概率变 化。至于gama模型方法,它假定一个给定的序列变化的概率是遵守 gamma分布规律的,据此 指定位点的取代概率; gamma分布的形状(有形状参数α描述)描述了一个序列中各个位点的 取代频率的分布( Swofford et al.,1996a,p.444 Fi gure13:cf.Li,1997,p.76, Fi gure3.10:注意尺度差异)。在一个混合方法中,可以假定一部分位点是不变的,而剩余 的位点则是按照 gamma分布变化的。 实际上,gama修正可以是连续的,离散的或者自离散的(W.M. Yang et al.1996)。连续 gama的意思是各个位点沿一条连续的概率曲线变化;目前,这个方法在绝大多数情况下无法 计算。离散gama逼近方法指定各个位点的概率,使得这些(大量的)概率值逼近 gamma曲 线。自离散模型假定相邻的位点的变化速率是相关联的;许多组位点被分为许多类,其中每 类中的位点的变化速率可能被假定为常量或者异类值。 进化树建立程序使用各种各样的位点速率差异修正方法。对于核酸数据,PAUP4.0在单独或 者混合使用时间可逆的距离建树方法和最大似然建树方法时,既使用不变式 gamma模型,也使 用离散的gama模型;在使用lσ&#o;det距离建树方法时,使用不变式模型(见下)。对于核 酸,氨基酸和编码子数据,PAM使用连续的,离散的和自离散的gama模型。对于核酸和氨基 酸数据, PHYLIP使用一种离散的gama模型 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18䰡㟇᳔Ԣؐˈ㗠∖ᡞ䙷ѯЏ㽕Ꮒᓖᰃ䕀ᤶⱘᑣ߫䲚Ёϔ䍋DŽ ӏԩϔ⾡Āᯊ䯈ৃ䗚āⱘḌ㣋䝌পҷൟ䛑ৃҹ⫼9.5᠔⼎ⱘᮍ䰉ࠏˈ⬏াᰃ݊ЁϔϾ䗳⥛ ݊ᅗ䗳⥛ⱘᏂᓖ˗ӏᛣ㒘ড়Ёˈ᳔ৃҹ䖒ࠄা᳝݁Ͼখ᭄ˈ݊Ё↣ϔϾ䗳⥛খ᭄䛑ᰃ ⣀ゟⱘ˄Swofford et al., 1996a˗Li, 1997˅DŽབᵰᑇ㸵ⱘ⺅乥⥛ϡⳌㄝˈ߭䳔㽕乱 ⱘখ᭄˗བᵰᑇ㸵ⱘ⺅乥⥛ϡⳌㄝˈԚᰃै؛ᅮ䖭ѯ乥⥛Ⳍㄝˈ䙷М㋏㒳থ㚆䖯࣪ᷥⱘ᳔ 㒜㒧ᵰᇚӮߎ䫭˄Li, 1997˅DŽ ջ㒓˄paralinear˅˄Lake, 1994˅“log�det”˄Lockhart et al., 1994˅خњϔѯ ׂℷ˄㾕Swofford et al., 1996a˅ᴹ⒵䎇䴲䴭ᗕ⦃๗ⱘ䳔㽕˗䖭Ͼᮍ⊩া䗖⫼Ѣ䎱⾏䖯࣪ ᷥⱘᓎゟ˗䖭Ͼᮍ⊩ЁˈᇍѢ↣ϔϾᑣ߫ऍ䜡ˈ⾡㉏ൟব࣪ᮍⱘॳྟপҷⱘ᭄Ⳃ䛑 Ӯ䅵ㅫϔϾ4×4ⱘᮍ䰉Ё˄བ9.6˅DŽ↣Ͼᮍ䰉䛑Ӯ᳝ϔϾҷ᭄㸠߫ᓣˈ䖭Ͼ㸠߫ᓣⱘ logؐᰃ䆘Ԅᑣ߫ᏂᓖᗻⱘϔϾ㽕㋴ˈℸ㹿⿄Ў“log�det”DŽᇍ䙷ѯᢹ᳝⾡ḋⱘ⺅ 乥⥛ⱘᑣ߫䖯㸠ঠ䞡↨䕗ˈህӮᕫࠄ辵ḋⱘᮍ䰉ˈгህӮᕫࠄ辵ḋⱘ㸠߫ᓣؐ˗ ℸˈ䆘Ԅᑣ߫ϸϸП䯈ⱘ䎱⾏ⱘᯊˈህ㽕ফࠄᑣ߫ϸϸП䯈ⱘ㸠߫ᓣؐⱘᕅડˈ㗠Ϩ ᑣ߫ϸϸП䯈ⱘ↨䕗ܕ䆌䗖⫼ϡৠⱘপҷൟˈℸ⊓ⴔ㋏㒳থ㚆䖯࣪ᷥⱘϡৠᷥᵱˈᇚӮ ѻ⫳࣪ܗDŽLog�detᇸ݊ᇍԡ⚍П䯈ⱘ䗳⥛Ꮒᓖ˄㾕ϟ᭛˅ᬣᛳˈℸˈ⺅乥⥛ⱘأ ৃ㛑াᄬѢ䙷ѯᡓফব࣪ⱘԡ⚍DŽ ԡ⚍ݙ䗳⥛Ꮒᓖൟ 䰸њপҷൟⱘ࣪ܗҹˈϔϾᑣ߫ЁϾϡৠԡ⚍П䯈পҷ䗳⥛ⱘᏂᓖгӮᇍᓎゟ䖯࣪ ᷥⱘ㒧ᵰѻ⫳ᕜ⏅䖰ⱘᕅડ˄Swofford et al., 1996a˅˗݇Ѣԡ⚍П䯈ⱘ䗳⥛Ꮒᓖ˄㗙 িخԡ⚍ᓖ䋼ᗻ˅ˈ᳝ϔϾ᳔ᯢᰒⱘ՟ᄤˈህᰃϔϾ㓪ⷕᑣ߫Ёˈϝ㘨ԧ㓪ⷕⱘԡ⚍Ꮒ ᓖ˖ϝ㘨ԧ㓪ⷕЁˈϝϾ㓪ⷕԡ⚍↨ϸϾԡ⚍ࡴᆍᯧথ⫳ব࣪˗ℷᰃߎѢ䖭Ͼॳ ˈ䆌㋏㒳থ㚆ߚᵤᮍ⊩ߚᵤ㓪ⷕᑣ߫ᯊˈ䛑ӮᡞϝϾ㓪ⷕԡ⚍ᥦ䰸˗Ԛᰃᶤ ѯᚙމϟˈ䗳⥛ᏂᓖൟӮࡴᬣ䫤˄↨བˈᇍᑨѢ㲟ⱑ䋼㗙rRNAⱘֱᅜᑣ߫˅DŽ ᇍԡ⚍Ꮒᓖⱘপҷ䗳⥛䖯㸠Ԅؐⱘᮍ⊩᳝䴲খ᭄࣪˄ൟW.M. Yang et al., 1996˅ˈϡব ᓣൟgammaߚᏗൟ˄Swofford et al., 1996a˅DŽ䴲খ᭄࣪ᮍ⊩⑤Ѣ⡍ᓖԡ⚍ⱘⳌᇍ䗳 ⥛ⱘ㣗⭈˗䖭Ͼᮍ⊩ৃҹMPᓎᷥᮍ⊩ЁՓ⫼ˈা㽕ḍⳌᇍⱘবᓖ乥⥛ᇍ⡍ᓖԡ⚍䖯㸠ㅔ ऩࡴᴗህৃҹњˈᔧ✊䖯㸠ࡴᴗᯊ䳔㽕᳝݇Ѣⳳᅲ䖯࣪ᷥⱘ乘ⶹ䆚˗䖭Ͼᮍ⊩ৠḋгৃҹ 䗖⫼ѢMLᓎᷥᮍ⊩ˈԚᰃ䅵ㅫϞ㹿䅸Ўᰃϡߛᅲ䰙ⱘ˄W.M. Yang et al., 1996˅DŽϡব ᓣൟᇍϔᅮ↨՟ⱘԡ⚍䖯㸠Ԅؐˈ䖭ѯԡ⚍ᑊϡ㛑㞾⬅ব࣪˗࠽ԭⱘԡ⚍؛ᅮЎㄝὖ⥛ব ࣪DŽ㟇Ѣgammaൟᮍ⊩ˈᅗ؛ᅮϔϾ㒭ᅮⱘᑣ߫ব࣪ⱘὖ⥛ᰃ䙉ᅜgammaߚᏗ㾘ᕟⱘˈℸ ᣛᅮԡ⚍ⱘপҷὖ⥛˗gammaߚᏗⱘᔶ⢊˄᳝ᔶ⢊খ᭄Įᦣ䗄˅ᦣ䗄њϔϾᑣ߫ЁϾԡ⚍ⱘ পҷ乥⥛ⱘߚᏗ˄Swofford et al., 1996a, p. 444, Figure 13; cf. Li, 1997, p. 76, Figure 3.10; ⊼ᛣሎᑺᏂᓖ˅DŽϔϾ⏋ড়ᮍ⊩Ёˈৃҹ؛ᅮϔ䚼ߚԡ⚍ᰃϡবⱘˈ㗠࠽ԭ ⱘԡ⚍߭ᰃᣝ✻gammaߚᏗব࣪ⱘDŽ ᅲ䰙Ϟˈgammaׂℷৃҹᰃ䖲㓁ⱘˈ⾏ᬷⱘ㗙㞾⾏ᬷⱘ˄W.M. Yang et al., 1996˅DŽ䖲㓁 gammaⱘᛣᗱᰃϾԡ⚍⊓ϔᴵ䖲㓁ⱘὖ⥛᳆㒓ব࣪˗Ⳃࠡˈ䖭Ͼᮍ⊩㒱᭄ᚙމϟ᮴⊩ 䅵ㅫDŽ⾏ᬷgamma䘐䖥ᮍ⊩ᣛᅮϾԡ⚍ⱘὖ⥛ˈՓᕫ䖭ѯ˄䞣ⱘ˅ὖ⥛ؐ䘐䖥gamma᳆ 㒓DŽ㞾⾏ᬷൟ؛ᅮⳌ䚏ⱘԡ⚍ⱘব࣪䗳⥛ᰃⳌ݇㘨ⱘ˗䆌㒘ԡ⚍㹿ߚЎ䆌㉏ˈ݊Ё↣ ϔ㉏Ёⱘԡ⚍ⱘব࣪䗳⥛ৃ㛑㹿؛ᅮЎᐌ䞣㗙ᓖ㉏ؐDŽ 䖯࣪ᷥᓎゟᑣՓ⫼⾡ḋⱘԡ⚍䗳⥛Ꮒᓖׂℷᮍ⊩DŽᇍѢḌ䝌᭄ˈPAUP 4.0ऩ⣀ 㗙⏋ড়Փ⫼ᯊ䯈ৃ䗚ⱘ䎱⾏ᓎᷥᮍ⊩᳔Ԑ✊ᓎᷥᮍ⊩ᯊˈ᮶Փ⫼ϡবᓣgammaൟˈгՓ ⫼⾏ᬷⱘgammaൟ˗Փ⫼log�det䎱⾏ᓎᷥᮍ⊩ᯊˈՓ⫼ϡবᓣൟ˄㾕ϟ˅DŽᇍѢḌ 䝌ˈ⇼䝌㓪ⷕᄤ᭄ˈPAMLՓ⫼䖲㓁ⱘˈ⾏ᬷⱘ㞾⾏ᬷⱘgammaൟDŽᇍѢḌ䝌⇼ 䝌᭄ˈPHYLIPՓ⫼ϔ⾡⾏ᬷⱘgammaൟDŽ бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ7/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com