正在加载图片...
第九章系统发育分析 页码,7/3 降至最低值,而力求把那些主要差异是转换的序列集中在一起。 任何一种“时间可逆”的核苷酸取代模型都可以用图9.5所示的方阵刻画,只是其中一个速率 和其它速率的差异;在任意组合中,最多可以达到只有六个参数,其中每一个速率参数都是 独立的( Swofford et al.,19%6a;Li,1997)。如果平衡的碱基频率不相等,则需要额外 的参数:如果平衡的碱基频率不相等,但是却假定这些频率相等,那么系统发育进化树的最 终结果将会出错(Li,1997)。 侧线( paral inear)(Lake,1994)和“log�det”( Lockhart et al.,1994)做了一些 修正(见 Swofford et a.,1996a)来满足非静态环境的需要;这个方法只适用于距离进化 树的建立;在这个方法中,对于每一个序列匹配,各种类型和变化方向的原始取代的数目都 会计算在一个4×4的方阵中(如图9.6)。每个方阵都会有一个代数行列式,这个行列式的 og值是评估序列差异性的一个要素,因此被称为“Iog&#0:det”。对那些拥有各种各样的碱 基频率的序列进行双重比较,就会得到各种各样的方阵,也就会得到各种各样的行列式值 因此,在评估序列两两之间的距离的时候,就要受到序列两两之间的行列式值的影响,而且 序列两两之间的比较允许适用不同的取代模型,因此沿着系统发育进化树的不同树枝,将会 产生多元化。Log&#o;det尤其对位点之间的速率差异(见下文)敏感,因此,碱基频率的偏 向可能只存在于那些承受变化的位点 位点内速率差异模型 除了取代模型的多元化以外,一个序列中各个不同位点之间取代速率的差异也会对建立进化 树的结果产生很深远的影响( Swofford et a.,1996a);关于位点之间的速率差异(或者 叫做位点异质性),有一个最明显的例子,就是在一个编码序列中,三联体编码的位点差 异:在三联体编码中,第三个编码位点比另外两个位点更加容易发生变化;正是出于这个原 因,许多系统发育分析方法在分析编码序列时,都会把第三个编码位点排除在外;但是在某 些情况下,速率差异模型会更加敏锐(比如,对应于蛋白质或者rRNA的保守序列) 对位点差异的取代速率进行估值的方法有非参数化模型(W.M. Yang et a.,1996),不变 式模型和gama分布模型( Swofford et al.1996a)。非参数化方法源于特异位点的相对速 率的范畴;这个方法可以在MP建树方法中使用,只要根据相对的变异频率对特异位点进行简 单加权就可以了,当然进行加权时需要有关于真实进化树的预备知识;这个方法同样也可以 适用于M建树方法,但是在计算上被认为是不切实际的(W.M. Yang et al.,1996)。不 式模型对一定比例的位点进行估值,这些位点并不能自由变化;剩余的位点假定为等概率变 化。至于gama模型方法,它假定一个给定的序列变化的概率是遵守 gamma分布规律的,据此 指定位点的取代概率; gamma分布的形状(有形状参数α描述)描述了一个序列中各个位点的 取代频率的分布( Swofford et al.,1996a,p.444 Fi gure13:cf.Li,1997,p.76, Fi gure3.10:注意尺度差异)。在一个混合方法中,可以假定一部分位点是不变的,而剩余 的位点则是按照 gamma分布变化的。 实际上,gama修正可以是连续的,离散的或者自离散的(W.M. Yang et al.1996)。连续 gama的意思是各个位点沿一条连续的概率曲线变化;目前,这个方法在绝大多数情况下无法 计算。离散gama逼近方法指定各个位点的概率,使得这些(大量的)概率值逼近 gamma曲 线。自离散模型假定相邻的位点的变化速率是相关联的;许多组位点被分为许多类,其中每 类中的位点的变化速率可能被假定为常量或者异类值。 进化树建立程序使用各种各样的位点速率差异修正方法。对于核酸数据,PAUP4.0在单独或 者混合使用时间可逆的距离建树方法和最大似然建树方法时,既使用不变式 gamma模型,也使 用离散的gama模型;在使用lσ&#o;det距离建树方法时,使用不变式模型(见下)。对于核 酸,氨基酸和编码子数据,PAM使用连续的,离散的和自离散的gama模型。对于核酸和氨基 酸数据, PHYLIP使用一种离散的gama模型 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18䰡㟇᳔Ԣؐˈ㗠࡯∖ᡞ䙷ѯЏ㽕Ꮒᓖᰃ䕀ᤶⱘᑣ߫䲚Ё೼ϔ䍋DŽ ӏԩϔ⾡Āᯊ䯈ৃ䗚āⱘḌ㣋䝌পҷ῵ൟ䛑ৃҹ⫼೒9.5᠔⼎ⱘᮍ䰉ࠏˈ⬏াᰃ݊ЁϔϾ䗳⥛ ੠݊ᅗ䗳⥛ⱘᏂᓖ˗೼ӏᛣ㒘ড়Ёˈ᳔໮ৃҹ䖒ࠄা᳝݁Ͼখ᭄ˈ݊Ё↣ϔϾ䗳⥛খ᭄䛑ᰃ ⣀ゟⱘ˄Swofford et al., 1996a˗Li, 1997˅DŽབᵰᑇ㸵ⱘ⺅෎乥⥛ϡⳌㄝˈ߭䳔㽕乱໪ ⱘখ᭄˗བᵰᑇ㸵ⱘ⺅෎乥⥛ϡⳌㄝˈԚᰃै؛ᅮ䖭ѯ乥⥛Ⳍㄝˈ䙷М㋏㒳থ㚆䖯࣪ᷥⱘ᳔ 㒜㒧ᵰᇚӮߎ䫭˄Li, 1997˅DŽ ջ㒓˄paralinear˅˄Lake, 1994˅੠“log�det”˄Lockhart et al., 1994˅خњϔѯ ׂℷ˄㾕Swofford et al., 1996a˅ᴹ⒵䎇䴲䴭ᗕ⦃๗ⱘ䳔㽕˗䖭Ͼᮍ⊩া䗖⫼Ѣ䎱⾏䖯࣪ ᷥⱘᓎゟ˗೼䖭Ͼᮍ⊩ЁˈᇍѢ↣ϔϾᑣ߫ऍ䜡ˈ৘⾡㉏ൟ੠ব࣪ᮍ৥ⱘॳྟপҷⱘ᭄Ⳃ䛑 Ӯ䅵ㅫ೼ϔϾ4×4ⱘᮍ䰉Ё˄བ೒9.6˅DŽ↣Ͼᮍ䰉䛑Ӯ᳝ϔϾҷ᭄㸠߫ᓣˈ䖭Ͼ㸠߫ᓣⱘ logؐᰃ䆘Ԅᑣ߫ᏂᓖᗻⱘϔϾ㽕㋴ˈ಴ℸ㹿⿄Ў“log�det”DŽᇍ䙷ѯᢹ᳝৘⾡৘ḋⱘ⺅ ෎乥⥛ⱘᑣ߫䖯㸠ঠ䞡↨䕗ˈህӮᕫࠄ৘辵৘ḋⱘᮍ䰉ˈгህӮᕫࠄ৘辵৘ḋⱘ㸠߫ᓣؐ˗ ಴ℸˈ೼䆘Ԅᑣ߫ϸϸП䯈ⱘ䎱⾏ⱘᯊ׭ˈህ㽕ফࠄᑣ߫ϸϸП䯈ⱘ㸠߫ᓣؐⱘᕅડˈ㗠Ϩ ᑣ߫ϸϸП䯈ⱘ↨䕗ܕ䆌䗖⫼ϡৠⱘপҷ῵ൟˈ಴ℸ⊓ⴔ㋏㒳থ㚆䖯࣪ᷥⱘϡৠᷥᵱˈᇚӮ ѻ⫳໮࣪ܗDŽLog�detᇸ݊ᇍԡ⚍П䯈ⱘ䗳⥛Ꮒᓖ˄㾕ϟ᭛˅ᬣᛳˈ಴ℸˈ⺅෎乥⥛ⱘأ ৥ৃ㛑াᄬ೼Ѣ䙷ѯᡓফব࣪ⱘԡ⚍DŽ ԡ⚍ݙ䗳⥛Ꮒᓖ῵ൟ 䰸њপҷ῵ൟⱘ໮࣪ܗҹ໪ˈϔϾᑣ߫Ё৘Ͼϡৠԡ⚍П䯈পҷ䗳⥛ⱘᏂᓖгӮᇍᓎゟ䖯࣪ ᷥⱘ㒧ᵰѻ⫳ᕜ⏅䖰ⱘᕅડ˄Swofford et al., 1996a˅˗݇Ѣԡ⚍П䯈ⱘ䗳⥛Ꮒᓖ˄៪㗙 িخԡ⚍ᓖ䋼ᗻ˅ˈ᳝ϔϾ᳔ᯢᰒⱘ՟ᄤˈህᰃ೼ϔϾ㓪ⷕᑣ߫Ёˈϝ㘨ԧ㓪ⷕⱘԡ⚍Ꮒ ᓖ˖೼ϝ㘨ԧ㓪ⷕЁˈ㄀ϝϾ㓪ⷕԡ⚍↨঺໪ϸϾԡ⚍᳈ࡴᆍᯧথ⫳ব࣪˗ℷᰃߎѢ䖭Ͼॳ ಴ˈ䆌໮㋏㒳থ㚆ߚᵤᮍ⊩೼ߚᵤ㓪ⷕᑣ߫ᯊˈ䛑Ӯᡞ㄀ϝϾ㓪ⷕԡ⚍ᥦ䰸೼໪˗Ԛᰃ೼ᶤ ѯᚙމϟˈ䗳⥛Ꮒᓖ῵ൟӮ᳈ࡴᬣ䫤˄↨བˈᇍᑨѢ㲟ⱑ䋼៪㗙rRNAⱘֱᅜᑣ߫˅DŽ ᇍԡ⚍Ꮒᓖⱘপҷ䗳⥛䖯㸠Ԅؐⱘᮍ⊩᳝䴲খ᭄࣪˄ൟ῵W.M. Yang et al., 1996˅ˈϡব ᓣ῵ൟ੠gammaߚᏗ῵ൟ˄Swofford et al., 1996a˅DŽ䴲খ᭄࣪ᮍ⊩⑤Ѣ⡍ᓖԡ⚍ⱘⳌᇍ䗳 ⥛ⱘ㣗⭈˗䖭Ͼᮍ⊩ৃҹ೼MPᓎᷥᮍ⊩ЁՓ⫼ˈা㽕ḍ᥂Ⳍᇍⱘবᓖ乥⥛ᇍ⡍ᓖԡ⚍䖯㸠ㅔ ऩࡴᴗህৃҹњˈᔧ✊䖯㸠ࡴᴗᯊ䳔㽕᳝݇Ѣⳳᅲ䖯࣪ᷥⱘ乘໛ⶹ䆚˗䖭Ͼᮍ⊩ৠḋгৃҹ 䗖⫼ѢMLᓎᷥᮍ⊩ˈԚᰃ೼䅵ㅫϞ㹿䅸Ўᰃϡߛᅲ䰙ⱘ˄W.M. Yang et al., 1996˅DŽϡব ᓣ῵ൟᇍϔᅮ↨՟ⱘԡ⚍䖯㸠Ԅؐˈ䖭ѯԡ⚍ᑊϡ㛑㞾⬅ব࣪˗࠽ԭⱘԡ⚍؛ᅮЎㄝὖ⥛ব ࣪DŽ㟇Ѣgamma῵ൟᮍ⊩ˈᅗ؛ᅮϔϾ㒭ᅮⱘᑣ߫ব࣪ⱘὖ⥛ᰃ䙉ᅜgammaߚᏗ㾘ᕟⱘˈ᥂ℸ ᣛᅮԡ⚍ⱘপҷὖ⥛˗gammaߚᏗⱘᔶ⢊˄᳝ᔶ⢊খ᭄Įᦣ䗄˅ᦣ䗄њϔϾᑣ߫Ё৘Ͼԡ⚍ⱘ পҷ乥⥛ⱘߚᏗ˄Swofford et al., 1996a, p. 444, Figure 13; cf. Li, 1997, p. 76, Figure 3.10; ⊼ᛣሎᑺᏂᓖ˅DŽ೼ϔϾ⏋ড়ᮍ⊩Ёˈৃҹ؛ᅮϔ䚼ߚԡ⚍ᰃϡবⱘˈ㗠࠽ԭ ⱘԡ⚍߭ᰃᣝ✻gammaߚᏗব࣪ⱘDŽ ᅲ䰙Ϟˈgammaׂℷৃҹᰃ䖲㓁ⱘˈ⾏ᬷⱘ៪㗙㞾⾏ᬷⱘ˄W.M. Yang et al., 1996˅DŽ䖲㓁 gammaⱘᛣᗱᰃ৘Ͼԡ⚍⊓ϔᴵ䖲㓁ⱘὖ⥛᳆㒓ব࣪˗Ⳃࠡˈ䖭Ͼᮍ⊩೼㒱໻໮᭄ᚙމϟ᮴⊩ 䅵ㅫDŽ⾏ᬷgamma䘐䖥ᮍ⊩ᣛᅮ৘Ͼԡ⚍ⱘὖ⥛ˈՓᕫ䖭ѯ˄໻䞣ⱘ˅ὖ⥛ؐ䘐䖥gamma᳆ 㒓DŽ㞾⾏ᬷ῵ൟ؛ᅮⳌ䚏ⱘԡ⚍ⱘব࣪䗳⥛ᰃⳌ݇㘨ⱘ˗䆌໮㒘ԡ⚍㹿ߚЎ䆌໮㉏ˈ݊Ё↣ ϔ㉏Ёⱘԡ⚍ⱘব࣪䗳⥛ৃ㛑㹿؛ᅮЎᐌ䞣៪㗙ᓖ㉏ؐDŽ 䖯࣪ᷥᓎゟ⿟ᑣՓ⫼৘⾡৘ḋⱘԡ⚍䗳⥛Ꮒᓖׂℷᮍ⊩DŽᇍѢḌ䝌᭄᥂ˈPAUP 4.0೼ऩ⣀៪ 㗙⏋ড়Փ⫼ᯊ䯈ৃ䗚ⱘ䎱⾏ᓎᷥᮍ⊩੠᳔໻Ԑ✊ᓎᷥᮍ⊩ᯊˈ᮶Փ⫼ϡবᓣgamma῵ൟˈгՓ ⫼⾏ᬷⱘgamma῵ൟ˗೼Փ⫼log�det䎱⾏ᓎᷥᮍ⊩ᯊˈՓ⫼ϡবᓣ῵ൟ˄㾕ϟ˅DŽᇍѢḌ 䝌ˈ⇼෎䝌੠㓪ⷕᄤ᭄᥂ˈPAMLՓ⫼䖲㓁ⱘˈ⾏ᬷⱘ੠㞾⾏ᬷⱘgamma῵ൟDŽᇍѢḌ䝌੠⇼෎ 䝌᭄᥂ˈPHYLIPՓ⫼ϔ⾡⾏ᬷⱘgamma῵ൟDŽ ㄀бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ7/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有