正在加载图片...
第九章系统发育分析 页码,6/32 由 MALI GN( Wheeler and gl adstein,1994)和 TreeAl i gn得到的比对不需要在比对后用这些 方法中的建树方法进行数据修饰,即使这些比对中仍然有一些同样类型的不确定性,这些不 确定性在另外一个程序进行分析时需要修正。如前所述,这些程序会根据由比对得到的最好 的MP系统发育进化树,对比对参数进行递归优化。 MALI GN还会利用一套空位为代价,对以连 接的可供选择的比对为基础的建树方法进行优化;在这个方法中,在最有可能的几种比对中 出现的比对特征将会被加权。这就提供了一种方法,可以捕获序列分歧的数量(在取消不确 定的比对区域的分值的时候这些分歧是被忽略掉的),因为这些区域的所有可能的比对方式 都将显示这些区域的最大的序列分歧。处于不确定的比对区域中的位点很可能不是同源的, 因此在进化树中需要加入一些噪声干扰或者偏向。 决定取代模型 对于取代模型,应该给予同比对和建树同样的重视。就像前面暗示的那样,取代模型既影响 比对,也影响建树;因此需要采用递归方法。现在,对于核酸数据而言,可以通过取代模型 中的两个要素进行计算机评估( Swofford,1997),但是对于氨基酸和密码子数据而言,没 有什么评估方案( Fel sensei n,1996)。其中一个要素是碱基之间相互取代的模型;另外- 个要素是序列中不同位点的所有取代的相对速率。还没有一种简单的计算机程序可以对较复 杂的变量(比如,位点特异性或者系统特异性取代模型)进行评估,同样,现有的建树软件 也不可能理解这些复杂变量。 碱基取代速率模型 一般而言,生物化学性质相近的碱基之间的取代频率较高;在DNA中,四种转换(A→G,G→ A,C→T,T>C)的频率比八种颠换(A→C,A→T,C→G,G→T,以及前四种的反向取 代)的频率要高;这些偏向会影响两个序列之间的预计的分歧。 各个残基之间的相对取代速率一般由方阵形式列出;对于碱基而言,行数和列数都是4,对于 氨基酸而言,行数和列数都是20(比如PAM方阵),对于密码子而言,行数和列数都是61(除 去了中止密码子)。非对角线元素对应于一个碱基变为另一个碱基的相对代价,而对角线元 素则代表不同序列拥有同一个碱基的代价 这些代价值可以固定为先验的代价表,以确保建树方法在计分时对每一种取代都使用确定的 代价值。固定的代价方阵是典型的静态权重方阵,MP建树方法(如图9.4)使用的就是这种方 阵。如果使用这种权重,那么这个方法就会被称为“加权节约”。又如,ML建树方法,代价 值是由即时的速率方阵得到的,这个方阵(如图9.5)代表了各种取代可能会发生的概率的M 估计值。MP权重方阵只涉及简单的算术,而应用距离和M速率方阵则可以引入复杂的代数 为了避免盲目使用不适当的方法,建议大家熟悉其内部的基本原理(见Li,1997,and/or Swofford et al. 1996a) 实际上,“前进”和“反向”取代速率被认为是相同的:这个取代模型被称为是“时间可 逆”;这个模型拥有“静态”的性质,因为在所有的碱基频率中没有预知的变化。在系统发 育的特殊历史中,不同序列中的碱基频率不同表明,前进和反向速率实际上可能会不同;而 传统的取代权重或者速率方阵不能包容这个“非静态”环境;本节的结尾将讨论一个基于非 静态取代模型(“1og&#0:det")的建树方法,这个方法将会提供一个可供选择的计算方 法 通常,特征符状态的权重方阵都会或多或少地通过观察进行过估值,当然也可以从速率矩阵 衍生得到。比如,如果假定两个转化的其中一个,发生的频率是每个颠换的两倍,那么据此 就可以确定一个权重方阵,比如,A&#0:G的转换代价为1,而A&#0:T的颠换代价为2(图 9.4)。(节约方法规定对角线元素值,或者说是不同序列中拥有相同碱基的代价值为零。这 是节约方法的一个缺点&#0�详见下文)在随后的建树步骤中,这套假定会把颠换的总数 file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18⬅MALIGN˄Wheeler and Gladstein, 1994˅੠TreeAlignᕫࠄⱘ↨ᇍϡ䳔㽕೼↨ᇍৢ⫼䖭ѯ ᮍ⊩Ёⱘᓎᷥᮍ⊩䖯㸠᭄᥂ׂ佄ˈेՓ䖭ѯ↨ᇍЁҡ✊᳝ϔѯৠḋ㉏ൟⱘϡ⹂ᅮᗻˈ䖭ѯϡ ⹂ᅮᗻ೼঺໪ϔϾ⿟ᑣ䖯㸠ߚᵤᯊ䳔㽕ׂℷDŽབࠡ᠔䗄ˈ䖭ѯ⿟ᑣӮḍ᥂⬅↨ᇍᕫࠄⱘ᳔ད ⱘMP㋏㒳থ㚆䖯࣪ˈᷥᇍ↨ᇍখ᭄䖯㸠䗦ᔦӬ࣪DŽMALIGN䖬Ӯ߽⫼ϔ༫ぎԡЎҷӋˈᇍҹ䖲 ᥹ⱘৃկ䗝ᢽⱘ↨ᇍЎ෎⸔ⱘᓎᷥᮍ⊩䖯㸠Ӭ࣪೼˗䖭Ͼᮍ⊩Ёˈ೼᳔᳝ৃ㛑ⱘ޴↨辵ᇍЁ ߎ⦃ⱘ↨ᇍ⡍ᕕᇚӮ㹿ࡴᴗDŽ䖭ህᦤկњϔ⾡ᮍ⊩ˈৃҹᤩ㦋ᑣ߫ߚFAXⱘ᭄䞣˄೼প⍜ϡ⹂ ᅮⱘ↨ᇍऎඳⱘߚؐⱘᯊ׭䖭ѯߚFAXᰃ㹿ᗑ⬹ᥝⱘ˅ˈ಴Ў䖭ѯऎඳⱘ᠔᳝ৃ㛑ⱘ↨ᇍᮍᓣ 䛑ᇚᰒ⼎䖭ѯऎඳⱘ᳔໻ⱘᑣ߫ߚFAXDŽ໘Ѣϡ⹂ᅮⱘ↨ᇍऎඳЁⱘԡ⚍ᕜৃ㛑ϡᰃৠ⑤ⱘˈ ಴ℸ೼䖯࣪ᷥЁ䳔㽕ࡴܹϔѯాໄᑆᡄ៪㗙أ৥DŽ ൟ῵ᅮপҷއ ᇍѢপҷ῵ൟˈᑨ䆹㒭ќৠ↨ᇍ੠ᓎᷥৠḋⱘ䞡㾚DŽህڣࠡ䴶ᱫ⼎ⱘ䙷ḋˈপҷ῵ൟ᮶ᕅડ ↨ᇍˈгᕅડᓎᷥ˗಴ℸ䳔㽕䞛⫼䗦ᔦᮍ⊩DŽ⦄೼ˈᇍѢḌ䝌᭄᥂㗠㿔ˈৃҹ䗮䖛পҷ῵ൟ ЁⱘϸϾ㽕㋴䖯㸠䅵ㅫᴎ䆘Ԅ˄Swofford, 1997˅ˈԚᰃᇍѢ⇼෎䝌੠ᆚⷕᄤ᭄᥂㗠㿔ˈ≵ ᳝ҔМ䆘ԄᮍḜ˄Felsenstein, 1996˅DŽ݊ЁϔϾ㽕㋴ᰃ⺅෎П䯈ⳌѦপҷⱘ῵ൟ˗঺໪ϔ Ͼ㽕㋴ᰃᑣ߫Ёϡৠԡ⚍ⱘ᠔᳝পҷⱘⳌᇍ䗳⥛DŽ䖬≵᳝ϔ⾡ㅔऩⱘ䅵ㅫᴎ⿟ᑣৃҹᇍ䕗໡ ᴖⱘব䞣˄↨བˈԡ⚍⡍ᓖᗻ៪㗙㋏㒳⡍ᓖᗻপҷ῵ൟ˅䖯㸠䆘Ԅˈৠḋˈ⦄᳝ⱘᓎᷥ䕃ӊ гϡৃ㛑⧚㾷䖭ѯ໡ᴖব䞣DŽ ⺅෎পҷ䗳⥛῵ൟ ϔ㠀㗠㿔ˈ⫳⠽࣪ᄺᗻ䋼Ⳍ䖥ⱘ⺅෎П䯈ⱘপҷ乥⥛䕗催˗೼DNAЁˈಯ⾡䕀ᤶ˄AÆ G, GÆ A, CÆ T, TÆ &˅ⱘ乥⥛↨ܿ⾡乴ᤶ˄AÆ C, AÆ T, CÆ G, GÆ T, ҹঞࠡಯ⾡ⱘড৥প ҷ˅ⱘ乥⥛㽕催˗䖭ѯأ৥ӮᕅડϸϾᑣ߫П䯈ⱘ乘䅵ⱘߚFAXDŽ ৘Ͼ⅟෎П䯈ⱘⳌᇍপҷ䗳⥛ϔ㠀⬅ᮍ䰉ᔶᓣ߫ߎ˗ᇍѢ⺅෎㗠㿔ˈ㸠᭄੠᭄߫䛑ᰃˈᇍѢ ⇼෎䝌㗠㿔ˈ㸠᭄੠᭄߫䛑ᰃ20˄↨བPAMᮍ䰉˅ˈᇍѢᆚⷕᄤ㗠㿔ˈ㸠᭄੠᭄߫䛑ᰃ61˄䰸 এњЁℶᆚⷕᄤ˅DŽ䴲ᇍ㾦㒓ܗ㋴ᇍᑨѢϔϾ⺅෎বЎ঺ϔϾ⺅෎ⱘⳌᇍҷӋˈ㗠ᇍ㾦㒓ܗ ㋴߭ҷ㸼ϡৠᑣ߫ᢹ᳝ৠϔϾ⺅෎ⱘҷӋDŽ 䖭ѯҷӋؐৃҹ೎ᅮЎܜ偠ⱘҷӋ㸼ˈҹ⹂ֱᓎᷥᮍ⊩೼䅵ߚᯊᇍ↣ϔ⾡পҷ䛑Փ⫼⹂ᅮⱘ ҷӋؐDŽ೎ᅮⱘҷӋᮍ䰉ᰃ݌ൟⱘ䴭ᗕᴗ䞡ᮍ䰉ˈMPᓎᷥᮍ⊩˄བ೒9.4˅Փ⫼ⱘህᰃ䖭⾡ᮍ 䰉DŽབᵰՓ⫼䖭⾡ᴗ䞡ˈ䙷М䖭Ͼᮍ⊩ህӮ㹿⿄ЎĀࡴᴗ㡖㑺āDŽজབˈMLᓎᷥᮍ⊩ˈҷӋ ؐᰃ⬅ेᯊⱘ䗳⥛ᮍ䰉ᕫࠄⱘˈ䖭Ͼᮍ䰉˄བ೒9.5˅ҷ㸼њ৘⾡পҷৃ㛑Ӯথ⫳ⱘὖ⥛ⱘML Ԅ䅵ؐDŽMPᴗ䞡ᮍ䰉া⍝ঞㅔऩⱘㅫᴃˈ㗠ᑨ⫼䎱⾏੠ML䗳⥛ᮍ䰉߭ৃҹᓩܹ໡ᴖⱘҷ᭄DŽ Ўњ䙓ܡⳆⳂՓ⫼ϡ䗖ᔧⱘᮍ⊩ˈᓎ䆂໻ᆊ❳ᙝ݊ݙ䚼ⱘ෎ᴀॳ⧚˄㾕Li, 1997, and / or Swofford et al., 1996a˅DŽ ᅲ䰙ϞˈĀࠡ䖯ā੠Āড৥āপҷ䗳⥛㹿䅸ЎᰃⳌৠⱘ˗䖭Ͼপҷ῵ൟ㹿⿄ЎᰃĀᯊ䯈ৃ 䗚ā˗䖭Ͼ῵ൟᢹ᳝Ā䴭ᗕāⱘᗻ䋼ˈ಴Ў೼᠔᳝ⱘ⺅෎乥⥛Ё≵᳝乘ⶹⱘব࣪DŽ೼㋏㒳থ 㚆ⱘ⡍⅞ग़৆Ёˈϡৠᑣ߫Ёⱘ⺅෎乥⥛ϡৠ㸼ᯢˈࠡ䖯੠ড৥䗳⥛ᅲ䰙Ϟৃ㛑Ӯϡৠ˗㗠 Ӵ㒳ⱘপҷᴗ䞡៪㗙䗳⥛ᮍ䰉ϡ㛑ࣙᆍ䖭ϾĀ䴲䴭ᗕā⦃๗˗ᴀ㡖ⱘ㒧ሒᇚ䅼䆎ϔϾ෎Ѣ䴲 䴭ᗕপҷ῵ൟ˄“log�det”˅ⱘᓎᷥᮍ⊩ˈ䖭Ͼᮍ⊩ᇚӮᦤկϔϾৃկ䗝ᢽⱘ䅵ㅫᮍ ⊩DŽ 䗮ᐌˈ⡍ᕕヺ⢊ᗕⱘᴗ䞡ᮍ䰉䛑Ӯ៪໮៪ᇥഄ䗮䖛㾖ᆳ䖯㸠䖛Ԅؐˈᔧ✊гৃҹҢ䗳⥛ⶽ䰉 㸡⫳ᕫࠄDŽ↨བˈབᵰ؛ᅮϸϾ䕀࣪ⱘ݊ЁϔϾˈথ⫳ⱘ乥⥛ᰃ↣Ͼ乴ᤶⱘϸסˈ䙷М᥂ℸ ህৃҹ⹂ᅮϔϾᴗ䞡ᮍ䰉ˈ↨བˈA�Gⱘ䕀ᤶҷӋЎˈ㗠A�Tⱘ乴ᤶҷӋЎ˄೒ 9.4˅DŽ˄㡖㑺ᮍ⊩㾘ᅮᇍ㾦㒓ܗ㋴ؐˈ៪㗙䇈ᰃϡৠᑣ߫Ёᢹ᳝Ⳍৠ⺅෎ⱘҷӋؐЎ䳊DŽ䖭 ᰃ㡖㑺ᮍ⊩ⱘϔϾ㔎⚍��䆺㾕ϟ᭛˅೼䱣ৢⱘᓎᷥℹ偸Ёˈ䖭༫؛ᅮӮᡞ乴ᤶⱘᘏ᭄ ㄀бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ6/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有