正在加载图片...
第九章系统发育分析 页码,8/3 究竟使用哪一种取代模型呢? 在一个给定的序列集中,即使一个取代模型中的任何参数都可以证明是很有判断力的,但是 最好的模型并不一定总是拥有最多的蚕室;相反,参数越少,模型越好,这是因为对每一个 参数进行估值都会引入一个相关的变量,而每引入一个附加的参数维度,都会使得整体的变 数增加,有时候甚至会对模型起抑制作用(见Li,1997:p.84,表4.1)。对于一个给定的 序列比较,如果模型只有两个参数,那么碱基差异的总和要被划分为两个类别;如果模型有 六个参数,那么碱基差异的总和要被划分为六个类别;很明显,如果分为六个类别,那么每 一个类别中的位点样本数目将会很小,很可能小得无法进行合理地估值 PAUP的“描述树”特征是对DNA序列的取代模型进行规范的一个较好的策略,它使用似然方法 同时评估六个可逆的取代速率、gama分布的a形状参数和不变的位点的比例(图97)。这些 参数可以通过相等的或者指定的碱基频率进行估值。通常,任何一个合理的系统发育进化树 (比如,很容易就可以得到一个相邻连接的进化树)都适用于这个程序,因为很明显,对参 数的估值在很大程度上受到特征符模式的影响,而不是进化树的拓扑结构( Swofford et a.,1996b)。这个估值程序对于50个序列而言,并不会耗费太多的时间。如果序列较多, 或者时间较紧,可以对试验的进化树进行精简,在保留全部的系统发育范围和结构的同时, 减少分类数目。通过这些估算的取代参数,我们可以通过比较由较多参数和较少参数分别评 估得到的似然分值,决定一个简化的模型是否合理(比如,六个取代类别是否可以减少到两 个)。有时候,α参数和不变位点的比例可以相互替换,所以我们应该比较每一个单独使用时 得到的似然分值和两个同时使用时得到的似然分值。注意,和MP以及M不同,用不同的参数 值得到M分值可以直接比较( Swofford et a.,1996b) 对于编码蛋白质的DNA序列,根据样本的分歧程度,有时候很明显地,有用的变化基本上都是 第一位和第二位的编码位点,而在整个数据集中,第三位点通常都是随机的,或者第三位点 变化而第一位点和第二位点不变。尽管除去“无用”位点可以提高剩余位点的不同速率的估 值精确度,上面所述的程序还是要对这个速率差异进行修正。对于节约进化树的建立,我们 有时候会把随机的第三位点从分析中除去,因为这些位点只会引入噪声,如果碱基频率不相 等,这些位点还会引入错误 怎么样才能确定数据集中的非静态因素是否会成为一个问题呢?最简单的方法可能就是去比 较PAUP中两种通过不同方法得到的建树结果和进化树评估结果,一种方法是使用时间可逆的 方法,另一种方法是log&#0:det距离建树方法。下面的章节中将会涉及到这些程序。 还没有什么好的计算方法,能够直接从序列数据中评估非静态因素的影响。PAUP中有一个命 令,会列出所有序列的碱基频率。这个程序应该使用排除不变位点( Excl ude Constant Si tes)的选项。序列中的碱基频率可以很直观地比较出来。数据文件应该指定 gapmode= mi ssi ng,或者PAUP要把一个空位特征符计算为一个碱基变化。碱基频率的命令还要 对数据执行一个“chi平方(chi� square)”测试,但是这个测试并不切实际,因为它假 定数据是从一个随机样本中提取的,而结果就会假定所观察到的不相等是相互独立的而不是 系统发育结构的结果。一个毫无意义的chi� square分值并不能除去非静态因素,而一个有 意义的分值很可能会进一步证实非静态因素。PAUP中的碱基组成命令已经被用来证明:在被 子植物和绿藻的5.8SrD№A序列中,两者之间变化比较大的位点集中存在中碱基偏好,但是并 不一定在某个序列上产生变化( Hershkovi tz and lewis,1996)。 建树方法 现有的软件中所采用的建树方法已经在某些著作( Sai tou,1996: Swofford et a.,1996a Li,1997)中有很详尽的讨论;这部分只是简单地描述一些最常用的方法。建树方法可以分 为两类,每类有两种不同的方法: file://E:wcb生物信息学(中译本)\第九章系统发育分析.htm 2005-1-18おコՓ⫼ાϔ⾡পҷ῵ൟਸ਼˛ ೼ϔϾ㒭ᅮⱘᑣ߫䲚ЁˈेՓϔϾপҷ῵ൟЁⱘӏԩখ᭄䛑ৃҹ䆕ᯢᰃᕜ᳝߸ᮁ࡯ⱘˈԚᰃ ᳔དⱘ῵ൟᑊϡϔᅮᘏᰃᢹ᳔᳝໮ⱘ㱩ᅸ˗Ⳍডˈখ᭄䍞ᇥˈ῵ൟ䍞དˈ䖭ᰃ಴Ўᇍ↣ϔϾ খ᭄䖯㸠Ԅؐ䛑ӮᓩܹϔϾⳌ݇ⱘব䞣ˈ㗠↣ᓩܹϔϾ䰘ࡴⱘখ᭄㓈ᑺˈ䛑ӮՓᕫᭈԧⱘব ᭄๲ࡴᯊ᳝ˈ׭⫮㟇Ӯᇍ῵ൟ䍋ᡥࠊ˄⫼԰㾕Li, 1997: p. 84, 㸼4.1˅DŽᇍѢϔϾ㒭ᅮⱘ ᑣ߫↨䕗ˈབᵰ῵ൟা᳝ϸϾখ᭄ˈ䙷М⺅෎Ꮒᓖⱘᘏ੠㽕㹿ߚߦЎϸϾ㉏߿˗བᵰ῵ൟ᳝ ݁Ͼখ᭄ˈ䙷М⺅෎Ꮒᓖⱘᘏ੠㽕㹿ߚߦЎ݁Ͼ㉏߿˗ᕜᯢᰒˈབᵰߚЎ݁Ͼ㉏߿ˈ䙷М↣ ϔϾ㉏߿Ёⱘԡ⚍ḋᴀ᭄ⳂᇚӮᕜᇣˈᕜৃ㛑ᇣᕫ᮴⊩䖯㸠ড়⧚ഄԄؐDŽ PAUPⱘĀᦣ䗄ᷥā⡍ᕕᰃᇍDNAᑣ߫ⱘপҷ῵ൟ䖯㸠㾘㣗ⱘϔϾ䕗དⱘㄪ⬹ˈᅗՓ⫼Ԑ✊ᮍ⊩ ৠᯊ䆘Ԅ݁Ͼৃ䗚ⱘপҷ䗳⥛ǃgammaߚᏗⱘĮᔶ⢊খ᭄੠ϡবⱘԡ⚍ⱘ↨՟˄೒9.7˅DŽ䖭ѯ খ᭄ৃҹ䗮䖛Ⳍㄝⱘ៪㗙ᣛᅮⱘ⺅෎乥⥛䖯㸠ԄؐDŽ䗮ᐌˈӏԩϔϾড়⧚ⱘ㋏㒳থ㚆䖯࣪ᷥ ˄↨བˈᕜᆍᯧህৃҹᕫࠄϔϾⳌ䚏䖲᥹ⱘ䖯࣪˅ᷥ䛑䗖⫼Ѣ䖭Ͼ⿟ᑣˈ಴Ўᕜᯢᰒˈᇍখ ᭄ⱘԄؐ೼ᕜ໻⿟ᑺϞফࠄ⡍ᕕヺ῵ᓣⱘᕅડˈ㗠ϡᰃ䖯࣪ᷥⱘᢧᠥ㒧ᵘ˄Swofford et al., 1996b˅DŽ䖭ϾԄؐ⿟ᑣᇍѢ50Ͼᑣ߫㗠㿔ˈᑊϡӮ㗫䌍໾໮ⱘᯊ䯈DŽབᵰᑣ߫䕗໮ˈ ៪㗙ᯊ䯈䕗㋻ˈৃҹᇍ䆩偠ⱘ䖯࣪ᷥ䖯㸠㊒ㅔˈ೼ֱ⬭ܼ䚼ⱘ㋏㒳থ㚆㣗ೈ੠㒧ᵘⱘৠᯊˈ ޣᇥߚ㉏᭄ⳂDŽ䗮䖛䖭ѯԄㅫⱘপҷখ᭄ˈ៥Ӏৃҹ䗮䖛↨䕗⬅䕗໮খ᭄੠䕗ᇥখ᭄߿ߚ䆘 ԄᕫࠄⱘԐ✊ߚˈؐއᅮϔϾㅔ࣪ⱘ῵ൟᰃ৺ড়⧚˄↨བˈ݁Ͼপҷ㉏߿ᰃ৺ৃҹޣᇥࠄϸ Ͼ˅DŽ᳝ᯊ׭ˈĮখ᭄੠ϡবԡ⚍ⱘ↨՟ৃҹⳌѦ᳓ᤶˈ᠔ҹ៥Ӏᑨ䆹↨䕗↣ϔϾऩ⣀Փ⫼ᯊ ᕫࠄⱘԐ✊ߚ੠ؐϸϾৠᯊՓ⫼ᯊᕫࠄⱘԐ✊ߚؐDŽ⊼ᛣˈ੠MPҹঞMEϡৠˈ⫼ϡৠⱘখ᭄ ؐᕫࠄMLߚৃؐҹⳈ᥹↨䕗˄Swofford et al., 1996b˅DŽ ᇍѢ㓪ⷕ㲟ⱑ䋼ⱘDNAᑣ߫ˈḍ᥂ḋᴀⱘߚ⿟FAXᑺˈ᳝ᯊ׭ᕜᯢᰒഄˈ᳝⫼ⱘব࣪෎ᴀϞ䛑ᰃ ㄀ϔԡ੠㄀Ѡԡⱘ㓪ⷕԡ⚍ˈ㗠೼ᭈϾ᭄᥂䲚Ёˈ㄀ϝԡ⚍䗮ᐌ䛑ᰃ䱣ᴎⱘˈ៪㗙㄀ϝԡ⚍ ব࣪㗠㄀ϔԡ⚍੠㄀Ѡԡ⚍ϡবDŽሑㅵ䰸এĀ᮴⫼āԡ⚍ৃҹᦤ催࠽ԭԡ⚍ⱘϡৠ䗳⥛ⱘԄ ؐ㊒⹂ᑺˈϞ䴶᠔䗄ⱘ⿟ᑣ䖬ᰃ㽕ᇍ䖭Ͼ䗳⥛Ꮒᓖ䖯㸠ׂℷDŽᇍѢ㡖㑺䖯࣪ᷥⱘᓎゟˈ៥Ӏ ᳝ᯊ׭Ӯᡞ䱣ᴎⱘ㄀ϝԡ⚍ҢߚᵤЁ䰸এˈ಴Ў䖭ѯԡ⚍াӮᓩܹాໄˈབᵰ⺅෎乥⥛ϡⳌ ㄝˈ䖭ѯԡ⚍䖬Ӯᓩܹ䫭䇃DŽ ᗢМḋᠡ㛑⹂ᅮ᭄᥂䲚Ёⱘ䴲䴭ᗕ಴㋴ᰃ৺Ӯ៤ЎϔϾ䯂乬ਸ਼˛᳔ㅔऩⱘᮍ⊩ৃ㛑ህᰃএ↨ 䕗PAUPЁϸ⾡䗮䖛ϡৠᮍ⊩ᕫࠄⱘᓎᷥ㒧ᵰ੠䖯࣪ᷥ䆘Ԅ㒧ᵰˈϔ⾡ᮍ⊩ᰃՓ⫼ᯊ䯈ৃ䗚ⱘ ᮍ⊩ˈ঺ϔ⾡ᮍ⊩ᰃlog�det䎱⾏ᓎᷥᮍ⊩DŽϟ䴶ⱘゴ㡖ЁᇚӮ⍝ঞࠄ䖭ѯ⿟ᑣDŽ 䖬≵᳝ҔМདⱘ䅵ㅫᮍ⊩ˈ㛑໳Ⳉ᥹Ңᑣ᭄߫᥂Ё䆘Ԅ䴲䴭ᗕ಴㋴ⱘᕅડDŽPAUPЁ᳝ϔϾੑ ҸˈӮ߫ߎ᠔᳝ᑣ߫ⱘ⺅෎乥⥛DŽ䖭Ͼ⿟ᑣᑨ䆹Փ⫼ᥦ䰸ϡবԡ⚍˄Exclude Constant Sites˅ⱘ䗝乍DŽᑣ߫Ёⱘ⺅෎乥⥛ৃҹᕜⳈ㾖ഄ↨䕗ߎᴹDŽ᭄᥂᭛ӊᑨ䆹ᣛᅮ gapmode=missingˈ៪㗙PAUP㽕ᡞϔϾぎԡ⡍ᕕヺ䅵ㅫЎϔϾ⺅෎ব࣪DŽ⺅෎乥⥛ⱘੑҸ䖬㽕 ᇍ᭄᥂ᠻ㸠ϔϾ“chiᑇᮍ˄chi�square˅ā⌟䆩ˈԚᰃ䖭Ͼ⌟䆩ᑊϡߛᅲ䰙ˈ಴Ўᅗ؛ ᅮ᭄᥂ᰃҢϔϾ䱣ᴎḋᴀЁᦤপⱘˈ㗠㒧ᵰህӮ؛ᅮ᠔㾖ᆳࠄⱘϡⳌㄝᰃⳌѦ⣀ゟⱘ㗠ϡᰃ ㋏㒳থ㚆㒧ᵘⱘ㒧ᵰDŽϔϾ↿᮴ᛣНⱘchi�squareߚؐᑊϡ㛑䰸এ䴲䴭ᗕ಴㋴ˈ㗠ϔϾ᳝ ᛣНⱘߚؐᕜৃ㛑Ӯ䖯ϔℹ䆕ᅲ䴲䴭ᗕ಴㋴DŽPAUPЁⱘ⺅෎㒘៤ੑҸᏆ㒣㹿⫼ᴹ䆕ᯢ˖೼㹿 ᄤỡ⠽੠㓓㯏ⱘ5.8S rDNAᑣ߫Ёˈϸ㗙П䯈ব࣪↨䕗໻ⱘԡ⚍䲚Ёᄬ೼Ё⺅෎أདˈԚᰃᑊ ϡϔᅮ೼ᶤϾᑣ߫Ϟѻ⫳ব࣪˄Hershkovitz and Lewis, 1996˅DŽ ᓎᷥᮍ⊩ ⦄᳝ⱘ䕃ӊЁ᠔䞛⫼ⱘᓎᷥᮍ⊩Ꮖ㒣೼ᶤѯ㨫԰˄Saitou, 1996; Swofford et al., 1996a; Li, 1997˅Ё᳝ᕜ䆺ሑⱘ䅼䆎˗䖭䚼ߚাᰃㅔऩഄᦣ䗄ϔѯ᳔ᐌ⫼ⱘᮍ⊩DŽᓎᷥᮍ⊩ৃҹߚ Ўϸ㉏ˈ↣㉏᳝ϸ⾡ϡৠⱘᮍ⊩˖ ㄀бゴ㋏㒳থ㚆ߚᵤ 义ⷕˈ8/32 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀бゴ㋏㒳থ㚆ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有