第十章利用核酸序列的预测方法 页码,10/16 Q 搜寻tRNA基因 VA基因的识别要易于识别编码蛋白的基因,部分是由于po启动子结构简单以及tRNA 级结构的保守性。在 tRNAscan-SE(Loe和Edy,1997)中,结合了多个早期程序,基本上解 决了tRNA基因识别的问题。Lowe和Eddy发现,将依赖于二级结构检查和保守启动子元件的PWM 检测的 tRNAscan( Fi chant和 Burks,1991)的预测结果,与依赖于转录控制元件分析的 Pavesi等(1994)的算法加以合并后,超过99%的真tRNA基因都能被识别出来。这种混和的 预测结果列表中还包含了超过50%的假阳性。一种很好的选择性算法, COVELS(Eddy和 luri n,1994)发现能除去列表中几乎全部的错误。整个结果就是一种据报道称能识别9% 的真tRNA基因,并在每个基因组中少于一个假阳性的方法。 tRNAscan-SE的服务和软件均可得 到(见章末列表)。图10.4给出了一个例子的输出结果。 Sequence tRNA Bounds tRNA Anti Intron Bounds Cove Name tRNA Begi n End Type Codon Begi n End Score Your-seg 1 2348 2420 Val TAC 0 76.52 Your-seq 2 2440 2512 Thr TGT.70 Your-seq 3 2522 2594 Lys TIT 0 84. 24 Your-seq426272698GyGC0075.46 Your -seg 5 2709 2794 Leu taa00 62.99 Your-seq 6 2803 2876 Arg ACG0 0 71.02 Your-seq 7 2900 2973 Pro TGG0 0 79. 67 Your-seq829973069A|aTGC0071.25 Your-seq 9 4841 4914 Ile gat 0 84. 04 图10.4 tRNAscan-SE对样例的输出结果。样例序列是SA5SRR,添加号L36472,源于 Staphy! ococcus aureus。其tRNA基因预测结果与DBJ/EMBL/ Gen Bank中的注解完全一致。 未来的展望 在不久前,普通用户很难得到最好的技术工具。随着大量因特网服务能方便得到,以及通过 一个单纯界面就能不断提供服务的Ww网页,这种情况得以好转。虽然如此,一个用户想使用 整套合适的算法,就得要愿意将数据提交给一大堆程序;此外,还要把数据通过因特网送 出去(若涉及隐私则是个难题),或者只有请一个程序员来获取和安装相应程序。在大规模 测序中,就必须发明出一种方法,自动将序列提交给各个程序,并将所有结果整理清楚后交 给最终用户。如果有一种工具组合的体系框架,允许群体中任一个成员独立进行开发,又能 让只受过相对简单编程训练的工作者能将这些程序组合成一组适用于专门实验室需要的解决 方案,这将成为一个很有意义的进步。这种体系框架应基于电子邮件或 Worl d wi de Web 一个新的动人的发展是试图把当前对转录调节机制的知识融于软件,以通过计算分析为基因 file://E:wcb生物信息学(中译本)\第十章利用核酸序列的预测方法.htm2005-1-18᧰ᇏtRNA ᇍtRNAⱘ䆚߿㽕ᯧѢ䆚߿㓪ⷕ㲟ⱑⱘ䚼ߚᰃ⬅Ѣpolċਃࡼᄤ㒧ᵘㅔऩҹঞtRNAѠ 㑻㒧ᵘⱘֱᅜᗻDŽtRNAscan-SE˄LoweEddyˈ1997˅Ёˈ㒧ড়њϾᮽᳳᑣˈᴀϞ㾷 އњtRNA䆚߿ⱘ䯂乬DŽLoweEddyথ⦄ˈᇚձ䌪ѢѠ㑻㒧ᵘẔᶹֱᅜਃࡼᄤܗӊⱘPWM Ẕ⌟ⱘtRNAscan˄FichantBurksˈ1991˅ⱘ乘⌟㒧ᵰˈϢձ䌪Ѣ䕀ᔩܗࠊӊߚᵤⱘ Pavesiㄝ˄1994˅ⱘㅫ⊩ࡴҹড়ᑊৢˈ䍙䖛99ˁⱘⳳtRNA䛑㛑㹿䆚ߎ߿ᴹDŽ䖭⾡⏋ⱘ 乘⌟㒧ᵰ߫㸼Ё䖬ࣙњ䍙䖛50ˁⱘ؛䰇ᗻDŽϔ⾡ᕜདⱘ䗝ᢽᗻㅫ⊩ˈCOVELS˄Eddy Durbinˈ1994˅থ⦄㛑䰸এ߫㸼ЁТܼ䚼ⱘ䫭䇃DŽᭈϾ㒧ᵰህᰃϔ⾡䘧⿄㛑䆚߿99ˁ ⱘⳳtRNAˈᑊ↣Ͼ㒘ЁᇥѢϔϾ؛䰇ᗻⱘᮍ⊩DŽtRNAscan-SEⱘ᳡ࡵ䕃ӊഛৃᕫ ࠄ˄㾕ゴ߫㸼˅DŽ10.4㒭ߎњϔϾ՟ᄤⱘ䕧ߎ㒧ᵰDŽ Sequence tRNA Bounds tRNA Anti Intron Bounds Cove Name tRNA # Begin End Type Codon Begin End Score -------- ------ ----- --- ---- ----- ----- ----- ----- Your-seq 1 2348 2420 Val TAC 0 0 76.52 Your-seq 2 2440 2512 Thr TGT 0 0 77.70 Your-seq 3 2522 2594 Lys TTT 0 0 84.24 Your-seq 4 2627 2698 Gly GCC 0 0 75.46 Your-seq 5 2709 2794 Leu TAA 0 0 62.99 Your-seq 6 2803 2876 Arg ACG 0 0 71.02 Your-seq 7 2900 2973 Pro TGG 0 0 79.67 Your-seq 8 2997 3069 Ala TGC 0 0 71.25 Your-seq 9 4841 4914 Ile GAT 0 0 84.04 10.4 tRNAscan-SEᇍḋ՟ⱘ䕧ߎ㒧ᵰDŽḋ՟ᑣ߫ᰃSA5SRRˈ⏏ࡴোL36472ˈ⑤Ѣ Staphylococcus aureusDŽ݊tRNA乘⌟㒧ᵰϢDDBJ/EMBL/GenBankЁⱘ⊼㾷ᅠܼϔ㟈DŽ ᴹⱘሩᳯ ϡЙࠡˈ᱂䗮⫼᠋ᕜ䲒ᕫࠄ᳔དⱘᡔᴃᎹDŽ䱣ⴔ䞣⡍㔥᳡ࡵ㛑ᮍ֓ᕫࠄˈҹঞ䗮䖛 ϔϾऩ㒃⬠䴶ህ㛑ϡᮁᦤկ᳡ࡵⱘWWW㔥义ˈ䖭⾡ᚙމᕫҹད䕀DŽ㱑✊བℸˈϔϾ⫼᠋ᛇՓ⫼ ϔᭈ༫ড়䗖ⱘㅫ⊩ˈህᕫ㽕ᜓᛣᇚ᭄ᦤѸ㒭ϔේᑣ˗ℸˈ䖬㽕ᡞ᭄䗮䖛⡍㔥䗕 ߎএ˄㢹⍝ঞ䱤⾕߭ᰃϾ䲒乬˅ˈ㗙া᳝䇋ϔϾᑣਬᴹ㦋পᅝ㺙ⳌᑨᑣDŽ㾘 ⌟ᑣЁˈህᖙ乏থᯢߎϔ⾡ᮍ⊩ˈ㞾ࡼᇚᑣ߫ᦤѸ㒭Ͼᑣˈᑊᇚ᠔᳝㒧ᵰᭈ⧚⏙ἮৢѸ 㒭᳔㒜⫼᠋DŽབᵰ᳝ϔ⾡Ꮉ㒘ড়ⱘԧ㋏Ḛᶊˈܕ䆌㕸ԧЁӏϔϾ៤ਬ⣀ゟ䖯㸠ᓔথˈজ㛑 䅽াফ䖛Ⳍᇍㅔऩ㓪䆁㒗ⱘᎹ㗙㛑ᇚ䖭ѯᑣ㒘ড়៤ϔ㒘䗖⫼Ѣϧ䮼ᅲ偠ᅸ䳔㽕ⱘ㾷އ ᮍḜˈ䖭ᇚ៤ЎϔϾᕜ᳝ᛣНⱘ䖯ℹDŽ䖭⾡ԧ㋏ḚᶊᑨѢ⬉ᄤ䚂ӊWorld Wide WebDŽ ϔϾᮄⱘࡼҎⱘথሩᰃ䆩ᡞᔧࠡᇍ䕀ᔩ䇗㡖ᴎࠊⱘⶹ䆚㵡Ѣ䕃ӊˈҹ䗮䖛䅵ㅫߚᵤЎ कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ10/16 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कゴ߽⫼Ḍ䝌ᑣ߫ⱘ乘⌟ᮍ⊩.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com