第十四章提交DNA序列到数据库 页码,7/2 SequI n对同一条记录提供了许多不同的视图。传统的简单文件可以出现在 FASTA, Gen Bank.或 EMBL形式中。(它们可以在用户计算机中以文件的方式输出,然后输入其它的序列分析包 中。)图像视图显示了序列的特征间隔,这对于观察可变剪接的编码区尤其有意义。(图像 视图的风格可以定制,这些视图可以被复制到个人计算机的剪贴板中,粘贴到文字处理器或 视图程序中,用于准备出版物的手稿。)有一个视图可以更详细地显示实际序列的特征,对 于包含比对的记录(如:由一个用户输入的相关序列或通过 Power blast中查找的比对结果, 参见第7章),用户可以请求一个全图像视图以显示添加、删除和不匹配的情况,或细节视图 显示序列字母比对。 上述提及的观察者是主动的,单击一个特征、序列或序列比对图片,将会高亮度显示该处。 双击会出现一个合适的编辑框,以便多个观察者使用同一条记录,而能够看到不同的形式。 例如:可以很方便的使图像视图和 Gen Bank(或EMBL)的简单文件视图同时显示,尤其是对于 包含多个CDS的较大记录。图像视图可比做科学家实验室的记事本图片,为特征注解的准确性 提供一个快速实用的检查手段 先进的注解和编辑功能 Sequi n中的序列编辑器能在编辑序列时自动调节特征间隔,这对于想在已提交的序列记录中 加入一段5′端的序列尤为重要。在 Sequi n出现之前,这需要手工添加,并纠正序列中所有生 物特征间隔。这样很有可能从草稿开始重做全部提交过程。序列编辑器很象文本编辑器,可 在光标所在出处插入或输入一个新的序列。 在提交序列中的一个大类包含了多样的相关序列(如:种群、系统发生和变异的研究),如 果用户提交了这些序列是如何自身比对的信息,这些记录将会更有指导意义。这种比对可随 序列数据(如:以 PHYLIP、 NEXUS或 FASTA+GAP形式)输入或在输入序列以后用 Sequi n计算 参见附录中的各种形式的实例。 对于这些记录, Sequi n允许给一条序列添加注解,而且该注解可以被复制到其它的序列中。 (若为CDS特征,特征间隔可通过读蛋白质产物序列自动进行计算,而不必全部输入。)为了 实现这一方法,选用特征传播的方法(从比对编辑器中),被选中的特征将传播到剩余序列 中去,并用比对信息调整特征间隔。这和在每条序列上手工注解特征产生的效果相同。但用 特征传播的方法仅需几分钟就能完成全过程,而手工则需几小时 特征传播和序列编辑器组合起来为更新一个已经存在的序列提供了简单而且自动的方法。更 新序列的功能允许用户输入重叠或替代的序列。 Sequi n设计了比对,在有必要时合并序列, 将特征传播到新序列的新位置,以取代旧序列和旧特征。 Sequi n做为分析平台 Sequi n也提供了许多种序列分析的功能,例如:有一个功能可以反补于序列和特征间隔,也 很容易加入新的功能。这些功能在一个称为NCB桌面的窗口中出现,直接显示调入内存的当 前记录的内部结构。该窗口可以被理解为一个有描述器的ven图表(参见下述和第6章),此 描述器能在一组系统中(如:种群研究)应用于各种序列。在桌面上,用户可以读出 Power BlaST的分析结果,再拖动之将其在一条序列记录上释放,从而向记录中加入比对数 据,修改的结果将很快显示在观察者面前。注意:并非所有的注解都能被任何一个观察者看 见,简单文件视图有其局限性,例如:它不显示比对, NCB数据模型支持大量的序列集, Sequi n允许为了显示或注解的目的在这些序列集中进行完 全的漫游,例如:NuC-Prot类包含一条核苷酸序列和它的蛋白质产物,核苷酸序列可自身分 解。在这种情况下,Seg类包含了片段序列和一个 Parts类, Parts类顺序包含每一个片段的原 始数据。种群、系统发生和变异可包含多种相关序列或№uC-Prot类。NCB桌面是浏览记录内 部结构的最快的方法。 file://E:wcb生物信息学(中译本)\第十四章提交DNA序列到数据库.htm2005-1-18Sequinᇍৠϔᴵ䆄ᔩᦤկњ䆌ϡৠⱘ㾚DŽӴ㒳ⱘㅔऩ᭛ӊৃҹߎ⦃FASTAˈGenBank EMBLᔶᓣЁDŽ˄ᅗӀৃҹ⫼᠋䅵ㅫᴎЁҹ᭛ӊⱘᮍᓣ䕧ߎৢ✊ˈ䕧ܹ݊ᅗⱘᑣ߫ߚᵤࣙ ЁDŽ˅ڣ㾚ᰒ⼎њᑣ߫ⱘ⡍ᕕ䯈䱨ˈ䖭ᇍѢ㾖ᆳৃব࠾ⱘ㓪ⷕऎᇸ᳝݊ᛣНDŽ˄ڣ 㾚ⱘ亢Ḑৃҹᅮࠊˈ䖭ѯ㾚ৃҹ㹿ࠄࠊϾҎ䅵ㅫᴎⱘ࠾䌈ᵓЁˈ㉬䌈ࠄ᭛ᄫ໘⧚఼ 㾚ᑣЁˈ⫼Ѣޚߎ⠜⠽ⱘ〓DŽ˅᳝ϔϾ㾚ৃҹ䆺㒚ഄᰒ⼎ᅲ䰙ᑣ߫ⱘ⡍ᕕˈᇍ Ѣࣙ↨ᇍⱘ䆄ᔩ˄བ˖⬅ϔϾ⫼᠋䕧ܹⱘⳌ݇ᑣ߫䗮䖛PowerBLASTЁᶹᡒⱘ↨ᇍ㒧ᵰˈ খ㾕ゴ˅ˈ⫼᠋ৃҹ䇋∖ϔϾܼڣ㾚ҹᰒ⼎⏏ࡴǃߴ䰸ϡऍ䜡ⱘᚙމˈ㒚㡖㾚 ᰒ⼎ᑣ߫ᄫ↡↨ᇍDŽ Ϟ䗄ᦤঞⱘ㾖ᆳ㗙ᰃЏࡼⱘˈऩߏϔϾ⡍ᕕǃᑣ߫ᑣ߫↨ᇍ⠛ˈᇚӮ催҂ᑺᰒ⼎䆹໘DŽ ঠߏӮߎ⦃ϔϾড়䗖ⱘ㓪䕥Ḛˈҹ֓Ͼ㾖ᆳ㗙Փ⫼ৠϔᴵ䆄ᔩˈ㗠㛑ⳟࠄϡৠⱘᔶᓣDŽ ՟བ˖ৃҹᕜᮍ֓ⱘՓڣ㾚GenBank˄EMBL˅ⱘㅔऩ᭛ӊ㾚ৠᯊᰒ⼎ˈᇸ݊ᰃᇍѢ ࣙϾCDSⱘ䕗䆄ᔩDŽڣ㾚ৃ↨خ里ᄺᆊᅲ偠ᅸⱘ䆄џᴀ⠛ˈЎ⡍ᕕ⊼㾷ⱘޚ⹂ᗻ ᦤկϔϾᖿ䗳ᅲ⫼ⱘẔᶹ↉DŽ ܜ䖯ⱘ⊼㾷㓪䕥ࡳ㛑 SequinЁⱘᑣ߫㓪䕥఼㛑㓪䕥ᑣ߫ᯊ㞾ࡼ䇗㡖⡍ᕕ䯈䱨ˈ䖭ᇍѢᛇᏆᦤѸⱘᑣ߫䆄ᔩЁ ࡴܹϔ↉5’ッⱘᑣ߫ᇸЎ䞡㽕DŽSequinߎ⦃Пࠡˈ䖭䳔㽕Ꮉ⏏ࡴˈᑊ㑴ℷᑣ߫Ё᠔᳝⫳ ⠽⡍ᕕ䯈䱨DŽ䖭ḋᕜ᳝ৃ㛑Ң㤝〓ᓔྟ䞡خܼ䚼ᦤѸ䖛DŽᑣ߫㓪䕥఼ᕜ䈵᭛ᴀ㓪䕥఼ˈৃ ܝᷛ᠔ߎ໘ᦦܹ䕧ܹϔϾᮄⱘᑣ߫DŽ ᦤѸᑣ߫ЁⱘϔϾ㉏ࣙњḋⱘⳌ݇ᑣ߫˄བ˖⾡㕸ǃ㋏㒳থ⫳বᓖⱘⷨお˅ˈབ ᵰ⫼᠋ᦤѸњ䖭ѯᑣ߫ᰃབԩ㞾䑿↨ᇍⱘֵᙃˈ䖭ѯ䆄ᔩᇚӮ᳝ᣛᇐᛣНDŽ䖭⾡↨ᇍৃ䱣 ᑣ᭄߫˄བ˖ҹPHYLIPǃNEXUSFASTA+GAPᔶᓣ˅䕧ܹ䕧ܹᑣ߫ҹৢ⫼Sequin䅵ㅫDŽ খ㾕䰘ᔩIIЁⱘ⾡ᔶᓣⱘᅲ՟DŽ ᇍѢ䖭ѯ䆄ᔩˈSequinܕ䆌㒭ϔᴵᑣ߫⏏ࡴ⊼㾷ˈ㗠Ϩ䆹⊼㾷ৃҹ㹿ࠄࠊ݊ᅗⱘᑣ߫ЁDŽ ˄㢹ЎCDS⡍ᕕˈ⡍ᕕ䯈䱨ৃ䗮䖛䇏㲟ⱑ䋼ѻ⠽ᑣ߫㞾ࡼ䖯㸠䅵ㅫˈ㗠ϡᖙܼ䚼䕧ܹDŽ˅Ўњ ᅲ⦄䖭ϔᮍ⊩ˈ䗝⫼⡍ᕕӴ᪁ⱘᮍ⊩˄Ң↨ᇍ㓪䕥఼Ё˅ˈ㹿䗝Ёⱘ⡍ᕕᇚӴ᪁࠽ࠄԭᑣ߫ Ёএˈᑊ⫼↨ᇍֵᙃ䇗ᭈ⡍ᕕ䯈䱨DŽ䖭↣ᴵᑣ߫ϞᎹ⊼㾷⡍ᕕѻ⫳ⱘᬜᵰⳌৠDŽԚ⫼ ⡍ᕕӴ᪁ⱘᮍ⊩ҙ䳔ߚ䩳ህ㛑ᅠ៤ܼ䖛ˈ㗠Ꮉ߭䳔ᇣᯊDŽ ⡍ᕕӴ᪁ᑣ߫㓪䕥఼㒘ড়䍋ᴹЎᮄϔϾᏆ㒣ᄬⱘᑣ߫ᦤկњㅔऩ㗠Ϩ㞾ࡼⱘᮍ⊩DŽ ᮄᑣ߫ⱘࡳ㛑ܕ䆌⫼᠋䕧ܹ䞡᳓ҷⱘᑣ߫DŽSequin䆒䅵њ↨ᇍˈ᳝ᖙ㽕ᯊড়ᑊᑣ߫ˈ ᇚ⡍ᕕӴ᪁ࠄᮄᑣ߫ⱘᮄԡ㕂ˈҹপҷᮻᑣ߫ᮻ⡍ᕕDŽ SequinخЎߚᵤᑇৄ Sequinгᦤկњ䆌⾡ᑣ߫ߚᵤⱘࡳ㛑ˈ՟བ˖᳝ϔϾࡳ㛑ৃҹড㸹Ѣᑣ߫⡍ᕕ䯈䱨ˈг ᕜᆍᯧࡴܹᮄⱘࡳ㛑DŽ䖭ѯࡳ㛑ϔϾ⿄ЎNCBIḠ䴶ⱘにষЁߎˈ⦃Ⳉᰒ⼎䇗ܹݙᄬⱘᔧ ࠡ䆄ᔩⱘݙ䚼㒧ᵘDŽ䆹にষৃҹ㹿⧚㾷ЎϔϾ᳝ᦣ䗄఼ⱘVenn㸼˄খ㾕ϟ䗄ゴ˅ˈℸ ᦣ䗄఼㛑ϔ㒘㋏㒳Ё˄བ˖⾡㕸ⷨお˅ᑨ⫼Ѣ⾡ᑣ߫DŽḠ䴶Ϟˈ⫼᠋ৃҹ䇏ߎ PowerBLASTⱘߚᵤ㒧ᵰˈݡᢪࡼПᇚ݊ϔᴵᑣ߫䆄ᔩϞ䞞ᬒˈҢ㗠䆄ᔩЁࡴ↨ܹᇍ᭄ ˈׂᬍⱘ㒧ᵰᇚᕜᖿᰒ⼎㾖ᆳ㗙䴶ࠡDŽ⊼ᛣ˖ᑊ䴲᠔᳝ⱘ⊼㾷䛑㛑㹿ӏԩϔϾ㾖ᆳ㗙ⳟ 㾕ˈㅔऩ᭛ӊ㾚᳝݊ሔ䰤ᗻˈ՟བ˖ᅗϡᰒ⼎↨ᇍDŽ NCBI᭄ൟᬃᣕ䞣ⱘᑣ߫䲚ˈSequinܕ䆌Ўњᰒ⼎⊼㾷ⱘⳂⱘ䖭ѯᑣ߫䲚Ё䖯㸠ᅠ ܼⱘ⓿␌ˈ՟བ˖Nuc-Prot㉏ࣙϔᴵḌ㣋䝌ᑣ߫ᅗⱘ㲟ⱑ䋼ѻ⠽ˈḌ㣋䝌ᑣ߫ৃ㞾䑿ߚ 㾷DŽ䖭⾡ᚙމϟˈSeg㉏ࣙњ⠛↉ᑣ߫ϔϾParts㉏ˈParts㉏乎ᑣࣙ↣ϔϾ⠛↉ⱘॳ ྟ᭄DŽ⾡㕸ǃ㋏㒳থ⫳বᓖৃࣙ辵Ⳍ݇ᑣ߫Nuc-Prot㉏DŽNCBIḠ䴶ᰃ⌣㾜䆄ᔩݙ 䚼㒧ᵘⱘ᳔ᖿⱘᮍ⊩DŽ कಯゴᦤѸDNAᑣ߫ࠄ᭄ᑧ 义ⷕˈ7/21 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कಯゴᦤѸDNAᑣ߫ࠄ᭄ᑧ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com