正在加载图片...
第十四章提交DNA序列到数据库 页码,6/2 如何用 Sequin提交 Sequi n是设计用来协助科学家准备新序列,更新序列数据的一个程序,利用它将序列数据提 交到DDBJ,EMBL和 Gen Bank数据库。这是一个能在绝大多数计算机平台上运行的软件,而且适 用于各种序列长度和复杂情况,包括传统的(基因大小)核苷酸序列,分段的记录(如:剪 接的基因组,不是所有的内含子序列都已被确定),有许多注解特征的长序列(基因组大 小),和各种相关序列(如:对于一个特殊基因、域或滤过性病毒基因的种群、系统发生 变异的研究),许多这样的提交能通过互联网执行,但 Sequi n在复杂的情况下更实用。而且 特定类型的提交(如:分段类)不能通过Web来完成,除非给数据库工作人员加以明确的指 导。 Sequi n也接受以提交的核苷酸酸序列编码的蛋白质序列,允许在这些蛋白质上进行特征的注 解(如:信号肽、跨膜区或二硫键)。这与大多数科学家在提交DNA序列时的普遍观点形成鲜 明的对比。这里的新概念是蛋白质是直接注解的,而不是编码生成之的DNA的副产物。对于各 种相关或是相近的序列(如:种群或系统发生的研究), Sequi n从提交者处获得关于多个序 列是如何比对的信息,最终它可以用来编辑和重新提交已存在于 Gen Bank中的记录,不论是延 长(或取代)已有的序列,还是注解附加的特征或比对(见下描述)。 进入一个新的提交过程 Sequi n有许多性质大大简化了创建和注解一条记录的过程。最神奇的一方面是在只给定核苷 酸酸序列,蛋白质产物序列和遗传密码(从生物的名称中自动获得)的情况下,自动计算CDS 特征间隔。这所谓的“建议间隔”过程在计算中考虑了一致的剪接位点。传统上这些间隔是 手工输入的,这是一个既耗时又易错的过程,尤其是对于一个在可变剪接或分段时有许多外 显子的基因序列。 Sequi n的另一种重要的贡献在于能在序列数据库文件的定义行上以一种简单的格式输入相关 注解。在读序列时, Sequi n识别和提取这一信息,并将其放置在记录中合适的位置。对于核 苷酸序列,可以输入生物体的科学名称、品系或克隆名称和几个其它的修饰基因。对于蛋白 质序列,可以输入基因和蛋白质名称。(如果在定义行上没有这些信息, Sequi n在执行前就 会提示用户此信息。定义行的注解是非常方便的,因为信息和序列是在一起的因此以后不容 易被遗忘或混淆。)除了组建合适的CDS特征以外, Sequi n将自动利用该信息生成基因和蛋白 质特征。 由于大多数提交序列包含了一个单独的核苷酸序列和一个或多个编码区域特征(及相关的蛋 白质序列),前面概述的功能将频繁地影响一条没有进一步注解时就被提交的记录。由于正 确地记录了基因和蛋白质名称,从而使得该记录为其他科学家提供有用信息,他们可能通过 一个 BLAST的相似性比对或从 Entrez查找中获得该信息 有效性 为保证提交数据的质量, Sequin使用一个内建的有效器来查询。例如:丢失的生物体信息, 错误的编码区长度(相对于被提交的蛋白质序列),编码区内部的终止密码子,不匹配的氨 基酸或不一致的剪接位点。在错误报告中双击其中一项,在“冲突”特征项中就会出现一个 编辑框 有效器也检査“局部”指示器的使用是否一致,尤其是在编码区、蛋白质产物和产物的蛋白 质特征中的使用。(除非作了相反的设置,否则CDS就会自动的同步这些分散的局部指示器 将使纠正这类不一致问题变得很方便。) 观察序列记录 file://E:wcb生物信息学(中译本)\第十四章提交DNA序列到数据库.htm2005-1-18བԩ⫼SequinᦤѸ Sequinᰃ䆒䅵⫼ᴹणࡽ里ᄺᆊޚ໛ᮄᑣ߫ˈ᳈ᮄᑣ᭄߫᥂ⱘϔϾ⿟ᑣˈ߽⫼ᅗᇚᑣ᭄߫᥂ᦤ ѸࠄDDBJˈEMBL੠GenBank᭄᥂ᑧDŽ䖭ᰃϔϾ㛑೼㒱໻໮᭄䅵ㅫᴎᑇৄϞ䖤㸠ⱘ䕃ӊˈ㗠Ϩ䗖 ⫼Ѣ৘⾡ᑣ߫䭓ᑺ੠໡ᴖᚙމˈࣙᣀӴ㒳ⱘ˄෎಴໻ᇣ˅Ḍ㣋䝌ᑣ߫ˈߚ0⁄3ⱘ䆄ᔩ˄བ˖࠾ ᥹ⱘ෎಴㒘ˈϡᰃ᠔᳝ⱘݙ৿ᄤᑣ߫䛑Ꮖ㹿⹂ᅮ˅ˈ᳝䆌໮⊼㾷⡍ᕕⱘ䭓ᑣ߫˄෎಴㒘໻ ᇣ˅ˈ੠৘⾡Ⳍ݇ᑣ߫˄བ˖ᇍѢϔϾ⡍⅞෎಴ǃඳ៪Ⓒ䖛ᗻ⮙↦෎಴ⱘ⾡㕸ǃ㋏㒳থ⫳ǃ বᓖⱘⷨお˅ˈ䆌໮䖭ḋⱘᦤѸ㛑䗮䖛Ѧ㘨㔥ᠻ㸠ˈԚSequin ೼໡ᴖⱘᚙމϟ᳈ᅲ⫼DŽ㗠Ϩ ⡍ᅮ㉏ൟⱘᦤѸ˄བ˖ߚ0⁄3㉏˅ϡ㛑䗮䖛Webᴹᅠ៤ˈ䰸䴲㒭᭄᥂ᑧᎹ԰Ҏਬࡴҹᯢ⹂ⱘᣛ ᇐDŽ Sequin г᥹ফҹᦤѸⱘḌ㣋䝌䝌ᑣ߫㓪ⷕⱘ㲟ⱑ䋼ᑣ߫ˈܕ䆌೼䖭ѯ㲟ⱑ䋼Ϟ䖯㸠⡍ᕕⱘ⊼ 㾷˄བ˖ֵো㚑ǃ䎼㝰ऎ៪Ѡ⸿䬂˅DŽ䖭Ϣ໻໮᭄⾥ᄺᆊ೼ᦤѸDNAᑣ߫ᯊⱘ᱂䘡㾖⚍ᔶ៤剰 ᯢⱘᇍ↨DŽ䖭䞠ⱘᮄὖᗉᰃ㲟ⱑ䋼ᰃⳈ᥹⊼㾷ⱘˈ㗠ϡᰃ㓪ⷕ⫳៤ПⱘDNAⱘࡃѻ⠽DŽᇍѢ৘ ⾡Ⳍ݇៪ᰃⳌ䖥ⱘᑣ߫˄བ˖⾡㕸៪㋏㒳থ⫳ⱘⷨお˅ˈSequinҢᦤѸ㗙໘㦋ᕫ݇Ѣ໮Ͼᑣ ߫ᰃབԩ↨ᇍⱘֵᙃˈ᳔㒜ᅗৃҹ⫼ᴹ㓪䕥੠䞡ᮄᦤѸᏆᄬ೼ѢGenBankЁⱘ䆄ᔩˈϡ䆎ᰃᓊ 䭓˄៪পҷ˅Ꮖ᳝ⱘᑣ߫ˈ䖬ᰃ⊼㾷䰘ࡴⱘ⡍ᕕ៪↨ᇍ˄㾕ϟᦣ䗄˅DŽ 䖯ܹϔϾᮄⱘᦤѸ䖛⿟ Sequin᳝䆌໮ᗻ䋼໻໻ㅔ࣪њ߯ᓎ੠⊼㾷ϔᴵ䆄ᔩⱘ䖛⿟DŽ᳔⼲༛ⱘϔᮍ䴶ᰃ೼া㒭ᅮḌ㣋 䝌䝌ᑣ߫ˈ㲟ⱑ䋼ѻ⠽ᑣ߫੠䘫Ӵᆚⷕ˄Ң⫳⠽ⱘৡ⿄Ё㞾ࡼ㦋ᕫ˅ⱘᚙމϟˈ㞾ࡼ䅵ㅫCDS ⡍ᕕ䯈䱨DŽ䖭᠔䇧ⱘĀᓎ䆂䯈䱨ā䖛⿟೼䅵ㅫЁ㗗㰥њϔ㟈ⱘ࠾᥹ԡ⚍DŽӴ㒳Ϟ䖭ѯ䯈䱨ᰃ ᠟Ꮉ䕧ܹⱘˈ䖭ᰃϔϾ᮶㗫ᯊজᯧ䫭ⱘ䖛⿟ˈᇸ݊ᰃᇍѢϔϾ೼ৃব࠾៪᥹ߚ᳝ᯊ0⁄3䆌໮໪ ᰒᄤⱘ෎಴ᑣ߫DŽ Sequinⱘ঺ϔ⾡䞡㽕ⱘ䋵⤂೼Ѣ㛑೼ᑣ᭄߫᥂ᑧ᭛ӊⱘᅮН㸠Ϟҹϔ⾡ㅔऩⱘḐᓣ䕧ܹⳌ݇ ⊼㾷DŽ೼䇏ᑣ߫ᯊˈSequin䆚߿੠ᦤপ䖭ϔֵᙃˈᑊᇚ݊ᬒ㕂೼䆄ᔩЁড়䗖ⱘԡ㕂DŽᇍѢḌ 㣋䝌ᑣ߫ˈৃҹ䕧ܹ⫳⠽ԧⱘ⾥ᄺৡ⿄ǃક㋏៪ܟ䱚ৡ⿄੠޴Ͼ݊ᅗⱘׂ佄෎಴DŽᇍѢ㲟ⱑ 䋼ᑣ߫ˈৃҹ䕧ܹ෎಴੠㲟ⱑ䋼ৡ⿄DŽ˄བᵰ೼ᅮН㸠Ϟ≵᳝䖭ѯֵᙃˈSequin೼ᠻ㸠ࠡህ Ӯᦤ⼎⫼᠋ℸֵᙃDŽᅮН㸠ⱘ⊼㾷ᰃ䴲ᐌᮍ֓ⱘˈ಴Ўֵᙃ੠ᑣ߫ᰃ೼ϔ䍋ⱘ಴ℸҹৢϡᆍ ᯧ㹿䘫ᖬ៪⏋⎚DŽ˅䰸њ㒘ᓎড়䗖ⱘCDS⡍ᕕҹ໪ˈSequinᇚ㞾߽ࡼ⫼䆹ֵᙃ⫳៤෎಴੠㲟ⱑ 䋼⡍ᕕDŽ ⬅Ѣ໻໮᭄ᦤѸᑣ߫ࣙ৿њϔϾऩ⣀ⱘḌ㣋䝌ᑣ߫੠ϔϾ៪໮Ͼ㓪ⷕऎඳ⡍ᕕ˄ঞⳌ݇ⱘ㲟 ⱑ䋼ᑣ߫˅ˈࠡ䴶ὖ䗄ⱘࡳ㛑ᇚ乥㐕ഄᕅડϔᴵ≵᳝䖯ϔℹ⊼㾷ᯊህ㹿ᦤѸⱘ䆄ᔩDŽ⬅Ѣℷ ⹂ഄ䆄ᔩњ෎಴੠㲟ⱑ䋼ৡ⿄ˈҢ㗠Փᕫ䆹䆄ᔩЎ݊Ҫ⾥ᄺᆊᦤկ᳝⫼ֵᙃˈҪӀৃ㛑䗮䖛 ϔϾBLASTⱘⳌԐᗻ↨ᇍ៪ҢEntrezᶹᡒЁ㦋ᕫ䆹ֵᙃDŽ ᳝ᬜᗻ Ўֱ䆕ᦤѸ᭄᥂ⱘ䋼䞣ˈSequinՓ⫼ϔϾݙᓎⱘ᳝ᬜ఼ᴹᶹ䆶DŽ՟བ˖϶༅ⱘ⫳⠽ԧֵᙃˈ 䫭䇃ⱘ㓪ⷕऎ䭓ᑺ˄ⳌᇍѢ㹿ᦤѸⱘ㲟ⱑ䋼ᑣ߫˅ˈ㓪ⷕऎݙ䚼ⱘ㒜ℶᆚⷕᄤˈϡऍ䜡ⱘ⇼ ෎䝌៪ϡϔ㟈ⱘ࠾᥹ԡ⚍DŽ೼䫭䇃᡹ਞЁঠߏ݊Ёϔ乍ˈ೼Āކさā⡍ᕕ乍ЁህӮߎ⦃ϔϾ 㓪䕥ḚDŽ ᳝ᬜ఼гẔᶹĀሔ䚼āᣛ⼎఼ⱘՓ⫼ᰃ৺ϔ㟈ˈᇸ݊ᰃ೼㓪ⷕऎǃ㲟ⱑ䋼ѻ⠽੠ѻ⠽ⱘ㲟ⱑ 䋼⡍ᕕЁⱘՓ⫼DŽ˄䰸䴲԰њⳌডⱘ䆒㕂ˈ৺߭CDSህӮ㞾ࡼⱘৠℹ䖭ѯߚᬷⱘሔ䚼ᣛ⼎఼ˈ ᇚՓ㑴ℷ䖭㉏ϡϔ㟈䯂乬বᕫᕜᮍ֓DŽ˅ 㾖ᆳᑣ߫䆄ᔩ ㄀कಯゴᦤѸDNAᑣ߫ࠄ᭄᥂ᑧ 义ⷕˈ6/21 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀कಯゴᦤѸDNAᑣ߫ࠄ᭄᥂ᑧ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有