正在加载图片...
第十四章提交DNA序列到数据库 页码,3/2 的蛋白质产物序列。已经知道的基因和物种的种类足可以使数据库成员识别生物和其谱系。 NCBI提供了一个重要的分类服务,分类学家维护能用于所有核苷酸数据库和 Swi ss-Prot蛋白 质数据库的分类法。 引用 注解即使再好,也永远比不上一篇充分阐述生物学的已发表文章,因此,有必要保证正确链 接研究出版物和它将引用的原始数据。基于此理由,提交中准备好引用是很重要的,即使其 中只有作者的临时列表和工作标题。在出版时更新这些引用对于记录的价值也很重要。(这 由数据库成员惯例的执行,而且如果提交者在发表文章以前通知数据库成员,将执行得更 快) 编码序列 核苷酸序列的提交也意味着包括其编码的蛋白质序列,这是因为: 1.蛋白质数据库(如: Swi ss-Prot和PR)几乎完全由在DNA序列数据库中记录的蛋白质序列 所组成 2.在提交过程中包括蛋白质序列如果不是必需的话,也是重要和有效一步。 蛋白质包括执行我们研究的许多生物反应的酶分子,其序列数据是提交中的固有部分,它们 的重要性(在第6章中概述)也在提交过程中体现出来,在各种数据库中其信息作为代表性必 须被捕获。如果已知的话,蛋白质产物和基因的名称也很重要,有各种各样的资源(许多在 总结这些章节的列表中有描述)为给定的生物提供准确的命名系统。(参见“基因命名指 导,基因趋势”,1995, EI sevier。) 编码序列特征,或CDS,是DNA或RNA和蛋白质序列的联系,随同正确的翻译表一起,在有效性 中其正确定位占据了中心位置。核苷酸数据库现在用了13种不同遗传密码(参见章末的列 表),这些遗传密码由NCB|中的分类学和分子生物工作人员维护。由于蛋白质序列是如此重 要,它们是生物学家可以计算的主要分子生物信息资源之一,它们理所当然地得到各种数据 库成员的重视。在mRNA中正确地找到开放的读框架通常是很简单的(参见第10章),并且有 多种工具可供利用[如:NCB的0RF查找器(见章末列表)],而且在 Sequi n中是作为一个函数 (如下);从一个较高级的真核生物获得正确的CDS间隔就不那么容易了:必须连接不同的外 显子序列,这涉及许多方法,在第10章中有介绍(如果给定蛋白质序列和正确的遗传密码的 话, Sequi n中的推荐间隔函数可以计算cDS间隔)。在提交中包括什么内容将由数据库工作人 员来决定,更恰当地说,这受到所使用的提交工具的限制,如通过互联网或 Sequi n。有效性 检查包含CDS间隔中的起始和终止密码子,该间隔具有合法的外显子/内含子一致边界,用合 适的遗传密码可将提供的氨基酸序列从指定的CDS中转换出来。 其他特征 在提交序列记录的特征部分还有许多其它特征,并且其中许多特征将扩充记录内容。在特征 表文件中描述了完整的特征集,该文件可以WW方式取得或通过匿名FTP获得 PostScri pt文 件。尽管有许多特征可供利用,但在数据库中却有许多不一致的用法,主要原因是缺乏一致 的原则和生物学家们对它们究竟意味着什么看法很不相同。正确地获得生物、书目、基因 CDS、mRNA通常就足以并且有助于证实序列,使生物学家通过几行文字就能获得生物学的内 容。只要应用恰当,一个特征表文件是可以利用的,但要注意文件注解的意图 种群、系统发生、变异的研究 现在核苷酸数据库可接受种群、系统发生、变异的硏究作为提交的序列集,尽管在简单文件 file://E:wcb生物信息学(中译本)\第十四章提交DNA序列到数据库.htm2005-1-18ⱘ㲟ⱑ䋼ѻ⠽ᑣ߫DŽᏆ㒣ⶹ䘧ⱘ෎಴੠⠽⾡ⱘ⾡㉏䎇ৃҹՓ᭄᥂ᑧ៤ਬ䆚߿⫳⠽੠݊䈅㋏DŽ NCBIᦤկњϔϾ䞡㽕ⱘߚ㉏᳡ࡵˈߚ㉏ᄺᆊ㓈ᡸ㛑⫼Ѣ᠔᳝Ḍ㣋䝌᭄᥂ᑧ੠Swiss-Prot㲟ⱑ 䋼᭄᥂ᑧⱘߚ㉏⊩DŽ ᓩ⫼ ⊼㾷ेՓݡདˈг∌䖰↨ϡϞϔ㆛ߚܙ䯤䗄⫳⠽ᄺⱘᏆথ㸼᭛ゴˈ಴ℸˈ᳝ᖙ㽕ֱ䆕ℷ⹂䫒 ᥹ⷨおߎ⠜⠽੠ᅗᇚᓩ⫼ⱘॳྟ᭄᥂DŽ෎Ѣℸ⧚⬅, ᦤѸЁޚ໛དᓩ⫼ᰃᕜ䞡㽕ⱘˈेՓ݊ Ёা᳝԰㗙ⱘЈᯊ߫㸼੠Ꮉ԰ᷛ乬DŽ೼ߎ⠜ᯊ᳈ᮄ䖭ѯᓩ⫼ᇍѢ䆄ᔩⱘӋؐгᕜ䞡㽕DŽ˄䖭 ⬅᭄᥂ᑧ៤ਬᛃ՟ⱘᠻ㸠ˈ㗠ϨབᵰᦤѸ㗙೼থ㸼᭛ゴҹࠡ䗮ⶹ᭄᥂ᑧ៤ਬˈᇚᠻ㸠ᕫ᳈ ᖿ˅DŽ 㓪ⷕᑣ߫ Ḍ㣋䝌ᑣ߫ⱘᦤѸгᛣੇⴔࣙᣀ݊㓪ⷕⱘ㲟ⱑ䋼ᑣ߫ˈ䖭ᰃ಴Ў˖ 1. 㲟ⱑ䋼᭄᥂ᑧ˄བ˖Swiss-Prot੠PIR˅޴Тᅠܼ⬅೼DNAᑣ᭄߫᥂ᑧЁ䆄ᔩⱘ㲟ⱑ䋼ᑣ߫ ᠔㒘៤DŽ 2. ೼ᦤѸ䖛⿟Ёࣙᣀ㲟ⱑ䋼ᑣ߫བᵰϡᰃᖙ䳔ⱘ䆱, гᰃ䞡㽕੠᳝ᬜϔℹDŽ 㲟ⱑ䋼ࣙᣀᠻ㸠៥Ӏⷨおⱘ䆌໮⫳⠽ডᑨⱘ䝊ߚᄤˈ݊ᑣ᭄߫᥂ᰃᦤѸЁⱘ೎᳝䚼ߚˈᅗӀ ⱘ䞡㽕ᗻ˄೼㄀ゴЁὖ䗄˅г೼ᦤѸ䖛⿟Ёԧ⦄ߎᴹˈ೼৘⾡᭄᥂ᑧЁֵ݊ᙃ԰Ўҷ㸼ᗻᖙ 乏㹿ᤩ㦋DŽབᵰᏆⶹⱘ䆱, 㲟ⱑ䋼ѻ⠽੠෎಴ⱘৡ⿄гᕜ䞡㽕ˈ᳝৘⾡৘ḋⱘ䌘⑤˄䆌໮೼ ᘏ㒧䖭ѯゴ㡖ⱘ߫㸼Ё᳝ᦣ䗄˅Ў㒭ᅮⱘ⫳⠽ᦤկޚ⹂ⱘੑৡ㋏㒳DŽ˄খ㾕Ā෎಴ੑৡᣛ ᇐˈ෎಴䍟࢓āˈ1995ˈElsevierDŽ˅ 㓪ⷕᑣ߫⡍ᕕˈ៪CDSˈᰃDNA៪RNA੠㲟ⱑ䋼ᑣ߫ⱘ㘨㋏ˈ䱣ৠℷ⹂ⱘ㗏䆥㸼ϔ䍋, ೼᳝ᬜᗻ Ё݊ℷ⹂ᅮԡऴ᥂њЁᖗԡ㕂DŽḌ㣋䝌᭄᥂ᑧ⦄೼⫼њ13⾡ϡৠ䘫Ӵᆚⷕ˄খ㾕ゴ᳿ⱘ߫ 㸼˅ˈ䖭ѯ䘫Ӵᆚⷕ⬅NCBIЁⱘߚ㉏ᄺ੠ߚᄤ⫳⠽Ꮉ԰Ҏਬ㓈ᡸDŽ⬅Ѣ㲟ⱑ䋼ᑣ߫ᰃབℸ䞡 㽕ˈᅗӀᰃ⫳⠽ᄺᆊৃҹ䅵ㅫⱘЏ㽕ߚᄤ⫳⠽ֵᙃ䌘⑤ПϔˈᅗӀ⧚᠔ᔧ✊ഄᕫࠄ辵৘᭄᥂ ᑧ៤ਬⱘ䞡㾚DŽ೼mRNAЁℷ⹂ഄᡒࠄᓔᬒⱘ䇏Ḛᶊ䗮ᐌᰃᕜㅔऩⱘ˄খ㾕㄀10ゴ˅, ᑊϨ᳝ ໮⾡Ꮉ݋ৃկ߽ ] ⫼བ˖NCBIⱘORFᶹᡒ఼ 㾕ゴ᳿߫㸼)]ˈ㗠Ϩ೼SequinЁᰃ԰ЎϔϾߑ᭄ ˄བϟ˅˗ҢϔϾ䕗催㑻ⱘⳳḌ⫳⠽㦋ᕫℷ⹂ⱘCDS䯈䱨ህϡ䙷Мᆍᯧњ˖ᖙ乏䖲᥹ϡৠⱘ໪ ᰒᄤᑣ߫ˈ䖭⍝ঞ䆌໮ᮍ⊩ˈ೼㄀10ゴЁ᳝ҟ㒡 བᵰ㒭ᅮ㲟ⱑ䋼ᑣ߫੠ℷ⹂ⱘ䘫Ӵᆚⷕⱘ 䆱, SequinЁⱘ᥼㤤䯈䱨ߑ᭄ৃҹ䅵ㅫCDS䯈䱨 DŽ೼ᦤѸЁࣙᣀҔМݙᆍᇚ⬅᭄᥂ᑧᎹ԰Ҏ ਬᴹއᅮ, ᳈ᙄᔧഄ䇈, 䖭ফࠄ᠔Փ⫼ⱘᦤѸᎹ݋ⱘ䰤ࠊ ,བ䗮䖛Ѧ㘨㔥៪SequinDŽ᳝ᬜᗻ Ẕᶹࣙ৿CDS䯈䱨Ёⱘ䍋ྟ੠㒜ℶᆚⷕᄤˈ䆹䯈䱨݋᳝ড়⊩ⱘ໪ᰒᄤݙ৿ᄤϔ㟈䖍⬠ˈ⫼ড় 䗖ⱘ䘫Ӵᆚⷕৃᇚᦤկⱘ⇼෎䝌ᑣ߫ҢᣛᅮⱘCDSЁ䕀ᤶߎᴹDŽ ݊Ҫ⡍ᕕ ೼ᦤѸᑣ߫䆄ᔩⱘ⡍ᕕ䚼ߚ䖬᳝䆌໮݊ᅗ⡍ᕕˈᑊϨ݊Ё䆌໮⡍ᕕᇚᠽܙ䆄ᔩݙᆍDŽ೼⡍ᕕ 㸼᭛ӊЁᦣ䗄њᅠᭈⱘ⡍ᕕ䲚ˈ䆹᭛ӊৃҹWWWᮍᓣপᕫ៪䗮䖛ओৡFTP㦋ᕫPostScript ᭛ ӊDŽሑㅵ᳝䆌໮⡍ᕕৃկ߽ˈ⫼Ԛ೼᭄᥂ᑧЁै᳝䆌໮ϡϔ㟈ⱘ⫼⊩ˈЏ㽕ॳ಴ᰃ㔎Уϔ㟈 ⱘॳ߭੠⫳⠽ᄺᆊӀᇍᅗӀおコᛣੇⴔҔМⳟ⊩ᕜϡⳌৠDŽℷ⹂ഄ㦋ᕫ⫳⠽ǃкⳂǃ෎಴ǃ CDSǃmRNA䗮ᐌህ䎇ҹᑊϨ᳝ࡽѢ䆕ᅲᑣ߫ˈՓ⫳⠽ᄺᆊ䗮䖛޴㸠᭛ᄫህ㛑㦋ᕫ⫳⠽ᄺⱘݙ ᆍDŽা㽕ᑨ⫼ᙄᔧˈϔϾ⡍ᕕ㸼᭛ӊᰃৃҹ߽⫼ⱘˈԚ㽕⊼ᛣ᭛ӊ⊼㾷ⱘᛣ೒DŽ ⾡㕸ǃ㋏㒳থ⫳ǃবᓖⱘⷨお ⦄೼Ḍ㣋䝌᭄᥂ᑧৃ᥹ফ⾡㕸ǃ㋏㒳থ⫳ǃবᓖⱘⷨお԰ЎᦤѸⱘᑣ߫䲚ˈሑㅵ೼ㅔऩ᭛ӊ ㄀कಯゴᦤѸDNAᑣ߫ࠄ᭄᥂ᑧ 义ⷕˈ3/21 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀कಯゴᦤѸDNAᑣ߫ࠄ᭄᥂ᑧ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有