正在加载图片...
第六章NCB数据模型 页码,8/15 Q 2.提供了指示特别序列的标志。任何分析g54存储分析的人可以肯定只要U0000gi54 它就是有效的 3.它是稳定且可恢复的。NCB|保持每个gi号的最新版本。由于历史在记录中存在,任何发 现g54不再是 Gen Bank的一部分的人仍然可以通过MCB的1D复现该记录,通过查看历史 可以看到它被g8替代。检查gi54和gi88可以确定它们的关系,研究人员可以映射以前 的分析到gi88或者重新分析数据。由于gi54在D中总是存在的,这使得我们可以随时分 析时局而不仅限于 Gen Bank发行时间 基于上述原因,从计算 Entrez序列邻居到确定新序列的处理或 BLAST数据库的产生所有 NCB|的内部处理序列都是基于gi号。 NI D/PI DS Gen Bank中的ND和PD指示了核酸的gi号和记录的蛋白质序列。补充这个是使希望能在一个平 台上计算序列的科学家能利用稳定的qi号去追踪序列。正象前面提到的,使用g号而不是用 序列号将保持使用有效,即使记录的序列以后发生变化(例如,5′端) 在写本文时,又出现了一种新的 Seql d(序列版本,见下文),它是被用于选择的序列辨识 器。一旦这种转变完成,可能ND和P|D号将不再出现在数据格式中,尽管使用g号的分析将 继续有效。而且,初始数据将出现在NCB准备与 GenBank数据平行的ASN.1文件中。 序列版本组合辨识器 最近,国际核酸序列数据库联合会(DDBJ,EMBL和 Gen Bank)同意引入一种更好的辨识器。这 种辨识器是组合了序列(标明特定的序列记录)和版本号(根据序列本身变化)。这种 Seql d 被期望成为理想的引用序列的方法。 使用者将仍能够仅仅基于序列号就能复现记录而不需要特殊的版本号。这种情况下,将得到 该记录的最新版本,这也是 Entrez和其它复现程序现在所作的工作 分析数据库数据的科学家(例如将所有脱水酒精序列用一种特定分类方法中分离)和希望他 们的结论保持有效的科学家希望能参考序列号和版本号。某序列的子序列(例如在研究基因 的规则的5′延长端)被调整后,将导致版本号的增加。由于同时引用序列号和版本号,使得 复现出同一记录,原始分析将保持有效。 同时引用序列号和版本号将使马虎的使用者认识到在分析作完后序列可能已经发生了变化。 而且根据版本号可以轻易的知道一个序列被修改的次数。由于序列版本辨识器的优先权,现 已存在的NDs和PDs(简单使用gi号)将被去除 蛋白质序列的序列号 联合会也同意给蛋白质序列记录分配序列版本号。以前,除了使用qi号,很难可靠地引用给 定编码区翻译后的产品。这限制了 BLAST结果的使用。例如,这些序列将和提交给蛋白质数据 库的蛋白质序列有相同的状态,并且它们有和对应核酸序列优先的连接权。 一般的 Seql d 般的Seqd是指被基因中心和其他组织当作标识序列的一种辩识基因所使用的。其中一些序 列可能永远也不会出现在公共数据库中,或者是最终被提交的初级数据。例如,在 Entrez基 因分离的人体染色体的记录包含了除序列组成的多种物理和基因映射关系。物理映射是由不 同组织提供的,是用一般的 Seql d标识组织的。 file://E:wcb生物信息学(中译本)\第六章NCB|数据模型.htm 2005-1-182. ᦤկњᣛ⼎⡍߿ᑣ߫ⱘᷛᖫDŽӏԩߚᵤgi54ᄬߚټᵤⱘҎৃҹ㚃ᅮা㽕U00001᳝gi54ˈ ᅗህᰃ᳝ᬜⱘ˗ 3. ᅗᰃ〇ᅮϨৃᘶ໡ⱘDŽNCBIֱᣕ↣Ͼgiোⱘ᳔ᮄ⠜ᴀDŽ⬅Ѣग़৆೼䆄ᔩЁᄬ೼ˈӏԩথ ⦄gi54ϡݡᰃGenBankⱘϔ䚼ߚⱘҎҡ✊ৃҹ䗮䖛NCBIⱘID໡⦄䆹䆄ᔩˈ䗮䖛ᶹⳟग़৆ ৃҹⳟࠄᅗ㹿gi88᳓ҷDŽẔᶹgi54੠gi88ৃҹ⹂ᅮᅗӀⱘ݇㋏ˈⷨおҎਬৃҹ᯴ᇘҹࠡ ⱘߚᵤࠄgi88៪㗙䞡ᮄߚᵤ᭄᥂DŽ⬅Ѣgi54೼IDЁᘏᰃᄬ೼ⱘˈ䖭Փᕫ៥Ӏৃҹ䱣ᯊߚ ᵤᯊሔ㗠ϡҙ䰤ѢGenBankথ㸠ᯊ䯈DŽ ෎ѢϞ䗄ॳ಴ˈҢ䅵ㅫEntrezᑣ߫䚏ሙࠄ⹂ᅮᮄᑣ߫ⱘ໘⧚៪BLAST᭄᥂ᑧⱘѻ⫳᠔᳝ NCBIⱘݙ䚼໘⧚ᑣ߫䛑ᰃ෎ѢgiোDŽ NID/PIDs GenBankЁⱘNID੠PIDᣛ⼎њḌ䝌ⱘgiো੠䆄ᔩⱘ㲟ⱑ䋼ᑣ߫DŽ㸹ܙ䖭ϾᰃՓᏠᳯ㛑೼ϔϾᑇ ৄϞ䅵ㅫᑣ߫ⱘ⾥ᄺᆊ㛑߽⫼〇ᅮⱘgiোএ䗑䏾ᑣ߫DŽℷ䈵ࠡ䴶ᦤࠄⱘˈՓ⫼giো㗠ϡᰃ⫼ ᑣ߫োᇚֱᣕՓ⫼᳝ᬜˈेՓ䆄ᔩⱘᑣ߫ҹৢথ⫳ব࣪˄՟བˈ5’ッ˅DŽ ೼ݭᴀ᭛ᯊˈজߎ⦃њϔ⾡ᮄⱘSeqId˄ᑣ߫⠜ᴀˈ㾕ϟ᭛˅ˈᅗᰃ㹿⫼Ѣ䗝ᢽⱘᑣ߫䕼䆚 ఼DŽϔᮺ䖭⾡䕀বᅠ៤ˈৃ㛑NID੠PIDোᇚϡߎݡ೼⦃᭄᥂ḐᓣЁˈሑㅵՓ⫼giোⱘߚᵤᇚ 㒻㓁᳝ᬜDŽ㗠Ϩˈ߱ྟ᭄᥂ᇚߎ೼⦃NCBIޚ໛ϢGenBank᭄᥂ᑇ㸠ⱘASN.1᭛ӊЁDŽ ᑣ߫⠜ᴀ㒘ড়䕼䆚఼ ᳔䖥ˈ೑䰙Ḍ䝌ᑣ᭄߫᥂ᑧ㘨ড়Ӯ˄DDBJˈEMBL੠GenBank˅ৠᛣᓩܹϔ⾡᳈དⱘ䕼䆚఼DŽ䖭 ⾡䕼䆚఼ᰃ㒘ড়њᑣ߫˄ᷛᯢ⡍ᅮⱘᑣ߫䆄ᔩ˅੠⠜ᴀো˄ḍ᥂ᑣ߫ᴀ䑿ব࣪˅DŽ䖭⾡SeqId 㹿ᳳᳯ៤Ў⧚ᛇⱘᓩ⫼ᑣ߫ⱘᮍ⊩DŽ Փ⫼㗙ᇚҡ㛑໳ҙҙ෎Ѣᑣ߫োህ㛑໡⦄䆄ᔩ㗠ϡ䳔㽕⡍⅞ⱘ⠜ᴀোDŽ䖭⾡ᚙމϟˈᇚᕫࠄ 䆹䆄ᔩⱘ᳔ᮄ⠜ᴀˈ䖭гᰃEntrez੠݊ᅗ໡⦄⿟ᑣ⦄೼᠔԰ⱘᎹ԰DŽ ߚᵤ᭄᥂ᑧ᭄᥂ⱘ⾥ᄺᆊ˄՟བᇚ᠔᳝㜅∈䜦㊒ᑣ߫⫼ϔ⾡⡍ᅮߚ㉏ᮍ⊩Ёߚ੠˅行ᏠᳯҪ Ӏⱘ㒧䆎ֱᣕ᳝ᬜⱘ⾥ᄺᆊᏠᳯ㛑খ㗗ᑣ߫ো੠⠜ᴀোDŽᶤᑣ߫ⱘᄤᑣ߫˄՟བ೼ⷨお෎಴ ⱘ㾘߭ⱘ5’ᓊ䭓ッ˅㹿䇗ᭈৢˈᇚᇐ㟈⠜ᴀোⱘ๲ࡴDŽ⬅Ѣৠᯊᓩ⫼ᑣ߫ো੠⠜ᴀোˈՓᕫ ໡⦄ߎৠϔ䆄ᔩˈॳྟߚᵤᇚֱᣕ᳝ᬜDŽ ৠᯊᓩ⫼ᑣ߫ো੠⠜ᴀোᇚՓ偀㰢ⱘՓ⫼㗙䅸䆚ࠄ೼ߚᵤ԰ᅠৢᑣ߫ৃ㛑Ꮖ㒣থ⫳њব࣪DŽ 㗠Ϩḍ᥂⠜ᴀোৃҹ䕏ᯧⱘⶹ䘧ϔϾᑣ߫㹿ׂᬍⱘ⃵᭄DŽ⬅Ѣᑣ߫⠜ᴀ䕼䆚఼ⱘӬܜᴗˈ⦄ Ꮖᄬ೼ⱘNIDs੠PIDs˄ㅔऩՓ⫼giো˅ᇚ㹿এ䰸DŽ 㲟ⱑ䋼ᑣ߫ⱘᑣ߫ো 㘨ড়Ӯгৠᛣ㒭㲟ⱑ䋼ᑣ߫䆄ᔩߚ䜡ᑣ߫⠜ᴀোDŽҹࠡˈ䰸њՓ⫼giোˈᕜ䲒ৃ䴴ഄᓩ⫼㒭 ᅮ㓪ⷕऎ㗏䆥ৢⱘѻકDŽ䖭䰤ࠊњBLAST㒧ᵰⱘՓ⫼DŽ՟བˈ䖭ѯᑣ߫ᇚ੠ᦤѸ㒭㲟ⱑ䋼᭄᥂ ᑧⱘ㲟ⱑ䋼ᑣ᳝߫Ⳍৠⱘ⢊ᗕˈᑊϨᅗӀ᳝੠ᇍᑨḌ䝌ᑣ߫Ӭܜⱘ䖲᥹ᴗDŽ ϔ㠀ⱘSeqId ϔ㠀ⱘSeqIdᰃᣛ㹿෎಴Ёᖗ੠݊Ҫ㒘㒛ᔧ԰ᷛ䆚ᑣ߫ⱘϔ⾡䕽䆚෎಴᠔Փ⫼ⱘDŽ݊Ёϔѯᑣ ߫ৃ㛑∌䖰гϡӮߎ݅݀೼⦃᭄᥂ᑧЁˈ៪㗙ᰃ᳔㒜㹿ᦤѸⱘ߱㑻᭄᥂DŽ՟བˈ೼Entrez෎ ಴ߚ行ⱘҎԧᶧ㡆ԧⱘ䆄ᔩࣙ৿њ䰸ᑣ߫㒘៤ⱘ໮⾡⠽⧚੠෎಴᯴ᇘ݇㋏DŽ⠽⧚᯴ᇘᰃ⬅ϡ ৠ㒘㒛ᦤկⱘˈᰃ⫼ϔ㠀ⱘSeqIdᷛ䆚㒘㒛ⱘDŽ ㄀݁ゴ NCBI᭄᥂῵ൟ 义ⷕˈ8/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀݁ゴ NCBI᭄᥂῵ൟ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有