第六章NCB数据模型 页码,10/15 这时,所有的部分都可能是原生物序列(许多情况的记录都已经存在于 Gen Bank中)。可能在 连接部分有重叠。 De/ta生物序列 elta生物序列是用于代表从不同的基因序列中心得到的未完高产量基因序列(HTGS)。即使 有未知的生物序列子区域存在,使用 Del ta序列而不是离散序列是指对整个序列只需一个序列 辨识器。也就是说即使数据库中存在早期的版本,Deta序列保持着相同的序列号(见本章末 尾 映射生物序列 映射生物序列用于代表遗传和物理的映射关系,和实生物序列类似都包含有分子结构可能是 拓扑结构以及真实分子长度粗糙估计的长度信息。这个信息只提供协调系统以每个生物序列 的属性。对一个遗传映射给定协调系统我们可以根据遗传证据估计基因的位置。和原生物序 列的数据是碱基和残基类似,作用基因特征表是映射生物序列的主要数据。 BI0 SEOSETS:序列集合 生物序列经常储存在相关序列的上下文中。例如核酸序列和它编码的蛋白质序列自然属于一 类。NCB数据模型为这个目的提供了序列集合。 序列集合有一系列描述。将生物序列进行压缩时,需要对集合中每个序列进行描述。将出版 物和生物原信息结合在一起是比较方便的安排,这些生物原信息是期望对所有序列的但经常 在序列集合中出现相同。例如,DNA和蛋白质序列都是从同一组织中获得的,所以该描述信息 应该用于该集合,同样也适用于出版物 最一般的序列集合如下。 核酸--蛋白质集合 核酸-蛋白质集合包含核酸和一个或多个蛋白质,它是最经常由 Sequel n数据提交产生的集合。 序列的组成是通过描述从核酸到蛋白质的翻译过程的编码区(CDS)的特征来联系的。传统的 核酸和蛋白质数据库中这些记录可能用交叉参考来指明这种联系。核酸-蛋白质集合将二者放 在一起使得这种联系更加清楚。它也允许用于所有序列的描述信息的同时存在(例如组织或 出处) 数量、种类的研究 序列提交的一个主要的类是以人口或种类研究的形式出现。这些研究包括同种类(数量研 究)或不同种类(种类研究)一定数量的个体相同基因的比对。序列比对可能从以下的序列 比对中得到。若基因编码了某个蛋白质,则数量或种类的序列集合可能也是一个核酸-蛋白质 集合。 其它的生物序列集合 Seg集合包含了一个离散的生物序列和一个部分生物集合,反过来部分生物集合有包含了被离 散生物序列引用的原生物序列(这可能组成了核酸-蛋白质集合的核酸部分)。 Equi v生物序列集合被用于 Entrez基因分离,以维持生物序列的多平衡。例如,人体染色体有 一个或多个不同种类的遗传、物理映射。不同生物序列之间的比对是基于对一般人员的注释 (见第12章和图12.4)。 file://E:wcb生物信息学(中译本)\第六章NCB|数据模型.htm 2005-1-18䖭ᯊˈ᠔᳝ⱘ䚼ߚ䛑ৃ㛑ᰃॳ⫳⠽ᑣ߫˄䆌ᚙމⱘ䆄ᔩ䛑Ꮖ㒣ᄬѢGenBankЁ˅DŽৃ㛑 䖲䚼ߚ᳝䞡DŽ Delta⫳⠽ᑣ߫ Delta⫳⠽ᑣ߫ᰃ⫼Ѣҷ㸼Ңϡৠⱘᑣ߫Ёᖗᕫࠄⱘᅠ催ѻ䞣ᑣ߫˄HTGS˅DŽेՓ ᳝ⶹⱘ⫳⠽ᑣ߫ᄤऎඳᄬˈՓ⫼Deltaᑣ߫㗠ϡᰃ⾏ᬷᑣ߫ᰃᣛᇍᭈϾᑣ߫া䳔ϔϾᑣ߫ 䕼䆚఼DŽгህᰃ䇈ेՓ᭄ᑧЁᄬᮽᳳⱘ⠜ᴀˈDeltaᑣֱ߫ᣕⴔⳌৠⱘᑣ߫ো˄㾕ᴀゴ ሒ˅DŽ ᇘ⫳⠽ᑣ߫ ᇘ⫳⠽ᑣ߫⫼Ѣҷ㸼䘫Ӵ⠽⧚ⱘᇘ݇㋏ˈᅲ⫳⠽ᑣ߫㉏Ԑ䛑᳝ࣙߚᄤ㒧ᵘৃ㛑ᰃ ᢧᠥ㒧ᵘҹঞⳳᅲߚᄤ䭓ᑺ㉫㊭Ԅ䅵ⱘ䭓ᑺֵᙃDŽ䖭Ͼֵᙃাᦤկण䇗㋏㒳ҹ↣Ͼ⫳⠽ᑣ߫ ⱘሲᗻDŽᇍϔϾ䘫Ӵᇘ㒭ᅮण䇗㋏㒳៥Ӏৃҹḍ䘫Ӵ䆕Ԅ䅵ⱘԡ㕂DŽॳ⫳⠽ᑣ ߫ⱘ᭄ᰃ⺅⅟㉏Ԑˈ⫼⡍ᕕ㸼ᰃᇘ⫳⠽ᑣ߫ⱘЏ㽕᭄DŽ BIOSEQSETS˖ᑣ߫䲚ড় ⫳⠽ᑣ߫㒣ᐌټᄬⳌ݇ᑣ߫ⱘϞϟ᭛ЁDŽ՟བḌ䝌ᑣ߫ᅗ㓪ⷕⱘ㲟ⱑ䋼ᑣ߫㞾✊ሲѢϔ ㉏DŽNCBI᭄ൟЎ䖭ϾⳂⱘᦤկњᑣ߫䲚ড়DŽ ᑣ߫䲚ড়᳝ϔ㋏߫ᦣ䗄DŽᇚ⫳⠽ᑣ߫䖯㸠य़㓽ᯊˈ䳔㽕ᇍ䲚ড়Ё↣Ͼᑣ߫䖯㸠ᦣ䗄DŽᇚߎ⠜ ⠽⫳⠽ॳֵᙃ㒧ড়ϔ䍋ᰃ↨䕗ᮍ֓ⱘᅝᥦˈ䖭ѯ⫳⠽ॳֵᙃᰃᳳᳯᇍ᠔᳝ᑣ߫ⱘԚ㒣ᐌ ᑣ߫䲚ড়Ёߎ⦃ⳌৠDŽ՟བˈDNA㲟ⱑ䋼ᑣ߫䛑ᰃҢৠϔ㒘㒛Ё㦋ᕫⱘˈ᠔ҹ䆹ᦣ䗄ֵᙃ ᑨ䆹⫼Ѣ䆹䲚ড়ˈৠḋг䗖⫼Ѣߎ⠜⠽DŽ ᳔ϔ㠀ⱘᑣ߫䲚ড়བϟDŽ Ḍ䝌--㲟ⱑ䋼䲚ড় Ḍ䝌㲟ⱑ䋼䲚ড়ࣙḌ䝌ϔϾϾ㲟ⱑ䋼ˈᅗᰃ᳔㒣ᐌ⬅SequIn᭄ᦤѸѻ⫳ⱘ䲚ড়DŽ ᑣ߫ⱘ㒘៤ᰃ䗮䖛ᦣ䗄ҢḌ䝌ࠄ㲟ⱑ䋼ⱘ㗏䆥䖛ⱘ㓪ⷕऎ˄CDS˅ⱘ⡍ᕕᴹ㘨㋏ⱘDŽӴ㒳ⱘ Ḍ䝌㲟ⱑ䋼᭄ᑧЁ䖭ѯ䆄ᔩৃ㛑⫼Ѹঝখ㗗ᴹᣛᯢ䖭⾡㘨㋏DŽḌ䝌㲟ⱑ䋼䲚ড়ᇚѠ㗙ᬒ ϔ䍋Փᕫ䖭⾡㘨㋏ࡴ⏙ἮDŽᅗгܕ䆌⫼Ѣ᠔᳝ᑣ߫ⱘᦣ䗄ֵᙃⱘৠᯊᄬ˄՟བ㒘㒛 ߎ໘˅DŽ ᭄䞣ǃ⾡㉏ⱘⷨお ᑣ߫ᦤѸⱘϔϾЏ㽕ⱘ㉏ᰃҹҎষ⾡㉏ⷨおⱘᔶᓣߎ⦃DŽ䖭ѯⷨおࣙᣀৠ⾡㉏˄᭄䞣ⷨ お˅ϡৠ⾡㉏˄⾡㉏ⷨお˅ϔᅮ᭄䞣ⱘϾԧⳌৠⱘ↨ᇍDŽᑣ߫↨ᇍৃ㛑Ңҹϟⱘᑣ߫ ↨ᇍЁᕫࠄDŽ㢹㓪ⷕњᶤϾ㲟ⱑ䋼ˈ᭄߭䞣⾡㉏ⱘᑣ߫䲚ড়ৃ㛑гᰃϔϾḌ䝌㲟ⱑ䋼 䲚ড়DŽ ݊ᅗⱘ⫳⠽ᑣ߫䲚ড় Seg䲚ড়ࣙњϔϾ⾏ᬷⱘ⫳⠽ᑣ߫ϔϾ䚼ߚ⫳⠽䲚ড়ˈড䖛ᴹ䚼ߚ⫳⠽䲚ড়᳝ࣙњ㹿⾏ ᬷ⫳⠽ᑣ߫ᓩ⫼ⱘॳ⫳⠽ᑣ߫˄䖭ৃ㛑㒘៤њḌ䝌㲟ⱑ䋼䲚ড়ⱘḌ䝌䚼ߚ˅DŽ Equiv⫳⠽ᑣ߫䲚ড়㹿⫼ѢEntrezߚˈ行ҹ㓈ᣕ⫳⠽ᑣ߫ⱘᑇ㸵DŽ՟བˈҎԧᶧ㡆ԧ᳝ ϔϾϾϡৠ⾡㉏ⱘ䘫Ӵǃ⠽⧚ᇘDŽϡৠ⫳⠽ᑣ߫П䯈ⱘ↨ᇍᰃѢᇍϔ㠀Ҏਬⱘ⊼䞞 ˄㾕12ゴ12.4˅DŽ ݁ゴ NCBI᭄ൟ 义ⷕˈ10/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?݁ゴ NCBI᭄ൟ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com