正在加载图片...
第六章NCB数据模型 页码,3/15 HORS Yakovl ev, A.G. TITLE Di rect Submi ssi on JOURNAL Submi tted(02-DEC1994)Al exander G. Yakovl ev, Georgetown Uni versi ty School of Medi ci ne, Neurol ogy, 3900 Reservoi r Rd Washi ngton, DC 20007, USA FEATURES LocationQuali fiers Source 1..1757 /organi sm= Rattus norvegi cus /strai n= Sprague-Dawley /sex=" maile CoNTIG join(U17993:1.1757.gap(200,U17994:1..658.93p0.U17995:1..4048) 图6.1A:从 Gen Bank中一条记录的部分。 GenBank格式仅仅指出了记录是有顺序的序列的一部 分;它不提供关于其他部分是什么或它们之间如何联系的。完整的该记录见 http://www.ncbi.nlm.nih.gov/htbin-post/entrez/query? uid=2182225&form=6&db=&Dopt= B:新的C0N中片段代表,新的 Gen Bank格式的延续,容许片段记录之间建立联系, CONTIG行可 以包含单个序列,已知长度的间隔,未知长度的间隔。尽管这种格式中没有特征及序列,但 每个组成成分仍以传统格式表达 Gen Bank格式也隐藏了一些DNA序列的多序列性。例如一般意义上,一个基因的三个外显子是 有顺序的,或是被侧面的非编码区或DNA内含子密集包围着,而内含子的整个长度是没有被测 序的。这时候在 Gen Bank的数据中会有三条记录,每一个对应一个外显子。没有一个特征能清 楚地代表该编码区完整的序列顺序(三个外显子是有一定的顺序并被一定长度的未翻译的DNA 序列隔断)。在 Gen Ban格式中,这时会有 SEGMENT行指出第一个记录是 SEGMENT10f3、第 个记录是 SEGMENT20f3、第三个记录是 SEGMENT30f3,但这仅告诉使用者这是一些没 有确定顺序的片段(图6.1A)。从整个 Gen Bank角度来看,使用一种被称为L0CUS的算法将无 序片段正确定位,组合在一起的片段使用相同的起始字母,以不同的数字结尾,例如 RNKOR1, RNKOR2, RNKOR3。显然当L0CUS名字中包含其它与该序列不相关的干扰时,这种复杂 的安排会遇到问题。况且还没有一个序列记录包含了全部的片段,也没有任何方法可以描述 片段之间的距离。因为在EMB|序列数据库中根本没有分割片段的信息,所以任何从这种形式 派生出来的记录都缺乏一些基本的信息。 NCBI数据模型定义了一种直接代表片段的格式,被成为“片段序列”。其包含的元素不是A, G,C,T,而是由怎样从其它序列构造的方法组成。所以以上面的例子为例,片段序列将包 含: RNKOR1-200bp间隔- RNKOR2-未知长度的间隔- RNKOR3。该片段序列和其他记录一样有自己 的名称(RNK0R)、序列号、特征、位点和注解。通常我们将这种形式的存储方式称为包含 RNKOR1、 RNKOR2、RNK0R3、所有中间联系和特征的序列 RNKOR片段集。当 Gen Bank以核酸-蛋白 质组形式发行时,片段集被分成多条记录,片段集就消失了。然而从 Entrez图的视角看片段 集,片段集象一条线将它的组分连接在一起。DDBJ/EMBL/ GenBank最近同意了一种方法用于代 表构造结构,它将被放在新的C0N分割中(图6.1B) 不同于 Gen Bank格式,NCB|片段序列不要求片段间有间隙,事实上片段可以重叠。这使得片段 序列适合用于代表诸如细菌基因的长序列,这恰恰就是 Entrez基因分离细菌基因和其它诸如 酵母等全染色体基因中所做的。NCB|软件工具包(0 stel l,1996:见本章末尾的内部资源) file://E:wcb生物信息学(中译本)\第六章NCB|数据模型.htm 2005-1-18AUTHORS Yakovlev,A.G. TITLE Direct Submission JOURNAL Submitted(02-DEC_1994) Alexander G. Yakovlev, Georgetown University School of Medicine, Neurology, 3900 Reservoir Rd., Washington, DC 20007, USA FEATURES Location/Qualifiers Source 1..1757 /organism=”Rattus norvegicus” /strain=”Sprague-Dawley” /sex=”maile” CONTIG join(U17993:1..1757,gap(200),U17994:1..658,gap(),U17995:1..4048) ೒6.1 A˖ҢGenBankЁϔᴵ䆄ᔩⱘ䚼ߚDŽGenBankḐᓣҙҙᣛߎњ䆄ᔩᰃ᳝乎ᑣⱘᑣ߫ⱘϔ䚼 ߚ˗ᅗϡᦤկ݇Ѣ݊Ҫ䚼ߚᰃҔМ៪ᅗӀП䯈བԩ㘨㋏ⱘDŽᅠᭈⱘ䆹䆄ᔩ㾕 http://www.ncbi.nlm.nih.gov/htbin-post/Entrez/query? uid=2182225&form=6&db=n&Dopt=g %˖ᮄⱘCONЁ⠛↉ҷ㸼ˈᮄⱘGenBankḐᓣⱘᓊ㓁ˈᆍ䆌⠛↉䆄ᔩП䯈ᓎゟ㘨㋏ˈCONTIG㸠ৃ ҹࣙ৿ऩϾᑣ߫ˈᏆⶹ䭓ᑺⱘ䯈䱨ˈ᳾ⶹ䭓ᑺⱘ䯈䱨DŽሑㅵ䖭⾡ḐᓣЁ≵᳝⡍ᕕঞᑣ߫ˈԚ ↣Ͼ㒘៤៤ߚҡҹӴ㒳Ḑᓣ㸼䖒DŽ GenBankḐᓣг䱤㮣њϔѯDNAᑣ߫ⱘ໮ᑣ߫ᗻDŽ՟བϔ㠀ᛣНϞˈϔϾ෎಴ⱘϝϾ໪ᰒᄤᰃ ᳝乎ᑣⱘˈ៪ᰃ㹿ջ䴶ⱘ䴲㓪ⷕऎ៪DNAݙ৿ᄤᆚ䲚ࣙೈⴔˈ㗠ݙ৿ᄤⱘᭈϾ䭓ᑺᰃ≵᳝㹿⌟ ᑣⱘDŽ䖭ᯊ׭೼GenBankⱘ᭄᥂ЁӮ᳝ϝᴵ䆄ᔩˈ↣ϔϾᇍᑨϔϾ໪ᰒᄤDŽ≵᳝ϔϾ⡍ᕕ㛑⏙ Ἦഄҷ㸼䆹㓪ⷕऎᅠᭈⱘᑣ߫乎ᑣ˄ϝϾ໪ᰒᄤᰃ᳝ϔᅮⱘ乎ᑣᑊ㹿ϔᅮ䭓ᑺⱘ᳾㗏䆥ⱘDNA ᑣ߫䱨ᮁ˅DŽ೼GenBankḐᓣЁˈ䖭ᯊӮ᳝SEGMENT㸠ᣛߎ㄀ϔϾ䆄ᔩᰃSEGMENT 1 of 3ǃ㄀ ѠϾ䆄ᔩᰃSEGMENT 2 of 3ǃ㄀ϝϾ䆄ᔩᰃSEGMENT 3 of 3ˈԚ䖭ҙਞ䆝Փ⫼㗙䖭ᰃϔѯ≵ ᳝⹂ᅮ乎ᑣⱘ⠛↉˄೒6.1A˅DŽҢᭈϾGenBank㾦ᑺᴹⳟˈՓ⫼ϔ⾡㹿⿄ЎLOCUSⱘㅫ⊩ᇚ᮴ ᑣ⠛↉ℷ⹂ᅮԡˈ㒘ড়೼ϔ䍋ⱘ⠛↉Փ⫼Ⳍৠⱘ䍋ྟᄫ↡ˈҹϡৠⱘ᭄ᄫ㒧ሒˈ՟བ RNKOR1ˈRNKOR2ˈRNKOR3DŽᰒ✊ᔧLOCUSৡᄫЁࣙ݊৿ᅗϢ䆹ᑣ߫ϡⳌ݇ⱘᑆᡄᯊˈ䖭⾡໡ᴖ ⱘᅝᥦӮ䘛ࠄ䯂乬DŽމϨ䖬≵᳝ϔϾᑣ߫䆄ᔩࣙ৿њܼ䚼ⱘ⠛↉ˈг≵᳝ӏԩᮍ⊩ৃҹᦣ䗄 ⠛↉П䯈ⱘ䎱⾏DŽ಴Ў೼EMBIᑣ᭄߫᥂ᑧЁḍᴀ≵᳝ࡆߚ⠛↉ⱘֵᙃˈ᠔ҹӏԩҢ䖭⾡ᔶᓣ ⌒⫳ߎᴹⱘ䆄ᔩ䛑㔎Уϔѯ෎ᴀⱘֵᙃDŽ NCBI᭄᥂῵ൟᅮНњϔ⾡Ⳉ᥹ҷ㸼⠛↉ⱘḐᓣˈ㹿៤ЎĀ⠛↉ᑣ߫āDŽ݊ࣙ৿ⱘܗ㋴ϡᰃ$ˈ *ˈ&ˈ7ˈ㗠ᰃ⬅ᗢḋҢ݊ᅗᑣ߫ᵘ䗴ⱘᮍ⊩㒘៤DŽ᠔ҹҹϞ䴶ⱘ՟ᄤЎ՟ˈ⠛↉ᑣ߫ᇚࣙ ৿˖RNKOR1-200bp䯈䱨-RNKOR2-᳾ⶹ䭓ᑺⱘ䯈䱨-RNKOR3DŽ䆹⠛↉ᑣ߫੠݊Ҫ䆄ᔩϔḋ᳝㞾Ꮕ ⱘৡ⿄˄RNKOR˅ǃᑣ߫োǃ⡍ᕕǃԡ⚍੠⊼㾷DŽ䗮ᐌ៥Ӏᇚ䖭⾡ᔶᓣⱘᄬټᮍᓣ⿄Ўࣙ৿ RNKOR1ǃRNKOR2ǃRNKOR3ǃ᠔᳝Ё䯈㘨㋏੠⡍ᕕⱘᑣ߫RNKOR⠛↉䲚DŽᔧGenBankҹḌ䝌㲟ⱑ 䋼㒘ᔶᓣথ㸠ᯊˈ⠛↉䲚㹿ߚ៤໮ᴵ䆄ᔩˈ⠛↉䲚ህ⍜༅њDŽ✊㗠ҢEntrez೒ⱘ㾚㾦ⳟ⠛↉ 䲚ˈ⠛↉䲚䈵ϔᴵ㒓ᇚᅗⱘ㒘ߚ䖲᥹೼ϔ䍋DŽDDBJ/EMBL/GenBank᳔䖥ৠᛣњϔ⾡ᮍ⊩⫼Ѣҷ 㸼ᵘ䗴㒧ᵘˈᅗᇚ㹿ᬒ೼ᮄⱘCONࡆߚЁ˄೒6.1B˅DŽ ϡৠѢGenBankḐᓣˈNCBI⠛↉ᑣ߫ϡ㽕∖⠛↉䯈᳝䯈䱭ˈџᅲϞ⠛↉ৃҹ䞡঴DŽ䖭Փᕫ⠛↉ ᑣ߫䗖ড়⫼Ѣҷ㸼䇌བ㒚㦠෎಴ⱘ䭓ᑣ߫ˈ䖭ᙄᙄህᰃEntrez෎಴ߚ行㒚㦠෎಴੠݊ᅗ䇌བ 䝉↡ㄝܼᶧ㡆ԧ෎಴Ё᠔خⱘDŽNCBI䕃ӊᎹࣙ݋˄Ostellˈ1996˖㾕ᴀゴ᳿ሒⱘݙ䚼䌘⑤˅ ㄀݁ゴ NCBI᭄᥂῵ൟ 义ⷕˈ3/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀݁ゴ NCBI᭄᥂῵ൟ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有