第十三章 ACEDB一个基因组信息的数据库 页码,9/12 序列的长度被计算出,并被自动插入到对象中跟在DNA标识符后的整型字段( Int field) 里。这里的DMNA是指 Magic Tag”。这些特殊的识别标记被写入到数据库引擎中,主要用来 显示目的。一种 Magi c Tag含义是数据库的开发者和序列分析者需要知道哪些标识被用来产生 ACEDB显示元素的。 Magi c Tag怎样被使用的说明见[9]。 程序使用于把 Gene Bank和EMBL记录改变为ace格式[23]。如果是公共的,这些程序大大降低 了输入序列的工作量。从 Gene Bank-到-ace的语法分析程序产生的一个aCe文件显示于图 13.7。这个例子表明了 ACEDB中序列建模的一些表现形式。核酸序列与转录子(如CDS和mRNA) 与序列对象GB: ATABI IG相链接。虽然,转录子本身应是 Sequence(序列)对象,但它们被作 为GB: ATABIIG的子序列的模型。这序列/子序列的建模可通过在另一 sequence(序列)对象中确 定两序列的交叠部分来建造序列的重叠群。这一假想的例子加入到两列有81个重叠单元的序 Sequence "LINK_MySe Subsequence"MyshortSeq"100 20000 BLAST分析和 MSPcrunch Fmap, BLAST,和D0TER都能显示 BLAST系列程序的结果(见7章)。使用 ACEDB的方案,将运行 如下的典型的数据库搜索,来获取最大同源物的信息(X代表有序的有机体)。 BLASTX对所有蛋白序列的核苷转译因子的査询。 BLASTN对x有机体中的ESTs的核苷查询。 TBLASTX对非x有机体中的ESTs的核苷转译因子的查询。 BLASTN对除ESTs以外的所有核苷序列的核苷査询 实际的数据库搜索依靠一系列的因素(见第二章中讨论的公共的序列数据库)。 BLAST搜索的 结果是通过 BLAST的事后处理程序 MSPcrunch被筛选的。 MSPcrunch有很多有用的功能: 1.偏离成分的区域被 BLAST勿赋予高分值, MSPcrunch适当的降低这些分值。 2.类似大蛋白质类型和有高频率出现的氨基酸的区域会产生很多MSPs, MSPcrunch可消除 这些拥挤区域多余的MSPs。 3. MSPcrunch从相同的数据库序列中检测接近的MSPs,这检测保留低分值的MSPS,它们与 个带缺口的列相一致。 4. MSPcrunch分析 BLAST的输出,并产生ace文件。 行1-3使 BLAST非常灵敏,但是,如果要求一个数据库中的所有MSPs查询, MSPcrunch可被用 作带有w开关的aCe文件生成器。 在公共区域的全序列的 BLAST内部査询,需要对计算资源有大量的投入,因序列数据库的规 模;需要长的时间来查找;还需要维持日易增大的数据库。不过,少量的序列可通过网页提 供的 BLAST服务来得到分析。 BLAST的输出可被EMAL引用,且 MSPcrunch可用作产生ace文 件 file://E:wcb生物信息学(中译本)\第十三章 ACEDB一个基因组信息的数..2005-1-18ᑣ߫ⱘ䭓ᑺ㹿䅵ㅫߎˈᑊ㹿㞾ࡼᦦܹࠄᇍ䈵Ё䎳DNAᷛ䆚ヺৢⱘᭈൟᄫ↉˄Int field˅ 䞠DŽ䖭䞠ⱘDNAᰃᣛ“Magic Tag”DŽ䖭ѯ⡍⅞ⱘ䆚߿ᷛ䆄㹿ݭܹࠄ᭄ᑧᓩ᪢ЁˈЏ㽕⫼ᴹ ᰒ⼎ⳂⱘDŽϔ⾡Magic TagНᰃ᭄ᑧⱘᓔথ㗙ᑣ߫ߚᵤ㗙䳔㽕ⶹ䘧ાѯᷛ䆚㹿⫼ᴹѻ⫳ ACEDBᰒ⼎ܗ㋴ⱘDŽMagic Tagᗢḋ㹿Փ⫼ⱘ䇈ᯢ㾕[9]DŽ ᑣՓ⫼ѢᡞGeneBank EMBL䆄ᔩᬍবЎaceḐᓣ[23]DŽབᵰᰃ݀݅ⱘˈ䖭ѯᑣ䰡Ԣ њ䕧ܹᑣ߫ⱘᎹ䞣DŽҢGeneBank-ࠄ-aceⱘ䇁⊩ߚᵤᑣѻ⫳ⱘϔϾace᭛ӊᰒ⼎Ѣ 13.7DŽ䖭Ͼ՟ᄤ㸼ᯢњACEDBЁᑣ߫ᓎⱘϔѯ㸼⦄ᔶᓣDŽḌ䝌ᑣ߫Ϣ䕀ᔩᄤབCDSmRNA) Ϣᑣ߫ᇍ䈵GB:ATABIIGⳌ䫒DŽ㱑✊ˈ䕀ᔩᄤᴀ䑿ᑨᰃSequence˄ᑣ߫˅ᇍ䈵ˈԚᅗӀ㹿 ЎGB:ATABIIGⱘᄤᑣ߫ⱘൟDŽ䖭ᑣ߫ᄤᑣ߫ⱘᓎৃ䗮䖛ϔsequence(ᑣ߫ᇍ䈵Ё⹂ ᅮϸᑣ߫ⱘѸ䚼ߚᴹᓎ䗴ᑣ߫ⱘ䞡㕸DŽ䖭ϔ؛ᛇⱘ՟ᄤࡴܹࠄϸ᳝߫81Ͼ䞡ऩܗⱘᑣ ߫DŽ Sequence "LINK_MySeqs" Subsequence "MyShortSeq" 1 180 Subsequence "MyShortSeq" 100 20000 BLASTߚᵤMSPcrunch Fmap, BLAST,DOTTER䛑㛑ᰒ⼎BLAST㋏߫ᑣⱘ㒧ᵰ˄㾕ゴ˅DŽՓ⫼ACEDBⱘᮍḜˈᇚ䖤㸠 བϟⱘൟⱘ᭄ᑧ᧰㋶ˈᴹ㦋প᳔ৠ⑤⠽ⱘֵᙃ˄;ҷ㸼᳝ᑣⱘ᳝ᴎԧ˅DŽ BLASTX ᇍ᠔᳝㲟ⱑᑣ߫ⱘḌ㣋䕀䆥ᄤⱘᶹ䆶DŽ BLASTN ᇍ[᳝ᴎԧЁⱘESTsⱘḌ㣋ᶹ䆶DŽ TBLASTX ᇍ䴲[᳝ᴎԧЁⱘESTsⱘḌ㣋䕀䆥ᄤⱘᶹ䆶DŽ BLASTN ᇍ䰸ESTsҹⱘ᠔᳝Ḍ㣋ᑣ߫ⱘḌ㣋ᶹ䆶DŽ ᅲ䰙ⱘ᭄ᑧ᧰㋶ձ䴴ϔ㋏߫ⱘ㋴˄㾕ѠゴЁ䅼䆎ⱘ݀݅ⱘᑣ᭄߫ᑧ˅DŽBLAST᧰㋶ⱘ 㒧ᵰᰃ䗮䖛BLASTⱘџৢ໘⧚ᑣMSPcrunch㹿ㄯ䗝ⱘDŽMSPcrunch᳝ᕜ᳝⫼ⱘࡳ㛑˖ 1. أ行៤ߚⱘऎඳ㹿BLAST࣓䌟ќ催ߚˈؐMSPcrunch䗖ᔧⱘ䰡Ԣ䖭ѯߚؐDŽ 2. ㉏Ԑ㲟ⱑ䋼㉏ൟ᳝催乥⥛ߎ⦃ⱘ⇼䝌ⱘऎඳӮѻ⫳ᕜMSPsˈMSPcrunchৃ⍜䰸 䖭ѯᢹऎඳԭⱘMSPsDŽ 3. MSPcrunch ҢⳌৠⱘ᭄ᑧᑣ߫ЁẔ⌟䖥ⱘMSPsˈ䖭Ẕ⌟ֱ⬭ԢߚؐⱘMSPsˈᅗӀϢ ϔϾᏺ㔎ষⱘ߫Ⳍϔ㟈DŽ 4. MSPcrunchߚᵤBLASTⱘ䕧ߎˈᑊѻ⫳ace᭛ӊDŽ 䖤㸠1-3ՓBLAST䴲ᐌ♉ᬣˈԚᰃˈབᵰ㽕∖ϔϾ᭄ᑧЁⱘ᠔᳝MSPsᶹ䆶ˈMSPcrunchৃ㹿⫼ ᏺ᳝Zᓔ݇ⱘace᭛ӊ⫳៤఼DŽ ݀݅ऎඳⱘܼᑣ߫ⱘBLASTݙ䚼ᶹ䆶ˈ䳔㽕ᇍ䅵ㅫ䌘⑤᳝䞣ⱘᡩܹˈᑣ᭄߫ᑧⱘ㾘 ˗䳔㽕䭓ⱘᯊ䯈ᴹᶹᡒ˗䖬䳔㽕㓈ᣕ᮹ᯧⱘ᭄ᑧDŽϡ䖛ˈᇥ䞣ⱘᑣ߫ৃ䗮䖛㔥义ᦤ կⱘBLAST᳡ࡵᴹᕫߚࠄᵤDŽBLASTⱘ䕧ߎৃ㹿E-MAILᓩ⫼ˈϨMSPcrunchৃ⫼ѻ⫳ace᭛ ӊDŽ कϝゴ ACEDBϔϾ㒘ֵᙃⱘ᭄ᑧ 义ⷕˈ9/12 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कϝゴ ACEDBϔϾ㒘ֵᙃⱘ᭄... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com