第十四章提交DNA序列到数据库 页码,10/2 图14.9 Sequi n的联系人页面记录了回答数据库工作人员查询的负责人的姓名和联系信息(通 常是执行提交的人,但不必是真正测序的人)。Sfx域要求名字后缀(例如:Jr.,lH1),而 不是敬语或学位(如Ph.D,M.D.)。当记录公布时该信息并不公开,而是保存在数据库中 序列格式表格(图14.12)询问提交的类型(单个的序列,如例子中所用;片段序列或种群 系统发生、变异研究)。对于最后三种类型的提交,包括相关序列的比对研究,输入数据的 形式也能被指示。缺省是 FASTA格式(或原始序列),不过 PHYLIP, NEXUS,PAUP和 FASTA GAP格式也是支持的。后几种格式包含比对信息,这些存储在序列记录中。 图14.10 图14.10 Sequi n作者页命名了描述测序的手稿作者。(例如从测序中获得荣誉的人),本页 是一个电子表格,可以容纳需要的作者名。按TAB按钮可以水平地从一个域移动到下一个域。 要移动到下一行的第一个名字列,从Sfx列内按TAB按钮。如果在最后一行中键入了任何东 西,新的一行将附加到表格的后面。(在视觉上立刻感到滚动条的变化),在一行中的任何 位置按下回车按钮将在当前行下增加新的一行。 Sequi n将忽略任何姓一栏空着的行。 图14.11 图14.11 Sequi n的联系页,用于与手稿原始作者的制度上的联系,当数据库工作人员处理记 录时,该信息将出现在引用其自身的参考书目中。在本页中下一页( Next Page)换名为下 表格( Next form);当按下该按钮时, Sequi n自动检査表格内容,如果用户遗漏了任何基本 信息的话,将给出提示。如果输入的信息符合要求, Sequi n将出现下一个表格。 图14.12 图14.12Seqμuin的序列格式表格,允许用户指定提交记录的类型和原始序列数据的类型。大 数提交是单个的序列(核苷酸)(也可能有一条或几条蛋白质产物序列)。另一类提交是片 段序列。例如,在一些基因组序列中,外显子已测序,但是内含子并未完全测序。通过分割 该记录,我们可以注解编码区和mR№A特征。系统发生、种群研究和变异硏究涉及不止一条相 关序列的提交,它们由 Sequi n包装为合适的集合。批量提交是用于那些并不具有相似性的序 列集的提交,这样作只是基于方便的理由。单个的序列数据和分段的序列数据必须是 FASTA格 式。种群、系统发生和变异研究也可以使用包含比对的格式。这些比对是关于提交者对于序 列之间关系的断言。目前 Sequi n支持 FASTA+GAP,PHYL|P,交叉存取 NEXUS和近邻的 NEXUS多 种格式 生物体和序列表(图14.13-14.15)要求生物学数据。在生物体页面上(图14.13,随着用户 键入生物体的科学名,经常使用的生物体名列表自动翻卷, Sequi n保存了 Gen Bank中存在的 最多的800种生物体。)因此在键入几个字母后,用户可以通过在列表中单击合适的项来补全 生物体名称的其余部分。现在 Sequi n知道了科学名称,一般名称, Gen Bank分类,分类学联系 file://E:wcb生物信息学(中译本)\第十四章提交DNA序列到数据库.htm2005-1-1814.9 Sequinⱘ㘨㋏Ҏ义䴶䆄ᔩњಲㄨ᭄ᑧᎹҎਬᶹ䆶ⱘ䋳䋷Ҏⱘྦྷৡ㘨㋏ֵᙃ˄䗮 ᐌᰃᠻ㸠ᦤѸⱘҎˈԚϡᖙᰃⳳℷ⌟ᑣⱘҎ˅DŽSfxඳ㽕∖ৡᄫৢ㓔˄՟བ˖Jr.,III˅ˈ㗠 ϡᰃᭀ䇁ᄺԡ˄བPh.D,M.D.˅DŽᔧ䆄ᔩ݀Ꮧᯊ䆹ֵᙃᑊϡ݀ᓔˈ㗠ᰃֱᄬ᭄ᑧЁDŽ ᑣ߫Ḑᓣ㸼Ḑ˄14.12˅䆶䯂ᦤѸⱘ㉏ൟ˄ऩϾⱘᑣ߫ˈབ՟ᄤЁ᠔⫼˗⠛↉ᑣ߫⾡㕸ǃ ㋏㒳থ⫳ǃবᓖⷨお˅DŽᇍѢ᳔ৢϝ⾡㉏ൟⱘᦤѸˈࣙᣀⳌ݇ᑣ߫ⱘ↨ᇍⷨおˈ䕧᭄ܹⱘ ᔶᓣг㛑㹿ᣛ⼎DŽ㔎ⳕᰃFASTAḐᓣ˄ॳྟᑣ߫˅ˈϡ䖛PHYLIPˈNEXUSˈPAUPFASTAˇ GAPḐᓣгᰃᬃᣕⱘDŽৢ辵Ḑᓣࣙ↨ᇍֵᙃˈ䖭ѯᄬټᑣ߫䆄ᔩЁDŽ 14.10 14.10 Sequin㗙义ੑৡњᦣ䗄⌟ᑣⱘ〓㗙DŽ˄՟བҢ⌟ᑣЁ㦋ᕫ㤷䁝ⱘҎ˅ˈᴀ义 ᰃϔϾ⬉ᄤ㸼Ḑˈৃҹᆍ㒇䳔㽕ⱘ㗙ৡDŽᣝTABᣝ䪂ৃҹ∈ᑇഄҢϔϾඳ⿏ࠄࡼϟϔϾඳDŽ 㽕⿏ࠄࡼϟϔ㸠ⱘϔϾৡᄫ߫ˈҢSfx߫ݙᣝTABᣝ䪂DŽབᵰ᳔ৢϔ㸠Ё䬂ܹњӏԩϰ 㽓ˈᮄⱘϔ㸠ᇚ䰘ࠄࡴ㸼Ḑⱘৢ䴶DŽ˄㾚㾝Ϟゟࠏᛳࠄ⒮ࡼᴵⱘব࣪ˈ˅ϔ㸠Ёⱘӏԩ ԡ㕂ᣝϟಲ䔺ᣝ䪂ᇚᔧࠡ㸠ϟࡴᮄⱘϔ㸠DŽSequinᇚᗑ⬹ӏԩྦྷϔᷣぎⴔⱘ㸠DŽ 14.11 14.11 Sequinⱘ㘨㋏义ˈ⫼ѢϢ〓ॳྟ㗙ⱘࠊᑺϞⱘ㘨㋏ˈᔧ᭄ᑧᎹҎਬ໘⧚䆄 ᔩᯊˈ䆹ֵᙃᇚߎ⦃ᓩ⫼݊㞾䑿ⱘখ㗗кⳂЁDŽᴀ义Ёϟϔ义˄Next Page˅ᤶৡЎϟϔ 㸼Ḑ˄Next Form˅˗ᔧᣝϟ䆹ᣝ䪂ᯊˈSequin㞾ࡼẔᶹ㸼Ḑݙᆍˈབᵰ⫼᠋䘫ⓣњӏԩᴀ ֵᙃⱘ䆱ˈᇚ㒭ߎᦤ⼎DŽབᵰ䕧ܹⱘֵᙃヺড়㽕∖ˈSequinᇚߎ⦃ϟϔϾ㸼ḐDŽ `14.12 14.12 Sequinⱘᑣ߫Ḑᓣ㸼Ḑˈܕ䆌⫼᠋ᣛᅮᦤѸ䆄ᔩⱘ㉏ൟॳྟᑣ᭄߫ⱘ㉏ൟDŽ ᭄ᦤѸᰃऩϾⱘᑣ߫˄Ḍ㣋䝌˅˄гৃ㛑᳝ϔᴵᴵ㲟ⱑ䋼ѻ⠽ᑣ߫˅DŽϔ㉏ᦤѸᰃ⠛ ↉ᑣ߫DŽ՟བˈϔѯ㒘ᑣ߫ЁˈᰒᄤᏆ⌟ᑣˈԚᰃݙᄤᑊᅠܼ⌟ᑣDŽ䗮䖛ࡆߚ 䆹䆄ᔩˈ៥Ӏৃҹ⊼㾷㓪ⷕऎmRNA⡍ᕕDŽ㋏㒳থ⫳ǃ⾡㕸ⷨおবᓖⷨお⍝ঞϡℶϔᴵⳌ ݇ᑣ߫ⱘᦤѸˈᅗӀ⬅Sequinࣙ㺙Ўড়䗖ⱘ䲚ড়DŽᡍ䞣ᦤѸᰃ⫼Ѣ䙷ѯᑊϡ᳝ⳌԐᗻⱘᑣ ߫䲚ⱘᦤѸˈ䖭ḋাᰃѢᮍ֓ⱘ⧚⬅DŽऩϾⱘᑣ᭄߫ߚ0⁄3ⱘᑣ᭄߫ᖙ乏ᰃFASTAḐ ᓣDŽ⾡㕸ǃ㋏㒳থ⫳বᓖⷨおгৃҹՓ⫼ࣙ↨ᇍⱘḐᓣDŽ䖭ѯ↨ᇍᰃ݇ѢᦤѸ㗙ᇍѢᑣ ߫П䯈݇㋏ⱘᮁ㿔DŽⳂࠡSequinᬃᣕFASTAˇGAPˈPHYLIPˈѸঝᄬপNEXUS䖥䚏ⱘNEXUS ⾡ḐᓣDŽ ⫳⠽ԧᑣ߫㸼˄14.13ˉ14.15˅㽕∖⫳⠽ᄺ᭄DŽ⫳⠽ԧ义䴶Ϟ˄14.13ˈ䱣ⴔ⫼᠋ 䬂ܹ⫳⠽ԧⱘ⾥ᄺৡˈ㒣ᐌՓ⫼ⱘ⫳⠽ԧৡ߫㸼㞾ࡼ㗏ोˈSequin ֱᄬњGenBankЁᄬⱘ ᳔ⱘ800⾡⫳⠽ԧDŽ˅ℸ䬂ܹϾᄫ↡ৢˈ⫼᠋ৃҹ䗮䖛߫㸼Ёऩߏড়䗖ⱘ乍ᴹ㸹ܼ ⫳⠽ԧৡ⿄ⱘ݊ԭ䚼ߚDŽ⦄Sequinⶹ䘧њ⾥ᄺৡ⿄ˈϔ㠀ৡ⿄ˈGenBankߚ㉏ˈߚ㉏ᄺ㘨㋏ कಯゴᦤѸDNAᑣ߫ࠄ᭄ᑧ 义ⷕˈ10/21 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कಯゴᦤѸDNAᑣ߫ࠄ᭄ᑧ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com