第四章应用GCG进行序列分析 页码,8/15 九、在 SeqLab Edi tor中保存序列 当用户退出 Sealab Edi tor模式或保存编辑的工作时,信息被保存在一个富含序列格式文件 (RSF)中。这是一种新型文件,它包含了序列的参考信息和特征信息以及序列本身。RSF文 件格式允许特征信息显示在 SeaLab Edi tor中。RSF文件可以包含一个或多个序列条目。如果 数据库条目被保存,这些条目的复制件(包括所有的参考信息和特征表格信息)都被包含在 这个RSF文件中。以这种方式创建的RSF文件自动添加到显示在 SeaLab List模式下的当前列表 文件中并存储在用户的工作目录里 十、在 SeaLab中可以实现的分析实例 Sealab中可以使用多个序列分析程序的特性使用户可以应用这些程序顺序地回答相关问题或 在对输入序列进行编辑后重复某项分析。而可以同时访问公用数据库和本机序列的优点使用 户可以在一个分析中使用其中任意一种而不用先进行转换或格式化的工作。这一部分中介绍 了6种用 SeaLab可以解决的序列分析问题。 在两条mRNA中寻找开放阅读框架,翻译并对比RNA与蛋白质序列。 对两条相关的mRNA进行测序的用户可能希望寻找开放阅读框架(0RF)、翻译以及进行核酸与 氨基酸序列间的两两对比。 把序列加入 SeaLab Edi tor中,从 Functi ons菜单中选中Map选项运行Map程序。Map输出文件包 含了限制性酶切图和6种可能的翻译框架的0RF的显示。这些0RF的起始和终止位置可进行标记 并选为 SeaLab Edi tor中序列显示的范围,然后可用Edit菜单的 Transl ate操作进行翻译。翻 译结果自动出现在 SeaLab Edi tor中 两条相关的核酸或蛋白质序列可用Gap程序( Needl eman and Wunsch,1970)或 BestFi t ( Smi th and Waterman,1981)程序进行对比。Gap程序寻找两条序列间的全局最优对比结果 适用于两条待比对的序列是进化相关的情况。 BestFi t程序寻找两条序列的局部最优对比结 果,它适用于两条序列不是进化相关而是功能相关的情况。 通过参考搜索寻找数据库中的相关条目并进行对比 研究一个特征序列家族成员的用户可能希望寻找这个家族中的其它成员并建立它们的多序列 对 从 Functi ons菜单中选取Lookψp程序。 LookUp在数据库条目的参考信息部分搜索描述词并建立 匹配条目的列表( Etzol d and argos,1993; Etzold et al.,1996)。在参考部分的 Defi ni ton, Author, Keyword和 Organi sm域中搜索描述词并在词之间使用“and"(&)、 or”(|)以及“ but not"(!)布尔表达式。例如,在SWSS-PROT条目的 Descri pti on域 搜索“ I actate& dehydrogenase&h& chai n"将产生一个输出文件,其中列出了乳酸脱氢 酶H链( l actate dehydrogenase H chain)条目。这个输出文件可以从 Output Manager窗 口中加以显示,然后与用户的序列一起添加到 SeaLab Edi tor中。 要创建所有这些序列的多序列对比,只要根据序列名称选中这些序列并从 Functi ons菜单中运 行 PileUp程序。由 PileUp产生的多序列文件也列在 Output Manager窗口中并可以直接添加到 SeaLab Edi tor中。推荐釆用这一步的原因在于数据库条目的特征表格( Features tabl e)信 息可与对比结果一起被包括进来。必要时对比结果是可以被编辑的,并且如果数据库条目有 相似的特征,这些特征可被附加给用户序列。 LookUp程序窗口,输出文件以及输出文件中的 序列对比结果如图4.7所示。 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18бǃSeqLab EditorЁֱᄬᑣ߫ ᔧ⫼᠋䗔ߎSeqLab Editorᓣֱᄬ㓪䕥ⱘᎹᯊˈֵᙃ㹿ֱᄬϔϾᆠᑣ߫Ḑᓣ᭛ӊ ˄RSF˅ЁDŽ䖭ᰃϔ⾡ᮄൟ᭛ӊˈᅗࣙњᑣ߫ⱘখ㗗ֵᙃ⡍ᕕֵᙃҹঞᑣ߫ᴀ䑿DŽRSF᭛ ӊḐᓣܕ䆌⡍ᕕֵᙃᰒ⼎SeqLab EditorЁDŽRSF᭛ӊৃҹࣙϔϾϾᑣ߫ᴵⳂDŽབᵰ ᭄ᑧᴵⳂ㹿ֱᄬˈ䖭ѯᴵⳂⱘࠊӊ˄ࣙᣀ᠔᳝ⱘখ㗗ֵᙃ⡍ᕕ㸼Ḑֵᙃ˅䛑㹿ࣙ 䖭ϾRSF᭛ӊЁDŽҹ䖭⾡ᮍᓣ߯ᓎⱘRSF᭛ӊ㞾ࡼ⏏ࠄࡴᰒ⼎SeqLab Listᓣϟⱘᔧࠡ߫㸼 ᭛ӊЁᑊᄬټ᠋⫼ⱘᎹⳂᔩ䞠DŽ कǃSeqLabЁৃҹᅲ⦄ⱘߚᵤᅲ՟DŽ SeqLabЁৃҹՓ⫼Ͼᑣ߫ߚᵤᑣⱘ⡍ᗻՓ⫼᠋ৃҹᑨ⫼䖭ѯᑣ乎ᑣഄಲㄨⳌ݇䯂乬 ᇍ䕧ܹᑣ߫䖯㸠㓪䕥ৢ䞡ᶤ乍ߚᵤDŽ㗠ৃҹৠᯊ䆓䯂݀⫼᭄ᑧᴀᴎᑣ߫ⱘӬ⚍Փ⫼ ᠋ৃҹϔϾߚᵤЁՓ⫼݊Ёӏᛣϔ⾡㗠ϡ⫼ܜ䖯㸠䕀ᤶḐᓣ࣪ⱘᎹDŽ䖭ϔ䚼ߚЁҟ㒡 њ⾡⫼SeqLabৃҹ㾷އⱘᑣ߫ߚᵤ䯂乬DŽ ϸᴵmRNAЁᇏᡒᓔᬒ䯙䇏Ḛᶊˈ㗏䆥ᑊᇍ↨RNAϢ㲟ⱑ䋼ᑣ߫DŽ ᇍϸᴵⳌ݇ⱘmRNA䖯㸠⌟ᑣⱘ⫼᠋ৃ㛑Ꮰᳯᇏᡒᓔᬒ䯙䇏Ḛᶊ˄ORF˅ǃ㗏䆥ҹঞ䖯㸠Ḍ䝌Ϣ ⇼䝌ᑣ߫䯈ⱘϸϸᇍ↨DŽ ᡞᑣ߫ࡴܹSeqLab EditorЁˈҢFunctions㦰ऩЁ䗝ЁMap䗝乍䖤㸠MapᑣDŽMap䕧ߎ᭛ӊࣙ њ䰤ࠊᗻ䝊ߛৃ辵㛑ⱘ㗏䆥ḚᶊⱘORFⱘᰒ⼎DŽ䖭ѯORFⱘ䍋ྟ㒜ℶԡ㕂ৃ䖯㸠ᷛ䆄 ᑊ䗝ЎSeqLab EditorЁᑣ߫ᰒ⼎ⱘ㣗ೈˈ✊ৢৃ⫼Edit㦰ऩⱘTranslate᪡䖯㸠㗏䆥DŽ㗏 䆥㒧ᵰ㞾ߎࡼ⦃SeqLab EditorЁDŽ ϸᴵⳌ݇ⱘḌ䝌㲟ⱑ䋼ᑣ߫ৃ⫼Gapᑣ˄Needleman and Wunsch, 1970˅BestFit (Smith and Waterman, 1981)ᑣ䖯㸠ᇍ↨DŽGapᑣᇏᡒϸᴵᑣ߫䯈ⱘܼሔ᳔Ӭᇍ↨㒧ᵰDŽ 䗖⫼Ѣϸᴵᕙ↨ᇍⱘᑣ߫ᰃ䖯࣪Ⳍ݇ⱘᚙމDŽBestFitᑣᇏᡒϸᴵᑣ߫ⱘሔ䚼᳔Ӭᇍ↨㒧 ᵰˈᅗ䗖⫼Ѣϸᴵᑣ߫ϡᰃ䖯࣪Ⳍ݇㗠ᰃࡳ㛑Ⳍ݇ⱘᚙމDŽ 䗮䖛খ㗗᧰㋶ᇏᡒ᭄ᑧЁⱘⳌ݇ᴵⳂᑊ䖯㸠ᇍ↨ ⷨおϔϾ⡍ᕕᑣ߫ᆊᮣ៤ਬⱘ⫼᠋ৃ㛑Ꮰᳯᇏᡒ䖭ϾᆊᮣЁⱘ݊ᅗ៤ਬᑊᓎゟᅗӀⱘᑣ߫ ᇍ↨DŽ ҢFunctions㦰ऩЁ䗝পLookUpᑣDŽLookUp᭄ᑧᴵⳂⱘখ㗗ֵᙃ䚼ߚ᧰㋶ᦣ䗄䆡ᑊᓎゟ ऍ䜡ᴵⳂⱘ߫㸼˄Etzold and Argos, 1993; Etzold et al., 1996˅DŽখ㗗䚼ߚⱘ Definiton, Author, KeywordOrganismඳЁ᧰㋶ᦣ䗄䆡ᑊ䆡П䯈Փ⫼“and”˄ ˅ǃ “or”˄_˅ҹঞ“but not”˄ʽ˅Ꮧᇨ㸼䖒ᓣDŽ՟བˈSWISS-PROTᴵⳂⱘDescriptionඳ ᧰㋶“lactate & dehydrogenase & h & chain”ᇚѻ⫳ϔϾ䕧ߎ᭛ӊˈ݊Ё߫ߎњч䝌㜅⇶ 䝊 H 䫒˄lactate dehydrogenase H chain˅ᴵⳂDŽ䖭Ͼ䕧ߎ᭛ӊৃҹҢOutput Managerに ষЁࡴҹᰒ⼎ˈ✊ৢϢ⫼᠋ⱘᑣ߫ϔ䍋⏏ࠄࡴSeqLab EditorЁDŽ 㽕߯ᓎ᠔᳝䖭ѯᑣ߫ⱘᑣ߫ᇍ↨ˈা㽕ḍᑣ߫ৡ⿄䗝Ё䖭ѯᑣ߫ᑊҢFunctions㦰ऩЁ䖤 㸠PileUpᑣDŽ⬅PileUpѻ⫳ⱘᑣ߫᭛ӊг߫Output ManagerにষЁᑊৃҹⳈ⏏ࠄࡴ SeqLab EditorЁDŽ㤤䞛⫼䖭ϔℹⱘॳѢ᭄ᑧᴵⳂⱘ⡍ᕕ㸼Ḑ˄Features table˅ֵ ᙃৃϢᇍ↨㒧ᵰϔ䍋㹿ࣙᣀ䖯ᴹDŽᖙ㽕ᯊᇍ↨㒧ᵰᰃৃҹ㹿㓪䕥ⱘˈᑊϨབᵰ᭄ᑧᴵⳂ᳝ ⳌԐⱘ⡍ᕕˈ䖭ѯ⡍ᕕৃ㹿䰘ࡴ㒭⫼᠋ᑣ߫DŽLookUpᑣにষˈ䕧ߎ᭛ӊҹঞ䕧ߎ᭛ӊЁⱘ ᑣ߫ᇍ↨㒧ᵰབ4.7᠔⼎DŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ8/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com