第四章应用GCG进行序列分析 页码,1/15 Q 第四章应用GCG进行序列分析 Barbara a. butler Genetics Computer Group. Inc Oxford Mol ecu ar Group Madi son. Wi consin 引言 快速、经济的核酸序列测序方法的出现使包括分子生物学、遗传学以及生物化学在内的许多 科学领域发生了革命。( Gi l bert,1981: Sanger,1981)。这项技术的发展同时也使人们需 要构建公用数据库来存储在全世界范围的实验室内得到的序列信息( Benson et a.,1997 Stoesser et al.,1997)。由于提交到数据库中的序列需要进行分析和解释,同时已经存在 的数据库中的条目需要进行辨识和修补以供研究人员进一步研究之用,因此随着公用数据库 的建立,生物信息学和计算生物学逐渐走向成熟 生物信息学可被视为为对生物信息,特别是对核酸以及蛋白质序列信息的获取、分析和存 储。而计算生物学则是指为实现上述目的进行的相应算法和计算机应用程序的开发。近十年 来全基因组测序计划中积累的大量数据使这两个领域都有了飞速的发展,从商业的、学术的 各种来源出现了许多可用于序列分析和数据库搜索的程序。用于个人计算机和 Maci ntoshe机 的软件包,特别是可供多用户使用的软件包通常比较昂贵,并且可能缺少用于分析和编辑的 综合性的程序组。与商业程序相比,那些公用的能独立运行的程序(即此程序不是作为软件 包的一部分而可以独立运行)很便宜,但需要下载有时甚至要在本机上进行编译,而且用户 还必须熟悉输入序列的格式和学习如何使程序有效地运行。虽然现在通过网络使用选定的程 序已经成为可能,但如果分析需要综合多个程序则难以进行。例如,研究者可以使用某种软 件进行数据库搜索但却无法进一步将搜索到的序列进行对比。同样,要创建一个序列对比然 后再进行编辑也是很困难的 这一章中介绍了一种集成环境,它将大量序列分析和数据库搜索程序集成在一起,并且可以 访问各种来源的序列数据。这一集成环境即为 Geneti cs Computer Group开发的 Sealab,它同 时也是 Wi sconsi n软件包的一部分。 Wi sconsi n软件包是一组综合性的序列分析程序,它使用 公用的核酸和蛋白质数据库。 SeaLab是一个图形用户界面(GU),通过它可以使用所有 Wi sconsi n软件包中的程序及其支持的数据库。此外,它还提供了一个环境用于创建、显示、 编辑和注释序列。 Sealab也可以被扩展使其可以包括其它公用或非公用的程序和数据库, 在这一卷的其它章节中详细讨论了许多应用 Wi sconsi n软件包程序所进行的分析,以及 Wi consin软件包与 SeaLab支持的数据库。因此,这一章中只强调访问数据库条目和本机序列 的环境,可进行分析的类型以及编辑和注释这些条目和序列的方法。 二、 Wi sconsi n软件包 Wi sconsi n软件包是一个综合性的序列分析软件包,它由120多个独立的程序组成,每个程序 进行一项单一的分析任务。由于所有程序输入的序列有统一的格式,所以无论是公用的还是 私人的数据库中的条目或是独立的序列文件都可以用 Wi sconsi n软件包中的程序进行分析。此 外,某些程序的输出文件的格式设定使得这些文件可以用其它程序进行进一步的分析。基于 上述原因,以及软件包作为一个整体的模块性,用户可以将这些程序进行组合,从而可以对 序列进行各种不同的分析。这一章的附录中列举了使用最广泛的一些程序。包括所有程序的 完整目录以及详细的描述可以在 Wi consin软件包的程序使用文档中找到。 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ Barbara A. Butler Genetics Computer Group. Inc Oxford Molecular Group Madison. Wisconsin ϔǃᓩ㿔 ᖿ䗳ǃ㒣⌢ⱘḌ䝌ᑣ߫⌟ᑣᮍ⊩ⱘߎ⦃Փࣙᣀߚᄤ⫳⠽ᄺǃ䘫Ӵᄺҹঞ⫳⠽࣪ᄺݙⱘ䆌 ⾥ᄺ乚ඳথ⫳њ䴽ੑDŽ˄Gilbert, 1981; Sanger, 1981)DŽ䖭乍ᡔᴃⱘথሩৠᯊгՓҎӀ䳔 㽕ᵘᓎ݀⫼᭄ᑧᴹᄬټܼϪ⬠㣗ೈⱘᅲ偠ᅸݙᕫࠄⱘᑣֵ߫ᙃ˄Benson et al., 1997; Stoesser et al., 1997˅DŽ⬅ѢᦤѸࠄ᭄ᑧЁⱘᑣ߫䳔㽕䖯㸠ߚᵤ㾷䞞ˈৠᯊᏆ㒣ᄬ ⱘ᭄ᑧЁⱘᴵⳂ䳔㽕䖯㸠䕼䆚ׂ㸹ҹկⷨおҎਬ䖯ϔℹⷨおП⫼ˈℸ䱣ⴔ݀⫼᭄ᑧ ⱘᓎゟˈ⫳⠽ֵᙃᄺ䅵ㅫ⫳⠽ᄺ䗤⏤䍄៤❳DŽ ⫳⠽ֵᙃᄺৃ㹿㾚ЎЎᇍ⫳⠽ֵᙃˈ⡍߿ᰃᇍḌ䝌ҹঞ㲟ⱑ䋼ᑣֵ߫ᙃⱘ㦋পǃߚᵤᄬ ټDŽ㗠䅵ㅫ⫳⠽ᄺ߭ᰃᣛЎᅲ⦄Ϟ䗄Ⳃⱘ䖯㸠ⱘⳌᑨㅫ⊩䅵ㅫᴎᑨ⫼ᑣⱘᓔথDŽ䖥कᑈ ᴹܼ㒘⌟ᑣ䅵ߦЁ⿃㌃ⱘ䞣᭄Փ䖭ϸϾ乚ඳ䛑᳝њ亲䗳ⱘথሩˈҢଚϮⱘǃᄺᴃⱘ ⾡ᴹ⑤ߎ⦃њ䆌ৃ⫼Ѣᑣ߫ߚᵤ᭄ᑧ᧰㋶ⱘᑣDŽ⫼ѢϾҎ䅵ㅫᴎMacintosheᴎ ⱘ䕃ӊࣙˈ⡍߿ᰃৃկ⫼᠋Փ⫼ⱘ䕃ӊࣙ䗮ᐌ↨䕗ᯖ䌉ˈᑊϨৃ㛑㔎ᇥ⫼Ѣߚᵤ㓪䕥ⱘ 㓐ড়ᗻⱘᑣ㒘DŽϢଚϮᑣⳌ↨ˈ䙷ѯ݀⫼ⱘ㛑⣀ゟ䖤㸠ⱘᑣ˄ेℸᑣϡᰃЎ䕃ӊ ࣙⱘϔ䚼ߚ㗠ৃҹ⣀ゟ䖤㸠˅ᕜ֓ᅰˈԚ䳔㽕ϟ䕑᳝ᯊ⫮㟇㽕ᴀᴎϞ䖯㸠㓪䆥ˈ㗠Ϩ⫼᠋ 䖬ᖙ乏❳ᙝ䕧ܹᑣ߫ⱘḐᓣᄺдབԩՓᑣ᳝ᬜഄ䖤㸠DŽ㱑✊⦄䗮䖛㔥㒰Փ⫼䗝ᅮⱘ ᑣᏆ㒣៤Ўৃ㛑ˈԚབᵰߚᵤ䳔㽕㓐ড়Ͼᑣ߭䲒ҹ䖯㸠DŽ՟བˈⷨお㗙ৃҹՓ⫼ᶤ⾡䕃 ӊ䖯㸠᭄ᑧ᧰㋶Ԛै᮴⊩䖯ϔℹᇚ᧰㋶ࠄⱘᑣ߫䖯㸠ᇍ↨DŽৠḋˈ㽕߯ᓎϔϾᑣ߫ᇍ↨✊ 䖯㸠㓪䕥гᰃᕜೄ䲒ⱘDŽݡৢ 䖭ϔゴЁҟ㒡њϔ⾡䲚៤⦃๗ˈᅗᇚ䞣ᑣ߫ߚᵤ᭄ᑧ᧰㋶ᑣ䲚៤ϔ䍋ˈᑊϨৃҹ 䆓䯂⾡ᴹ⑤ⱘᑣ᭄߫DŽ䖭ϔ䲚៤⦃๗ेЎGenetics Computer GroupᓔথⱘSeqLab, ᅗৠ ᯊгᰃWisconsin䕃ӊࣙⱘϔ䚼ߚDŽWisconsin䕃ӊࣙᰃϔ㒘㓐ড়ᗻⱘᑣ߫ߚᵤᑣˈᅗՓ⫼ ݀⫼ⱘḌ䝌㲟ⱑ䋼᭄ᑧDŽSeqLabᰃϔϾᔶ⫼᠋⬠䴶˄GUI˅ˈ䗮䖛ᅗৃҹՓ⫼᠔᳝ Wisconsin䕃ӊࣙЁⱘᑣঞ݊ᬃᣕⱘ᭄ᑧDŽℸˈᅗ䖬ᦤկњϔϾ⦃๗⫼Ѣ߯ᓎǃᰒ⼎ǃ 㓪䕥⊼䞞ᑣ߫DŽSeqLabгৃҹ㹿ᠽሩՓ݊ৃҹࣙᣀ݊ᅗ݀⫼䴲݀⫼ⱘᑣ᭄ᑧDŽ 䖭ϔोⱘ݊ᅗゴ㡖Ё䆺㒚䅼䆎њ䆌ᑨ⫼Wisconsin䕃ӊࣙᑣ᠔䖯㸠ⱘߚᵤˈҹঞ Wisconsin䕃ӊࣙϢSeqLabᬃᣕⱘ᭄ᑧDŽℸˈ䖭ϔゴЁাᔎ䇗䆓䯂᭄ᑧᴵⳂᴀᴎᑣ߫ ⱘ⦃๗ˈৃ䖯㸠ߚᵤⱘ㉏ൟҹঞ㓪䕥⊼䞞䖭ѯᴵⳂᑣ߫ⱘᮍ⊩DŽ ࣙѠǃWisconsin䕃ӊ Wisconsin䕃ӊࣙᰃϔϾ㓐ড়ᗻⱘᑣ߫ߚᵤ䕃ӊࣙˈᅗ⬅120Ͼ⣀ゟⱘᑣ㒘៤ˈ↣Ͼᑣ 䖯㸠ϔ乍ऩϔⱘߚᵤӏࡵDŽ⬅Ѣ᠔᳝ᑣ䕧ܹⱘᑣ᳝߫㒳ϔⱘḐᓣˈ᠔ҹ᮴䆎ᰃ݀⫼ⱘ䖬ᰃ ⾕Ҏⱘ᭄ᑧЁⱘᴵⳂᰃ⣀ゟⱘᑣ߫᭛ӊ䛑ৃҹ⫼Wisconsin䕃ӊࣙЁⱘᑣ䖯㸠ߚᵤDŽℸ ˈᶤѯᑣⱘ䕧ߎ᭛ӊⱘḐᓣ䆒ᅮՓᕫ䖭ѯ᭛ӊৃҹ⫼݊ᅗᑣ䖯㸠䖯ϔℹⱘߚᵤDŽѢ Ϟ䗄ॳˈҹঞ䕃ӊࣙЎϔϾᭈԧⱘഫᗻˈ⫼᠋ৃҹᇚ䖭ѯᑣ䖯㸠㒘ড়ˈҢ㗠ৃҹᇍ ᑣ߫䖯㸠⾡ϡৠⱘߚᵤDŽ䖭ϔゴⱘ䰘ᔩЁ߫ВњՓ⫼᳔ᑓ⊯ⱘϔѯᑣDŽࣙᣀ᠔᳝ᑣⱘ ᅠᭈⳂᔩҹঞ䆺㒚ⱘᦣ䗄ৃҹWisconsin䕃ӊࣙⱘᑣՓ⫼᭛ḷЁᡒࠄDŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ1/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,2/15 consin软件包支持各种UNX平台以及0 penIS。关于GCG, Wi sconsi n软件包,支持的平台 以及硬件需求的一般性信息可以在GC的主页(wW.gcg.com/)以及Wisconsin软件包的用户 手册中找到。 、 Wi sconsi n软件包使用的数据库 GCG支持五种数据库供 Wi sconsi n软件包使用,其中包括两种核酸数据库和三种蛋白质数据 库。这些数据库既有GCG格式的(供大多数 Wi sconsi n软件包程序使用),也有 BLAST格式的 (供BAST数据库搜索程序使用)。同时还提供了用于 LookUp程序以及数据库参考搜索的索 引 GG支持的两种核酸数据库是 GenBank数据库( Benson et al.,1997)以及仅由 Gen Bank中没有 的序列组成的简化版的EMBL核酸序列数据库( Stoesser et a.,1997)。为了方便进行搜 索,这两个数据库被组合成一个更为广泛的核酸数据库,称为 GenEmbLPl us。这个联合数据库 包括 Gen Bank和EMBL核酸序列数据库的表达序列标记(EST),序列标记位点(STS)以及基因 组序列纵览(GSS)条目部分。可以用特定TAG分别搜索这三部分或用特定 GenEMBL搜索没有这 三部分的 GenEMBLp|us。 GCG支持的三种蛋白质数据库是 Protei n I nformati on Resource(PIR)国际蛋白质序列数据库 ( George et al.1997), SWISS PR0T蛋白质序列数据库( Bai roch and Apweiler,1997)和 SP- TrEMBL数据库( Bai roch and Apwei ler,1997)。SP- TrEMBL是欧洲生物信息学研究所以及 Swi tzen and的 Geneva大学的 Amos bai roch博士联合开发的。它包含了大多数在EMBL数据库条 目中有标记的预测的翻译区域,但不包含已经在SWSs-PR0T中出现的任何条目。SP- TrEMBL中 的条目用SWSS-PR0T的格式进行注释,当这些条目在SWSS-PROT中出现时,就会从SP- TrEMBl 中删除掉。为了方便进行搜索,SWSS-PROT和SP- TrEMBL这两个数据库被结合在一起组成一个 更为广泛的蛋白质数据库��:SWSS- PROTP|uS。 GCG支持的数据库两个月更新一次(与 Gen Bank数据库的更新日程同步),这是GG数据库更新 服务的一部分。 Wi sconsi n软件包实体程序和脚本也可用于下载数据库以及格式化站点上的数 据库版本,或者用于数据库版本间的更新以及将个人的数据库转换为 Wi sconsi n软件包可用数 据库的格式。这些实体程序的列表和说明都可在 Wi sconsi n软件包系统支持文档中找到。 FASTA格式的数据库可直接用于 Wi sconsi n软件包中除 BLAST和L0okUp以外的所有程序而不需进 行格式转换。 四、 Sealab环境 SeaLab是 Wi consin软件包基于0 SF/Motif的图形用户界面。它使用户可以在一个基于窗口的 环境中使用大多数 Wi consin软件包中的程序和所有支持的数据库。 Sealab的使用需要在微型 计算机上运行X-termina或X-server。关于X-server软件的介绍可以在GC主页ww.gcg.com 中找到。 Wi consin软件包初始化完成后,在UNX提示符下键入命令 seql ab以启动 Sealab。这时会出现 个标题为 Sealab主窗口的窗口(如图4.1所示)。这个主窗口可以有两种模式: Main li st 模式和 lEdi tor.模式(这里即指 SeaLab Edi tor)。在 Main li st模式中 SeaLab主窗口显示一个 列表文件,文件中包含单序列文件、列表文件、多序列格式(MSF)文件、富含序列格式 RSF)文件以及数据库条目的名称。在 Edi tor模式下 Sealab主窗口显示这些文件和数据库条 目中的序列。用户可用 Sealab主窗口(图4.1)中的Mode:选择按钮在两种模式之间进行切 换。两种模式下都可以访问 Wi consin软件包程序以及所支持的数据库,然而除此以外在 SeaLab Edi tor下用户还可以编辑和注释序列。因此这一章重点介绍 ISeqLab Edi tor。 横贯 Sealab主窗口顶端的是一个菜单条,菜单选项可概括如下: file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
Wisconsin䕃ӊࣙᬃᣕ⾡UNIXᑇৄҹঞOpenVMSDŽ݇ѢGCGˈWisconsin䕃ӊࣙᬃˈᣕⱘᑇৄ ҹঞ⹀ӊ䳔∖ⱘϔ㠀ᗻֵᙃৃҹGCGⱘЏ义˄/www.gcg.com/˅ҹঞWisconsin䕃ӊࣙⱘ⫼᠋ DŽࠄЁᡒݠ ϝǃWisconsin䕃ӊࣙՓ⫼ⱘ᭄ᑧ GCGᬃᣕѨ⾡᭄ᑧկWisconsin䕃ӊࣙՓ⫼ˈ݊Ёࣙᣀϸ⾡Ḍ䝌᭄ᑧϝ⾡㲟ⱑ䋼᭄ ᑧDŽ䖭ѯ᭄ᑧ᮶᳝GCGḐᓣⱘ˄կ᭄Wisconsin䕃ӊࣙᑣՓ⫼˅ˈг᳝BLASTḐᓣⱘ ˄կBLAST᭄ᑧ᧰㋶ᑣՓ⫼˅DŽৠᯊ䖬ᦤկњ⫼ѢLookUpᑣҹঞ᭄ᑧখ㗗᧰㋶ⱘ㋶ ᓩDŽ GCGᬃᣕⱘϸ⾡Ḍ䝌᭄ᑧᰃGenBank᭄ᑧ˄Benson et al., 1997)ҹঞҙ⬅GenBankЁ≵᳝ ⱘᑣ߫㒘៤ⱘㅔ࣪⠜ⱘEMBLḌ䝌ᑣ᭄߫ᑧ˄Stoesser et al., 1997˅DŽЎњᮍ֓䖯㸠᧰ ㋶ˈ䖭ϸϾ᭄ᑧ㹿㒘ড়៤ϔϾЎᑓ⊯ⱘḌ䝌᭄ᑧˈ⿄ЎGenEMBLPlusDŽ䖭Ͼ㘨ড়᭄ᑧ ࣙᣀGenBankEMBLḌ䝌ᑣ᭄߫ᑧⱘ㸼䖒ᑣ߫ᷛ䆄˄EST˅ˈᑣ߫ᷛ䆄ԡ⚍˄STS˅ҹঞ 㒘ᑣ߫㒉㾜˄GSS˅ᴵⳂ䚼ߚDŽৃҹ⫼⡍ᅮTAG߿ߚ᧰㋶䖭ϝ䚼ߚ⫼⡍ᅮGenEMBL᧰㋶≵᳝䖭 ϝ䚼ߚⱘGenEMBLPlusDŽ GCGᬃᣕⱘϝ⾡㲟ⱑ䋼᭄ᑧᰃProtein Information Resource(PIR)䰙㲟ⱑ䋼ᑣ᭄߫ᑧ ˄George et al., 1997), SWISS PROT㲟ⱑ䋼ᑣ᭄߫ᑧ˄Bairoch and Apweiler, 1997) SP-TrEMBL᭄ᑧ(Bairoch and Apweiler, 1997)DŽSP-TrEMBLᰃ⌆⫳⠽ֵᙃᄺⷨお᠔ҹঞ SwitzenlandⱘGenevaᄺⱘAmos Bairochम㘨ড়ᓔথⱘDŽᅗࣙњ᭄EMBL᭄ᑧᴵ ⳂЁ᳝ᷛ䆄ⱘ乘⌟ⱘ㗏䆥ऎඳˈԚϡࣙᏆ㒣SWISS-PROTЁߎ⦃ⱘӏԩᴵⳂDŽSP-TrEMBLЁ ⱘᴵⳂ⫼SWISS-PROTⱘḐᓣ䖯㸠⊼䞞ˈᔧ䖭ѯᴵⳂSWISS-PROTЁߎˈᯊ⦃ህӮҢSP-TrEMBL Ёߴ䰸ᥝDŽЎњᮍ֓䖯㸠᧰㋶ˈSWISS-PROTSP-TrEMBL䖭ϸϾ᭄ᑧ㹿㒧ড়ϔ䍋㒘៤ϔϾ Ўᑓ⊯ⱘ㲟ⱑ䋼᭄ᑧ��SWISS-PROTPlusDŽ GCGᬃᣕⱘ᭄ᑧϸϾ᳜ᮄϔ˄ϢGenBank᭄ᑧⱘᮄ᮹ৠℹ˅ˈ䖭ᰃGCG᭄ᑧᮄ ᳡ࡵⱘϔ䚼ߚDŽWisconsin䕃ӊࣙᅲԧᑣ㛮ᴀгৃ⫼Ѣϟ䕑᭄ᑧҹঞḐᓣ࣪キ⚍Ϟⱘ᭄ ᑧ⠜ᴀˈ㗙⫼Ѣ᭄ᑧ⠜ᴀ䯈ⱘᮄҹঞᇚϾҎⱘ᭄ᑧ䕀ᤶЎWisconsin䕃ӊࣙ⫼ৃ᭄ ᑧⱘḐᓣDŽ䖭ѯᅲԧᑣⱘ߫㸼䇈ᯢ䛑ৃWisconsin䕃ӊࣙLTD㒳ᬃᣕ᭛ḷЁᡒࠄDŽ FASTAḐᓣⱘ᭄ᑧৃⳈ⫼ѢWisconsin䕃ӊࣙЁ䰸BLASTLookUpҹⱘ᠔᳝ᑣ㗠ϡ䳔䖯 㸠Ḑᓣ䕀ᤶDŽ ಯǃSeqLab⦃๗ SeqLabᰃWisconsin䕃ӊࣙѢOSF/Motifⱘᔶ⫼᠋⬠䴶DŽᅗՓ⫼᠋ৃҹϔϾѢにষⱘ ⦃๗ЁՓ⫼᭄Wisconsin䕃ӊࣙЁⱘᑣ᠔᳝ᬃᣕⱘ᭄ᑧDŽSeqLabⱘՓ⫼䳔㽕ᖂൟ 䅵ㅫᴎϞ䖤㸠X-terminalX-serverDŽ݇ѢX-server䕃ӊⱘҟ㒡ৃҹGCGЏ义www.gcg.com ЁᡒࠄDŽ Wisconsin䕃ӊࣙྟ߱࣪ᅠ៤ৢˈUNIXᦤ⼎ヺϟ䬂ܹੑҸseqlabҹਃࡼSeqLabDŽ䖭ᯊӮߎ⦃ ϔϾᷛ乬ЎSeqLabЏにষⱘにষ˄བ4.1᠔⼎˅DŽ䖭ϾЏにষৃҹ᳝ϸ⾡ᓣ˖Main List ᓣEditorᓣ˄䖭䞠ेᣛSeqLab Editor˅DŽMain ListᓣЁSeqLabЏにষᰒ⼎ϔϾ ߫㸼᭛ӊˈ᭛ӊЁࣙऩᑣ߫᭛ӊǃ߫㸼᭛ӊǃᑣ߫Ḑᓣ˄MSF˅᭛ӊǃᆠᑣ߫Ḑᓣ ˄RSF˅᭛ӊҹঞ᭄ᑧᴵⳂⱘৡ⿄DŽEditorᓣϟSeqLabЏにষᰒ⼎䖭ѯ᭛ӊ᭄ᑧᴵ ⳂЁⱘᑣ߫DŽ⫼᠋ৃ⫼SeqLabЏにষ˄4.1˅ЁⱘMode:䗝ᢽᣝ䪂ϸ⾡ᓣП䯈䖯㸠ߛ ᤶDŽϸ⾡ᓣϟ䛑ৃҹ䆓䯂Wisconsin䕃ӊࣙᑣҹঞ᠔ᬃᣕⱘ᭄ᑧˈ✊㗠䰸ℸҹ SeqLab Editorϟ⫼᠋䖬ৃҹ㓪䕥⊼䞞ᑣ߫DŽℸ䖭ϔゴ䞡⚍ҟ㒡SeqLab EditorDŽ ῾䌃SeqLabЏにষ乊ッⱘᰃϔϾ㦰ऩᴵˈ㦰ऩ䗝乍ৃὖᣀབϟ˖ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ2/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,3/15 ile:从数据库或目录文件中增加序列或创建新的序列。 Edit:移动、编辑序列并执行简单的操作, Functi ons:根据分析主题进行组织的 Wi sconsi n软件包程序。 Extensi ons:可从 Sealab运行的附加程序列表 0 pti ons:用于序列和输出显示、文件管理器以及打印的参数 Wi ndows:用于输出显示,程序监视和特征注释的窗口列表 Help: Wi sconsi n软件包程序和 Sealab界面的在线帮助。 除了Mode选择按钮以外, SeaLab主窗口中还包括一个 Di spl ay.选择按钮用于改变显示序列的颜 色或给它加上阴影,以及一个比例条用于改变水平方向的比例。此外,还有一组图标提供了 另一种选择编辑选项,观看序列信息以及设置保护的方法。当然,窗口中的大部分空间还是 用于显示序列的 (图4.1)。 从数据库中增加条目以及从目录中增加序列文件 个序列首先必须出现在 Sealab主窗口中,然后才能对其进行编辑或用 Wi sconsi n软件包中的 程序进行分析。数据库条目可以通过条目名称或访问号加入。GCG格式的单序列文件、列表文 件、MSF以及RSF文件可以用文件名加入(关于这些文件格式的细节以及如何创建可参考 SeaLab指南)。 要从数据库中往 SeaLab主窗口中增加一个条目,首先使用鼠标左键选取菜单条中的File选项 然后从下拉菜单中选取 Add Sequences From选项。接下来,从出现的扩展菜单中选取 Databases选项 这时将出现一个 Database Browser窗口(如图4.2)。在窗口底部的 Database Speci fi cation文本框中键入要加入的数据库条目的名称或访问号,然后点击Add to main wi ndow按钮和 Close按钮。这一过程可简写如下。(本章中全部采用这种简写方式来 描述键盘和鼠标命令) 从数据库中往 SeaLab主窗口中增加一个条目的方法如下: 1。选取Fie菜单中的 Add Sequences From,单击 Database选项 在 Database browser(图4.2)的 Database speci fi cation文本框中键入条目名称或访问 3。单击 Add to mai n wi ndow与 Close按钮。 用户也可以往 Sealab主窗口显示的列表中加入GCG格式的序列文件。 往 SeaLab主窗口中加入目录文件的方法如下: 1。选取Fie菜单中的 Add Sequences From菜单,单击 Sequence Files选项 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
File: Ң᭄ᑧⳂᔩ᭛ӊЁࡴᑣ߫߯ᓎᮄⱘᑣ߫DŽ Edit: ⿏ࡼǃ㓪䕥ᑣ߫ᑊᠻ㸠ㅔऩⱘ᪡DŽ Functions: ḍߚᵤЏ乬䖯㸠㒘㒛ⱘWisconsin䕃ӊࣙᑣDŽ Extensions: ৃҢSeqLab䖤㸠ⱘ䰘ࡴᑣ߫㸼DŽ Options: ⫼Ѣᑣ߫䕧ߎᰒ⼎ǃ᭛ӊㅵ⧚఼ҹঞᠧॄⱘখ᭄DŽ Windows: ⫼Ѣ䕧ߎᰒ⼎ˈᑣⲥ㾚⡍ᕕ⊼䞞ⱘにষ߫㸼DŽ Help: Wisconsin䕃ӊࣙᑣSeqLab⬠䴶ⱘ㒓ᐂࡽDŽ 䰸њMode䗝ᢽᣝ䪂ҹˈSeqLabЏにষЁ䖬ࣙᣀϔϾDisplay䗝ᢽᣝ䪂⫼Ѣᬍবᰒ⼎ᑣ߫ⱘ买 㡆㒭ᅗࡴϞ䰈ᕅˈҹঞϔϾ↨՟ᴵ⫼Ѣᬍব∈ᑇᮍⱘ↨՟DŽℸˈ䖬᳝ϔ㒘ᷛᦤկњ ϔ⾡䗝ᢽ㓪䕥䗝乍ˈ㾖ⳟᑣֵ߫ᙃҹঞ䆒㕂ֱᡸⱘᮍ⊩DŽᔧ✊ˈにষЁⱘ䚼ߚぎ䯈䖬ᰃ ⫼Ѣᰒ⼎ᑣ߫ⱘ˄4.1˅DŽ Ң᭄ᑧЁࡴᴵⳂҹঞҢⳂᔩЁࡴᑣ߫᭛ӊ ϔϾᑣ߫佪ܜᖙ乏ߎ⦃SeqLabЏにষЁˈ✊ৢᠡ㛑ᇍ݊䖯㸠㓪䕥⫼Wisconsin䕃ӊࣙЁⱘ ᑣ䖯㸠ߚᵤDŽ᭄ᑧᴵⳂৃҹ䗮䖛ᴵⳂৡ⿄䆓䯂োࡴܹDŽGCGḐᓣⱘऩᑣ߫᭛ӊǃ߫㸼᭛ ӊǃMSFҹঞRSF᭛ӊৃҹ⫼᭛ӊৡࡴ݇˄ܹѢ䖭ѯ᭛ӊḐᓣⱘ㒚㡖ҹঞབԩ߯ᓎৃখ㗗 SeqLabᣛफ˅DŽ 㽕Ң᭄ᑧЁᕔSeqLabЏにষЁࡴϔϾᴵⳂˈ佪ܜՓ⫼哴ᷛᎺ䬂䗝প㦰ऩᴵЁⱘFile䗝乍, ✊ৢҢϟᢝ㦰ऩЁ䗝পAdd Sequences From䗝乍DŽϟᴹˈҢߎ⦃ⱘᠽሩ㦰ऩЁ䗝প Databases䗝乍, 䖭ᯊᇚߎ⦃ϔϾDatabase Browserにষ˄བ4.2˅DŽにষᑩ䚼ⱘ Database Specification᭛ᴀḚЁ䬂ܹ㽕ࡴܹⱘ᭄ᑧᴵⳂⱘৡ⿄䆓䯂োˈ✊ৢ⚍ߏAdd to Main Windowᣝ䪂Closeᣝ䪂DŽ䖭ϔ䖛ৃㅔݭབϟDŽ˄ᴀゴЁܼ䚼䞛⫼䖭⾡ㅔݭᮍᓣᴹ ᦣ䗄䬂Ⲭ哴ᷛੑҸ˅ Ң᭄ᑧЁᕔSeqLabЏにষЁࡴϔϾᴵⳂⱘᮍ⊩བϟ˖ DŽ䗝পFile㦰ऩЁⱘAdd Sequences From, ऩߏDatabase䗝乍DŽ DŽDatabase Browser˄4.2˅ⱘDatabase specification ᭛ᴀḚЁ䬂ܹᴵⳂৡ⿄䆓䯂 োDŽ DŽऩߏAdd to Main Window ϢCloseᣝ䪂DŽ ⫼᠋гৃҹᕔSeqLabЏにষᰒ⼎ⱘ߫㸼ЁࡴܹGCGḐᓣⱘᑣ߫᭛ӊDŽ ᕔSeqLabЏにষЁࡴܹⳂᔩ᭛ӊⱘᮍ⊩བϟ˖ DŽ䗝পFile㦰ऩЁⱘAdd Sequences From㦰ऩˈऩߏSequence Files䗝乍DŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ3/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,4/15 选取 Fil ter文本框中合适的过滤器(缺省值为*.Seq,它将显示目录中文件名以.Seq结尾 的所有文件。如果用*代替*.Seq将显示目录中所有文件) 3。从 Di rectory域中选择合适的目录。 单击 Fil ter按钮。 5。从 Add Sequence窗口的 Files域中选择要加入的文件名 6。单击Ad与 Close按钮。 双击数据库条目或序列名称可以看到有关此条目或序列的参考信息。这一操作将打开 Sequence Informati on窗口。在必要的时候,这一窗口中任何文本框里的信息都可以进行编 辑。例如要给数据库的条目改名或给作为一个大项目的一部分的序列加一个1D号(访问号) 通常是很方便的。 用户可以用箭头键和水平、竖直滚动条浏览显示在 Sealab中的序列。键入残基的编号然后回 车即可移动到序列中相应的残基处。关于在 SeaLab Edi to中浏览用的其它快捷方式,包括移 动到当前光标处等等,在 SeaLab的指南中有详细的介绍。 创建一个新的序列条目 用户可以向 Sealab中输入新的蛋白质或核酸序列 输入一个新的蛋白质或核酸序列的方法如下 1。选取File菜单的 New Sequence选项 2。在 New Sequence框中选择DNA,RNA或蛋白质中的一种。 当列表出现后,单击条目的开始处,然后键入序列或从其它窗口粘贴序列信息。双击新条目 的名称加入参考信息。这一操作会打开 Sequence I nformati on窗口。所有文本框都是可编辑 的,包括改变条目名称,描述,作者名以及1D/访问号。在窗口底部的大文本框中可以加入 般参考信息。 编辑已存在的序列 显示在 SeaLab Edi tor中的已存在序列是受保护的,不可能无意中插入或删除一些残基。然而 这种保护状态是可以改变的。当这种保护被去除时,可以增加或删除残基,也可以在条目间 剪切和粘贴序列或序列的一部分。 改变一个序列的保护状态的方法如下 1。选取File菜单中的 Sequence Protecti ons选项 2。选取 Sequence Protecti ons窗口中所有按钮并单击0K。 Sealab用于编辑多序列对比结果特别有效。因为用户可以移动到独立序列或对比结果内的某 个绝对位置上,可以把序列组成组,这样一组中一条序列的改变同样会影响发生这组中所有 其它的序列,或者把已经组成的组打散,可以在间隙间移动残基岛而不改变整个对比结果 例如,用户可以通过滑动pqat岛将一个包含 gq.. psqal t.…,asw的对比结果改为 psgml t..asw,就好象 psqal t这六个残基连成一个字符串。这个岛代替了右边 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
DŽ䗝পFilter᭛ᴀḚЁড়䗖ⱘ䖛Ⓒ఼˄㔎ⳕؐЎ*.seqˈᅗᇚᰒ⼎ⳂᔩЁ᭛ӊৡҹ.seq㒧ሒ ⱘ᠔᳝᭛ӊDŽབᵰ⫼ ҷ᳓*.seqᇚᰒ⼎ⳂᔩЁ᠔᳝᭛ӊ˅DŽ DŽҢDirectoryඳЁ䗝ᢽড়䗖ⱘⳂᔩDŽ DŽऩߏFilterᣝ䪂DŽ DŽҢAdd SequenceにষⱘFilesඳЁ䗝ᢽ㽕ࡴܹⱘ᭛ӊৡDŽ DŽऩߏAddϢCloseᣝ䪂DŽ ঠߏ᭄ᑧᴵⳂᑣ߫ৡ⿄ৃҹⳟࠄ᳝݇ℸᴵⳂᑣ߫ⱘখ㗗ֵᙃDŽ䖭ϔ᪡ᇚᠧᓔ Sequence Information にষDŽᖙ㽕ⱘᯊˈ䖭ϔにষЁӏԩ᭛ᴀḚ䞠ⱘֵᙃ䛑ৃҹ䖯㸠㓪 䕥DŽ՟བ㽕㒭᭄ᑧⱘᴵⳂᬍৡ㒭ЎϔϾ乍Ⳃⱘϔ䚼ߚⱘᑣ߫ࡴϔϾIDো˄䆓䯂ো˅ 䗮ᐌᰃᕜᮍ֓ⱘDŽ ⫼᠋ৃҹ⫼ㆁ༈䬂∈ᑇǃオⳈ⒮ࡼᴵ⌣㾜ᰒ⼎SeqLabЁⱘᑣ߫DŽ䬂ܹ⅟ⱘ㓪ো✊ৢಲ 䔺ेৃ⿏ࠄࡼᑣ߫ЁⳌᑨⱘ⅟໘DŽ݇ѢSeqLab EditorЁ⌣㾜⫼ⱘ݊ᅗᖿ᥋ᮍᓣˈࣙᣀ⿏ ࠄࡼᔧࠡܝᷛ໘ㄝㄝˈSeqLabⱘᣛफЁ᳝䆺㒚ⱘҟ㒡DŽ ߯ᓎϔϾᮄⱘᑣ߫ᴵⳂ ⫼᠋ৃҹSeqLabЁ䕧ܹᮄⱘ㲟ⱑ䋼Ḍ䝌ᑣ߫DŽ 䕧ܹϔϾᮄⱘ㲟ⱑ䋼Ḍ䝌ᑣ߫ⱘᮍ⊩བϟ˖ DŽ䗝পFile㦰ऩⱘNew Sequence䗝乍DŽ DŽNew SequenceḚЁ䗝ᢽDNA, RNA㲟ⱑ䋼Ёⱘϔ⾡DŽ ᔧ߫㸼ߎˈৢ⦃ऩߏᴵⳂⱘᓔྟ໘ˈ✊ৢ䬂ܹᑣ߫Ң݊ᅗにষ㉬䌈ᑣֵ߫ᙃDŽঠߏᮄᴵⳂ ⱘৡ⿄ࡴܹখ㗗ֵᙃDŽ䖭ϔ᪡ӮᠧᓔSequence InformationにষDŽ᠔᳝᭛ᴀḚ䛑ᰃৃ㓪䕥 ⱘˈࣙᣀᬍবᴵⳂৡ⿄ˈᦣ䗄ˈ㗙ৡҹঞID/䆓䯂োDŽにষᑩ䚼ⱘ᭛ᴀḚЁৃҹࡴܹϔ 㠀খ㗗ֵᙃDŽ 㓪䕥Ꮖᄬⱘᑣ߫ ᰒ⼎SeqLab EditorЁⱘᏆᄬᑣ߫ᰃফֱᡸⱘˈϡৃ㛑᮴ᛣЁᦦܹߴ䰸ϔѯ⅟DŽ✊㗠 䖭⾡ֱᡸ⢊ᗕᰃৃҹᬍবⱘDŽᔧ䖭⾡ֱᡸ㹿এ䰸ᯊˈৃҹࡴߴ䰸⅟ˈгৃҹᴵⳂ䯈 ߛ࠾㉬䌈ᑣ߫ᑣ߫ⱘϔ䚼ߚDŽ ᬍবϔϾᑣ߫ⱘֱᡸ⢊ᗕⱘᮍ⊩བϟ˖ DŽ䗝পFile㦰ऩЁⱘSequence Protections䗝乍DŽ DŽ䗝পSequence ProtectionsにষЁ᠔᳝ᣝ䪂ᑊऩߏOKDŽ SeqLab⫼Ѣ㓪䕥ᑣ߫ᇍ↨㒧ᵰ⡍߿᳝ᬜDŽЎ⫼᠋ৃҹ⿏ࠄࡼ⣀ゟᑣ߫ᇍ↨㒧ᵰݙⱘᶤ Ͼ㒱ᇍԡ㕂Ϟˈৃҹᡞᑣ߫㒘៤㒘ˈ䖭ḋϔ㒘Ёϔᴵᑣ߫ⱘᬍবৠḋӮᕅડথ⫳䖭㒘Ё᠔᳝ ݊ᅗⱘᑣ߫ˈ㗙ᡞᏆ㒣㒘៤ⱘ㒘ᠧᬷˈৃҹ䯈䱭䯈⿏ࡼ1/ቯ㗠ϡᬍবᭈϾᇍ↨㒧ᵰDŽ ՟བˈ⫼᠋ৃҹ䗮䖛⒥ࡼpsqaltቯᇚϔϾࣙgq...psqalt......aswⱘᇍ↨㒧ᵰᬍЎ gq.......psqalt....aswˈህད䈵psqalt䖭݁Ͼ⅟䖲៤ϔϾᄫヺІDŽ䖭Ͼቯҷ᳓њে䖍ϔ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ4/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,5/15 ↑间隙符号,就好象残基岛向右方移动,同时一个间隙符号出现在岛的左边,这样整个对比 结果保留下来。关于编辑操作的完整列表见 Wi sconsi n软件包的 SeaLab指南 五、用操作( operations)和 Wi sconsi n软件包程序分析序列 旦序列加入并显示在 Sealab主窗口中,就可以运行任何 Wi sconsi n软件包中程序对其进行分 析。程序创建的输出文件列在 Output Manager窗口中(详见下文观察输出部分)。这些文件 有些可以重新加入到 ISegLab Edi tor或 SeaLab Li st模式中进行扩展或相关分析。此外,还有 几种简单的操作可以从 SeaLab Edi tor中直接运行。 执行简单操作 SeaLab Edi tor中的Edit菜单使用户可以对显示的序列进行一些简单的操作而不用运行程序。 这些操作包括翻译核酸序列,反转以及互补核酸序列,计算序列对比结果中的共有序列,寻 找短的序列特征模式。这些操作的优势在于运行迅速并且结果可以自动显示在 SeaLab Edi tor 中,从而可以直接进行编辑和注释,同时也是最重要的是其结果可以作为从 Functi ons菜单中 选中的 Wi sconsi n软件包程序的输入 选择一个操作的方法如下: 1。根据名称选择一个序列或一段序列。 选取Edit菜单中相应的操作选项 运行 Wi scans n软件包程序 Wi sconsi n软件包程序用于对 Sealab Edi tor中显示的序列进行更大规模的或更为鲁棒的分 析。所有可用的程序都列在 Functi ons菜单下并根据分析功能进行了分组。以作图功能组中的 Map程序为例。 运行 Ni sconsi n软件包中Map程序的方法如下: 1。根据名称选定一个序列或用光标选定一段序列 2。选取 Functi ons菜单中的 Mapp ng,然后选定Map选项 根据名称选定一个程序将为此程序打开一个 Program窗口。每个 Program窗口都有相同的基本 格式,其中包括选定的序列名称,运行此程序所需的参数,一组用于选择和存储可选参数的 按钮以及用于运行程序、关闭窗口和获取帮助的按钮。Map程序的 Program窗口如图4.3的左图 所示 用户可以选用参数的缺省值来运行程序,也可以通过 Program窗口中的按钮和文本框来改变参 数值。此外,每个程序都有其独有的一组可选择的参数,可用于修改程序进行的分析或改变 输出显示的方式。这些可选参数列于 Program Opti ons窗口中,当选定 Program窗口的 lOpti ons 按钮时 Program0 pti ons窗口将被打开。通过为Map程序选定必须的以及可选择的参数,用户 可以选择包含在一个限制性酶切图中的酶子集,使其只包含产生图上5突出端的酶,或选择 忽略作为限制性酶切图一部分正常所包含的反转互补链。Map0 ptions窗口如图4.3右图所 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
Ͼ䯈䱭ヺোˈህད䈵⅟ቯেᮍ⿏ࡼˈৠᯊϔϾ䯈䱭ヺোߎ⦃ቯⱘᎺ䖍ˈ䖭ḋᭈϾᇍ↨ 㒧ᵰֱ⬭ϟᴹDŽ݇Ѣ㓪䕥᪡ⱘᅠᭈ߫㸼㾕Wisconsin䕃ӊࣙⱘSeqLabᣛफDŽ Ѩǃ⫼᪡˄operations˅Wisconsin䕃ӊࣙᑣߚᵤᑣ߫DŽ ϔᮺᑣ߫ࡴܹᑊᰒ⼎SeqLabЏにষЁˈህৃҹ䖤㸠ӏԩWisconsin䕃ӊࣙЁᑣᇍ݊䖯㸠ߚ ᵤDŽᑣ߯ᓎⱘ䕧ߎ᭛ӊ߫Output ManagerにষЁ˄䆺㾕ϟ᭛㾖ᆳ䕧ߎ䚼ߚ˅DŽ䖭ѯ᭛ӊ ᳝ѯৃҹ䞡ᮄࡴܹࠄSeqLab EditorSeqLab ListᓣЁ䖯㸠ᠽሩⳌ݇ߚᵤDŽℸˈ䖬᳝ 辵ㅔऩⱘ᪡ৃҹҢSeqLab EditorЁⳈ䖤㸠DŽ ᠻ㸠ㅔऩ᪡ SeqLab EditorЁⱘEdit㦰ऩՓ⫼᠋ৃҹᇍᰒ⼎ⱘᑣ߫䖯㸠ϔѯㅔऩⱘ᪡㗠ϡ⫼䖤㸠ᑣDŽ 䖭ѯ᪡ࣙᣀ㗏䆥Ḍ䝌ᑣ߫ˈড䕀ҹঞѦ㸹Ḍ䝌ᑣ߫ˈ䅵ㅫᑣ߫ᇍ↨㒧ᵰЁⱘ᳝݅ᑣ߫ˈᇏ ᡒⷁⱘᑣ߫⡍ᕕᓣDŽ䖭ѯ᪡ⱘӬѢ䖤㸠䖙䗳ᑊϨ㒧ᵰৃҹ㞾ࡼᰒ⼎SeqLab Editor ЁˈҢ㗠ৃҹⳈ䖯㸠㓪䕥⊼䞞ˈৠᯊгᰃ᳔䞡㽕ⱘᰃ݊㒧ᵰৃҹЎҢFunctions㦰ऩЁ 䗝ЁⱘWisconsin䕃ӊࣙᑣⱘ䕧ܹDŽ 䗝ᢽϔϾ᪡ⱘᮍ⊩བϟ˖ DŽḍৡ⿄䗝ᢽϔϾᑣ߫ϔ↉ᑣ߫DŽ DŽ䗝পEdit㦰ऩЁⳌᑨⱘ᪡䗝乍DŽ 䖤㸠Wisconsin䕃ӊࣙᑣ Wisconsin䕃ӊࣙᑣ⫼ѢᇍSeqLab EditorЁᰒ⼎ⱘᑣ߫䖯㸠㾘ⱘЎ剕Ầⱘߚ ᵤDŽ᠔᳝ৃ⫼ⱘᑣ䛑߫Functions㦰ऩϟᑊḍߚᵤࡳ㛑䖯㸠њߚ㒘DŽҹࡳ㛑㒘Ёⱘ MapᑣЎ՟DŽ 䖤㸠Wisconsin䕃ӊࣙЁMapᑣⱘᮍ⊩བϟ˖ DŽḍৡ⿄䗝ᅮϔϾᑣ߫⫼ܝᷛ䗝ᅮϔ↉ᑣ߫DŽ DŽ䗝পFunctions㦰ऩЁⱘMapping, ✊ৢ䗝ᅮMap䗝乍DŽ ḍৡ⿄䗝ᅮϔϾᑣᇚЎℸᑣᠧᓔϔϾProgramにষDŽ↣ϾProgramにষ䛑᳝Ⳍৠⱘᴀ Ḑᓣˈ݊Ёࣙᣀ䗝ᅮⱘᑣ߫ৡ⿄ˈ䖤㸠ℸᑣ᠔䳔ⱘখ᭄ˈϔ㒘⫼Ѣ䗝ᢽᄬټৃ䗝খ᭄ⱘ ᣝ䪂ҹঞ⫼Ѣ䖤㸠ᑣǃ݇䯁にষ㦋পᐂࡽⱘᣝ䪂DŽMapᑣⱘProgramにষབ4.3ⱘᎺ ᠔⼎DŽ ⫼᠋ৃҹ䗝⫼খ᭄ⱘ㔎ⳕؐᴹ䖤㸠ᑣˈгৃҹ䗮䖛ProgramにষЁⱘᣝ䪂᭛ᴀḚᴹᬍবখ ᭄ؐDŽℸˈ↣Ͼᑣ䛑᳝݊⣀᳝ⱘϔ㒘ৃ䗝ᢽⱘখ᭄ˈৃ⫼Ѣׂᬍᑣ䖯㸠ⱘߚᵤᬍব 䕧ߎᰒ⼎ⱘᮍᓣDŽ䖭ѯৃ䗝খ᭄߫ѢProgram OptionsにষЁˈᔧ䗝ᅮProgramにষⱘOptions ᣝ䪂ᯊProgram Optionsにষᇚ㹿ᠧᓔDŽ䗮䖛ЎMapᑣ䗝ᅮᖙ乏ⱘҹঞৃ䗝ᢽⱘখ᭄ˈ⫼᠋ ৃҹ䗝ᢽࣙϔϾ䰤ࠊᗻ䝊ߛЁⱘ䝊ᄤ䲚ˈՓ݊াࣙѻ⫳Ϟ5'さߎッⱘ䝊ˈ䗝ᢽ ᗑ⬹Ў䰤ࠊᗻ䝊ߛϔ䚼ߚℷᐌ᠔ࣙⱘড䕀Ѧ㸹䫒DŽMap Optionsにষབ4.3ে᠔ ⼎DŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ5/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,6/15 选取 Program窗口中的Run按钮将使用选定的参数运行这一程序并关闭 Program窗口。如果一个 程序在同一个 SeaLab运行进程内再一次运行, Program窗口出现时会保留上一次选定的参数。 通过选定 Save Settings按钮可以在不同的 Sealab运行进程间保存选定的参数。在 Program窗 口中选取 GCG Defaul ts将把 Program和 Programs Options中的参数重新设为缺省值。所有的 Program窗口都有一个Help按钮用于访问此程序特定的在线帮助 六、观察输出 在 Sealab期间运行程序产生的输出文件列于 Output Manager窗口中(如图4.4所示) 打开 Output Manager窗口的方式如下 1。选取 Wi ndows菜单中的 Output Manager选项 这个窗口中列出的输出文件可以被显示或打印出来。单击 Di spl ay按钮可以显示窗口中被加亮 的那个文件。图4.4中给出了一个显示的输出文件的例子。单击 Print按钮可以把选定的文件 传送到网络打印机上。 对于以前启动的 SeaLab运行进程间产生的输出文件必须列在 Output Manager窗口中才能看到 或打印出来。选取 Add text files或 Add Graphi Cs Files按钮并且从出现的 file browser中 根据文件名选取相应文件。产生图形输出的程序将创建以 fi gure为扩展名的文件。当这种类 型的文件被选中要进行显示,它会被转换使其可以显示在一个X- li ndow中。当这种类型的文 件被选中进行打印,它会根据选择的打印机及其设置被转换为 PostScri pt或HPGL格式。 某些输出文件(序列文件,列表文件,MSF文件)可被加入 SeqLab Main Li st或 Edi tor中用作 Wi consin软件包程序的输入。如果在 Output Manager窗口中选中这样一个文件, Add to Main list以及 Add to edi tor按钮将处于激活状态(如图4.4所示)。如果选中的文件不能 加入这些窗口中,这些按钮将处于非激活状态。 七、监视程序执行过程并解决问题 每次 SeaLab进程执行期间运行的程序都记录在 Job Manager窗口中(如图4.5所示)。这个窗 口可从 SeaLab Mai n Wi ndow的 Wi ndows菜单条中访问到。 打开 Job Manager窗口的方法如下: 1。选中 Wi ndows菜单的 Job Manager选项 Job Manager窗口的上半部分是所有当前 SeaLab进程间运行的程序的事件记录。根据名称选中 相应程序即可监视此程序的状态。如果一个程序因某种原因运行失败,会在这个窗口中出现 条消息,并在0 utput Manager窗口中出现这个程序的一个事件文件。从这个窗口中也可以 终止正在运行的程序 八、给序列加注释并在 SeqLab Edi tor中图形化地显示注释。 Sealab有一个独特的特征即它链接到数据库条目的特征表格( Features tabl e)上。例如, file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
䗝পProgramにষЁⱘRunᣝ䪂ᇚՓ⫼䗝ᅮⱘখ᭄䖤㸠䖭ϔᑣᑊ݇䯁ProgramにষDŽབᵰϔϾ ᑣৠϔϾSeqLab䖤㸠䖯ݡݙϔ䖤㸠ˈProgramにষߎᯊ⦃Ӯֱ⬭Ϟϔ䗝ᅮⱘখ᭄DŽ 䗮䖛䗝ᅮSave Settingsᣝ䪂ৃҹϡৠⱘSeqLab䖤㸠䖯䯈ֱᄬ䗝ᅮⱘখ᭄DŽProgramに ষЁ䗝পGCG DefaultsᇚᡞProgramPrograms OptionsЁⱘখ᭄䞡ᮄ䆒Ў㔎ⳕؐDŽ᠔᳝ⱘ Programにষ䛑᳝ϔϾHelpᣝ䪂⫼Ѣ䆓䯂ℸᑣ⡍ᅮⱘ㒓ᐂࡽDŽ ߎǃ㾖ᆳ䕧݁ SeqLabᳳ䯈䖤㸠ᑣѻ⫳ⱘ䕧ߎ᭛ӊ߫ѢOutput ManagerにষЁ˄བ4.4᠔⼎˅DŽ ᠧᓔOutput Managerにষⱘᮍᓣབϟ˖ DŽ䗝পWindows㦰ऩЁⱘOutput Manager䗝乍DŽ 䖭ϾにষЁ߫ߎⱘ䕧ߎ᭛ӊৃҹ㹿ᰒ⼎ᠧॄߎᴹDŽऩߏDisplayᣝ䪂ৃҹᰒ⼎にষЁ㹿ࡴ҂ ⱘ䙷Ͼ᭛ӊDŽ4.4Ё㒭ߎњϔϾᰒ⼎ⱘ䕧ߎ᭛ӊⱘ՟ᄤDŽऩߏPrintᣝ䪂ৃҹᡞ䗝ᅮⱘ᭛ӊ Ӵ䗕ࠄ㔥㒰ᠧॄᴎϞDŽ ᇍѢҹࠡਃࡼⱘSeqLab䖤㸠䖯䯈ѻ⫳ⱘ䕧ߎ᭛ӊᖙ乏߫Output ManagerにষЁᠡ㛑ⳟࠄ ᠧॄߎᴹDŽ䗝পAdd Text FilesAdd Graphics Filesᣝ䪂ᑊϨҢߎ⦃ⱘfile browserЁ ḍ᭛ӊৡ䗝পⳌᑨ᭛ӊDŽѻ⫳ᔶ䕧ߎⱘᑣᇚ߯ᓎҹ.figureЎᠽሩৡⱘ᭛ӊDŽᔧ䖭⾡㉏ ൟⱘ᭛ӊ㹿䗝Ё㽕䖯㸠ᰒ⼎ˈᅗӮ㹿䕀ᤶՓ݊ৃҹᰒ⼎ϔϾX-windowЁDŽᔧ䖭⾡㉏ൟⱘ᭛ ӊ㹿䗝Ё䖯㸠ᠧॄˈᅗӮḍ䗝ᢽⱘᠧॄᴎঞ݊䆒㕂㹿䕀ᤶЎPostScriptHPGLḐᓣDŽ ᶤѯ䕧ߎ᭛ӊ˄ᑣ߫᭛ӊˈ߫㸼᭛ӊˈMSF᭛ӊ˅ৃ㹿ࡴܹSeqLab Main ListEditorЁ⫼ Wisconsin䕃ӊࣙᑣⱘ䕧ܹDŽབᵰOutput ManagerにষЁ䗝Ё䖭ḋϔϾ᭛ӊˈAdd to Main List ҹঞAdd to Editorᣝ䪂ᇚ໘Ѣ▔⌏⢊ᗕ˄བ4.4᠔⼎˅DŽབᵰ䗝Ёⱘ᭛ӊϡ㛑 ࡴܹ䖭ѯにষЁˈ䖭ѯᣝ䪂ᇚ໘Ѣ䴲▔⌏⢊ᗕDŽ ϗǃⲥ㾚ᑣᠻ㸠䖛ᑊ㾷އ䯂乬 ↣SeqLab䖯ᠻ㸠ᳳ䯈䖤㸠ⱘᑣ䛑䆄ᔩJob ManagerにষЁ˄བ4.5᠔⼎˅DŽ䖭Ͼに ষৃҢSeqLab Main WindowⱘWindows㦰ऩᴵЁ䆓䯂ࠄDŽ ᠧᓔJob Managerにষⱘᮍ⊩བϟ˖ DŽ䗝ЁWindows㦰ऩⱘJob Manager䗝乍DŽ Job ManagerにষⱘϞञ䚼ߚᰃ᠔᳝ᔧࠡSeqLab䖯䯈䖤㸠ⱘᑣⱘџӊ䆄ᔩDŽḍৡ⿄䗝Ё Ⳍᑨᑣेৃⲥ㾚ℸᑣⱘ⢊ᗕDŽབᵰϔϾᑣᶤ⾡ॳ䖤㸠༅䋹ˈӮ䖭ϾにষЁߎ⦃ ϔᴵ⍜ᙃˈᑊOutput ManagerにষЁߎ⦃䖭ϾᑣⱘϔϾџӊ᭛ӊDŽҢ䖭ϾにষЁгৃҹ 㒜ℶℷ䖤㸠ⱘᑣDŽ ܿǃ㒭ᑣ߫ࡴ⊼䞞ᑊSeqLab EditorЁᔶ࣪ഄᰒ⼎⊼䞞DŽ SeqLab᳝ϔϾ⣀⡍ⱘ⡍ᕕेᅗ䫒ࠄ᭄ᑧᴵⳂⱘ⡍ᕕ㸼Ḑ˄Features table˅ϞDŽ՟བˈ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ6/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,7/15 咳酸数据库的条目通常有关于位置、编码区、单独的内含子和外显子以及聚腺苷酸化位点的 特征。SwSS- PROTPI US条目通常有关于已知蛋白质模式 modi f的位置、翻译后修饰位点以及二 级结构的特征。这些特征可以在 SeqLab Edi tor中通过涂色残基( Features Col ori ng)或示意 图( Graphic Features)观察到。 选择特征显示方式的方法如下 1。选定 Di spl ay方式按钮中的 Features Col ori ng。 2。选定 Di spl ay方式按钮中的 Graphi cs Features 图4.6的上图给出了一组对比的数据库条目的图形特征显示的实例。 Sealab主窗口(图4.1) 中的1:1滑动条可用于改变示意图的水平比例 通过选取 Wi ndows菜单的 Features选项可以显示一个条目的数据库特征。这一操作将打开一个 Sequence Features窗口(图4.6)。用户可以选择观看所有的特征或是只看选中的那部分特 征。在 Sequence Features窗口上部区域选取一个特征时在下部区域中会显示关于这个特征的 详细信息。双击一个条目中的一个特征也可以打开这个窗口。 SeaLabε di tor另一个独特同时的也是非常有用的特征是可以增加特征或编辑现有特征。这一 操作可以在 Sequence Features和 Feature edi tor窗口中完成(图4.6)。 增加一个特征的方法如下: 1。用光标加亮一个区域(或在 Feature Edi tor的文本框中From和To区域中填上起止范 围) 2。选中 Wi ndows菜单的 Features选项 3。在 Sequence Features窗口中选中Add按钮。 。在 Feature Edi tor窗口中选中 Shape and col or按钮 5。在 Feature Edi tor窗口的关键词文本框中键入特征名。 6。在 Feature Edi tor出口的 Comments域中键入详细的注释。 7。单击K按钮和Cose按钮。 编辑一个特征的方法如下 1。选中 Wi ndows菜单的 Features选项。 2。在 Sequence Features窗口中选中要编辑的特征。 3。在 Sequence Features窗口中选中Edit按钮。 4。修改 Feature edi tor窗口中的形状、颜色、范围、关键词或注释。 5。单击0K按钮和 Close按钍 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
Ḍ䝌᭄ᑧⱘᴵⳂ䗮ᐌ᳝݇Ѣԡ㕂ǃ㓪ⷕऎǃऩ⣀ⱘݙᄤᰒᄤҹঞ㘮㝎㣋䝌࣪ԡ⚍ⱘ ⡍ᕕDŽSWISS-PROTPlusᴵⳂ䗮ᐌ᳝݇ѢᏆⶹ㲟ⱑ䋼ᓣmodifⱘԡ㕂ǃ㗏䆥ৢׂ佄ԡ⚍ҹঞѠ 㑻㒧ᵘⱘ⡍ᕕDŽ䖭ѯ⡍ᕕৃҹSeqLab EditorЁ䗮䖛⍖㡆⅟˄Features Coloring)⼎ᛣ ˄Graphic Features˅㾖ᆳࠄDŽ 䗝ᢽ⡍ᕕᰒ⼎ᮍᓣⱘᮍ⊩བϟ˖ DŽ䗝ᅮDisplayᮍᓣᣝ䪂ЁⱘFeatures ColoringDŽ DŽ䗝ᅮDisplayᮍᓣᣝ䪂ЁⱘGraphics FeaturesDŽ 4.6ⱘϞ㒭ߎњϔ㒘ᇍ↨ⱘ᭄ᑧᴵⳂⱘᔶ⡍ᕕᰒ⼎ⱘᅲ՟DŽSeaLabЏにষ˄4.1˅ Ёⱘ˖⒥ࡼᴵৃ⫼Ѣᬍব⼎ᛣⱘ∈ᑇ↨՟DŽ 䗮䖛䗝পWindows㦰ऩⱘFeatures䗝乍ৃҹᰒ⼎ϔϾᴵⳂⱘ᭄ᑧ⡍ᕕDŽ䖭ϔ᪡ᇚᠧᓔϔϾ Sequence Featuresにষ˄4.6˅DŽ⫼᠋ৃҹ䗝ᢽ㾖ⳟ᠔᳝ⱘ⡍ᕕᰃাⳟ䗝Ёⱘ䙷䚼ߚ⡍ ᕕDŽSequence FeaturesにষϞ䚼ऎඳ䗝পϔϾ⡍ᕕᯊϟ䚼ऎඳЁӮᰒ⼎݇Ѣ䖭Ͼ⡍ᕕⱘ 䆺㒚ֵᙃDŽঠߏϔϾᴵⳂЁⱘϔϾ⡍ᕕгৃҹᠧᓔ䖭ϾにষDŽ SeqLab EditorϔϾ⣀⡍ৠᯊⱘгᰃ䴲ᐌ᳝⫼ⱘ⡍ᕕᰃৃҹࡴ⡍ᕕ㓪䕥⦄᳝⡍ᕕDŽ䖭ϔ ᪡ৃҹSequence FeaturesFeature EditorにষЁᅠ៤˄4.6˅DŽ ࡴϔϾ⡍ᕕⱘᮍ⊩བϟ˖ DŽ⫼ܝᷛࡴ҂ϔϾऎඳ˄Feature Editorⱘ᭛ᴀḚЁFromToऎඳЁ฿Ϟ䍋ℶ㣗 ೈ˅DŽ DŽ䗝ЁWindows㦰ऩⱘFeatures䗝乍DŽ DŽSequence FeaturesにষЁ䗝ЁAddᣝ䪂DŽ DŽFeature EditorにষЁ䗝ЁShape and Colorᣝ䪂DŽ DŽFeature Editorにষⱘ݇䬂䆡᭛ᴀḚЁ䬂ܹ⡍ᕕৡDŽ DŽFeature EditorߎষⱘCommentsඳЁ䬂ܹ䆺㒚ⱘ⊼䞞DŽ DŽऩߏOKᣝ䪂Closeᣝ䪂DŽ 㓪䕥ϔϾ⡍ᕕⱘᮍ⊩བϟ˖ DŽ䗝ЁWindows㦰ऩⱘFeatures䗝乍DŽ DŽSequence FeaturesにষЁ䗝Ё㽕㓪䕥ⱘ⡍ᕕDŽ DŽSequence FeaturesにষЁ䗝ЁEditᣝ䪂DŽ DŽׂᬍFeature EditorにষЁⱘᔶ⢊ǃ买㡆ǃ㣗ೈǃ݇䬂䆡⊼䞞DŽ DŽऩߏOKᣝ䪂Closeᣝ䪂DŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ7/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,8/15 九、在 SeqLab Edi tor中保存序列 当用户退出 Sealab Edi tor模式或保存编辑的工作时,信息被保存在一个富含序列格式文件 (RSF)中。这是一种新型文件,它包含了序列的参考信息和特征信息以及序列本身。RSF文 件格式允许特征信息显示在 SeaLab Edi tor中。RSF文件可以包含一个或多个序列条目。如果 数据库条目被保存,这些条目的复制件(包括所有的参考信息和特征表格信息)都被包含在 这个RSF文件中。以这种方式创建的RSF文件自动添加到显示在 SeaLab List模式下的当前列表 文件中并存储在用户的工作目录里 十、在 SeaLab中可以实现的分析实例 Sealab中可以使用多个序列分析程序的特性使用户可以应用这些程序顺序地回答相关问题或 在对输入序列进行编辑后重复某项分析。而可以同时访问公用数据库和本机序列的优点使用 户可以在一个分析中使用其中任意一种而不用先进行转换或格式化的工作。这一部分中介绍 了6种用 SeaLab可以解决的序列分析问题。 在两条mRNA中寻找开放阅读框架,翻译并对比RNA与蛋白质序列。 对两条相关的mRNA进行测序的用户可能希望寻找开放阅读框架(0RF)、翻译以及进行核酸与 氨基酸序列间的两两对比。 把序列加入 SeaLab Edi tor中,从 Functi ons菜单中选中Map选项运行Map程序。Map输出文件包 含了限制性酶切图和6种可能的翻译框架的0RF的显示。这些0RF的起始和终止位置可进行标记 并选为 SeaLab Edi tor中序列显示的范围,然后可用Edit菜单的 Transl ate操作进行翻译。翻 译结果自动出现在 SeaLab Edi tor中 两条相关的核酸或蛋白质序列可用Gap程序( Needl eman and Wunsch,1970)或 BestFi t ( Smi th and Waterman,1981)程序进行对比。Gap程序寻找两条序列间的全局最优对比结果 适用于两条待比对的序列是进化相关的情况。 BestFi t程序寻找两条序列的局部最优对比结 果,它适用于两条序列不是进化相关而是功能相关的情况。 通过参考搜索寻找数据库中的相关条目并进行对比 研究一个特征序列家族成员的用户可能希望寻找这个家族中的其它成员并建立它们的多序列 对 从 Functi ons菜单中选取Lookψp程序。 LookUp在数据库条目的参考信息部分搜索描述词并建立 匹配条目的列表( Etzol d and argos,1993; Etzold et al.,1996)。在参考部分的 Defi ni ton, Author, Keyword和 Organi sm域中搜索描述词并在词之间使用“and"(&)、 or”(|)以及“ but not"(!)布尔表达式。例如,在SWSS-PROT条目的 Descri pti on域 搜索“ I actate& dehydrogenase&h& chai n"将产生一个输出文件,其中列出了乳酸脱氢 酶H链( l actate dehydrogenase H chain)条目。这个输出文件可以从 Output Manager窗 口中加以显示,然后与用户的序列一起添加到 SeaLab Edi tor中。 要创建所有这些序列的多序列对比,只要根据序列名称选中这些序列并从 Functi ons菜单中运 行 PileUp程序。由 PileUp产生的多序列文件也列在 Output Manager窗口中并可以直接添加到 SeaLab Edi tor中。推荐釆用这一步的原因在于数据库条目的特征表格( Features tabl e)信 息可与对比结果一起被包括进来。必要时对比结果是可以被编辑的,并且如果数据库条目有 相似的特征,这些特征可被附加给用户序列。 LookUp程序窗口,输出文件以及输出文件中的 序列对比结果如图4.7所示。 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
бǃSeqLab EditorЁֱᄬᑣ߫ ᔧ⫼᠋䗔ߎSeqLab Editorᓣֱᄬ㓪䕥ⱘᎹᯊˈֵᙃ㹿ֱᄬϔϾᆠᑣ߫Ḑᓣ᭛ӊ ˄RSF˅ЁDŽ䖭ᰃϔ⾡ᮄൟ᭛ӊˈᅗࣙњᑣ߫ⱘখ㗗ֵᙃ⡍ᕕֵᙃҹঞᑣ߫ᴀ䑿DŽRSF᭛ ӊḐᓣܕ䆌⡍ᕕֵᙃᰒ⼎SeqLab EditorЁDŽRSF᭛ӊৃҹࣙϔϾϾᑣ߫ᴵⳂDŽབᵰ ᭄ᑧᴵⳂ㹿ֱᄬˈ䖭ѯᴵⳂⱘࠊӊ˄ࣙᣀ᠔᳝ⱘখ㗗ֵᙃ⡍ᕕ㸼Ḑֵᙃ˅䛑㹿ࣙ 䖭ϾRSF᭛ӊЁDŽҹ䖭⾡ᮍᓣ߯ᓎⱘRSF᭛ӊ㞾ࡼ⏏ࠄࡴᰒ⼎SeqLab Listᓣϟⱘᔧࠡ߫㸼 ᭛ӊЁᑊᄬټ᠋⫼ⱘᎹⳂᔩ䞠DŽ कǃSeqLabЁৃҹᅲ⦄ⱘߚᵤᅲ՟DŽ SeqLabЁৃҹՓ⫼Ͼᑣ߫ߚᵤᑣⱘ⡍ᗻՓ⫼᠋ৃҹᑨ⫼䖭ѯᑣ乎ᑣഄಲㄨⳌ݇䯂乬 ᇍ䕧ܹᑣ߫䖯㸠㓪䕥ৢ䞡ᶤ乍ߚᵤDŽ㗠ৃҹৠᯊ䆓䯂݀⫼᭄ᑧᴀᴎᑣ߫ⱘӬ⚍Փ⫼ ᠋ৃҹϔϾߚᵤЁՓ⫼݊Ёӏᛣϔ⾡㗠ϡ⫼ܜ䖯㸠䕀ᤶḐᓣ࣪ⱘᎹDŽ䖭ϔ䚼ߚЁҟ㒡 њ⾡⫼SeqLabৃҹ㾷އⱘᑣ߫ߚᵤ䯂乬DŽ ϸᴵmRNAЁᇏᡒᓔᬒ䯙䇏Ḛᶊˈ㗏䆥ᑊᇍ↨RNAϢ㲟ⱑ䋼ᑣ߫DŽ ᇍϸᴵⳌ݇ⱘmRNA䖯㸠⌟ᑣⱘ⫼᠋ৃ㛑Ꮰᳯᇏᡒᓔᬒ䯙䇏Ḛᶊ˄ORF˅ǃ㗏䆥ҹঞ䖯㸠Ḍ䝌Ϣ ⇼䝌ᑣ߫䯈ⱘϸϸᇍ↨DŽ ᡞᑣ߫ࡴܹSeqLab EditorЁˈҢFunctions㦰ऩЁ䗝ЁMap䗝乍䖤㸠MapᑣDŽMap䕧ߎ᭛ӊࣙ њ䰤ࠊᗻ䝊ߛৃ辵㛑ⱘ㗏䆥ḚᶊⱘORFⱘᰒ⼎DŽ䖭ѯORFⱘ䍋ྟ㒜ℶԡ㕂ৃ䖯㸠ᷛ䆄 ᑊ䗝ЎSeqLab EditorЁᑣ߫ᰒ⼎ⱘ㣗ೈˈ✊ৢৃ⫼Edit㦰ऩⱘTranslate᪡䖯㸠㗏䆥DŽ㗏 䆥㒧ᵰ㞾ߎࡼ⦃SeqLab EditorЁDŽ ϸᴵⳌ݇ⱘḌ䝌㲟ⱑ䋼ᑣ߫ৃ⫼Gapᑣ˄Needleman and Wunsch, 1970˅BestFit (Smith and Waterman, 1981)ᑣ䖯㸠ᇍ↨DŽGapᑣᇏᡒϸᴵᑣ߫䯈ⱘܼሔ᳔Ӭᇍ↨㒧ᵰDŽ 䗖⫼Ѣϸᴵᕙ↨ᇍⱘᑣ߫ᰃ䖯࣪Ⳍ݇ⱘᚙމDŽBestFitᑣᇏᡒϸᴵᑣ߫ⱘሔ䚼᳔Ӭᇍ↨㒧 ᵰˈᅗ䗖⫼Ѣϸᴵᑣ߫ϡᰃ䖯࣪Ⳍ݇㗠ᰃࡳ㛑Ⳍ݇ⱘᚙމDŽ 䗮䖛খ㗗᧰㋶ᇏᡒ᭄ᑧЁⱘⳌ݇ᴵⳂᑊ䖯㸠ᇍ↨ ⷨおϔϾ⡍ᕕᑣ߫ᆊᮣ៤ਬⱘ⫼᠋ৃ㛑Ꮰᳯᇏᡒ䖭ϾᆊᮣЁⱘ݊ᅗ៤ਬᑊᓎゟᅗӀⱘᑣ߫ ᇍ↨DŽ ҢFunctions㦰ऩЁ䗝পLookUpᑣDŽLookUp᭄ᑧᴵⳂⱘখ㗗ֵᙃ䚼ߚ᧰㋶ᦣ䗄䆡ᑊᓎゟ ऍ䜡ᴵⳂⱘ߫㸼˄Etzold and Argos, 1993; Etzold et al., 1996˅DŽখ㗗䚼ߚⱘ Definiton, Author, KeywordOrganismඳЁ᧰㋶ᦣ䗄䆡ᑊ䆡П䯈Փ⫼“and”˄ ˅ǃ “or”˄_˅ҹঞ“but not”˄ʽ˅Ꮧᇨ㸼䖒ᓣDŽ՟བˈSWISS-PROTᴵⳂⱘDescriptionඳ ᧰㋶“lactate & dehydrogenase & h & chain”ᇚѻ⫳ϔϾ䕧ߎ᭛ӊˈ݊Ё߫ߎњч䝌㜅⇶ 䝊 H 䫒˄lactate dehydrogenase H chain˅ᴵⳂDŽ䖭Ͼ䕧ߎ᭛ӊৃҹҢOutput Managerに ষЁࡴҹᰒ⼎ˈ✊ৢϢ⫼᠋ⱘᑣ߫ϔ䍋⏏ࠄࡴSeqLab EditorЁDŽ 㽕߯ᓎ᠔᳝䖭ѯᑣ߫ⱘᑣ߫ᇍ↨ˈা㽕ḍᑣ߫ৡ⿄䗝Ё䖭ѯᑣ߫ᑊҢFunctions㦰ऩЁ䖤 㸠PileUpᑣDŽ⬅PileUpѻ⫳ⱘᑣ߫᭛ӊг߫Output ManagerにষЁᑊৃҹⳈ⏏ࠄࡴ SeqLab EditorЁDŽ㤤䞛⫼䖭ϔℹⱘॳѢ᭄ᑧᴵⳂⱘ⡍ᕕ㸼Ḑ˄Features table˅ֵ ᙃৃϢᇍ↨㒧ᵰϔ䍋㹿ࣙᣀ䖯ᴹDŽᖙ㽕ᯊᇍ↨㒧ᵰᰃৃҹ㹿㓪䕥ⱘˈᑊϨབᵰ᭄ᑧᴵⳂ᳝ ⳌԐⱘ⡍ᕕˈ䖭ѯ⡍ᕕৃ㹿䰘ࡴ㒭⫼᠋ᑣ߫DŽLookUpᑣにষˈ䕧ߎ᭛ӊҹঞ䕧ߎ᭛ӊЁⱘ ᑣ߫ᇍ↨㒧ᵰབ4.7᠔⼎DŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ8/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,9/15 用查询序列搜索数据库,将找到的条目与查询序列进行对比并产生进化系统树 克隆并测序一个未知功能基因的用户可能希望在一个数据库中搜索相似的序列。如果搜索到 了,用户可能进一步希望创建与查询序列最相似的序列的多序列对比并产生数据的种系图 Edi tor中添加一个查询序列并从 Functi ons菜单中选取 FASTA程序。 FASTA程序 ( Pearson and Li pman,1988)在数据库中搜索与查询序列相似的序列。输出文件可从 Output Manager窗口中加以显示并直接添加到 SeaLab Edi tor中。在这个输出文件中数据库条目与查 询序列局部相似性最好的区域被加以标记。如果要显示的话,每个数据库条目只有这种区域 可以显示在 SeaLab Edi tor中。不要的条目可以从 SeqLab Edi tor中一起被删除 从 Functi ons菜单中选中Pi!eup程序创建这些序列的多序列对比。输出可从 Output Manager窗 口中加以显示并添加到 Sealab Edi to中更新已经存在的未对比序列。必要时可对这一对比结 果进行编辑,并且数据库条目的有用的特征表格信息也可以添加给査询序列 从 Functi ons菜单中选取 PaupSearch程序,程序提供了一个PAUP(进化系统简约性分析 ( Phyl ogenetic Anal ysi s Usi ng Parsi mony))( Swofford,1996)中树搜索方式的GC接 口。 PaupDi spl ay程序为PAUP中的树操作,鉴定以及显示方式提供了一个GC接口。 FASTA搜索 的输出,前6个序列的对比结果以及这一对比结果产生的进化树如图4.8所示 拼接交叠序列片段产生一连续序列,寻找并翻译这一序列的编码区域并在数据库中搜索相似 序列 克隆了一个基因,把它分解克隆为一组有交叠的序列片段并进行了测序的用户可能希望把这 些序列片段重新组装为一条连续的序列。一旦 conti g拼接完成,用户可能希望在序列中寻找 阅读框架,翻译并在数据库中搜索相似序列 Fragment Assmbly System的程序可用于拼接交叠序列片段。 Gel Start程序创建一个项目 Gel Enter程序把序列片段复制到项目中。 Gel Merge程序寻找片段之间的交叠并把它们拼接成 conti g。 Gel assembl e程序是一个编辑器,可用于编辑这些连续的部分并解决片段之间的冲突 问题。所有这些程序都可以从 Functi ons菜单中选取。一旦拼接完成,最终构成此 conti g的连 续序列可以被保存为一个序列文件并添加到 SeqLab Edi tor中。 使用Map、 Frames、 Test Code( Fiekett,1982)或 Codon preference( Gri skov et al.1983 程序可预测序列中的编码区(所有这些程序可以从 Functi ons菜单中选中)。使用Edit菜单的 Sel ect Range功能选择这些程序预测的区域并使用Edit菜单中的翻译操作把它们翻译为蛋白 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
⫼ᶹ䆶ᑣ߫᧰㋶᭄ᑧˈᇚᡒࠄⱘᴵⳂϢᶹ䆶ᑣ߫䖯㸠ᇍ↨ᑊѻ⫳䖯࣪LTD㒳ᷥ ܟ䱚ᑊ⌟ᑣϔϾⶹࡳ㛑ⱘ⫼᠋ৃ㛑ᏠᳯϔϾ᭄ᑧЁ᧰㋶ⳌԐⱘᑣ߫DŽབᵰ᧰㋶ࠄ њˈ⫼᠋ৃ㛑䖯ϔℹᏠᳯ߯ᓎϢᶹ䆶ᑣ᳔߫ⳌԐⱘᑣ߫ⱘᑣ߫ᇍ↨ᑊѻ⫳᭄ⱘ⾡㋏DŽ ᕔSeqLab EditorЁ⏏ࡴϔϾᶹ䆶ᑣ߫ᑊҢFunctions㦰ऩЁ䗝পFASTAᑣDŽFASTAᑣ (Pearson and Lipman, 1988)᭄ᑧЁ᧰㋶Ϣᶹ䆶ᑣ߫ⳌԐⱘᑣ߫DŽ䕧ߎ᭛ӊৃҢOutput ManagerにষЁࡴҹᰒ⼎ᑊⳈ⏏ࠄࡴSeqLab EditorЁDŽ䖭Ͼ䕧ߎ᭛ӊЁ᭄ᑧᴵⳂϢᶹ 䆶ᑣ߫ሔ䚼ⳌԐᗻ᳔དⱘऎඳ㹿ࡴҹᷛ䆄DŽབᵰ㽕ᰒ⼎ⱘ䆱ˈ↣Ͼ᭄ᑧᴵⳂা᳝䖭⾡ऎඳ ৃҹᰒ⼎SeqLab EditorЁDŽϡ㽕ⱘᴵⳂৃҹҢSeqLab EditorЁϔ䍋㹿ߴ䰸DŽ ҢFunctions㦰ऩЁ䗝ЁPileUpᑣ߯ᓎ䖭ѯᑣ߫ⱘᑣ߫ᇍ↨DŽ䕧ߎৃҢOutput Managerに ষЁࡴҹᰒ⼎ᑊ⏏ࠄࡴSeqLab EditorЁᮄᏆ㒣ᄬⱘᇍ↨ᑣ߫DŽᖙ㽕ᯊৃᇍ䖭ϔᇍ↨㒧 ᵰ䖯㸠㓪䕥ˈᑊϨ᭄ᑧᴵⳂⱘ᳝⫼ⱘ⡍ᕕ㸼Ḑֵᙃгৃҹ⏏ࡴ㒭ᶹ䆶ᑣ߫DŽ ҢFunctions㦰ऩЁ䗝পPaupSearchᑣˈᑣᦤկњϔϾPAUP˄䖯࣪LTD㒳ㅔ㑺ᗻߚᵤ ˄Phylogenetic Analysis Using Parsimony˅˅(Suofford, 1996)Ёᷥ᧰㋶ᮍᓣⱘGCG ষDŽPaupDisplayᑣЎPAUPЁⱘᷥ᪡ˈ䡈ᅮҹঞᰒ⼎ᮍᓣᦤկњϔϾGCGষDŽFASTA᧰㋶ ⱘ䕧ߎࠡˈϾᑣ߫ⱘᇍ↨㒧ᵰҹঞ䖭ϔᇍ↨㒧ᵰѻ⫳ⱘ䖯࣪ᷥབ4.8᠔⼎DŽ ᣐѸᑣ߫⠛↉ѻ⫳ϔ䖲㓁ᑣ߫ˈᇏᡒᑊ㗏䆥䖭ϔᑣ߫ⱘ㓪ⷕऎඳᑊ᭄ᑧЁ᧰㋶ⳌԐ ᑣ߫ ܟ䱚њϔϾˈᡞᅗߚ㾷ܟ䱚Ўϔ㒘᳝Ѹⱘᑣ߫⠛↉ᑊ䖯㸠њ⌟ᑣⱘ⫼᠋ৃ㛑Ꮰᳯᡞ䖭 ѯᑣ߫⠛↉䞡ᮄ㒘㺙Ўϔᴵ䖲㓁ⱘᑣ߫DŽϔᮺcontigᣐᅠ៤ˈ⫼᠋ৃ㛑Ꮰᳯᑣ߫Ёᇏᡒ 䯙䇏Ḛᶊˈ㗏䆥ᑊ᭄ᑧЁ᧰㋶ⳌԐᑣ߫DŽ Fragment Assmbly Systemⱘᑣৃ⫼ѢᣐѸᑣ߫⠛↉DŽGelStartᑣ߯ᓎϔϾ乍ⳂDŽ GelEnterᑣᡞᑣ߫⠛↉ࠄࠊ乍ⳂЁDŽGelMergeᑣᇏᡒ⠛↉П䯈ⱘѸᑊᡞᅗӀᣐ៤ contigDŽGelAssembleᑣᰃϔϾ㓪䕥఼ˈৃ⫼Ѣ㓪䕥䖭ѯ䖲㓁ⱘ䚼ߚᑊ㾷އ⠛↉П䯈ⱘކさ 䯂乬DŽ᠔᳝䖭ѯᑣ䛑ৃҹҢFunctions㦰ऩЁ䗝পDŽϔᮺᣐᅠ៤ˈ᳔㒜ᵘ៤ℸcontigⱘ䖲 㓁ᑣ߫ৃҹ㹿ֱᄬЎϔϾᑣ߫᭛ӊᑊ⏏ࠄࡴSeqLab EditorЁDŽ Փ⫼MapǃFramesǃTestCode(Fiekett, 1982)Codon Preference(Gribskov et al., 1983) ᑣৃ乘⌟ᑣ߫Ёⱘ㓪ⷕऎ˄᠔᳝䖭ѯᑣৃҹҢFunctions㦰ऩЁ䗝Ё˅DŽՓ⫼Edit㦰ऩⱘ Select Rangeࡳ㛑䗝ᢽ䖭ѯᑣ乘⌟ⱘऎඳᑊՓ⫼Edit㦰ऩЁⱘ㗏䆥᪡ᡞᅗӀ㗏䆥Ў㲟ⱑ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ9/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
第四章应用GCG进行序列分析 页码,10/15 。这些提出的翻译区域也可以作为核酸共有序列的特征被加入, 选取蛋白质序列然后选择 Functi ons菜单中 BLAST( Al tschul et al.,1990)。 BLAST程序在 数据库中搜索与査询序列相似的条目,此程序既可以进行远程搜索也可以进行本机搜索。搜 索结果可以从 Output Manager窗口中加以显示。如果被搜索的是一个本机的数据库,结果文 件可以加入 SeaLab Edi tor或 Main li st窗口中,并允许对找到的序列进行进一步分析 对比相关的蛋白质序列,计算对比结果的共有序列,辨识序列中新的特征序列模式,在数据 库中搜索包含此模式的序列或在对比结果的共有序列中搜索已知的蛋白质模式 辨识了一组相关序列的用户可能希望对其进行对比并计算对比结果的共有序列。如果可以在 对比结果中找到保守模式,用户可能希望在数据库中搜索包含这种模式的其它序列。用户可 能还希望在计算出的共有序列搜索已知的蛋白质模式 选取待对比的序列,从 Functi ons菜单中选取 Pi eUp程序创建多序列对比, PileUp程序的输出 文件可从0 utput Manager窗口中加以显示并添加到 SeaLab Edi tor中。用户可以对对比结果的 某个区域重新加以对比并以此替换原有的对比结果。只要选取一个区域并重新运行 Pi l eUp即 可。从 PileUp Opti ons窗口中选取" real i gn a porti on of an exi sting al i gnment(重新对 比一个已存在的对比结果的一部分)",这可能有利于选择一个替代评分矩阵或不同的创建和 扩展处罚。新的输出文件将包含最初的对比结果以及替换原始对比结果的重新对比的区域 用Edⅰt菜单中 Consensus操作计算对比结果的共有序列。如果保守模式可被辨识,从 Functi ons菜单中选取 FindPatterns选项。从共有序列中剪切下此特征序列模式并把它粘贴到 Fi ndPatterns模式选择器中,并在数据库中搜索包含这一模式的序列。 此外,运行 Motif程序可在共有序列中搜索已知的蛋白质模式。 Motif在蛋白质序列中搜索在 PR0STE,蛋白质位点和模式的PR0S|TE字典中已知的蛋白质模式( Bai roch et al 1997)。如果辨识出一个 Motif,则给所有序列增加一个特征,并标出它的位置。图4.9显示 了一个蛋白质序列的匹配、一个共有序列以及 Motif搜索的结果。 使用 Profi le进行相似性搜索并对比相关序列 序列分析的一个新的扩展领域是 Profile技术。一个 profile是一个位置特定的评分矩阵,它 包含了一个序列对比结果中每个位置的所有残基信息。这一点与共有序列不同,共有序列中 只包含每个位置的保守残基的信息。 Profile做好后可用于搜索数据库、数据库划分或在一个 集合中搜索与原始对比结果中的序列相似的序列。它也可以用于把一条单独的序列与一个对 比结果进行对比 使用 Profi l eMake程序( Gri skov et al 1987,1990)可创建一个序列对比结果的 profi le。使用 Profi l esearch程序可用 profi le对数据库进行搜索, Profi l sEgment程序可以 显示搜索结果( Gri skov et a.,1987,.1990)。使用 Profi l eGap程序可将一个序列与 profi le进行对比( Gri skov et al.1987,1990)。 Profi l emake, Profi l esearch, Profi l sEgments以及 Profi l eGap程序都可以从 Functi ons菜单中启动。 file://E:wcb生物信息学(中译本)\第四章应用GCG进行序列分析.htm 2005-1-18
䋼DŽ䖭ѯᦤߎⱘ㗏䆥ऎඳгৃҹЎḌ䝌᳝݅ᑣ߫ⱘ⡍ᕕ㹿ࡴܹDŽ 䗝প㲟ⱑ䋼ᑣ߫✊ৢ䗝ᢽFunctions㦰ऩЁBLAST˄Altschul et al., 1990˅DŽBLASTᑣ ᭄ᑧЁ᧰㋶Ϣᶹ䆶ᑣ߫ⳌԐⱘᴵⳂˈℸᑣ᮶ৃҹ䖯㸠䖰᧰㋶гৃҹ䖯㸠ᴀᴎ᧰㋶DŽ᧰ ㋶㒧ᵰৃҹҢOutput ManagerにষЁࡴҹᰒ⼎DŽབᵰ㹿᧰㋶ⱘᰃϔϾᴀᴎⱘ᭄ᑧˈ㒧ᵰ᭛ ӊৃҹࡴܹSeqLab EditorMain ListにষЁˈᑊܕ䆌ᇍᡒࠄⱘᑣ߫䖯㸠䖯ϔℹߚᵤDŽ ᇍ↨Ⳍ݇ⱘ㲟ⱑ䋼ᑣ߫ˈ䅵ㅫᇍ↨㒧ᵰⱘ᳝݅ᑣ߫ˈ䕼䆚ᑣ߫Ёᮄⱘ⡍ᕕᑣ߫ᓣˈ᭄ ᑧЁ᧰㋶ࣙℸᓣⱘᑣ߫ᇍ↨㒧ᵰⱘ᳝݅ᑣ߫Ё᧰㋶Ꮖⶹⱘ㲟ⱑ䋼ᓣ 䕼䆚њϔ㒘Ⳍ݇ᑣ߫ⱘ⫼᠋ৃ㛑Ꮰᳯᇍ݊䖯㸠ᇍ↨ᑊ䅵ㅫᇍ↨㒧ᵰⱘ᳝݅ᑣ߫DŽབᵰৃҹ ᇍ↨㒧ᵰЁᡒࠄֱᅜᓣˈ⫼᠋ৃ㛑Ꮰᳯ᭄ᑧЁ᧰㋶ࣙ䖭⾡ᓣⱘ݊ᅗᑣ߫DŽ⫼᠋ৃ 㛑䖬Ꮰᳯ䅵ㅫߎⱘ᳝݅ᑣ߫᧰㋶Ꮖⶹⱘ㲟ⱑ䋼ᓣDŽ 䗝পᕙᇍ↨ⱘᑣ߫ˈҢFunctions㦰ऩЁ䗝পPileUpᑣ߯ᓎᑣ߫ᇍ↨ˈPileUpᑣⱘ䕧ߎ ᭛ӊৃҢOutput ManagerにষЁࡴҹᰒ⼎ᑊ⏏ࠄࡴSeqLab EditorЁDŽ⫼᠋ৃҹᇍᇍ↨㒧ᵰⱘ ᶤϾऎඳ䞡ᮄࡴҹᇍ↨ᑊҹℸ᳓ᤶॳ᳝ⱘᇍ↨㒧ᵰDŽা㽕䗝পϔϾऎඳᑊ䞡ᮄ䖤㸠PileUpे ৃDŽҢPileUp OptionsにষЁ䗝প"realign a portion of an existing alignment˄䞡ᮄᇍ ↨ϔϾᏆᄬⱘᇍ↨㒧ᵰⱘϔ䚼ߚˈ˅䖭ৃ㛑᳝߽Ѣ䗝ᢽϔϾ᳓ҷ䆘ߚⶽ䰉ϡৠⱘ߯ᓎ ᠽሩ໘㔮DŽᮄⱘ䕧ߎ᭛ӊᇚ᳔ࣙ߱ⱘᇍ↨㒧ᵰҹঞ᳓ᤶॳྟᇍ↨㒧ᵰⱘ䞡ᮄᇍ↨ⱘऎඳDŽ ⫼Edit㦰ऩЁConsensus᪡䅵ㅫᇍ↨㒧ᵰⱘ᳝݅ᑣ߫DŽབᵰֱᅜᓣৃ㹿䕼䆚ˈҢ Functions㦰ऩЁ䗝পFindPatterns䗝乍DŽҢ᳝݅ᑣ߫Ёߛ࠾ϟℸ⡍ᕕᑣ߫ᓣᑊᡞᅗ㉬䌈ࠄ FindPatternsᓣ䗝ᢽ఼Ёˈᑊ᭄ᑧЁ᧰㋶ࣙ䖭ϔᓣⱘᑣ߫DŽ ℸˈ䖤㸠Motifᑣৃ᳝݅ᑣ߫Ё᧰㋶Ꮖⶹⱘ㲟ⱑ䋼ᓣDŽMotif㲟ⱑ䋼ᑣ߫Ё᧰㋶ PROSITEˈ㲟ⱑ䋼ԡ⚍ᓣⱘPROSITEᄫЁᏆⶹⱘ㲟ⱑ䋼ᓣ˄Bairoch et al., 1997˅DŽབᵰ䕼䆚ߎϔϾMotifˈ߭㒭᠔᳝ᑣ߫ࡴϔϾ⡍ᕕˈᑊᷛߎᅗⱘԡ㕂DŽ4.9ᰒ⼎ њϔϾ㲟ⱑ䋼ᑣ߫ⱘऍ䜡ǃϔϾ᳝݅ᑣ߫ҹঞMotif᧰㋶ⱘ㒧ᵰDŽ Փ⫼Profile䖯㸠ⳌԐᗻ᧰㋶ᑊᇍ↨Ⳍ݇ᑣ߫ ᑣ߫ߚᵤⱘϔϾᮄⱘᠽሩ乚ඳᰃProfileᡔᴃDŽϔϾprofileᰃϔϾԡ㕂⡍ᅮⱘ䆘ߚⶽ䰉ˈᅗ ࣙњϔϾᑣ߫ᇍ↨㒧ᵰЁ↣Ͼԡ㕂ⱘ᠔᳝⅟ֵᙃDŽ䖭ϔ⚍Ϣ᳝݅ᑣ߫ϡৠˈ᳝݅ᑣ߫Ё াࣙ↣Ͼԡ㕂ⱘֱᅜ⅟ⱘֵᙃDŽProfileخདৢৃ⫼Ѣ᧰㋶᭄ᑧǃ᭄ᑧߚߦϔϾ 䲚ড়Ё᧰㋶Ϣॳྟᇍ↨㒧ᵰЁⱘᑣ߫ⳌԐⱘᑣ߫DŽᅗгৃҹ⫼Ѣᡞϔᴵऩ⣀ⱘᑣ߫ϢϔϾᇍ ↨㒧ᵰ䖯㸠ᇍ↨DŽ Փ⫼ProfileMakeᑣ˄Gribskov et al., 1987,1990˅ৃ߯ᓎϔϾᑣ߫ᇍ↨㒧ᵰⱘ profileDŽՓ⫼ProfileSearchᑣৃ⫼profileᇍ᭄ᑧ䖯㸠᧰㋶ˈProfileSegmentᑣৃҹ ᰒ⼎᧰㋶㒧ᵰ˄Gribskov et al., 1987,1990˅DŽՓ⫼ProfileGapᑣৃᇚϔϾᑣ߫Ϣ profile䖯㸠ᇍ↨(Gribskov et al., 1987,1990)DŽProfileMake, ProfileSearch, ProfileSegmentsҹঞProfileGapᑣ䛑ৃҹҢFunctions㦰ऩЁਃࡼDŽ ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ 义ⷕˈ10/15 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?ಯゴᑨ⫼GCG䖯㸠ᑣ߫ߚᵤ.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com