正在加载图片...
第十三章 ACEDB一个基因组信息的数据库 页码,7/12 对的区域,这些可被详细的显示在下面的扩展显示区中,来说明序列中MSPs比对的具体情 况。在缺省情况下,片段显示出全同区(暗蓝),保守的替代区(明蓝),差别区(无染 色)。从图形或扩展区中选取(LM)一个MSPs,可高亮所选序列中所有其他的MSPS。这一功 能可帮助判断匹配的性质,因为沿基因的MSPs分配可很容易的被估计出。这种匹配可放到任 何一个数据库记录中的功能信息的环境中进行检测;双击(LM)扩展显示区中的一个序列可 检索序列的记录。 Bli exm窗可被设置成显示Fmap序列的双链,高亮片段中的差别区,合并同 序列中的MSPs到同一行上,修改颜色或显示低复杂度区域的图形。 D0TER(点标器) 通过 BLI XEM窗口可进入到点标器D0TTER(右键点击背景),点标器是一个点绘图程序,用来 比较两个序列的细节。点标器和 BLI XEM都可单独使用[20,21]。图13.6展示了 S pombe假想蛋 白质C8A4.02C的自比较,其中带有一个基因组序列的三读框转译因子,并包括相应的位点 SPAC8A4.02C。蛋白质序列沿y轴绘制,转译的基因组序列和代表这个单独外显子基因的框沿 κ轴。最长的对角线是一个很好的自匹配,而其他的以最长对角线对称分布的对角线表示了六 种不太完美的36氨基酸重复单位。移动十字准线(LM,鼠标左键和按键)超过一条对角线则 在另一窗口中显示相应的队列 为能绘图,点标器的算法首先计算一个二维矩阵,它存储了所有成对比较的残基的分值,就是 说,每一水平序列的残基与每一竖直序列的残基相对应。为提高绘图的信噪比,一个窗口 (缺省25个残基)沿对角线步进,新的分值是窗口内的所有点的平均值。矩阵中每一点的值 在0至255之间(每一点一个字节)。每一项都有一与之分值成比例的灰色亮点。 Greyramp工 具(见图13.6)给出两个域值,其可由鼠标来设置。数值低于最小值显示成白色,高于最大 值的显示成黑色,数值只有在两域值之间的显示成灰色。这一工具可让点绘图的域值动态变 化,这有助于探测相关的对角线 从 ACEDB调用的点标器 DOTTER即可对比 BLI XEM中的DNA序列,又可比较 BLI XEM中的蛋白质序 列,或是进行自比较(DNA/DNA)。各选择也可用来对比 BLAST HSPS,或相对于全部比较加 亮HSPs。这些后面的选择用来探测那些 BLAST可能忽视的非常弱的相似体,例子参见相关文献 [21]的图2。 GeneFi nder Genefi nder[18]是 ACEDB系统中的一个应用程序。单独使用还是 ACEDB的版本中基本上都使用 相同的算法(关于这个问题见第十章)。这里我们着重讨论 ACEDB中的 GeneFi nder的图形界 面 Genefi nder只有依靠一系列明确且有机结合的配置文件才能正常的运行。这些文件储存在数 据库的wpf目录下。带有独立版本 GeneFi nder的一些应用程序可用来建立各种表格 Genefi nder分配中就提供这些制作表格的指令。 Fmap中的 GeneFi nder按钮可击活(RM)一个菜单,选择 GeneFi nder Features选项将在Fmap中 标记出剪接位点、可能的编码区、转译的起始密码子。这些特性是根据wpf目录下的表格计算 得出的,并且每一特性都分配一个分值。点选 Autofi nd one gene可在Fmap中标出一个预测 的基因,命名为temp_gene。创建基因的位点标为绿色的高亮区。 Autofi nd one gene一经被选种, GeneFi nder的算法就产生一系列的待选外显子。这些外显 子有三种:引导外显子,它们开始于转译起始密码子,结束于剪接供体或终止密码子;中部 外显子,它们开始于剪接受体,结束于剪接供体;尾部外显子,它们开始于剪接受体,结束 于终止密码子。注意 GeneFi nder不能预测基因的3′或5′的非转译区域;本文中的预测“基 因”就是指编码部分。外显子的分值是通过综合单个有限位点及可能被其包围的编码段的分 值得出的。内涵子是根据长度来赋值的。外显子和内涵子最高分值的有效结合的区域既是预 file://E:wcb生物信息学(中译本)\第十三章 ACEDB一个基因组信息的数..2005-1-18ᇍⱘऎඳˈ䖭ѯৃ㹿䆺㒚ⱘᰒ⼎೼ϟ䴶ⱘᠽሩᰒ⼎ऎЁˈᴹ䇈ᯢᑣ߫ЁMSPs↨ᇍⱘ݋ԧᚙ މDŽ೼㔎ⳕᚙމϟˈ⠛↉ᰒ⼎ߎܼৠऎ˄ᱫ㪱˅ˈֱᅜⱘ᳓ҷऎ˄ᯢ㪱˅ˈᏂ߿ऎ˄᮴ᶧ 㡆˅DŽҢ೒ᔶ៪ᠽሩऎЁ䗝প˄LM˅ϔϾMSPsˈৃ催҂᠔䗝ᑣ߫Ё᠔᳝݊ҪⱘMSPsDŽ䖭ϔࡳ 㛑ৃᐂࡽᮁ߸ऍ䜡ⱘᗻ䋼ˈ಴Ў⊓෎಴ⱘMSPsߚ䜡ৃᕜᆍᯧⱘ㹿Ԅ䅵ߎDŽ䖭⾡ऍ䜡ৃᬒࠄӏ ԩϔϾ᭄᥂ᑧ䆄ᔩЁⱘࡳ㛑ֵᙃⱘ⦃๗Ё䖯㸠Ẕ⌟˗ঠߏ˄LM˅ᠽሩᰒ⼎ऎЁⱘϔϾᑣ߫ৃ Ẕ㋶ᑣ߫ⱘ䆄ᔩDŽBliexmにৃ㹿䆒㕂៤ᰒ⼎Fmapᑣ߫ⱘঠ䫒ˈ催҂⠛↉ЁⱘᏂ߿ऎˈড়ᑊৠ ϔᑣ߫ЁⱘMSPsࠄৠϔ㸠Ϟˈׂᬍ买㡆៪ᰒ⼎Ԣ໡ᴖᑺऎඳⱘ೒ᔶDŽ DOTTER(⚍఼ᷛ) 䗮䖛BLIXEMにষৃ䖯ܹࠄ఼ᷛ⚍DOTTER˄ে䬂⚍ߏ㚠᱃˅ˈ⚍఼ᷛᰃϔϾ⚍㒬೒⿟ᑣˈ⫼ᴹ ↨䕗ϸϾᑣ߫ⱘ㒚㡖DŽ⚍఼ᷛ੠BLIXEM䛑ৃऩ⣀Փ⫼[20,21]DŽ೒13.6ሩ⼎њS.pombe؛ᛇ㲟 ⱑ䋼C8A4.02Cⱘ㞾↨䕗ˈ݊Ёᏺ᳝ϔϾ෎಴㒘ᑣ߫ⱘϝ䇏Ḛ䕀䆥಴ᄤˈᑊࣙᣀⳌᑨⱘԡ⚍ˈ SPA C8A4.02CDŽ㲟ⱑ䋼ᑣ߫⊓\䕈㒬ࠊˈ䕀䆥ⱘ෎಴㒘ᑣ߫੠ҷ㸼䖭Ͼऩ⣀໪ᰒᄤ෎಴ⱘḚ⊓ [䕈DŽ᳔䭓ⱘᇍ㾦㒓ᰃϔϾᕜདⱘ㞾ऍ䜡ˈ㗠݊Ҫⱘҹ᳔䭓ᇍ㾦㒓ᇍ⿄ߚᏗⱘᇍ㾦㒓㸼⼎њ݁ ⾡ϡ໾ᅠ㕢ⱘ36⇼෎䝌䞡໡ऩԡDŽ⿏ࡼकᄫޚ㒓˄LMˈ哴ᷛᎺ䬂੠ᣝ䬂˅䍙䖛ϔᴵᇍ㾦㒓߭ ೼঺ϔにষЁᰒ⼎Ⳍᑨⱘ䯳߫DŽ Ў㛑㒬೒ˈ⚍఼ᷛⱘㅫ⊩佪ܜ䅵ㅫϔϾѠ㓈ⶽ䰉ˈᅗᄬټњ᠔᳝៤ᇍ↨䕗ⱘ⅟෎ⱘߚؐህᰃ 䇈ˈ↣ϔ∈ᑇᑣ߫ⱘ⅟෎Ϣ↣ϔオⳈᑣ߫ⱘ⅟෎ⳌᇍᑨDŽЎᦤ催㒬೒ⱘֵా↨ˈϔϾにষ ˄㔎ⳕ25Ͼ⅟෎˅⊓ᇍ㾦㒓ℹ䖯ˈᮄⱘߚؐᰃにষݙⱘ᠔᳝⚍ⱘᑇഛؐDŽⶽ䰉Ё↣ϔ⚍ⱘؐ ೼㟇255П䯈˄↣ϔ⚍ϔϾᄫ㡖˅DŽ↣ϔ乍䛑᳝ϔϢПߚؐ៤↨՟ⱘ♄㡆҂⚍DŽGreyrampᎹ ݋˄㾕೒13.6˅㒭ߎϸϾඳؐˈ݊ৃ⬅哴ᷛᴹ䆒㕂DŽ᭄ؐԢѢ᳔ᇣؐᰒ⼎៤ⱑ㡆ˈ催Ѣ᳔໻ ؐⱘᰒ⼎៤咥㡆ˈ᭄ؐা᳝೼ϸඳؐП䯈ⱘᰒ⼎៤♄㡆DŽ䖭ϔᎹ݋ৃ䅽⚍㒬೒ⱘඳؐࡼᗕব ࣪ˈ䖭᳝ࡽѢ᥶⌟Ⳍ݇ⱘᇍ㾦㒓DŽ ҢACEDB䇗⫼ⱘ⚍఼ᷛDOTTERेৃᇍ↨BLIXEMЁⱘDNAᑣ߫ˈজৃ↨䕗BLIXEMЁⱘ㲟ⱑ䋼ᑣ ߫ˈ៪ᰃ䖯㸠㞾↨䕗˄DNA/DNA˅DŽ৘䗝ᢽгৃ⫼ᴹᇍ↨ BLAST HSPsˈ៪ⳌᇍѢܼ䚼↨䕗ࡴ ҂HSPsDŽ䖭ѯৢ䴶ⱘ䗝ᢽ⫼ᴹ᥶⌟䙷ѯBLASTৃ㛑ᗑ㾚ⱘ䴲ᐌᔅⱘⳌԐԧˈ՟ᄤখ㾕Ⳍ݇᭛⤂ [21]ⱘ೒DŽ GeneFinder GeneFinder[18]ᰃACEDB㋏㒳ЁⱘϔϾᑨ⫼⿟ᑣDŽऩ⣀Փ⫼䖬ᰃACEDBⱘ⠜ᴀЁ෎ᴀϞ䛑Փ⫼ Ⳍৠⱘㅫ⊩˄݇Ѣ䖭Ͼ䯂乬㾕㄀कゴ˅DŽ䖭䞠៥Ӏⴔ䞡䅼䆎ACEDBЁⱘGeneFinderⱘ೒ᔶ⬠ 䴶DŽ GeneFinderা᳝ձ䴴ϔ㋏߫ᯢ⹂Ϩ᳝ᴎ㒧ড়ⱘ䜡㕂᭛ӊᠡ㛑ℷᐌⱘ䖤㸠DŽ䖭ѯ᭛ӊټᄬ೼᭄ ᥂ᑧⱘwpfⳂᔩϟDŽᏺ᳝⣀ゟ⠜ᴀGeneFinderⱘϔѯᑨ⫼⿟ᑣৃ⫼ᴹᓎゟ৘⾡㸼ḐDŽ GeneFinder ߚ䜡Ёህᦤկ䖭ѯࠊ԰㸼ḐⱘᣛҸDŽ FmapЁⱘGeneFinderᣝ䪂ৃߏ˄⌏RM˅ϔϾ㦰ऩˈ䗝ᢽGeneFinder Features䗝乍ᇚ೼FmapЁ ᷛ䆄࠾ߎ᥹ԡ⚍ǃৃ㛑ⱘ㓪ⷕऎǃ䕀䆥ⱘ䍋ྟᆚⷕᄤDŽ䖭ѯ⡍ᗻᰃḍ᥂wpfⳂᔩϟⱘ㸼Ḑ䅵ㅫ ᕫߎⱘˈᑊϨ↣ϔ⡍ᗻ䛑ߚ䜡ϔϾߚؐDŽ⚍䗝Autofind One Gene ৃ೼FmapЁᷛߎϔϾ乘⌟ ⱘ෎಴ˈੑৡЎtemp_geneDŽ߯ᓎ෎಴ⱘԡ⚍ᷛЎ㓓㡆ⱘ催҂ऎDŽ AutoFind One Gene ϔ㒣㹿䗝⾡ˈGeneFinderⱘㅫ⊩ህѻ⫳ϔ㋏߫ⱘᕙ䗝໪ᰒᄤDŽ䖭ѯ໪ᰒ ᄤ᳝ϝ⾡˖ᓩᇐ໪ᰒᄤˈᅗӀᓔྟѢ䕀䆥䍋ྟᆚⷕᄤˈ㒧ᴳѢ࠾᥹կԧ៪㒜ℶᆚⷕᄤ˗Ё䚼 ໪ᰒᄤˈᅗӀᓔྟѢ࠾᥹ফԧˈ㒧ᴳѢ࠾᥹կԧ˗ሒ䚼໪ᰒᄤˈᅗӀᓔྟѢ࠾᥹ফԧˈ㒧ᴳ Ѣ㒜ℶᆚⷕᄤDŽ⊼ᛣGeneFinder ϡ㛑乘⌟෎಴ⱘ3’៪5’ⱘ䴲䕀䆥ऎඳ˗ᴀ᭛Ёⱘ乘⌟Ā෎ ಴āህᰃᣛ㓪ⷕ䚼ߚDŽ໪ᰒᄤⱘߚؐᰃ䗮䖛㓐ড়ऩϾ᳝䰤ԡ⚍ঞৃ㛑㹿݊ࣙೈⱘ㓪ⷕ↉ⱘߚ ؐᕫߎⱘDŽݙ⎉ᄤᰃḍ᥂䭓ᑺᴹ䌟ؐⱘDŽ໪ᰒᄤ੠ݙ⎉ᄤ᳔催ߚؐⱘ᳝ᬜ㒧ড়ⱘऎඳ᮶ᰃ乘 ㄀कϝゴ ACEDBϔϾ෎಴㒘ֵᙃⱘ᭄᥂ᑧ 义ⷕˈ7/12 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀कϝゴ ACEDBϔϾ෎಴㒘ֵᙃⱘ᭄... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有