利用蛋白质序列的预测方法 页码,9/20 2、α3和α4),而有些预测方法所得的结果缺乏生物学意义(如双重预测方法在β4,认为 螺旋、叠片和拐角一个接一个交替出现)。 PredictProtein方法正确找到了所有的二级结构 单元,并在多处准确识别了二级结构元件的长度,在整体上预测表现最佳。但并非说明其它 方法没用或不够好,因为在其它某些实例中无疑会有某种方法表现更好。由于没有更多信息 可用来判断哪种方法最好,最好是把序列提交给多个服务器,将结果汇集整理,通过人为的 比较来判断哪些预测结果成立或不成立。(在图11.3中显示的CNRS一致序列就属于这一类尝 试,但一致序列也不是完全正确的。)虽然这一方法中并未包含某种对预测方法失败保险的 预测,但由这些预测的确增强了结果了可信度。 图11.3各种二级结构预测方法的比较。作为查询序列的黄素氧还蛋白( fl ayodoxi n)是一种 α邝β蛋白,其序列排在第一行。对每个预测,H代表α螺旋,E代表β链,T代表β拐角,其 它位点都认为是无规卷曲。所采用的各预测方法列在其结果的左侧,其详细描述见正文。图 的最下一行是由PDB文件中的黄素氧还蛋白(10FV, Smi th等,1983)所得的二级结构分布 特殊结构或结构特征 就象α螺旋和β叠片的位置可以较为准确地预测出来,其它特定的结构或结构特征,如卷曲 螺旋和跨膜区也可以预测出来。但这类预测的方法没有二级结构预测方法多,主要是由于这 些结构或结构特征的折叠规律尚不十分清楚。尽管如此,若査询序列在已知结构数据库中能 搜索到相似蛋白,则预测的准确度可能很高。 卷曲螺旋 CoLS算法将査询序列在一个由已知包含卷曲螺旋蛋白结构的数据库中进行搜索( Lupas等, 1991)。程序也将査询序列与包含球状蛋白序列的PDB次级库进行比较,并根据两个库搜索得 分的不同决定输入序列形成卷曲螺旋的概率。C0LS可以下载到WAX^WMS系统上使用,通过简 单的Web界面使用则更方便 程序要求序列数据为GCG或 FASTA格式,一次可以提交一条或多条序列。除了序列,用户还能 在两种打分矩阵中选择一种:MTK是根据肌球蛋白、原肌球蛋白和角蛋白序列得到的打分矩 阵;或MT吣K,是根据肌球蛋白、原肌球蛋白、中间纤维类蛋白I 桥粒蛋白和角蛋白得 到的打分矩阵。程序作者引述了两种矩阵的适用特点:MK更适合检测双链结构,而MI吣K适 合其它情形。用户还能启动一个选项给予每个卷曲a和d位置上残基(通常为亲水性)相同的 权重。如果CoLS在无权重和有权重情况下得到的结果相差很大,则可能表明存在正错误。程 序的作者警告说c0LS是用来检测与溶液接触的左手性卷曲螺旋的,对于包埋的或右手性卷曲 螺旋则可能检测不到。若一个序列被提交到服务器,程序会整理出一张预测结果图,显示沿 着序列各个部分形成卷曲螺旋的倾向性 个基于 Maci toshi系统的应用程序—- Maestri pe使用了 Lupas的 COILS的预测方法,能输出 较简单的预测结果( Kni ght,1994)。 MaeStri pe要求输入文件为 FASTA、PR或其它普遍文件 格式,并象C0ILS一样产生一个图形文件,包含形成卷曲螺旋的概率,以及用柱状图显示七连 体重复模式的连续性。下面是以GCN4为例,由 Maestri pe得到的统计结果文件的一部分。 8989L5a0.7604480.000047 9090D5b0.7604480.000047 9191D5c0.7604480.000047 file://E:wcb生物信息学(中译本)\第十一章利用蛋白质序列的预测方 2005-1-18ǃD 3D 4˅ˈ㗠᳝ѯ乘⌟ᮍ⊩᠔ᕫⱘ㒧ᵰ㔎У⫳⠽ᄺᛣН˄བঠ䞡乘⌟ᮍ⊩E 4ˈ䅸Ў 㶎ᮟǃ⠛ᢤ㾦ϔϾϔϾѸ᳓ߎ˅⦃DŽPredictProteinᮍ⊩ℷ⹂ᡒࠄњ᠔᳝ⱘѠ㑻㒧ᵘ ऩܗˈᑊ໘ޚ⹂䆚߿њѠ㑻㒧ᵘܗӊⱘ䭓ᑺˈᭈԧϞ乘⌟㸼⦄᳔ՇDŽԚᑊ䴲䇈ᯢ݊ᅗ ᮍ⊩≵⫼ϡདˈЎ݊ᅗᶤѯᅲ՟Ё᮴⭥Ӯ᳝ᶤ⾡ᮍ⊩㸼⦄དDŽ⬅Ѣ≵ֵ᳝ᙃ ৃ⫼ᴹ߸ᮁા⾡ᮍ⊩᳔དˈ᳔དᰃᡞᑣ߫ᦤѸ㒭Ͼ᳡ࡵˈ఼ᇚ㒧ᵰ∛䲚ᭈ⧚ˈ䗮䖛ҎЎⱘ ↨䕗ᴹ߸ᮁાѯ乘⌟㒧ᵰ៤ゟϡ៤ゟDŽ˄11.3Ёᰒ⼎ⱘCNRSϔ㟈ᑣ߫ህሲѢ䖭ϔ㉏ᇱ 䆩ˈԚϔ㟈ᑣ߫гϡᰃᅠܼℷ⹂ⱘDŽ˅㱑✊䖭ϔᮍ⊩Ёᑊࣙᶤ⾡ᇍ乘⌟ᮍ⊩༅䋹ֱ䰽ⱘ 乘⌟ˈԚ⬅䖭ѯ乘⌟ⱘ⹂ᔎњ㒧ᵰњৃֵᑺDŽ ……………… 11.3⾡Ѡ㑻㒧ᵘ乘⌟ᮍ⊩ⱘ↨䕗DŽЎᶹ䆶ᑣ߫ⱘ咘㋴⇻䖬㲟ⱑ˄flavodoxin˅ᰃϔ⾡ D /E㲟ⱑˈ݊ᑣ߫ᥦϔ㸠DŽᇍ↣Ͼ乘⌟ˈ+ҷ㸼D㶎ᮟˈ(ҷ㸼E䫒ˈ7ҷ㸼Eᢤ㾦ˈ݊ ᅗԡ⚍䛑䅸Ўᰃ᮴㾘ो᳆DŽ᠔䞛⫼ⱘ乘⌟ᮍ⊩߫݊㒧ᵰⱘᎺջˈ݊䆺㒚ᦣ䗄㾕ℷ᭛DŽ ⱘ᳔ϟϔ㸠ᰃ⬅PDB᭛ӊЁⱘ咘㋴⇻䖬㲟ⱑ˄1OFVˈSmithㄝˈ1983˅᠔ᕫⱘѠ㑻㒧ᵘߚᏗDŽ ⡍⅞㒧ᵘ㒧ᵘ⡍ᕕ ህ䈵D 㶎ᮟE ⠛ⱘԡ㕂ৃҹ䕗Ўޚഄ⹂乘⌟ߎᴹˈ݊ᅗ⡍ᅮⱘ㒧ᵘ㒧ᵘ⡍ᕕˈབो᳆ 㶎ᮟ䎼㝰ऎгৃҹ乘⌟ߎᴹDŽԚ䖭㉏乘⌟ⱘᮍ⊩≵᳝Ѡ㑻㒧ᵘ乘⌟ᮍ⊩ˈЏ㽕ᰃ⬅Ѣ䖭 ѯ㒧ᵘ㒧ᵘ⡍ᕕⱘᡬ㾘ᕟᇮϡकߚ⏙ἮDŽሑㅵབℸˈ㢹ᶹ䆶ᑣ߫Ꮖⶹ㒧ᵘ᭄ᑧЁ㛑 ᧰㋶ࠄⳌԐ㲟ⱑˈ߭乘⌟ⱘޚ⹂ᑺৃ㛑ᕜ催DŽ ो᳆㶎ᮟ COILSㅫ⊩ᇚᶹ䆶ᑣ߫ϔϾ⬅Ꮖⶹࣙो᳆㶎ᮟ㲟ⱑ㒧ᵘⱘ᭄ᑧЁ䖯㸠᧰㋶˄Lupasㄝˈ 1991˅DŽᑣгᇚᶹ䆶ᑣ߫Ϣࣙ⧗⢊㲟ⱑᑣ߫ⱘPDB㑻ᑧ䖯㸠↨䕗ˈᑊḍϸϾᑧ᧰㋶ᕫ ߚⱘϡৠއᅮ䕧ܹᑣ߫ᔶ៤ो᳆㶎ᮟⱘὖ⥛DŽCOILSৃҹϟ䕑ࠄVAX/VMS㋏㒳ϞՓ⫼ˈ䗮䖛ㅔ ऩⱘWeb⬠䴶Փ⫼߭ᮍ֓DŽ ᑣ㽕∖ᑣ᭄߫ЎGCGFASTAḐᓣˈϔৃҹᦤѸϔᴵᴵᑣ߫DŽ䰸њᑣ߫ˈ⫼᠋䖬㛑 ϸ⾡ᠧߚⶽ䰉Ё䗝ᢽϔ⾡˖MTKᰃḍ㙠⧗㲟ⱑǃॳ㙠⧗㲟ⱑ㾦㲟ⱑᑣ߫ᕫࠄⱘᠧߚⶽ 䰉˗MTIDKˈᰃḍ㙠⧗㲟ⱑǃॳ㙠⧗㲟ⱑǃЁ䯈㑸㓈㉏㲟ⱑĉčǃḹ㉦㲟ⱑ㾦㲟ⱑᕫ ࠄⱘᠧߚⶽ䰉DŽᑣ㗙ᓩ䗄њϸ⾡ⶽ䰉ⱘ䗖⫼⡍⚍˖MTK䗖ড়Ẕ⌟ঠ䫒㒧ᵘˈ㗠MTIDK䗖 ড়݊ᅗᚙᔶDŽ⫼᠋䖬㛑ਃࡼϔϾ䗝乍㒭ќ↣Ͼो᳆DGԡ㕂Ϟ⅟˄䗮ᐌЎ҆∈ᗻ˅Ⳍৠⱘ ᴗ䞡DŽབᵰCOILS᮴ᴗ䞡᳝ᴗ䞡ᚙމϟᕫࠄⱘ㒧ᵰⳌᏂᕜˈ߭ৃ㛑㸼ᯢᄬℷ䫭䇃DŽ ᑣⱘ㗙䄺ਞ䇈COILSᰃ⫼ᴹẔ⌟Ϣ⒊⎆㾺ⱘᎺᗻो᳆㶎ᮟⱘˈᇍѢࣙඟⱘেᗻो᳆ 㶎ᮟ߭ৃ㛑Ẕ⌟ϡࠄDŽ㢹ϔϾᑣ߫㹿ᦤѸࠄ᳡ࡵˈ఼ᑣӮᭈ⧚ߎϔᓴ乘⌟㒧ᵰˈᰒ⼎⊓ ⴔᑣ߫Ͼ䚼ߚᔶ៤ो᳆㶎ᮟⱘؒᗻDŽ ϔϾѢMacintoshi㋏㒳ⱘᑨ⫼ᑣ̣̣MacStripeՓ⫼њLupasⱘCOILSⱘ乘⌟ᮍ⊩ˈ㛑䕧ߎ 䕗ㅔऩⱘ乘⌟㒧ᵰ˄Knightˈ1994˅DŽMacStripe㽕∖䕧ܹ᭛ӊЎFASTAǃPIR݊ᅗ᱂䘡᭛ӊ Ḑᓣˈᑊ䈵COILSϔḋѻ⫳ϔϾᔶ᭛ӊˈࣙᔶ៤ो᳆㶎ᮟⱘὖ⥛ˈҹঞ⫼᷅⢊ᰒ⼎ϗ䖲 ԧ䞡ᓣⱘ䖲㓁ᗻDŽϟ䴶ᰃҹGCN4Ў՟ˈ⬅MacStripeᕫࠄⱘ㒳䅵㒧ᵰ᭛ӊⱘϔ䚼ߚDŽ 89 89 L 5 a 0.760448 0.000047 90 90 D 5 b 0.760448 0.000047 91 91 D 5 c 0.760448 0.000047 कϔゴ߽⫼㲟ⱑ䋼ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ9/20 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कϔゴ߽⫼㲟ⱑ䋼ᑣ߫ⱘ乘⌟ᮍ... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com