利用蛋白质序列的预测方法 页码,5/20 GREASE是沿蛋白质序列长度计算其疏水性的工具(Kyte和 Doolittle,1982)。“疏水性 是每种氨基酸所固有的特性,即氨基酸远离周围水分子,将自己包埋进蛋白质核心的相对趋 势。这一趋势加上空间立体条件和其它一些因素决定了一个蛋白质最终折叠成的三维空间构 象。因此, TGREASE对预测球状蛋白内埋区以及判断待定跨膜序列等方面都有应用。 TGREASE 属于 FASTA系列程序之一,可以从Ⅵirini a大学得到,并可以作为独立程序在Mc或Dos系统下 运行。 疏水性预测的方法依赖于疏水性的衡量尺度,这里每个氨基酸根据其一系列的物理特性(例 如,溶解性、跨越水一汽相时产生的自由能等),被赋予一个数值以代表其疏水性。具有更 高正值的氨基酸具有更大的疏水性;而具有更低负值的氨基酸则更加亲水。然后,沿蛋白质 序列的疏水性的移动平均值,或者称为亲/疏水性索引被计算出来。窗口的宽度是可以调整 的,这里推荐7-11残基的窗口宽度以获得更多的信息和更少的噪声干扰。最后把结果绘制成 亲/疏水性一残基序号的线形图。图11.2是用人的白介素8受体B作的 TGREASE图。图中的峰与 实际跨膜区段的位置虽然不完全一致,但二者的相关性已经相当明显。要注意的是这种方法 不仅仅预测跨膜区段,还预测所有的疏水区。专门用来检测跨膜区段的方法将在后面专门讨 图112 TGREASE所作Kytt- Dool ttl!e疏水性分析结果。输入序列是人高亲和白介素8受体B, 使用了缺省的窗口长度。图中底部的粗横线是手工加上的,代表了 SWISS-PR0T中标注的该蛋 白1L-8R-B(P25025)中的七个跨膜区段的位置 SAPS 蛋白质序列统计分析方法( Statisti cal Anal ysis of Protein Sequences,SAPS)用于给出 关于查询序列的广泛的统计信息( Brende等,1992 个蛋白序列通过Web界面提交给 SAPS,服务器会返回一大堆关于该蛋白的物理和化学性质的信息,这些都是仅仅通过序列本 身就可以分析出来的。输出的结果最先是按种类对氨基酸的统计计数;随后是电荷分布分 析,包括正/负电荷聚集区的位置,高度带电和不带电区段,以及电荷的传播和模式等;最后 的部分给出了高疏水性和跨膜区段、重复结构和多重态、以及周期性分析。 二级结构和折叠类 分析新发现的蛋白质或未知功能的基因产物的第一步是用 BLAST或其它工具在公共数据库中进 行相似性搜索。然而,这种搜索可能无法找到一个已知相符蛋白质;即使能得到一个统计显 著的相符蛋白质,也很可能在序列记录中没有任何关于其二级结构的信息,而这些信息对设 计合理的生物化学实验十分重要。虽然没有“已知”的信息,但仍然有办法预测出序列折叠 成α螺旋或β叠片的性能。这些方法依赖于对大量实验测定三维结构的蛋白质的观察和分 析 在讨论技术本身之前,有必要简要回顾一下二级结构和折叠类。前面已经提及,许多氨基酸 具有疏水性的侧链,而主链或称骨架是亲水性的。肽链通过构成离散的二级结构元件来平衡 这两种相反的作用力。这在1951年由 Li nus Paul i ng及其合作者提出( Paul i ng和 Corey, 1951)。α螺旋是一种用来起瓶塞的钻头一样的螺旋结构,由主链构成螺旋的骨架,侧链从 螺旋向外伸出。骨架是通过各个氨基酸上的C0基团与C末端方向+4个氨基酸(n+4)的№H基 团形成的氢键来保持稳定的,这样就形成了结实的棒状结构。一些残基比其它残基更易形成 α螺旋:丙氨酸、谷氨酸、亮氨酸和甲硫氨酸经常在α螺旋中岀现;而脯氨酸、甘氨酸、酪 氨酸和丝氨酸一般不会在α螺旋中岀现。通常认为,脯氨酸是螺旋破坏者,这是由于它的环 状结构中断了n+4氢键的形成 file://E:wcb生物信息学(中译本)\第十一章利用蛋白质序列的预测方 2005-1-18TGREASEᰃ⊓㲟ⱑ䋼ᑣ߫䭓ᑺ䅵ㅫ݊⭣∈ᗻⱘᎹ˄KyteDoolittleˈ1982˅DŽĀ⭣∈ᗻ” ᰃ↣⾡⇼䝌᠔᳝ⱘ⡍ᗻˈे⇼䝌䖰⾏਼ೈ∈ߚᄤˈᇚ㞾Ꮕࣙඟ䖯㲟ⱑ䋼ḌᖗⱘⳌᇍ䍟 DŽ䖭ϔ䍟ࡴϞぎ䯈ゟԧᴵӊ݊ᅗϔѯ㋴އᅮњϔϾ㲟ⱑ䋼᳔㒜ᡬ៤ⱘϝ㓈ぎ䯈ᵘ 䈵DŽℸˈTGREASEᇍ乘⌟⧗⢊㲟ⱑݙඟऎҹঞ߸ᮁᕙᅮ䎼㝰ᑣ߫ㄝᮍ䴶䛑᳝ᑨ⫼DŽTGREASE ሲѢFASTA㋏߫ᑣПϔˈৃҹҢVirginiaᄺᕫࠄˈᑊৃҹЎ⣀ゟᑣMacDos㋏㒳ϟ 䖤㸠DŽ ⭣∈ᗻ乘⌟ⱘᮍ⊩ձ䌪Ѣ⭣∈ᗻⱘ㸵䞣ሎᑺˈ䖭䞠↣Ͼ⇼䝌ḍ݊ϔ㋏߫ⱘ⠽⧚⡍ᗻ˄՟ བˈ⒊㾷ᗻǃ䎼䍞∈ˉ≑Ⳍᯊѻ⫳ⱘ㞾⬅㛑ㄝ˅ˈ㹿䌟ќϔϾ᭄ؐҹҷ㸼݊⭣∈ᗻDŽ᳝ 催ℷؐⱘ⇼䝌᳝ⱘ⭣∈ᗻ˗㗠᳝Ԣ䋳ؐⱘ⇼䝌߭ࡴ∋҆DŽ✊ৢˈ⊓㲟ⱑ䋼 ᑣ߫ⱘ⭣∈ᗻⱘ⿏ࡼᑇഛؐˈ㗙⿄Ў҆⭣∈ᗻ㋶ᓩ㹿䅵ㅫߎᴹDŽにষⱘᆑᑺᰃৃҹ䇗ᭈ ⱘˈ䖭䞠㤤ˉ11⅟ⱘにষᆑᑺҹ㦋ᕫⱘֵᙃᇥⱘాໄᑆᡄDŽ᳔ৢᡞ㒧ᵰ㒬ࠊ៤ ҆⭣∈ᗻˉ⅟ᑣোⱘ㒓ᔶDŽ11.2ᰃ⫼Ҏⱘⱑҟ㋴ফԧ%ⱘTGREASEDŽЁⱘዄϢ ᅲ䰙䎼㝰ऎ↉ⱘԡ㕂㱑✊ϡᅠܼϔ㟈ˈԚѠ㗙ⱘⳌ݇ᗻᏆ㒣ⳌᔧᯢᰒDŽ㽕⊼ᛣⱘᰃ䖭⾡ᮍ⊩ ϡҙҙ乘⌟䎼㝰ऎ↉ˈ䖬乘⌟᠔᳝ⱘ⭣∈ऎDŽϧ䮼⫼ᴹẔ⌟䎼㝰ऎ↉ⱘᮍ⊩ᇚৢ䴶ϧ䮼䅼 䆎DŽ ……………… 11.2 TGREASE᠔Kytt-Doolittle⭣∈ᗻߚᵤ㒧ᵰDŽ䕧ܹᑣ߫ᰃҎ催҆ⱑҟ㋴ফԧ%ˈ Փ⫼њ㔎ⳕⱘにষ䭓ᑺDŽЁᑩ䚼ⱘ㉫῾㒓ᰃᎹࡴϞⱘˈҷ㸼њSWISS-PROTЁᷛ⊼ⱘ䆹㲟 ⱑ1L-8R-B˄P25025˅ЁⱘϗϾ䎼㝰ऎ↉ⱘԡ㕂DŽ SAPS 㲟ⱑ䋼ᑣ߫㒳䅵ߚᵤᮍ⊩˄Statistical Analysis of Protein SequencesˈSAPS˅⫼Ѣ㒭ߎ ݇Ѣᶹ䆶ᑣ߫ⱘᑓ⊯ⱘ㒳䅵ֵᙃ˄Brendelㄝˈ1992˅DŽᔧϔϾ㲟ⱑᑣ߫䗮䖛Web⬠䴶ᦤѸ㒭 SAPSˈ᳡ࡵ఼Ӯ䖨ಲϔේ݇Ѣ䆹㲟ⱑⱘ⠽⧚࣪ᄺᗻ䋼ⱘֵᙃˈ䖭ѯ䛑ᰃҙҙ䗮䖛ᑣ߫ᴀ 䑿ህৃҹߚᵤߎᴹⱘDŽ䕧ߎⱘ㒧ᵰ᳔ܜᰃᣝ⾡㉏ᇍ⇼䝌ⱘ㒳䅵䅵᭄˗䱣ৢᰃ⬉㥋ߚᏗߚ ᵤˈࣙᣀℷ䋳⬉㥋㘮䲚ऎⱘԡ㕂ˈ催ᑺᏺ⬉ϡᏺ⬉ऎ↉ˈҹঞ⬉㥋ⱘӴ᪁ᓣㄝ˗᳔ৢ ⱘ䚼ߚ㒭ߎњ催⭣∈ᗻ䎼㝰ऎ↉ǃ䞡㒧ᵘ䞡ᗕǃҹঞ਼ᳳᗻߚᵤDŽ Ѡ㑻㒧ᵘᡬ㉏ ߚᵤᮄথ⦄ⱘ㲟ⱑ䋼ⶹࡳ㛑ⱘѻ⠽ⱘϔℹᰃ⫼BLAST݊ᅗᎹ᭄݅݀ᑧЁ䖯 㸠ⳌԐᗻ᧰㋶DŽ✊㗠ˈ䖭⾡᧰㋶ৃ㛑᮴⊩ᡒࠄϔϾᏆⶹⳌヺ㲟ⱑ䋼˗ेՓ㛑ᕫࠄϔϾ㒳䅵ᰒ 㨫ⱘⳌヺ㲟ⱑ䋼ˈгᕜৃ㛑ᑣ߫䆄ᔩЁ≵᳝ӏԩ݇Ѣ݊Ѡ㑻㒧ᵘⱘֵᙃˈ㗠䖭ѯֵᙃᇍ䆒 䅵ড়⧚ⱘ⫳⠽࣪ᄺᅲ偠कߚ䞡㽕DŽ㱑✊≵᳝ĀᏆⶹāⱘֵᙃˈԚҡ✊᳝ࡲ⫣乘⌟ߎᑣ߫ᡬ ៤D 㶎ᮟE ⠛ⱘᗻ㛑DŽ䖭ѯᮍ⊩ձ䌪Ѣᇍ䞣ᅲ偠⌟ᅮϝ㓈㒧ᵘⱘ㲟ⱑ䋼ⱘ㾖ᆳߚ ᵤDŽ 䅼䆎ᡔᴃᴀ䑿Пࠡˈ᳝ᖙ㽕ㅔ㽕ಲ乒ϔϟѠ㑻㒧ᵘᡬ㉏DŽࠡ䴶Ꮖ㒣ᦤঞˈ䆌⇼䝌 ∋⭣᳝ᗻⱘջ䫒ˈ㗠Џ䫒⿄偼ᶊᰃ҆∈ᗻⱘDŽ㚑䫒䗮䖛ᵘ៤⾏ᬷⱘѠ㑻㒧ᵘܗӊᴹᑇ㸵 䖭ϸ⾡Ⳍডⱘ⫼DŽ䖭1951ᑈ⬅Linus Paulingঞ݊ড়㗙ᦤߎ˄PaulingCoreyˈ 1951˅DŽD 㶎ᮟᰃϔ⾡⫼ᴹ䍋⫊าⱘ䪏༈ϔḋⱘ㶎ᮟ㒧ᵘˈ⬅Џ䫒ᵘ៤㶎ᮟⱘ偼ᶊˈջ䫒Ң 㶎ᮟԌߎDŽ偼ᶊᰃ䗮䖛Ͼ⇼䝌ϞⱘCOಶϢ&ッᮍˇϾ⇼䝌˄Qˇ˅ⱘNH ಶᔶ៤ⱘ⇶䬂ᴹֱᣕ〇ᅮⱘˈ䖭ḋህᔶ៤њ㒧ᅲⱘẦ⢊㒧ᵘDŽϔѯ⅟↨݊ᅗ⅟ᯧᔶ៤ D㶎ᮟ˖ϭ⇼䝌ǃ䈋⇼䝌ǃ҂⇼䝌⬆⸿⇼䝌㒣ᐌD㶎ᮟЁߎ˗⦃㗠㜃⇼䝌ǃ⫬⇼䝌ǃ䜾 ⇼䝌ϱ⇼䝌ϔ㠀ϡӮD 㶎ᮟЁߎ⦃DŽ䗮ᐌ䅸Ўˈ㜃⇼䝌ᰃ㶎ᮟ⸈ണ㗙ˈ䖭ᰃ⬅Ѣᅗⱘ⦃ ⢊㒧ᵘЁᮁњQˇ⇶䬂ⱘᔶ៤DŽ कϔゴ߽⫼㲟ⱑ䋼ᑣ߫ⱘ乘⌟ᮍ⊩ 义ⷕˈ5/20 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?कϔゴ߽⫼㲟ⱑ䋼ᑣ߫ⱘ乘⌟ᮍ... 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com