正在加载图片...
第七章序列比对和数据库搜索 页码,8/2 ( threoni n)(极性)。在计算比对分之时,相同的氨基酸打分会高于取代的氨基酸,而保 守的取代打分高于非保守变化,换句话说,设计了一系列的分值,而且,在比对非常相近的 序列(muse和rat的同源基因)以及差异极大的序列( mouse和 yeast的基因)时会设计出不 同系统的分值,考虑到这些因素,使用取代矩阵会极为有利,在这个矩阵中,任何氨基酸配 对的分值会一目了然。 第一个广泛使用的最优矩阵建立在进化的点突变模型上(PA( Dayhoff et al.,1978)。 一个PAM就是一个进化的变异单位即1%的氨基酸改变,这并不意味着经过100次PAM后,每个氨 基酸都发生变化,因为其中一些位置可能会经过多次改变,甚至可能变回到原先的氨基酸, 因此另外一些氨基酸可能不发生改变。如果这些变化是随机的,那么每一种可能的取代频率 仅仅取决于不同氨基酸的出现的频率(称为背景频率)。然而,在相关蛋白中,已经发现的 取代频率(称为目标频率)大大地倾向于那些不影响蛋白质功能的取代,换句话说,这些点 突变已经被进化所接受。 Dayhoff同合作者们第一次使用了l0g-0dd处理,在这种处理中,矩 阵中的取代分值同目标频率于背景频率的比值的自然对数成比例。为了评估目标频率,人们 用非常相近的序列(比对时不需要取代矩阵)来收集对应于一个PAM的突变频率,然后将数据 外推至250个PAM,PAM250矩阵结果如图7.7。虽然 Dayhof等人只发表了PAM250,但潜在的突 变数据可以外推至其它PAM值,产生一组矩阵,在比较差异极大的序列时,通常在较高的PAM 值处得到最佳结果,比如在PAM200到250之间,较低值的PAM矩阵一般使用于高度相似的序列 ( Al tsch,1991)。 图7.7、PAM250分值矩阵。 用同样方式建立了BOSM取代矩阵,但在评估目标频率时,应用了不同的策略,基本数据来 源于B0CKS数据库,其中包括了局部多重比对(包含较远的相关序列,同在PAM中使用较近的 相关序列相反)。虽然在这种情况下,没有进化模型,但它的优点在于可以通过直接观察获 得数据而不是通过外推获得。同PAM模型一样,也有许多编号的B0SUM矩阵,这里的编号指的 是序列可能相同的最高水平,并且同模型保持独立性。举例来说,如图7.8所示的BL0SUM的矩 阵,至少有62%的相同比例的序列被组合成一个序列,因此取代频率更加受到那些比空位变化 还大的序列的极大影响,取代矩阵在处理高度相似序列时使用高的阈值(直至 BLOSUM90), 处理差异大的序列时使用低的阈值(直至BL0SUM30) 图7.8、B0SM62分值矩阵。 为了补偿那些插入或缺失,可以在比对中引入一些空位,但不能太多,否则会使分子变得面 目全非。每引入一个断裂,比对的分值都会有所扣除,对于这些断裂有许多罚分的规则。最 常用的一个就是用一个附加的罚分比例去乘空位的长度,其中有两个参数:G(有时称为断裂 开放惩罚)和L(断裂延伸惩罚),对于一个长度为n的空位,扣分总数为GHLm,但在选择空 位参数时,在很大程度上是唯经验的,所选的分值很少会有理论上的支持。通常来说,对于G 会选择一个高分(在BL0SUM62中约为10-15),对于L会选择一个相对的低分(大约1-2),选 择这个范围是因为插入和变异是很罕见的,但当它们一旦发生,就会影响到一系列附近的残 file://E:wcb生物信息学(中译本)\第七章序列比对和数据库搜索.htm 2005-1-18˄threonin˅˄ᵕᗻ˅DŽ೼䅵ㅫ↨ᇍߚПᯊˈⳌৠⱘ⇼෎䝌ᠧߚӮ催Ѣপҷⱘ⇼෎䝌ˈ㗠ֱ ᅜⱘপҷᠧߚ催Ѣ䴲ֱᅜব࣪ˈᤶহ䆱䇈ˈ䆒䅵њϔ㋏߫ⱘߚˈؐ㗠Ϩˈ೼↨ᇍ䴲ᐌⳌ䖥ⱘ ᑣ߫˄mouse੠ratⱘৠ⑤෎಴˅ҹঞᏂᓖᵕ໻ⱘᑣ߫˄mouse੠ yeastⱘ෎಴˅ᯊӮ䆒䅵ߎϡ ৠ㋏㒳ⱘߚˈؐ㗗㰥ࠄ䖭ѯ಴㋴ˈՓ⫼পҷⶽ䰉ӮᵕЎ᳝߽೼ˈ䖭Ͼⶽ䰉Ёˈӏԩ⇼෎䝌䜡 ᇍⱘߚؐӮϔⳂњ✊DŽ ㄀ϔϾᑓ⊯Փ⫼ⱘ᳔Ӭⶽ䰉ᓎゟ೼䖯࣪ⱘ⚍さব῵ൟϞ˄PAM˅˄Dayhoff et al.,1978˅DŽ ϔϾPAMህᰃϔϾ䖯࣪ⱘবᓖऩԡे1%ⱘ⇼෎䝌ᬍবˈ䖭ᑊϡᛣੇⴔ㒣䖛100⃵PAMৢˈ↣Ͼ⇼ ෎䝌䛑থ⫳ব࣪಴ˈЎ݊Ёϔѯԡ㕂ৃ㛑Ӯ㒣䖛໮⃵ᬍবˈ⫮㟇ৃ㛑বಲࠄॳܜⱘ⇼෎䝌ˈ ಴ℸ঺໪ϔѯ⇼෎䝌ৃ㛑ϡথ⫳ᬍবDŽབᵰ䖭ѯব࣪ᰃ䱣ᴎⱘˈ䙷М↣ϔ⾡ৃ㛑ⱘপҷ乥⥛ ҙҙপއѢϡৠ⇼෎䝌ⱘߎ⦃ⱘ乥⥛˄⿄Ў㚠᱃乥⥛˅DŽ✊㗠ˈ೼Ⳍ݇㲟ⱑЁˈᏆ㒣থ⦄ⱘ পҷ乥⥛˄⿄ЎⳂᷛ乥⥛˅໻໻ഄؒ৥Ѣ䙷ѯϡᕅડ㲟ⱑ䋼ࡳ㛑ⱘপҷˈᤶহ䆱䇈ˈ䖭ѯ⚍ さবᏆ㒣㹿䖯࣪᠔᥹ফDŽDayhoffৠড়԰㗙Ӏ㄀ϔ⃵Փ⫼њlog-odd໘⧚ˈ೼䖭⾡໘⧚Ёˈⶽ 䰉ЁⱘপҷߚؐৠⳂᷛ乥⥛Ѣ㚠᱃乥⥛ⱘ↨ؐⱘ㞾✊ᇍ᭄៤↨՟DŽЎњ䆘ԄⳂᷛ乥⥛ˈҎӀ ⫼䴲ᐌⳌ䖥ⱘᑣ߫˄↨ᇍᯊϡ䳔㽕পҷⶽ䰉˅ᴹᬊ䲚ᇍᑨѢϔϾPAMⱘさব乥⥛ˈ✊ৢᇚ᭄᥂ ໪᥼㟇250ϾPAMˈPAM250ⶽ䰉㒧ᵰབ೒7.7DŽ㱑✊DayhoffㄝҎাথ㸼њPAM250ˈԚ┰೼ⱘさ ব᭄᥂ৃҹ໪᥼㟇݊ᅗPAMؐˈѻ⫳ϔ㒘ⶽ䰉ˈ೼↨䕗Ꮒᓖᵕ໻ⱘᑣ߫ᯊˈ䗮ᐌ೼䕗催ⱘPAM ؐ໘ᕫࠄ᳔Շ㒧ᵰˈ↨བ೼PAM200ࠄ250П䯈ˈ䕗ԢؐⱘPAMⶽ䰉ϔ㠀Փ⫼Ѣ催ᑺⳌԐⱘᑣ߫ ˄Altschul,1991˅DŽ ೒7.7ǃPAM250ߚؐⶽ䰉DŽ ⫼ৠḋᮍᓣᓎゟњBLOSUMপҷⶽ䰉ˈԚ೼䆘ԄⳂᷛ乥⥛ᯊˈᑨ⫼њϡৠⱘㄪ⬹ˈ෎ᴀ᭄᥂ᴹ ⑤ѢBLOCKS᭄᥂ᑧˈ݊Ёࣙᣀњሔ䚼໮䞡↨ᇍ˄ࣙ৿䕗䖰ⱘⳌ݇ᑣ߫ˈৠ೼PAMЁՓ⫼䕗䖥ⱘ Ⳍ݇ᑣ߫Ⳍড˅DŽ㱑✊೼䖭⾡ᚙމϟˈ≵᳝䖯࣪ˈൟ῵ԚᅗⱘӬ⚍೼Ѣৃҹ䗮䖛Ⳉ᥹㾖ᆳ㦋 ᕫ᭄᥂㗠ϡᰃ䗮䖛໪᥼㦋ᕫDŽৠPAM῵ൟϔḋˈг᳝䆌໮㓪োⱘBLOSUMⶽ䰉ˈ䖭䞠ⱘ㓪োᣛⱘ ᰃᑣ߫ৃ㛑Ⳍৠⱘ᳔催∈ᑇˈᑊϨৠ῵ൟֱᣕ⣀ゟᗻDŽВ՟ᴹ䇈ˈབ೒7.8᠔⼎ⱘBLOSUMⱘⶽ 䰉ˈ㟇ᇥ᳝62%ⱘⳌৠ↨՟ⱘᑣ߫㹿㒘ড়៤ϔϾᑣ߫ˈ಴ℸপҷ乥⥛᳈ࡴফࠄ䙷ѯ↨ぎԡব࣪ 䖬໻ⱘᑣ߫ⱘᵕ໻ᕅડˈপҷⶽ䰉೼໘⧚催ᑺⳌԐᑣ߫ᯊՓ⫼催ⱘ䯜ؐ˄Ⳉ㟇BLOSUM90˅ˈ ໘⧚Ꮒᓖ໻ⱘᑣ߫ᯊՓ⫼Ԣⱘ䯜ؐ˄Ⳉ㟇BLOSUM30˅DŽ ೒7.8ǃBLOSUM62ߚؐⶽ䰉DŽ Ўњ㸹ٓ䙷ѯᦦܹ៪㔎༅ˈৃҹ೼↨ᇍЁᓩܹϔѯぎԡˈԚϡ㛑໾໮ˈ৺߭ӮՓߚᄤবᕫ䴶 Ⳃܼ䴲DŽ↣ᓩܹϔϾᮁ㺖ˈ↨ᇍⱘߚؐ䛑Ӯ᳝᠔ᠷ䰸ˈᇍѢ䖭ѯᮁ㺖᳝䆌໮㔮ߚⱘ㾘߭DŽ᳔ ᐌ⫼ⱘϔϾህᰃ⫼ϔϾ䰘ࡴⱘ㔮ߚ↨՟এЬぎԡⱘ䭓ᑺˈ݊Ё᳝ϸϾখ᭄˖*˄᳝ᯊ⿄Ўᮁ㺖 ᓔᬒᚽ㔮˅੠/˄ᮁ㺖ᓊԌᚽ㔮˅ˈᇍѢϔϾ䭓ᑺЎQⱘぎԡˈᠷߚᘏ᭄ЎG+LnˈԚ೼䗝ᢽぎ ԡখ᭄ᯊˈ೼ᕜ໻⿟ᑺϞᰃଃ㒣偠ⱘˈ᠔䗝ⱘߚؐᕜᇥӮ᳝⧚䆎ϞⱘᬃᣕDŽ䗮ᐌᴹ䇈ˈᇍѢG Ӯ䗝ᢽϔϾ催ߚ೼˄BLOSUM62Ё㑺Ў10-15˅ˈᇍѢ/Ӯ䗝ᢽϔϾⳌᇍⱘԢߚ໻˄㑺1-2˅ˈ䗝 ᢽ䖭Ͼ㣗ೈᰃ಴Ўᦦܹ੠বᓖᰃᕜ㔩㾕ⱘˈԚᔧᅗӀϔᮺথ⫳ˈህӮᕅડࠄϔ㋏߫䰘䖥ⱘ⅟ ෎DŽ ㄀ϗゴᑣ߫↨ᇍ੠᭄᥂ᑧ᧰㋶ 义ⷕˈ8/28 file://E:\wcb\⫳⠽ֵᙃᄺ˄Ё䆥ᴀ˅?㄀ϗゴᑣ߫↨ᇍ੠᭄᥂ᑧ᧰㋶.htm 2005-1-18 Click to buy NOW! PDF-XCHANGE www.docu-track.com Click to buy NOW! PDF-XCHANGE www.docu-track.com
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有