正在加载图片...
Chou- Fasman预测方法原理简单明了,二级结构参数的物理意义明确,该方法中二级 结构的成核、延伸和终止规则基本上反映了真实蛋白质中二级结构形成的过程。该方法的预 测准确率在50%左右。 923GOR方法 GOR是一种基于信息论和贝叶斯统计学的方法,方法的名称以三个发明人姓名的第 个字母组合而成( Garnier, Osguthorpe, Robson)。信息论是于1950-1960期间发展起来的, 其基本理论由 Shannon首先提出,主要针对解决信息传递和处理问题 GOR方法将蛋白质序列当作一连串的信息值来处理,该方法不仅考虑了被预测位置本 身氨基酸残基种类的影响,而且考虑了相邻残基种类对该位置构象的影响。GOR针对长度 为17的残基窗进行二级结构预测。对序列中的每一个残基,GOR方法将与它N端紧邻的8 个残基和C端紧邻的8个残基与它放在一起进行考虑。与Chou- Fasman方法一样,GOR方 法也是通过对已知二级结构的蛋白样本集进行分析,计算出中心残基的二级结构分别为螺 旋、折叠和转角时每种氨基酸出现在窗口中各个位置的频率,从而产生一个17×20的得分 矩阵。然后利用矩阵中的值来计算待预测的序列中每个残基形成螺旋、折叠或者转角的概率。 GOR方法是基于信息论来计算这些参数的,下面介绍GOR方法的数学基础。 首先考虑两个事件S和R的条件概率P(SR),即在R发生的条件下,S发生的概率。定 义信息为: 1(S, R)=log[ P(S R)/P(S (7-2) 若S和R无关,即fPS的=P(,则I(,R=0:若R的发生有利于S的发生, 即2(S>F(8),则(8,2)>0;如果R的发生不利于S的发生,则有 P(S|<S),E(s,R<0 使用对数的优点在于可将概率的乘积变为信息值的加和。在二级结构预测过程中,S表 示特殊的二级结构类型,R代表氨基酸残基,P(S)就是残基R处于二级结构类型S的 概率。P(S是在统计过程中观察到二级结构类型S的概率。Chou-Fasman 预测方法原理简单明了,二级结构参数的物理意义明确,该方法中二级 结构的成核、延伸和终止规则基本上反映了真实蛋白质中二级结构形成的过程。该方法的预 测准确率在 50%左右。 9.2.3 GOR 方法 GOR 是一种基于信息论和贝叶斯统计学的方法,方法的名称以三个发明人姓名的第一 个字母组合而成(Garnier, Osguthorpe, Robson)。信息论是于 1950-1960 期间发展起来的, 其基本理论由 Shannon 首先提出,主要针对解决信息传递和处理问题。 GOR 方法将蛋白质序列当作一连串的信息值来处理,该方法不仅考虑了被预测位置本 身氨基酸残基种类的影响,而且考虑了相邻残基种类对该位置构象的影响。GOR 针对长度 为 17 的残基窗进行二级结构预测。对序列中的每一个残基,GOR 方法将与它 N 端紧邻的 8 个残基和 C 端紧邻的 8 个残基与它放在一起进行考虑。与 Chou-Fasman 方法一样,GOR 方 法也是通过对已知二级结构的蛋白样本集进行分析,计算出中心残基的二级结构分别为螺 旋、折叠和转角时每种氨基酸出现在窗口中各个位置的频率,从而产生一个 17×20 的得分 矩阵。然后利用矩阵中的值来计算待预测的序列中每个残基形成螺旋、折叠或者转角的概率。 GOR 方法是基于信息论来计算这些参数的,下面介绍 GOR 方法的数学基础。 首先考虑两个事件 S 和 R 的条件概率 P(S|R),即在 R 发生的条件下,S 发生的概率。定 义信息为: 若 S 和 R 无关,即 ,则 ;若 R 的发生有利于 S 的发生, 即 , 则 ;如果 R 的发生不利于 S 的发生,则有 , 。 使用对数的优点在于可将概率的乘积变为信息值的加和。在二级结构预测过程中,S 表 示特殊的二级结构类型,R 代表氨基酸残基, 就是残基 R 处于二级结构类型 S 的 概率。P(S)是在统计过程中观察到二级结构类型 S 的概率
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有