Chou-Fasman 预测方法原理简单明了，二级结构参数的物理意义明确，

正在加载图片...

Chou- Fasman预测方法原理简单明了,二级结构参数的物理意义明确,该方法中二级结构的成核、延伸和终止规则基本上反映了真实蛋白质中二级结构形成的过程。该方法的预测准确率在50%左右。 923GOR方法 GOR是一种基于信息论和贝叶斯统计学的方法,方法的名称以三个发明人姓名的第个字母组合而成( Garnier, Osguthorpe, Robson)。信息论是于1950-1960期间发展起来的, 其基本理论由 Shannon首先提出,主要针对解决信息传递和处理问题 GOR方法将蛋白质序列当作一连串的信息值来处理,该方法不仅考虑了被预测位置本身氨基酸残基种类的影响,而且考虑了相邻残基种类对该位置构象的影响。GOR针对长度为17的残基窗进行二级结构预测。对序列中的每一个残基,GOR方法将与它N端紧邻的8 个残基和C端紧邻的8个残基与它放在一起进行考虑。与Chou- Fasman方法一样,GOR方法也是通过对已知二级结构的蛋白样本集进行分析,计算出中心残基的二级结构分别为螺旋、折叠和转角时每种氨基酸出现在窗口中各个位置的频率,从而产生一个17×20的得分矩阵。然后利用矩阵中的值来计算待预测的序列中每个残基形成螺旋、折叠或者转角的概率。 GOR方法是基于信息论来计算这些参数的,下面介绍GOR方法的数学基础。首先考虑两个事件S和R的条件概率P(SR),即在R发生的条件下,S发生的概率。定义信息为: 1(S, R)=log[ P(S R)/P(S (7-2) 若S和R无关,即fPS的=P(,则I(,R=0:若R的发生有利于S的发生, 即2(S>F(8),则(8,2)>0;如果R的发生不利于S的发生,则有 P(S|<S),E(s,R<0 使用对数的优点在于可将概率的乘积变为信息值的加和。在二级结构预测过程中,S表示特殊的二级结构类型,R代表氨基酸残基,P(S)就是残基R处于二级结构类型S的概率。P(S是在统计过程中观察到二级结构类型S的概率。Chou-Fasman 预测方法原理简单明了，二级结构参数的物理意义明确，该方法中二级结构的成核、延伸和终止规则基本上反映了真实蛋白质中二级结构形成的过程。该方法的预测准确率在 50%左右。 9.2.3 GOR 方法 GOR 是一种基于信息论和贝叶斯统计学的方法，方法的名称以三个发明人姓名的第一个字母组合而成（Garnier, Osguthorpe, Robson）。信息论是于 1950-1960 期间发展起来的，其基本理论由 Shannon 首先提出，主要针对解决信息传递和处理问题。 GOR 方法将蛋白质序列当作一连串的信息值来处理，该方法不仅考虑了被预测位置本身氨基酸残基种类的影响，而且考虑了相邻残基种类对该位置构象的影响。GOR 针对长度为 17 的残基窗进行二级结构预测。对序列中的每一个残基，GOR 方法将与它 N 端紧邻的 8 个残基和 C 端紧邻的 8 个残基与它放在一起进行考虑。与 Chou-Fasman 方法一样，GOR 方法也是通过对已知二级结构的蛋白样本集进行分析，计算出中心残基的二级结构分别为螺旋、折叠和转角时每种氨基酸出现在窗口中各个位置的频率，从而产生一个 17×20 的得分矩阵。然后利用矩阵中的值来计算待预测的序列中每个残基形成螺旋、折叠或者转角的概率。 GOR 方法是基于信息论来计算这些参数的，下面介绍 GOR 方法的数学基础。首先考虑两个事件 S 和 R 的条件概率 P(S|R)，即在 R 发生的条件下，S 发生的概率。定义信息为：若 S 和 R 无关，即，则；若 R 的发生有利于 S 的发生，即 , 则；如果 R 的发生不利于 S 的发生，则有 , 。使用对数的优点在于可将概率的乘积变为信息值的加和。在二级结构预测过程中，S 表示特殊的二级结构类型，R 代表氨基酸残基，就是残基 R 处于二级结构类型 S 的概率。P(S)是在统计过程中观察到二级结构类型 S 的概率

<<向上翻页向下翻页>>

点击下载：《生物信息学》课程教学资源（电子讲义）第九章蛋白质序列分析与结构预测