正在加载图片...
根据条件概率的定义: (S|)=P(S,R (7-3) P(R) P(SR)是同时观察到S和R的联合概率,而P(R)是R的出现概率。对现有蛋白质序列数据库和 级结构数据库进行数学统计分析,很容易得到ISR)。如果令N为数据库中总的氨基酸残基 的个数,为残基R的总个数,为处于二级结构类型S的残基总数,R为残基R处于二级结 构类型S的总数,则 P(S, R) P(R)=fR/N (7-4) P(S)=fs/N R处于二级结构类型S的信息值按下式计算 I(S; R)=log[( sr/ fa)(s/N)] 75) Robson提出一种信息差的计算公式: I(AS: R)=1(S: R)-I(S,R)=log(sr/fs,r)+log(fs fs) (7-6) 这里,S’表示除S之外的其它所有二级结构类型。例如,如果S代表a螺旋,则在三态情 况下,S代表β折叠或者转角。公式(7-6)从正反两个方面给出关于氨基酸残基R与二级 结构S关系的信息值 若R可分为两个较简单的事件R1和R2,则有 (S,B)=l(s,R1,R2)=log[P(S|1,R2)/P(S) (7-7) =log P(S|R1, R2)/P(S,)]+log[ P(S R))/P(S) 式中第一项表示在R发生的条件下,R2对事件S的影响,第二项则表示R1对S的影响。上式可 改写为根据条件概率的定义: P(S,R)是同时观察到S和R的联合概率,而P(R)是R的出现概率。对现有蛋白质序列数据库和二 级结构数据库进行数学统计分析,很容易得到I(S;R)。如果令N为数据库中总的氨基酸残基 的个数,fR为残基R的总个数,fS为处于二级结构类型S的残基总数,fS,R为残基R处于二级结 构类型S的总数,则: R 处于二级结构类型 S 的信息值按下式计算: Robson 提出一种信息差的计算公式: 这里,S’ 表示除 S 之外的其它所有二级结构类型。例如,如果 S 代表 α 螺旋,则在三态情 况下,S’代表 β 折叠或者转角。公式(7-6)从正反两个方面给出关于氨基酸残基 R 与二级 结构 S 关系的信息值。 若R可分为两个较简单的事件R1和R2,则有: 式中第一项表示在R1发生的条件下,R2对事件S的影响,第二项则表示R1对S的影响。上式可 改写为
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有