正在加载图片...
INDING Group 基于序列信息的特征 1.K-space氨基酸对组分(CKSAAP) CKSAAP反映了氨基酸对之间的短程相互作用信息。假设K=0,那么有400(20*20) 个间隔为0的残基对(即AA,AC,AD,,YY).可以用下式计算特征向量: NAA NAC NAP NYY NTotal'NTotal'NTotal 'NTotal/400 其中,NTotau是总的残基组分的长度(例如,如果长度为L的蛋白质片段为31且 k=0、1、2、3、4和5,则NTotal=L-k-1,分别对应为为30、29、28、27、 26和25)。NAA、W4c、NAD、Nyy分别代表氨基酸对的频率。在本研究中设k= 0、1、2、3、4和5,因此基于CKSAAP的特征向量的总维数为400×6=2400。 99 基于序列信息的特征 1. K-space氨基酸对组分 (CKSAAP) CKSAAP反映了氨基酸对之间的短程相互作用信息。假设K = 0, 那么有400 (20*20) 个间隔为0的残基对 (即AA, AC, AD, …, YY). 可以用下式计算特征向量: 𝑁𝐴𝐴 𝑁𝑇𝑜𝑡𝑎𝑙 , 𝑁𝐴𝐶 𝑁𝑇𝑜𝑡𝑎𝑙 , 𝑁𝐴𝐷 𝑁𝑇𝑜𝑡𝑎𝑙 , ⋯ , 𝑁𝑌𝑌 𝑁𝑇𝑜𝑡𝑎𝑙 400 其中, 𝑁𝑇𝑜𝑡𝑎𝑙是总的残基组分的长度(例如,如果长度为 𝐿 的蛋白质片段为31且 k = 0、1、2、3、4和5,则𝑁𝑇𝑜𝑡𝑎𝑙 = 𝐿 − 𝑘 − 1,分别对应为为30、29、28、27、 26和25)。 𝑁𝐴𝐴 、𝑁𝐴𝐶 、𝑁𝐴𝐷 、𝑁𝑌𝑌分别代表氨基酸对的频率。 在本研究中设𝑘 = 0、1、2、3、4和5,因此基于CKSAAP的特征向量的总维数为400×6 = 2400
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有