正在加载图片...
20.6.366366.36919.0910.003.6432.732.7313.6491.001823.6400.91 3.3字符串的排列出现的频率 A,TC,G这4个字符组成了64种不同的3字符串。这64种3字符串构成生物蛋 白质的20种氨基酸。在参考文献的 Figur2中,给出了这20种氨基酸的编码(见图1) 因此,在计算3字符串的出现频率时,我们根据图1将代表同一种氨基酸的3字符串合成 类,只统计20类3字符串的出现频率。(不考虑字符串在序列片段中的起始位置,也采用“滚 动”算法。如 acotec中就有acg, cot gto,tcc共4个3字符串)见表3。(程序与附录一类似 AAA←→ GA G G c UAu+回uucu+DGu AAc+cAA←AUc+cUA AAG冖BAA←AUG+GUA AAU冖AA←因u←UA Ac←ccA+Aac+cGA AcG←BcA+AGG←GGA A+AGU cAa←Ad←cUa一[aU cAU+Ac←cuu+uc cca←Bcc+Ecaa←Ga Ccu+ucc+cGu+UGc GAU←UA[Guu+圆UG cu山cG+Gau+UGa Figure 2. Symmetries of the diamond code sort the 64 codons into 20 classes, indicated here by 20 colors. All the codons in each class specified the same amino acid. 图1 Brian Hayes在论文“ The Invention of the genetic code”中给出的图形 (注:图中DNA被转录为RNA,“U”代表“T” 表3 bI b2 b3 b4 b5 b6 b7 bs b9 b10 bll b12 b13 b14 b15 b16 b17 b18 b19 b20 11773.542650.880.000007960.884.422.6517.7010623.544424427081773.5413277.08 21891890.940940.0009418909447212267.5511328493.773.776.60 6.607.55283 0.005880988822940.000.0029410.7858813.730.004903921961196882588 40.000.000.000870.0008713041.746.0926111.3013043.485223.488.703.481.741478,783 52860.000003810.953.813810.003.813819.5295212382.869.524.767.622867.62952 60.000.000882.630.0017513.1608843917514049.6570252643911402631.7510.53614 71920.000.002880.964812880.0019248l12.506.7313.461926.7348l10.583859627.69 82563.420.000850.8508512820851.7108520.512.563.429405.981Ll0.854.2711973.42 90.000.000002972979902970000993.966.9319813861.982973.9623.76297891693 01870.933.742800.000002800.007.488419357.483.7414.9512150002804.67748748 110.000.890.000.000.001798.040.0053644615.188048934463578044.466.251339536 122730.000912.730.913.644553643.641.829095.453.645.456367278.185.4510.919.09 13I800900900.900.000.909.010.003.6072 8117216317214.501807211171450 142940.000.005880.006861.960.003.92686 98013.730.9858829410.780.9810.7898020. 6.36 6.36 6.36 .91 9.09 10.00 3.64 32.73 2.73 13.64 .91 .00 1.82 3.64 .00 .91 3.3 字符串的排列出现的频率 A,T,C,G 这 4 个字符组成了 64 种不同的 3 字符串。这 64 种 3 字符串构成生物蛋 白质的 20 种氨基酸。在参考文献[1]的 Figur2 中,给出了这 20 种氨基酸的编码(见图 1)。 因此,在计算 3 字符串的出现频率时,我们根据图 1 将代表同一种氨基酸的 3 字符串合成一 类,只统计 20 类 3 字符串的出现频率。(不考虑字符串在序列片段中的起始位置,也采用“滚 动”算法。如 acgtcc 中就有 acg,cgt,gtc,tcc 共 4 个 3 字符串)见表 3。(程序与附录一类似) Figure 2. Symmetries of the diamond code sort the 64 codons into 20 classes, indicated here by 20 colors. All the codons in each class specified the same amino acid. 图 1 Brian Hayes 在论文“The Invention of the Genetic Code”中给出的图形 (注:图中 DNA 被转录为 RNA,“U”代表“T”) 表 3 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20 1 1.77 3.54 2.65 0.88 0.00 0.00 7.96 0.88 4.42 2.65 17.70 10.62 3.54 4.42 4.42 7.08 1.77 3.54 13.27 7.08 2 1.89 1.89 0.94 0.94 0.00 0.94 1.89 0.94 4.72 12.26 7.55 11.32 8.49 3.77 3.77 6.60 9.43 6.60 7.55 2 .83 3 0.98 0.00 0.00 5.88 0.98 8.82 2.94 0.00 0.00 2.94 10.78 5.88 13.73 0.00 4.90 3.92 19.61 1.96 8.82 5.88 4 0.00 0.00 0.00 0.87 0.00 0.87 13.04 1.74 6.09 2.61 11.30 13.04 3.48 5.22 3.48 8.70 3.48 1.74 14.78, 7.83 5 2.86 0.00 0.00 3.81 0.95 3.81 3.81 0.00 3.81 3.81 9.52 9.52 12.38 2.86 9.52 4.76 7.62 2.86 7.62 9 .52 6 0.00 0.00 0.88 2.63 0.00 1.75 13.16 0.88 4.39 1.75 14.04 9.65 7.02 5.26 4.39 11.40 2.63 1.75 10.53 6.14 7 1.92 0.00 0.00 2.88 0.96 4.81 2.88 0.00 1.92 4.81 12.50 6.73 13.46 1.92 6.73 4.81 10.58 3.85 9.62 7 .69 8 2.56 3.42 0.00 0.85 0.85 0.85 12.82 0.85 1.71 0.85 20.51 2.56 3.42 9.40 5.98 11.11 0.85 4.27 11.97 3.42 9 0.00 0.00 0.00 2.97 2.97 9.90 2.97 0.00 0.99 3.96 6.93 1.98 13.86 1.98 2.97 3.96 23.76 2.97 8.91 6 .93 10 1.87 0.93 3.74 2.80 0.00 0.00 2.80 0.00 7.48 8.41 9.35 7.48 3.74 14.95 12.15 0.00 2.80 4.67 7.48 7.48 11 0.00 0.89 0.00 0.00 0.00 1.79 8.04 0.00 5.36 4.46 15.18 8.04 8.93 4.46 3.57 8.04 4.46 6.25 13.39 5 .36 12 2.73 0.00 0.91 2.73 0.91 3.64 4.55 3.64 3.64 1.82 9.09 5.45 3.64 5.45 6.36 7.27 8.18 5.45 10.91 9.09 13 1.80 0.90 0.90 0.90 0.00 0.90 9.01 0.00 3.60 7.21 14.41 8.11 7.21 6.31 7.21 4.50 1.80 7.21 11.71 4 .50 14 2.94 0.00 0.00 5.88 0.00 6.86 1.96 0.00 3.92 6.86 3.92 9.80 13.73 0.98 5.88 2.94 10.78 0.98 1 0.78 9.80
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有