正在加载图片...
(3)3字符串的排列出现的频率 G这4个字符组成了64种不同的3字符串.这64种3字符串构成生物蛋白 质的20种氨基酸.在参考文献的 Figur2中,给出了这20种氨基酸的编码(见图1).因此 在计算3字符串的出现频率时,我们根据图1将代表同一种氨基酸的3字符串合成一类,只 统计20类3字符串的出现频率.(不考虑字符串在序列片段中的起始位置,也采用“滚动 算法,如 ACGTCC中就有ACG, CGTGTO,TCC共4个3字符串)见表3.(程序与附录一类 似) AAA+AUA ACA+ Ac+cuc ccc GAG←uaca←Gaa UAu+回 Uu Ucu+Du AAc心EAA←AUc+cUA AAG+GAA+AUG+GuA AAU四AA←u←UA Acc+EcA←AGc+cGA ACG+GCA+AGG+GGA AcU CAG+GAc+ cuG+Guc cAU心团Ac←CUU+Uuc ccG+Gcc+cGG+GGc ccu+ucc+cGu+UGC GAU+ UAG+Guu+UUG cu←uca←au←Ga Symmetries of the diamond code sort the 64 codons into 20 classes, indicated here by 20 colors. All the codons in each class specified the same amino acid. 图1 Brian Haves在论文“ The Invention of the genetic Code”中给出的图形 (注:图中DNA被转录为RNA,“U”代表“T”) 表3 b5 b6 b7 b8 b9 b10 bl1 b12 b13 b14 b15 b16 b17 b18 b19 b20 l1773.542.650880.000.007960.88442265177010623.544.4244270817735413.277.08 21891890.940.940.000941890944.7212.267.5511328.493.773.776.609436.60755283 30.980.000.005880988822940.000.0029410.7858813.7300049039219611968.82588 40.000.000.000870.000871304174609261113013043.485223.488.703481.741478,783 52860.000.00381 3813810.003813s19.529.5212382869524.767.622867.62952 60000.000.882.63 17513.160.884391.75140496570252643911.402.631.7510.53614 82563.420.000.85085085128208517108520.512563.4294059811.110854.2711973.42 90.000.000.002972979902970.000993.9669319813861982973.9623.762.97891693 101870.933.742800.000.002800.007488419357483.7414.9512150002.804677.48748 110.000890.000000.001798.040.0053644615.188048934463.578044466251339536 122.730.000.912.730.913.644.553.643.641.829095.453.645.456367278.185.451091909 131800.900.900900000.909010.003.6072114418.117216317.214.501807211171450(3)3 字符串的排列出现的频率 A,T,C,G 这 4 个字符组成了 64 种不同的 3 字符串.这 64 种 3 字符串构成生物蛋白 质的 20 种氨基酸.在参考文献[1]的 Figur2 中,给出了这 20 种氨基酸的编码(见图 1).因此, 在计算 3 字符串的出现频率时,我们根据图 1 将代表同一种氨基酸的 3 字符串合成一类,只 统计 20 类 3 字符串的出现频率.(不考虑字符串在序列片段中的起始位置,也采用“滚动” 算法.如 ACGTCC 中就有 ACG,CGT,GTC,TCC 共 4 个 3 字符串)见表 3.(程序与附录一类 似) Symmetries of the diamond code sort the 64 codons into 20 classes, indicated here by 20 colors. All the codons in each class specified the same amino acid. 图 1 Brian Hayes 在论文“The Invention of the Genetic Code”中给出的图形 (注:图中 DNA 被转录为 RNA,“U”代表“T”) 表 3 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20 1 1.77 3.54 2.65 0.88 0.00 0.00 7.96 0.88 4.42 2.65 17.70 10.62 3.54 4.42 4.42 7.08 1.77 3.54 13.27 7.08 2 1.89 1.89 0.94 0.94 0.00 0.94 1.89 0.94 4.72 12.26 7.55 11.32 8.49 3.77 3.77 6.60 9.43 6.60 7.55 2 .83 3 0.98 0.00 0.00 5.88 0.98 8.82 2.94 0.00 0.00 2.94 10.78 5.88 13.73 0.00 4.90 3.92 19.61 1.96 8.82 5.88 4 0.00 0.00 0.00 0.87 0.00 0.87 13.04 1.74 6.09 2.61 11.30 13.04 3.48 5.22 3.48 8.70 3.48 1.74 14.78, 7.83 5 2.86 0.00 0.00 3.81 0.95 3.81 3.81 0.00 3.81 3.81 9.52 9.52 12.38 2.86 9.52 4.76 7.62 2.86 7.62 9 .52 6 0.00 0.00 0.88 2.63 0.00 1.75 13.16 0.88 4.39 1.75 14.04 9.65 7.02 5.26 4.39 11.40 2.63 1.75 10.53 6.14 7 1.92 0.00 0.00 2.88 0.96 4.81 2.88 0.00 1.92 4.81 12.50 6.73 13.46 1.92 6.73 4.81 10.58 3.85 9.62 7 .69 8 2.56 3.42 0.00 0.85 0.85 0.85 12.82 0.85 1.71 0.85 20.51 2.56 3.42 9.40 5.98 11.11 0.85 4.27 11.97 3.42 9 0.00 0.00 0.00 2.97 2.97 9.90 2.97 0.00 0.99 3.96 6.93 1.98 13.86 1.98 2.97 3.96 23.76 2.97 8.91 6 .93 10 1.87 0.93 3.74 2.80 0.00 0.00 2.80 0.00 7.48 8.41 9.35 7.48 3.74 14.95 12.15 0.00 2.80 4.67 7.48 7.48 11 0.00 0.89 0.00 0.00 0.00 1.79 8.04 0.00 5.36 4.46 15.18 8.04 8.93 4.46 3.57 8.04 4.46 6.25 13.39 5 .36 12 2.73 0.00 0.91 2.73 0.91 3.64 4.55 3.64 3.64 1.82 9.09 5.45 3.64 5.45 6.36 7.27 8.18 5.45 10.91 9.09 13 1.80 0.90 0.90 0.90 0.00 0.90 9.01 0.00 3.60 7.21 14.41 8.11 7.21 6.31 7.21 4.50 1.80 7.21 11.71 4 .50
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有