真核生物基因的一般结构 外显子内含子外显子 ATGGGCAATGCAAGGTACGGTGAGCAGGTAAGTGATTAATGCATTTCTCGCAGTGACTAGACGATGCATAG M GNA R G EQ. M Y G E Q V S D
真核生物基因的一般结构
内含子的组成特点 5 splice site Branch point 3 splice site nExon Intron 3 Exon Pre-mRNA AC A GG U AG A G UC U AG A C/U region N C A GG Frequency of7060801001009570804580908010080 8010010060 occurence(%) 20-50b 1)内含子具有前体mRNA加工的特征顺序 2)内含子含有高比例的三种读框的终止密码
内含子的组成特点 1) 内含子具有前体mRNA加工的特征顺序. 2) 内含子含有高比例的三种读框的终止密码
内含子含有高比例的三种读框的终止密码 pre-mRNA spl icing factor SF2 第1外显子:TAG,TAA,TGA=6,读码框=61,6/61=10% ctatatatgcagaaacaatgagcagacgcaacagccgcaccatctatgtaggcaatctc cctggggacattcgtgagagggaggttgaggatctcttttacaaggtgagctttactgc tttacaatctacctcagttcttctcataagcaac taccatt tcaatctggtcgtagc tg tataggcataatacattgcttattttc 第1内含子:TAG,TAA,TGA=41,读码框=224,41/224=18% ctacctgttaagt tgccttagcttattaatgtgagaaatagc tagcggt tgaaggattt aaatcatattatgctagtggttaaggatttaaataattattattatagtattataagag ttataaaggattattgttctgtaattcgtggatgagtctaagggtaaagcaattgcggg aagaaaggaaccatctggccttgtgtcgccaaagaagcgctatttaggaagttgtcttg tctgtat taaatatctgttggctgtttcaacttgcgatgtcttctcctgctgttttggt agtgaataatcattttct taatagcacaaccattgatgctcttgagcatccatcagcgt aaacagttgggtgtgatttatcctagatgacaactgataacctgtgtgccat tgcgaaa aagtagtcatatattgcagatgggaacgtgttgacaaatgatatatttcatgagtcata ttcagat taagggtgttgtatttgtacttattttctaagctaatgtggaggtgcagttg tgaaaagtttcac taataagtccaattaagtttatgtatatatgttattccagtgtttt tatcccttacaattgcaataagaaccttaatcttgataacatgcatgcttttttttctc ataaa tttattctaa tgcagt 内含子三种读框中终止密码比率远高于外显子(8%>10%
内含子含有高比例的三种读框的终止密码 内含子三种读框中终止密码比率远高于外显子(18%>10%)
外显子的组成特点 1)CpG岛:脊椎动物 2)摇摆密码子的使用频率或密 码子偏爱 3)5-和3”-非翻译区(UTR碱基 比率,水稻基因5的高GC比 不含或含有较少的终止密码
外显子的组成特点 1) CpG岛:脊椎动物 2) 摇摆密码子的使用频率或密 码子偏爱 3) 5’-和3’-非翻译区(UTR)碱基 比率, 水稻基因5’的高GC比 4) 不含或含有较少的终止密码
密码子偏爱 LEU: TTA SER: AGT( O) 2 ARG: AGA( 89) 5 TTG 91)4 AGO AGG CTA 2)1 TCA 2)3 CGA O CTG O) 1O TCG( O) O CGG O) O CTT O 2oo0 CT(46)5 CGT 10)O O) O ALA: GC GLY: GGA GGG GTG O GCT GTT 5O GCC GGC GTC 5O) PRO: CCA( 89) O THR: ACA( 3 ILE: ATA( O) O) CCT ACT ATT CCc AcC(52)4 ATC 50)6 PHE.TTT CYS: TGT (1O0) 8)2 92)6 TGC( O) CAC(92)1 GLN: CAA (100) 4 ASN: AAT( 3 ASP: GAT 16)2 CAG( O) 8 GAC(84)6 GLU: GAA 97)6 TYR: TAT LYS: AAA 14) GAG TAC 98)4 AAG 86) MET: ATG (1O0) 5 TRP: TGG (1OO) 2 STOP TAG 注:酵母细胞中密码子的偏爱克隆的人类基因在酵母中表达时 密码子的使用频率不同于人类细胞.括号内为酵母细胞密码子使 用频率,括号后的数字为人类干扰素基因密码使用次数
密码子偏爱
同源查询(DNA顺序) 1 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 2 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 1 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT 2 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT
同源查询(DNA顺序) 1 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 180 2 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 115 1 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT 240 2 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT 175