第5章基因组序列诠釋 1)基因注释 2)基因功能预测 3)基因功能检测 4)功能基因组研究
第5章 基因组序列诠释 1) 基因注释 2) 基因功能预测 3) 基因功能检测 4) 功能基因组研究
基因注释的依据 1)基因的组成特点 2)密码子偏爱 3)同源查询 4)实验
基因注释的依据 1) 基因的组成特点 2) 密码子偏爱 3) 同源查询 4) 实验
真核生物基因的一般结构 外显子内含子外显子 ATGGGCAATGCAAGGTACGGTGAGCAGGTAAGTGATTAATGCATTTCTCGCAGTGACTAGACGATGCATAG M GNA R G EQ. M Y G E Q V S D
真核生物基因的一般结构
真核生物基因的组成特征 1)外显子的组成 2)内含子的组成 3)碱基的分布规律
真核生物基因的组成特征 1) 外显子的组成 2) 内含子的组成 3) 碱基的分布规律
内含子的组成特点 5 splice site Branch point 3 splice site nExon Intron 3 Exon Pre-mRNA AC A GG U AG A G UC U AG A C/U region N C A GG Frequency of7060801001009570804580908010080 8010010060 occurence(%) 20-50b 1)内含子具有前体mRNA加工的特征顺序 2)内含子含有高比例的三种读框的终止密码
内含子的组成特点 1) 内含子具有前体mRNA加工的特征顺序. 2) 内含子含有高比例的三种读框的终止密码
内含子含有高比例的三种读框的终止密码 pre-mRNA spl icing factor SF2 第1外显子:TAG,TAA,TGA=6,读码框=61,6/61=10% ctatatatgcagaaacaatgagcagacgcaacagccgcaccatctatgtaggcaatctc cctggggacattcgtgagagggaggttgaggatctcttttacaaggtgagctttactgc tttacaatctacctcagttcttctcataagcaac taccatt tcaatctggtcgtagc tg tataggcataatacattgcttattttc 第1内含子:TAG,TAA,TGA=41,读码框=224,41/224=18% ctacctgttaagt tgccttagcttattaatgtgagaaatagc tagcggt tgaaggattt aaatcatattatgctagtggttaaggatttaaataattattattatagtattataagag ttataaaggattattgttctgtaattcgtggatgagtctaagggtaaagcaattgcggg aagaaaggaaccatctggccttgtgtcgccaaagaagcgctatttaggaagttgtcttg tctgtat taaatatctgttggctgtttcaacttgcgatgtcttctcctgctgttttggt agtgaataatcattttct taatagcacaaccattgatgctcttgagcatccatcagcgt aaacagttgggtgtgatttatcctagatgacaactgataacctgtgtgccat tgcgaaa aagtagtcatatattgcagatgggaacgtgttgacaaatgatatatttcatgagtcata ttcagat taagggtgttgtatttgtacttattttctaagctaatgtggaggtgcagttg tgaaaagtttcac taataagtccaattaagtttatgtatatatgttattccagtgtttt tatcccttacaattgcaataagaaccttaatcttgataacatgcatgcttttttttctc ataaa tttattctaa tgcagt 内含子三种读框中终止密码比率远高于外显子(8%>10%
内含子含有高比例的三种读框的终止密码 内含子三种读框中终止密码比率远高于外显子(18%>10%)
外显子的组成特点 1)CpG岛:脊椎动物 2)摇摆密码子的使用频率或密 码子偏爱 3)5-和3”-非翻译区(UTR碱基 比率,水稻基因5的高GC比 不含或含有较少的终止密码
外显子的组成特点 1) CpG岛:脊椎动物 2) 摇摆密码子的使用频率或密 码子偏爱 3) 5’-和3’-非翻译区(UTR)碱基 比率, 水稻基因5’的高GC比 4) 不含或含有较少的终止密码
密码子偏爱 LEU: TTA SER: AGT( O) 2 ARG: AGA( 89) 5 TTG 91)4 AGO AGG CTA 2)1 TCA 2)3 CGA O CTG O) 1O TCG( O) O CGG O) O CTT O 2oo0 CT(46)5 CGT 10)O O) O ALA: GC GLY: GGA GGG GTG O GCT GTT 5O GCC GGC GTC 5O) PRO: CCA( 89) O THR: ACA( 3 ILE: ATA( O) O) CCT ACT ATT CCc AcC(52)4 ATC 50)6 PHE.TTT CYS: TGT (1O0) 8)2 92)6 TGC( O) CAC(92)1 GLN: CAA (100) 4 ASN: AAT( 3 ASP: GAT 16)2 CAG( O) 8 GAC(84)6 GLU: GAA 97)6 TYR: TAT LYS: AAA 14) GAG TAC 98)4 AAG 86) MET: ATG (1O0) 5 TRP: TGG (1OO) 2 STOP TAG 注:酵母细胞中密码子的偏爱克隆的人类基因在酵母中表达时 密码子的使用频率不同于人类细胞.括号内为酵母细胞密码子使 用频率,括号后的数字为人类干扰素基因密码使用次数
密码子偏爱
同源查询(DNA顺序) 1 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 2 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 1 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT 2 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT
同源查询(DNA顺序) 1 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 180 2 CCCCCGGTTGCTGACTTGCCGCGGGAAGGAGGATGAGCAGGCGGTGGAGCCGGACGATCT 115 1 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT 240 2 ACGTGGGGAATCTCCCTGGTGACATCAGGGAGAGGGAGGTGGAGGATCTCTTCTACAAGT 175
同源查询(氨基酸顺序) GAPGMWLRLAAGS F EH AG 顺序1cG 顺序2 ACACCCCGTATTTGACAGCAATTTGCAGGGGGATGATTGCACCATGGAGCG DTPRI HHGA 从功能的意义看,氨基酸的同源性比DNA更加重要
同源查询(氨基酸顺序) 从功能的意义看, 氨基酸的同源性比DNA更加重要