第7章基因组分析 Yedo475 ATGGAGATGGAGGCTGCTAACTAGCCA CGCCGGGGGGCTGCCTGACCTCTTCACG GTGGCCTCGATGTCCACGTTGAGTATCC 12:< b264 Xbcd Ico GGTTGTGTCGCGAAGCGAGCGTAGCTC AATGGGCTATGTTOCTTTTTTTTAAATC ICTTAGCACATATACTTGTATTTAGTO ATAGATGTTAATTATAGTGTGTATTTAG UTR CDS UTR
第 7 章 基因组分析 3’ 5’ CDS UTR UTR
本章主要内容 □|5.1基因组分析概述 5.2基因组作图 □5.3比较基因组学 □|54功能基因组学
本章主要内容 5.1 基因组分析概述 5.2 基因组作图 5.3 比较基因组学 5.4 功能基因组学
51基因组分析概述
5.1 基因组分析概述
Genome Genome一词最早由 H. Winkler-于1920年提出。系 Gene和 Chromosome二词缩并而成。它可被译为 “基因组”或“染色体组”。后者指全套染色体, 前者指一个生物体、细胞器或病毒的全部基因总和 或全部遗传信息总和,这两个译名在早期被当作同 义词使用,近年来,前者仅在染色体水平研究中使 用 Genomics 以基因组分析为手段,研究基因组的结构组成、时 序表达模式和功能,并提供有关生物物种及其细胞 功能进化信息的一门学科
Genome一词最早由H.Winkler于1920年提出。系 Gene和Chromosome二词缩并而成。它可被译为 “基因组”或“染色体组” 。后者指全套染色体, 前者指一个生物体、细胞器或病毒的全部基因总和 或全部遗传信息总和,这两个译名在早期被当作同 义词使用,近年来,前者仅在染色体水平研究中使 用。 以基因组分析为手段,研究基因组的结构组成、时 序表达模式和功能,并提供有关生物物种及其细胞 功能进化信息的一门学科。 Genome Genomics
基因组学包括三个相互联系的领域: 1.结构基因组学 主要涉及从DNA序列水平上来确定基因组结构代表着基 因组分析的起始阶段,结构图谱指某一有机体的完整的DNA 序列图谱。 2功能基因组学 利用结构基因组学研究所得到的各种来源的信息,建立与 发展各种技术和实验模型来测定基因及基因组非编码序列生 物学功能的学科。代表着基因组学的新阶段。 3.比较基因组学 主要涉及不同有机体基因组间的比较研究。是基因组学 与生物信息学的一个重要分支。通过模式生物基因组间或模 式生物与人类基因组之间,待研究生物与模式生物基因组之 间的比较和鉴别,为研究生物进化、基因分离以及预测新基 因提供依据
基因组学包括三个相互联系的领域: 1.结构基因组学 主要涉及从DNA序列水平上来确定基因组结构,代表着基 因组分析的起始阶段, 结构图谱指某一有机体的完整的DNA 序列图谱。 2.功能基因组学 利用结构基因组学研究所得到的各种来源的信息,建立与 发展各种技术和实验模型来测定基因及基因组非编码序列生 物学功能的学科。代表着基因组学的新阶段。 3.比较基因组学 主要涉及不同有机体基因组间的比较研究。是基因组学 与生物信息学的一个重要分支。通过模式生物基因组间或模 式生物与人类基因组之间,待研究生物与模式生物基因组之 间的比较和鉴别,为研究生物进化、基因分离以及预测新基 因提供依据
基因组分析的任务 1.确定基因在染色体上的位置及包含的 遗传信息; 2.分析基因之间的联系; 3.分析基因与性状之间的关系; 4.基因的组成结构、表达调控等
1.确定基因在染色体上的位置及包含的 遗传信息; 2.分析基因之间的联系; 3.分析基因与性状之间的关系; 4.基因的组成结构、表达调控等。 基因组分析的任务:
基因组的特点 估计基因组大小 平均基因密度 生物体 估计基因数目 /bl 人( Homo sapiens) 3×10° 10000 l×10 小鼠( Mus musculus) 3×10 >80000 <4×104 黑腹果蝇( Drosphila melanogaster) 1.8×108 1360l 1378 拟南芥( Arabidopsis thaliana) 1×108 -25000 4000 秀丽新小杆线虫( Caenorhabditis elegans) 9.7×10 19099 5079 酿酒酵母( Saccharomyces cerevisiae) 1.2×10 6034 2005 大肠杆菌( Escherichia coli) 4.67×10 4288 l090 流感嗜血杆菌( Haemophilus influenzae) 1.8×105 1749 1030
基因组的特点: 1. 不同生物基因组大小不同 2. 不同生物基因组组成即基因在染色体上的分 布、编码区与非编码区的相对频率等不同 基因组大小与进化位置无关; 基因数目和基因组大小也不成比例。 3. 非编码区不只是基因组的组成部分 非编码区DNA对于DNA复制和控制特 定细胞中基因的表达相当重要。 非编码区一些序列与某些生长因子、激素 受体等特异结合,调节细胞以及胚胎发生 期的细胞分化、形态发生和模式形成 。 非编码区在进化方面:包含了碱基组成中 的大部分变异,给染色体重组和沉默突变 的积累提供了一个“平台”。 ~10 000
非编码区变异的检测 1.限制性酶切片段长度多态性(RFLP 2.单核苷酸多态性( Single Nucleotide polymorphism,SNP) 特点 1.数量大,分布密; 2.基因组中分布不均匀,大多数位于非编码区; 3非同义cSNP导致性状改变,对医学诊断、药 物开发研究具有重大意义
1. 限制性酶切片段长度多态性(RFLP): 非编码区变异的检测 2. 单核苷酸多态性(Single Nucleotide Polymorphism, SNP): 是指在基因组水平上由单个核苷酸的变异所引起的一种DNA序列多态 性。是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。 SNP在人类基因组中广泛存在,平均每500~1 000个碱基对中就有1个,估 计其总数可达300万个甚至更多。 SNP多态性只涉及单个碱基变异,可由转换(transition)或颠换 (transversion)引起,也可由碱基插入或缺失所致。但通常所说的SNP并不 包括后两种情况。 转换型变异的SNP约占2/3,多为C T, 易被甲基化而自发地脱氨基形成T。 因为CpG二核苷酸上的C cSNP (coding SNP): 位于编码区内的SNP,分为2种:同义cSNP 和非同义cSNP 同义cSNP:指SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨 基酸序列,突变碱基与未突变碱基的含义相同; 非同义cSNP:指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改 变,从而影响了蛋白质的功能。这种改变常是导致生物性状 改变的直接原因。 特点: 1. 数量大,分布密; 2. 基因组中分布不均匀,大多数位于非编码区; 3. 非同义cSNP 导致性状改变,对医学诊断、药 物开发研究具有重大意义
SNP(单核苷酸多态性) 等位型1 ---CATGGCAT GAATGAT - CATGGCATTAATGAT 等位型2
SNP(单核苷酸多态性)
件)编辑)查看)收藏④A)工具()帮助0 搜索收藏夹 上网助手 地址①)间ht∥a.ai.aio/c 转到链接” The Cooperative Human Linkage Center CHL C Genetic Mapping 目 Iaps I Iarkers I Publications | Information Welcome to the Cooperative Human Linkage Center World Wide Web server. The following information is available: · Genetic maps the positions of genetic markers Search by nam nformation on marke CHLC publications CHLC project information. y What s New 完毕 Internet 开始》画的团回‖瓶sea丽单核甘酸多态性的,‖ ooperative Human L,宁國像?的的园16:23
(1) dbSNP (http://www.ncbi.nlm.nih.gov/SNP/): 由美国的NCBI主办, 除了可接受各地发来的SNP申请注册外,也向公 众免费提供对SNP的查询。 国际上重要的SNP信息网站有: (2) HGBASE (http://hgbase.interactiva.de): 该网站建在德国,收集基因内SNP,研究者可通过检测出的序列查 询SNP。 (4) CHLC (Cooperative Human Linkage Center): http://gai.nci.nih.gov/CHLC/ (3) MIT SNP数据库 (http://www-genome.wi.mit.edu/SNP/human/index.html): 由美国麻省理工学院建立,包括数千条已经定位的SNP,可以通过 指定染色体的某一区域查询SNP