
生物信息学课程Bioinformatics第六章基因组学及宏基因组学
生物信息学 课程 Bioinformatics 第六章 基因组学及宏基因组学

生物信息学课程本章内容Bioinformatics:首先,定义了基因组学,并讨论了获得和解读基因组序列的方法,并介绍了高通量测序技术在动植物和微生物DNA测序中的应用。·其次,详细介绍了基因组组装的算法、基因预测技术和基因组注释的方法。·第三,深入探讨了序列变异检测的基本原理和技术·第四,宏基因组学部分概述了微生物组学的概念、数据分析方法,以及在健康和环境领域的应用·最后,对基因组和宏基因组的未来发展方向进行了展望。2
2 生物信息学 课程 Bioinformatics 本章内容 • 首先,定义了基因组学,并讨论了获得和解读基因组序列的方法,并介绍了高通量测序技术在动 植物和微生物DNA测序中的应用。 • 其次,详细介绍了基因组组装的算法、基因预测技术和基因组注释的方法。 • 第三,深入探讨了序列变异检测的基本原理和技术。 • 第四,宏基因组学部分概述了微生物组学的概念、数据分析方法,以及在健康和环境领域的应用。 • 最后,对基因组和宏基因组的未来发展方向进行了展望

生物信息学课程目录大纲Bioinformatics基因组学概述01研究基因组序列、结构和功能的科学。基因组组装与注释02基因组组装算法、基因预测技术和基因组注释方法。序列变异检测03单碱基替换、短插入缺失和结构变异的检测技术宏基因组学04微生物组学概念、数据分析方法,以及在健康和环境领域的应用。3
生物信息学 课程 Bioinformatics 基因组学概述 研究基因组序列、结构和功能的科学。 01 基因组组装与注释 基因组组装算法、基因预测技术和基因组注释方法。 02 03 序列变异检测 单碱基替换、短插入缺失和结构变异的检测技术。 宏基因组学 微生物组学概念、数据分析方法,以及在健康和环境领域的应用。 04 3 目录大纲

生物信息学课程基因组学概述Bioinformatics:基因组学(Genomics),简单来说就是研究基因组(Genome)的科学·在基因组学中所研究的问题主要分为三类:·如何获得基因组序列·如何解读/解码基因组·如何重写/编写新的基因组4
4 生物信息学 课程 Bioinformatics 基因组学概述 • 基因组学(Genomics),简单来说就是研究基因组(Genome)的科学 • 在基因组学中所研究的问题主要分为三类: • 如何获得基因组序列 • 如何解读/解码基因组 • 如何重写/编写新的基因组

生物信息学课程基因组学概述Bioinformatics测序原理及方法BA Sanger测序法/双脱氧链终止法二代测序法/边合成边测序荧光标记 (可切除)魅终止(可逆)QdGTPGCO一个测序:4个反应,4条泳道英光标记OdCTPCGCG.CGddGTPATATBa#adATP.复应A模板引物[P标记】ATedaCTP.dTTP3'ca86ddATPycle/PA福EHTT+ddATP+ddTTP+ddGTP+ddCTPddTTPteoCyclei+fTTDNATTccA+GG3GACKRUOUHUOKEUREPAROANOOAUUOAT加一个减基,1切除爱复基团,加下个减基+1AAA终止,漳灭荧光基团,oUuO0读取荧光进入下一轮循坏c3C0自动化A83883AN个智环,N个破基延伸2终止于肉毛细管电泳.+.TAE1+2cyclel/+1分子嵌1(custer)50004直读N眼毛细管dATPddATP=10:1爱胶放射自显影图..ATA五补链芯片N个测序N个分子链,N个读膜(read)(A)Sanger测序法基本原理及其毛细管电泳自动化。(B)二代高通量并行测序原理。5
生物信息学 课程 Bioinformatics 基因组学概述 测序原理及方法 (A)Sanger测序法基本原理及其毛细管电泳自动化。(B)二代高通量并行测序原理。 5

生物信息学课程基因组学概述Bioinformatics测序原理及方法通量特点仪器成本(S)测序成本($/Mbase)读长(bp)测序质量(Q30)HiSeq (NovaSeq XPlus)~100万~0.022x150每日~8Tb≥85%通量高、单Read成本低BGISEQ-T20~100万~0.012x150每小时900Gb≥80%成本效益高两种常用二代测序技术的比较6
6 生物信息学 课程 Bioinformatics 基因组学概述 测序原理及方法 两种常用二代测序技术的比较 仪器成本($) 测序成本($/Mbase) 读长(bp) 通量 测序质量(Q30) 特点 HiSeq (NovaSeq XPlus) ~100万 ~0.02 2x150 每日~8Tb ≥85% 通量高、单Read成本低 BGISEQ -T20 ~100万 ~0.01 2x150 每小时900Gb ≥80% 成本效益高

生物信息学课程基因组学概述Bioinformatics测序原理及方法ABPacBio三代测序Nanopore三代测序SDNA/RNAODNAsod马达蛋白四色荧光标记dNTPs纳米孔蛋白DNA案合MZMWL时间激发光荧光膜信号处理)记录电流信号变化N个孔,N个读段离子流.+...CTGATATTGCTT时间读长达20KbN个分子穿过孔,N个读段读长可达MbACGA三代测序技术原理示意图。(A)PacBio长读长测序法基本原理。(B)Nanopore长读长测序基本原理。7
生物信息学 课程 Bioinformatics 基因组学概述 测序原理及方法 三代测序技术原理示意图。(A)PacBio长读长测序法基本原理。(B)Nanopore长读长测序基本原理。 7

生物信息学课程基因组学概述Bioinformatics·一代、二代、三代PacBio测序技术的共同点在于基于在DNA复制中对掺入的A/C/G/T引入标记信号,通过不同的方法读出DNA序列:·一代测序技术通过按片段大小依次读出未端终止碱基;·二代测序技术并行、循环可逆地边合成边读取信号(掺入终止碱基/读取信号/去除终止基团和信号);:三代测序技术并行、以单分子实时读取掺入的碱基信号。它们的主要区别在于::一代测序技术通量最低、读长稍长于二代测序技术;·二代测序技术读长最短,但通量最大::三代测序技术读长最长,但通量低于二代测序技术。8
8 生物信息学 课程 Bioinformatics 基因组学概述 • 一代、二代、三代PacBio测序技术的共同点在于基于在DNA复制中对掺入的A/C/G/T引入标记信 号,通过不同的方法读出DNA序列: • 一代测序技术通过按片段大小依次读出末端终止碱基; • 二代测序技术并行、循环可逆地边合成边读取信号(掺入终止碱基/读取信号/去除终止基团 和信号); • 三代测序技术并行、以单分子实时读取掺入的碱基信号。 • 它们的主要区别在于: • 一代测序技术通量最低、读长稍长于二代测序技术; • 二代测序技术读长最短,但通量最大; • 三代测序技术读长最长,但通量低于二代测序技术

生物信息学课程基因组学概述Bioinformatics需求工具基因鉴定GENSCAN,GlimmerHMM重复DNA序列的鉴定RepeatMasker全基因组的多重比对PHAST,Multiz保守DNA元件的鉴定phastCons,Phylop二代测序读段与参考基因组的比对Bowtie、BWA、STAR比对文件的存储和解析SAMtoolsMACS2、PeakSeqChiP-seq的peak鉴定基因表达的定量Cuffinks差异表达的统计性检验edgeR,DESseq2可变剪接事件的鉴定和定量rMATS转录因子基序(Motif)的发现MEME、Homer染色体的突变鉴定GATK、VAAST染色质状态的鉴定ChromHMMPECA、ANANSE基因调控网络的解析常用工具及其作用9
9 生物信息学 课程 Bioinformatics 基因组学概述 需求 工具 基因鉴定 GENSCAN,GlimmerHMM 重复DNA序列的鉴定 RepeatMasker 全基因组的多重比对 PHAST,Multiz 保守DNA元件的鉴定 phastCons, PhyloP 二代测序读段与参考基因组的比对 Bowtie、BWA、STAR 比对文件的存储和解析 SAMtools ChIP-seq的peak鉴定 MACS2、PeakSeq 基因表达的定量 Cufflinks 差异表达的统计性检验 edgeR、DESseq2 可变剪接事件的鉴定和定量 rMATS 转录因子基序(Motif)的发现 MEME、Homer 染色体的突变鉴定 GATK、VAAST 染色质状态的鉴定 ChromHMM 基因调控网络的解析 PECA、ANANSE 常用工具及其作用

生物信息学课程基因组学概述Bioinformatics基因组学数据可视化·常见的基于网络的集成基因组浏览器包括:UcSC和EnsemblGenomeBrowser、NCBlGenomeDataViewer等,提供了涵盖多个物种的基因组数据和工具。:本地基因组浏览器包括IGV(IntegrativeGenomicsViewer)、IGB(lntegratedGenomeBrowser)等。10
10 生物信息学 课程 Bioinformatics 基因组学概述 基因组学数据可视化 • 常见的基于网络的集成基因组浏览器包括:UCSC和Ensembl Genome Browser、NCBI Genome Data Viewer等,提供了涵盖多个物种的基因 组数据和工具。 • 本地基因组浏览器包括IGV (Integrative Genomics Viewer)、IGB (Integrated Genome Browser)等