
生物信息学课程Bioinformatics第四章生物信息资源
生物信息学 课程 Bioinformatics 第四章 生物信息资源

生物信息学课程内容提纲Bioinformatics第一节生物数据库简介第二节国际主要数据中心第三节国际重要生物数据库第四节生物数据库发展趋势23
2 3 生物信息学 课程 Bioinformatics 内容提纲 第一节生物数据库简介 第二节国际主要数据中心 第 三节 国际重要生物数据库 第四节 生物数据库发展趋势

生物信息学课程第四章生物信息资源Bioinformatics第一节生物数据库简介
生物信息学 课程 Bioinformatics 第一节 生物数据库简介 第四章生物信息资源

生物信息学课程生命科学进入大数据时代Bioinformatics1000GenomesHUMANCELL大数据驱动91PBATLAS研究范式转变人类细胞图谱数据量*2016rotist干人基因组计划PX←20082015万种原生生物基因组计划The Cancer2019-GenomeAtias万种鸟类基因组计划12015-TCGA2006-2018大科学计划ROADMAPepigenomics科学数据累积PROJEC人类基因组计划ENCODE大熊猫基因组计划地球生物基因组计划2003-1990—20012018-20082009测序技术一代测序技术二代测序技术三代测序技术单细胞测序技术66*NCBISRA(asofJuly2024)
6 生物信息学 课程 Bioinformatics 生命科学进入大数据时代 6 测序技术 千人基因组计划 2008—2015 大科学计划 科学数据累积 一代测序技术 二代测序技术 三代测序技术 单细胞测序技术 大数据驱动 研究范式转变 人类基因组计划 1990—2001 万种鸟类基因组计划 2015— 大熊猫基因组计划 2008—2009 地球生物基因组计划 2018— TCGA 2006-2018 人类细胞图谱 2016— ENCODE 2003— 万种原生生物基因组计划 2019— * NCBI SRA (as of July 2024) 91 PB 数据量*

生物信息学课程生物大数据是国家重要战略资源Bioinformatics促进生物经济发展新质生产力驱动生命科学研究范式变革EGlobal Next-GenerationBiomanufacturingMarketGlobalBiopharmaceuticalsMarketnaturenatireMarket fofecast togrowat a CAGRof14.85%MarketforecasttogrowataCAGRof13.41生物制造生物医药GROWTHUSD 85,201.2MillionUSD 700,873.94FACTORROTEINWEUSD329,966.22.millionUSD21,333.7Million2021203120222028AlphaFoldGeneFormer2028年全球生物经济市场超过7800亿美元Nature2018Nature2023(根据ResearchandMarkets统计)科学研究2022中国生物产业2025年发展报告2022实验模型仿真数据我国生物经济总量达归纳推演模拟探索22万亿元第一范式第二范式第三范式第四范式57
生物信息学 课程 Bioinformatics 生物大数据是国家重要战略资源 驱动生命科学研究范式变革 AlphaFold Nature 2018 GeneFormer Nature 2023 2028年全球生物经济市场超过7800亿美元 (根据Research and Markets统计) 促进生物经济发展新质生产力 实验 归纳 模型 推演 仿真 模拟 数据 探索 科学研究 第一范式 第二范式 第三范式 第四范式 2025年 我国生物经济总量达 22万亿元 生 物 制 造 5 7 生 物 医 药

生物信息学课程生物数据库是生物数据的重要载体Bioinformatics收集访问国家重要战略资源生物数据库科技发展基础设施整理生物数据检索储存管理管理审编数据信息资源保藏V生物科技安全根基应用更新68
生物信息学 课程 Bioinformatics 生物数据库是生物数据的重要载体 收 集 整 理 储 存 管 理 审 编 应 用 生 物 数 据 访 问 检 索 管 理 更 新 ➢ 国家重要战略资源 生 ➢ 科技发展基础设施 物 数 据 库 6 8 ➢ 数据信息资源保藏 ➢ 生物科技安全根基

生物信息学课程生物数据库特点Bioinformatics生物数据库种类繁多:序列、结构、文献、代谢、表达谱、基因组等多层级:数据库一→信息库→知识库交叉链接:原始数据,分析结果,文献知识“用户至上”+“数据至上”:递交-存储-审核-质控-发布-共享序列文献代谢结构表达谱基因组79
生物信息学 课程 Bioinformatics 生物数据库特点 生 物 数 据 库 ➢ 种类繁多:序列、结构、文献、代谢、表达谱、基因组等 ➢ 多层级:数据库 → 信息库 → 知识库 ➢ 交叉链接:原始数据,分析结果,文献知识 ➢ “用户至上”+“数据至上”:递交-存储-审核-质控-发布-共享 序列 结构 文献 代谢 表达谱 基因组 7 9

生物信息学课程生物数据库分类Bioinformatics生物大分子数据库研究对象为主的数据库生物学其他数据库综合型数据库病毒数据库生物互作数据库DNA数据库原核生物数据库细胞通讯数据库RNA数据库代谢数据库真核生物数据库蛋白质数据库生物反应数据库人与人类疾病类数据库动物与动物模型数据库单细胞数据库植物数据库转录因子结合位点数据库微生物相关数据库非编码RNA数据库其它物种数据库10 10
10 10 生物信息学 课程 Bioinformatics 生物数据库分类 ◆ 生物大分子数据库 ➢ 综合型数据库 ➢ DNA数据库 ➢ RNA数据库 ➢ 蛋白质数据库 ◆ 研究对象为主的数据库 ➢ 病毒数据库 ➢ 原核生物数据库 ➢ 真核生物数据库 ➢ 人与人类疾病类数据库 ➢ 动物与动物模型数据库 ➢ 植物数据库 ➢ 微生物相关数据库 ➢ 其它物种数据库 ◆ 生物学其他数据库 ➢ 生物互作数据库 ➢ 细胞通讯数据库 ➢ 代谢数据库 ➢ 生物反应数据库 ➢ 单细胞数据库 ➢ 转录因子结合位点数据库 ➢ 非编码RNA数据库

生物信息学课程生物数据库期刊Bioinformaticsh Bioinformatics?Briefings inBioinformaticsBioinformaticsBioinformaticsAdvancesBriefingsinBioinformaticsBMCBioinformaticsCurrentBioinformaticsDatabaseONFS!GPBGenomicsProteomics&BioinformaticsclescAcidsResearchJournalof BioinformaticsandComputational BiologyMolecularPlantNucleicAcidsResearchNARGenomicsandBioinformaticsNatureGeneticsROSRERD±1.11
1 生物信息学 课程 Bioinformatics 生物数据库期刊 1 11 ➢ Bioinformatics ➢ Bioinformatics Advances ➢ Briefings in Bioinformatics ➢ BMC Bioinformatics ➢ Current Bioinformatics ➢ Database ➢ Genomics Proteomics & Bioinformatics ➢ Journal of Bioinformatics and Computational Biology ➢ Molecular Plant ➢ Nucleic Acids Research ➢ NAR Genomics and Bioinformatics ➢ Nature Genetics

生物信息学课程生物数据库简介BioinformaticsNucleicAcidsResearch数据库专辑(1994~)网络服务器专辑(2003~)计算机相关大型综合数据库DNA核苷酸序列、结构、调控类数据库Nucleic.Acids教育Research蛋白质序列、结构、结构域类数据库表达代谢、信号途径、酶类数据库人类基因组文献病毒、细菌、原生动物、真菌类数据库模式生物人类基因组、模式生物、比较基因组类数据库其他分子基因组变异、疾病、药物类数据库蛋白质植物类数据库OOXEORRRNA其它类数据库序列比较12 12
生物信息学 课程 Bioinformatics 生物数据库简介 Nucleic Acids Research ◆ 数据库专辑(1994~) ➢ 大型综合数据库 ➢ 核苷酸序列、结构、调控类数据库 ➢ 蛋白质序列、结构、结构域类数据库 ➢ 代谢、信号途径、酶类数据库 ➢ 病毒、细菌、原生动物、真菌类数据库 ➢ 人类基因组、模式生物、比较基因组类数据库 ➢ 基因组变异、疾病、药物类数据库 ➢ 植物类数据库 ➢ 其它类数据库 ◆ 网络服务器专辑(2003~) ➢ 计算机相关 ➢ DNA ➢ 教育 ➢ 表达 ➢ 人类基因组 ➢ 文献 ➢ 模式生物 ➢ 其他分子 ➢ 蛋白质 ➢ RNA ➢ 序列比较 12 12