生物信息岸 普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第二章生物学数据库及其检索
普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第二章 生物学数据库及其检索
第一节生物数据库简介 。什么是数据库 冬数据库类型 。生物学数据库 ÷重要的生物信息站点
第一节 生物数据库简介 ❖ 什么是数据库 ❖ 数据库类型 ❖ 生物学数据库 ❖ 重要的生物信息站点
一、什么是数据库 g数据库(database)是一类用于存储和管理数据的 计算机文档,是统一管理的相关数据的集合。其存 储形式有利于数据信息的检索与调用。数据库开发 的主要任务就是将数据以结构化记录的形式进行组 织以便于信息的检索。数据库的每一条记录 (record),也可以叫做条目(entry),则包含了 多个描述某一类的数据特性或属性的字段(field),比 如基因名,来源物种,序列的创建日期等,这也是 数据结构化的基础:而值(vaue)则是指每个记录 中某个字段的具体内容
一、什么是数据库 ❖ 数据库(database)是一类用于存储和管理数据的 计算机文档,是统一管理的相关数据的集合。其存 储形式有利于数据信息的检索与调用。数据库开发 的主要任务就是将数据以结构化记录的形式进行组 织以便于信息的检索。数据库的每一条记录 (record),也可以叫做条目(entry),则包含了 多个描述某一类的数据特性或属性的字段(field),比 如基因名,来源物种,序列的创建日期等,这也是 数据结构化的基础;而值(value)则是指每个记录 中某个字段的具体内容
二、数据库的类型 到目前为止,生物学数据库使用了4种不同的 数据库结构类型:平面文件、关系型数据库、 面向对象数据库和基于Internet平台的XML
二、数据库的类型 ❖ 到目前为止,生物学数据库使用了4种不同的 数据库结构类型:平面文件、关系型数据库、 面向对象数据库和基于Internet平台的XML
三、生物学数据库 ÷根据存放数据类型的不同,可以分为序列(如 GenBank,SWISSPROT等)、(三维)结构(如 PDB)、文献(如NCBI的PubMed)、序列特征 (如PROSITE,Pam等)、基因组图谱(如 MapViewer,Ensembl等)、表达谱等多种数据库, 每一种还可以进行更细致层次的划分。而根据数据 库存储的具体内容则还可以分为一级数据库和二级 数据库(primary and secondary databases)以及 用户针对性更强的专用数据库(specialized databases)
三、生物学数据库 ❖ 根据存放数据类型的不同,可以分为序列(如 GenBank, SWISSPROT等)、(三维)结构(如 PDB)、文献(如NCBI的PubMed)、序列特征 (如PROSITE, Pfam等)、基因组图谱(如 MapViewer, Ensembl等)、表达谱等多种数据库, 每一种还可以进行更细致层次的划分。而根据数据 库存储的具体内容则还可以分为一级数据库和二级 数据库(primary and secondary databases)以及 用户针对性更强的专用数据库(specialized databases)
一级数据库和二级数据库 一 级数据库主要内容是来源于实验室操作所得到的原始数据 结果(如测序得到的序列或经过X射线晶体衍射所得到的三维 结构数据等),包含一些基本的说明(如序列所属的物种、类 型、序列发表的文献出处等)。如GenBank、DDBJ、EMBL 以及PDB(Protein Data Bank)等 二次数据库则是在一次数据库的信息基础上进行了计算加工 处理并增加了许多人为的注释而构成的。比如NCB的 RefSeg数据库,其mRNA序列是综合了GenBank中来源于 同一物种相同基因的所有mRNA序列信息的一致性序列 consensus sequence)
一级数据库和二级数据库 ❖ 一级数据库主要内容是来源于实验室操作所得到的原始数据 结果(如测序得到的序列或经过X射线晶体衍射所得到的三维 结构数据等),包含一些基本的说明(如序列所属的物种、类 型、序列发表的文献出处等)。如GenBank、DDBJ、EMBL 以及PDB(Protein Data Bank)等 ❖ 二次数据库则是在一次数据库的信息基础上进行了计算加工 处理并增加了许多人为的注释而构成的。比如NCBI的 RefSeq数据库,其mRNA序列是综合了GenBank中来源于 同一物种相同基因的所有mRNA序列信息的一致性序列 (consensus sequence)
如何查找与研究相关的生物学资源 公共搜索引擎 冬重要的生物信息学门户站点 《核酸研究》每年的数据库专辑网络服务器 专辑
如何查找与研究相关的生物学资源 ❖ 公共搜索引擎 ❖ 重要的生物信息学门户站点 ❖ 《核酸研究》每年的数据库专辑/网络服务器 专辑
四、重要的生物信息站点 NCB-美国国家生物技术信息中心 冬EB引一欧洲生物信息研究所 ~EMBnet一欧洲分子生物学信息网络
四、重要的生物信息站点 ❖ NCBI--美国国家生物技术信息中心 ❖ EBI—欧洲生物信息研究所 ❖ EMBnet — 欧洲分子生物学信息网络
NCBI NCBl(htp:lww.ncbi.nlm.nih.goy,全称为National Center for Biotechnology Information,a建立于 1988年11月4日,下属于美国国立卫生研究院 (National Institutes of Health,简称NlH)的国立医 学图书馆(National Library of Medicine,简称 NLM)。中心的主要任务是创建公共可接入数据库 引导在计算生物学以及在基因组数据分析方面的软 件开发,同时发布各类生物医学信息。 冬 NCBI的数据资源主要包括数据库、分析工具、数据 提交及教育四个部分,每个部分的资源都有更为细 致的分类
NCBI ❖ NCBI(http://www.ncbi.nlm.nih.gov), 全称为National Center for Biotechnology Information,建立于 1988年11月4日,下属于美国国立卫生研究院 (National Institutes of Health,简称NIH)的国立医 学图书馆(National Library of Medicine,简称 NLM)。中心的主要任务是创建公共可接入数据库, 引导在计算生物学以及在基因组数据分析方面的软 件开发,同时发布各类生物医学信息。 ❖ NCBI的数据资源主要包括数据库、分析工具、数据 提交及教育四个部分,每个部分的资源都有更为细 致的分类
EBI EBl(http:lwww.ebi.ac.uk),全称是European Bioinformatics Institute,是隶属于欧洲分子生物学研究室 (EMBL)的一个非盈利性的学术机构,专门从事生物信息 学方面的研究与服务。EB的主要任务包括为科研团体免费 提供数据及生物信息学服务;从生物信息学的角度上为推动 特定科研项目的发展做出努力,为各阶层的科研人员提供高 级生物信息学培训以及帮助向工业界发布最新技术等。EB! 的网站在数据规模与承担的任务方面都与NCBI相当,其资 源也分为数据库、工具、EB研究小组、培训、帮助等几个 部分,而全部资源及工具则显示在其Site Index页面 (http://www.ebi.ac.uk/Information/sitemap.html)
EBI ❖ EBI(http://www.ebi.ac.uk),全称是European Bioinformatics Institute,是隶属于欧洲分子生物学研究室 (EMBL)的一个非盈利性的学术机构,专门从事生物信息 学方面的研究与服务。EBI的主要任务包括为科研团体免费 提供数据及生物信息学服务;从生物信息学的角度上为推动 特定科研项目的发展做出努力,为各阶层的科研人员提供高 级生物信息学培训以及帮助向工业界发布最新技术等。EBI 的网站在数据规模与承担的任务方面都与NCBI相当,其资 源也分为数据库、工具、EBI研究小组、培训、帮助等几个 部分,而全部资源及工具则显示在其Site Index页面 (http://www.ebi.ac.uk/Information/sitemap.html)中