第二章生物信息学数据库简
第二章 生物信息学数据库简介
数据库( Database) 用于收集、整理、储存、加工、发布 和检索数据的系统。 ◆生物类的数据库种类很多 ◆投稿文章首先要将核苷酸序列或蛋白 质序列提交到相应的数据库中
数据库(Database) 用于收集、整理、储存、加工、发布 和检索数据的系统。 生物类的数据库种类很多 投稿文章首先要将核苷酸序列或蛋白 质序列提交到相应的数据库中
◆数据库记录通常包括两部分 ◇原始数据 对这些数据进行的生物学意义的注释 ◆一个数据库通常链接了多个相关数据库 令核苷酸数据库一水稻抗病基因X26 AY364476 Taxonomy数据库 Pubmed数据库 NCBI- Protein数据库
数据库记录通常包括两部分 原始数据 对这些数据进行的生物学意义的注释 一个数据库通常链接了多个相关数据库 核苷酸数据库-水稻抗病基因Xa26 AY364476 Taxonomy 数据库 Pubmed 数据库 NCBI-Protein 数据库
(一)数据库工具 ◆建立纯文本数据库 令 Gen bank数据库、EMBL核苷酸数据库 MySQL数据库工具 令SQL(结构化查询语言)是世界上流行的和 标准化的数据库语言 令能够快速灵活存储记录文件和图像 ☆下载网址 http://download.sourceforge.net/pub/mirrors/mys ql/Downloads/MysQL-323/mysql-323 38 win.zp
(一)数据库工具 建立纯文本数据库 GenBank 数据库、EMBL 核苷酸数据库 MySQL 数据库工具 SQL(结构化查询语言)是世界上流行的和 标准化的数据库语言 能够快速灵活存储记录文件和图像 下载网址 http://download.sourceforge.net/pub/mirrors/mys ql/Downloads/MySQL-3.23/mysql-3.23.38- win.zp
◆ AceDB数据库工具 令 AceD:AC. elegans Data Base(线虫数据库) 令被广泛应用的管理和提供基因组数据的工具 令数据形式丰富 √遗传图谱 √物理图谱 √新陈代谢途径 序列等
AceDB 数据库工具 AceDB:A C. elegans DataBase(线虫数据库) 被广泛应用的管理和提供基因组数据的工具 数据形式丰富 9 遗传图谱 9 物理图谱 9 新陈代谢途径 9 序列等
(二)各种生物数据库 1、核苷酸数据库 ◆DNA、mRNA、tRNA、rRNA序列 RNA序列以CDNA序列的形式存在 核苷酸序列直接来源于实验数据 大量基酸序列 主要是非实验来源数据 o coding sequence(CDs)
(二)各种生物数据库 1、核苷酸数据库 DNA 、mRNA 、tRNA 、rRNA序列 RNA序列以cDNA序列的形式存在 核苷酸序列直接来源于实验数据 大量氨基酸序列 主要是非实验来源数据 coding sequence (CDS)
数据库种类很多 ◆三大核苷酸数据库 ☆ Gen bank、EMBL核苷酸、DDBJ 令信息资源共享:以天为基础进行数据库之间的 序列数据交换 令收集了专利的核苷酸序列 v United States Patent and Trademark office (USPTO) Y European Patent Office(EPO) Y Japan Patent Office (JPO)
数据库种类很多 GenBank、EMBL核苷酸、DDBJ 信息资源共享:以天为基础进行数据库之间的 序列数据交换 收集了专利的核苷酸序列 9 United States Patent and Trademark Office (USPTO) 9 European Patent Office (EPO) 9 Japan Patent Office (JPO) 三大核苷酸数据库
There are three major public dna databases EMBL Gen Bank DDBJ Housed Housed Housed at ebl at NcBi in Japan European National Bioinformatics Center for Institute Biotechnology Information
EMBL GenBank DDBJ Housed at EBI European Bioinformatics Institute There are three major public DNA databases Housed at NCBI National Center for Biotechnology Information Housed in Japan
>100,000 species are represented in Gen Bank all species 128,941 Viruses 6,137 bacteria 31262 archaea 2,100 eukaryota 87,147
>100,000 species are represented in GenBank all species 128,941 viruses 6,137 bacteria 31,262 archaea 2,100 eukaryota 87,147
The most sequenced organisms in Gen Bank Homo sapiens 10.7 billion bases Mus musculus 65b Rattus norvegicus 56b Danio rerio 1.7b Zea mays 14b Oryza sativa 0.8b Drosophila melanogaster 0.7b Ga∥ us gallus 0.5b Arabidopsis thaliana 0.5b Updated 8-12-04 Gen Bank release 142.0
The most sequenced organisms in GenBank Homo sapiens 10.7 billion bases Mus musculus 6.5b Rattus norvegicus 5.6b Danio rerio 1.7b Zea mays 1.4b Oryza sativa 0.8b Drosophila melanogaster 0.7b Gallus gallus 0.5b Arabidopsis thaliana 0.5b Updated 8-12-04 GenBank release 142.0