CRc 坐 Cancer Research Center Shandong University 第二章 生物数据库 ①
2
CRcI 坐 Cancer Research Center Shandong University 21为什么需要生物数据库? 什么 东东? 0同0分m○ gcattac ttqatctaatca ataggatctaatctt tactagaacgcc ttqatctaatca tgca
3 2.1为什么需要生物数据库? 什么 东东? gcattac ttgatctaatca ataggatctaatctt tactagaacgcc ttgatctaatca ttgcaa
CRcI 坐 Cancer Research Center Shandong University 21为什么需要生物数据库? 这是HIV1病毒 的整个基因组 包含9752个碱基, 构成9个基因。 gcattac ttgatctaatca 9p120 Protease ataggatctaatctt Glycoprote tactagaacgcc Lipid ttgatctaatca tgca
4 这是HIV1病毒 的整个基因组, 包含9752个碱基, 构成9个基因。 2.1为什么需要生物数据库? gcattac ttgatctaatca ataggatctaatctt tactagaacgcc ttgatctaatca ttgcaa
CRcI 坐 Cancer Research Center Shandong University 21为什么需要生物数据库? 人基因组:3Gbp=30000000bp 5000bp/页 600页/书 1000本3cm厚的书 60000页 1000书 30m长的书架 26.6me 超过1000个物种: LIBRARY 1000个30m长的书架 200个五层的书架 (6m/层 450,000本书
5 人基因组 : 3 Gbp = 3,000,000,000 bp 5000bp/页 600页/书 1000 本 3cm厚的书 600,000 页 1000 书 = 30m长的书架 超过1000个物种: 1000 个 30m长的书架 = 200 个 五层的书架 (6m/层) 450,000 本书 26.6m = 2 x 2.1为什么需要生物数据库?
CRcI 坐 Cancer Research Center Shandong University 21为什么需要生物数据库? 10c 所有测序的基因组: 收集 访问 00 更新 生物数据库: 被组织起来 的大量生物 管理 数据,这些 数据通过计 算机可以被 a回 方便的访问、 DATABASE MANAGEMEN 管理及更新
6 10cm 14.6cm x 1000 所有测序的基因组: 26.6m 收集 访问 管理 更 新 2.1为什么需要生物数据库? 生物数据库: 被组织起来 的大量生物 数据,这些 数据通过计 算机可以被 方便的访问、 管理及更新
CRcI 坐 Cancer Research Center Shandong University 21为什么需要生物数据库? 天文数字单位: 尧 yotta10000000000000000000000 泽 zetta 1000000000000000000000 艾exa 1000000000000000000 拍peta 10000000000000(千万亿) 太tera 1000000000000(万亿)。 吉giga 1000000000(十亿) 兆 mega 1000000(百万) 0 千ki1o 1000 百 hecto100 十 deca 10 总 个 mono 1
7 天文数字单位: 尧 yotta 1000000000000000000000000 泽 zetta 1000000000000000000000 艾 exa 1000000000000000000 拍 peta 1000000000000000 (千万亿) 太 tera 1000000000000 (万亿) 吉 giga 1000000000 (十亿) 兆 mega 1000000 (百万) 千 kilo 1000 百 hecto 100 十 deca 10 个 mono 1 2.1为什么需要生物数据库?
CRcI 坐 Cancer Research Center Shandong University 22生物数据库的分类 >2000 核酸数据库蛋白质数据库 级核酸数据库 一级蛋白质数据库 NCBI GenBankEML 蛋白质序列数据库蛋白质结构数据库 ENA INSDC swissprot TEMBLEPDI E assembl PROTEIN DAT UniProt DDBJ DNA Data Bank of Japan Protein Information Resource 二级核酸数据库 WombAt 公N 二级蛋白质数据库 SCHe PRINTS ma Fly Base Publ led.gov CAT:P STR小NG UniGene OMIM麟≥ 专用数据库 prosite pfam 8
8 蛋白质结构数据库 蛋白质数据库 一级蛋白质数据库 INSDC UniProt 蛋白质序列数据库 二级蛋白质数据库 核酸数据库 一级核酸数据库 二级核酸数据库 专用数据库 >2000 2.2生物数据库的分类
CRcI 坐 Cancer Research Center Shandong University 22生物数据库的分类 >2000 核酸数据库蛋白质数据库 级核酸数据库 一级蛋白质数据库 NCBI GenBankEML 蛋白质序列数据库蛋白质结构数据库 ENA INSDC swissprot TEMBLEPDI E assembl PROTEIN DAT UniProt DDBJ DNA Data Bank of Japan Protein Information Resource 二级核酸数据库 二级蛋白质数据库 WombAt rnot commercio SCHe PRINTS ma Fly Base PubMEd.go CAT:P STR小NG UniGene OMIM己m 专用数据库 prosite pfam 9
9 蛋白质结构数据库 蛋白质数据库 一级蛋白质数据库 INSDC UniProt 蛋白质序列数据库 二级蛋白质数据库 核酸数据库 一级核酸数据库 二级核酸数据库 专用数据库 >2000 2.2生物数据库的分类
CRcI 坐 Cancer Research Center Shandong University 23文献数据库 Pubmed Im, your sequence looks pretty much like a 基因序列 dUTPase 生物信息学 专家 可啥是 太棒了!原来 duTPase 是 dUTPase 啊! 10
10 基因序列 生物信息学 “专家” 2.3 文献数据库PubMed
CRCI 坐 Cancer Research Center Shandong University 23文献数据库 Pubmed http://www.ncbi.nlmnihgov/pubmedosE 8 NCBI Resources How To Sign in to NCBI PubmEd.gow PubMed√ dUTPase National Institutes of Health Advanced Help PubMed PubMed Commons PubMed comprises more than 24 million citations for biomedical literature from MEDLINE, life science journals and online books. Citations may include links to full-text Featured comment- Sep 3 content from PubMed Central and publisher web sites What you see: D Allison critiques animated representation of a weight management drugs trial results. 1.usa. gov/1lvlkiD Using PubMed PubMed Tools More Resources PubMed quick start guide PubMed mobile MesH Database Full Text Articles Single Citation Matcher Journals in ncBl databases PubMed FAQs Batch Citation Matcher Clinical Trials PubMed Tutorials Clinical Queries E-Utilities(APD) Topic-Specific Queries Linkout New and Noteworth
11 http://www.ncbi.nlm.nih.gov/pubmed 2.3 文献数据库PubMed