正在加载图片...
DDBJ的网址是:http://www.ddbi.nigac.ipo 基因组数据库(GDB)为人类基因组计划(HGP)保存和处理基因组图谱数据。GDB的目标是构建关于人类基因 组的百科全书,除了构建基因组图谱之外,还开发了描述序列水平的基因组内容的方法,包括序列变异和 其它对功能和表型的描述。目前GDB中有:人类基因组区域(包括基因、克隆、 amplimers PCr标记、断点 breakpoints、细胞遗传标记 cytogenetic markers、易碎位点 fragile sites、EST序列、综合区域 syndromic regions、 contigs和重复序列):人类基因组图谱(包括细胞遗传图谱、连接图谱、放射性杂交图谱、 content contig图谱和综合图谱等):人类基因组内的变异(包括突变和多态性,加上等位基因频率数据)。GDB数据 库以对象模型来保存数据,提供基于Web的数据对象检索服务,用户可以搜索各种类型的对象,并以图形 方式观看基因组图谱。 DB的网址是http://www.gdborga GDB的国内镜像是http://gdb.pkueducn/gdb/o 3.2蛋白质数据库 1.PIR和PSD PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国 际蛋白质序列数据库( JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释 的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完 整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按 蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以 及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶一底物相互作用、活化和调控级 联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分 PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互 式检索:标准的序列相似性搜索,包括 BLAST、 FASTA等:结合序列相似性、注释信息和蛋白质家族信息的 高级搜索,包括按注释分类的相似性搜索、结构域搜索 GeneFI№等 1R和PSD的网址是http://pir.georgetownedu 数据库下载地址是:ftp:// nbrfa, georgetown..edu/pir/。 SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列 每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、 转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序 列变异体和冲突等信息。 SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用 其中包括核酸序列库、蛋白质序列库和蛋白质结构库等 利用序列提取系统(SRS)可以方便地检索 SWISS-PROT和其它EBI的数据库DDBJ的网址是: http://www.ddbj.nig.ac.jp/ 。 4. GDB 基因组数据库(GDB)为人类基因组计划(HGP)保存和处理基因组图谱数据。GDB 的目标是构建关于人类基因 组的百科全书,除了构建基因组图谱之外,还开发了描述序列水平的基因组内容的方法,包括序列变异和 其它对功能和表型的描述。目前 GDB 中有:人类基因组区域(包括基因、克隆、amplimers PCR 标记、断点 breakpoints、细胞遗传标记 cytogenetic markers、易碎位点 fragile sites、EST 序列、综合区域 syndromic regions、contigs 和重复序列);人类基因组图谱(包括细胞遗传图谱、连接图谱、放射性杂交图谱、content contig 图谱和综合图谱等);人类基因组内的变异(包括突变和多态性,加上等位基因频率数据)。GDB 数据 库以对象模型来保存数据,提供基于 Web 的数据对象检索服务,用户可以搜索各种类型的对象,并以图形 方式观看基因组图谱。 GDB的网址是: http://www.gdb.org 。 GDB的国内镜像是: http://gdb.pku.edu.cn/gdb/ 。 3.2 蛋白质数据库 1. PIR 和 PSD PIR 国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国 际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释 的、非冗余的蛋白质序列数据库,包含超过 142,000 条蛋白质序列(至 99 年 9 月),其中包括来自几十个完 整基因组的蛋白质序列。所有序列数据都经过整理,超过 99%的序列已按蛋白质家族分类,一半以上还按 蛋白质超家族进行了分类。PSD 的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以 及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级 联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。 PSD 数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR 提供三类序列搜索服务:基于文本的交互 式检索;标准的序列相似性搜索,包括 BLAST、FASTA 等;结合序列相似性、注释信息和蛋白质家族信息的 高级搜索,包括按注释分类的相似性搜索、结构域搜索 GeneFIND 等。 PIR和PSD的网址是: http://pir.georgetown.edu/ 。 数据库下载地址是: ftp://nbrfa.georgetown.edu/pir/ 。 2. SWISS-PROT SWISS-PROT 是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列 条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、 转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序 列变异体和冲突等信息。SWISS-PROT 中尽可能减少了冗余序列,并与其它 30 多个数据建立了交叉引用, 其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。 利用序列提取系统(SRS)可以方便地检索 SWISS-PROT 和其它 EBI 的数据库
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有