第八章基因注释与功能分类 Gene Annotation And Functional classification
第八章 基因注释与功能分类 Gene Annotation And Functional Classification
第一节引言 背景 随着后基因组( post-genomIcs时代的来临,基因组学的研究 重心开始从阐明所有遗传信息转移到在整体分子水平对功能进行 研究。这种转变的一个重要标志是产生了功能基因组学 functional genomics >任务 功能基因组学的主要任务之一是进行基因组功能注释 ( genome annotation),了解基因的功能,认识基因与疾病的关 系,掌握基因的产物及其在生命活动中的作用等。 意义 快速有效的基因注释对进一步识别基因,研究基因的表达调 控机制,研究基因在生物体代谢途径中的地位,分析基因、基因 产物之间的相互作用关系,预测和发现蛋白质功能,揭示生命的 起源和进化等具有重要的意义
第一节 引 言 ➢背景 随着后基因组(post-genomics)时代的来临,基因组学的研究 重心开始从阐明所有遗传信息转移到在整体分子水平对功能进行 研 究 。 这种转变的一个重要标志是产生了 功能基因组学 (functional genomics)。 ➢任务 功能基因组学的主要任务之一是进行基因组 功能注释 (genome annotation),了解基因的功能,认识基因与疾病的关 系,掌握基因的产物及其在生命活动中的作用等。 ➢意义 快速有效的基因注释对进一步识别基因,研究基因的表达调 控机制,研究基因在生物体代谢途径中的地位,分析基因、基因 产物之间的相互作用关系,预测和发现蛋白质功能,揭示生命的 起源和进化等具有重要的意义
第二节基因注释数据库 Gene Annotation Database 基因注释数据库产生的原因 研究人员已经掌握了大量的全基因组数据,同时关 于基因、基因产物以及生物学通路的数据也越来越多,解释 生物学实验的结果,尤其从基因组角度,需要系统的方法。 二、在基因组范围内描述蛋白质功能十分复杂,最好的 工具就是计算机程序,提供结构化的标准的生物学模型,以便 计算机程序进行分析,成为从整体水平系统硏究基因及其产物 的一项基本需求
第二节 基因注释数据库 Gene Annotation Database 一、研究人员已经掌握了大量的全基因组数据,同时关 于基因、基因产物以及生物学通路的数据也越来越多,解释 生物学实验的结果,尤其从基因组角度,需要系统的方法。 基因注释数据库产生的原因 二、在基因组范围内描述蛋白质功能十分复杂,最好的 工具就是计算机程序,提供结构化的标准的生物学模型,以便 计算机程序进行分析,成为从整体水平系统研究基因及其产物 的一项基本需求
基因本体( gene ontology,GO)数据库 基因本体数据库是GO组织( Gene Ontology Consortium) 在2000年构建的一个结构化的标准生物学模型,旨在建立基因 及其产物知识的标准词汇体系,涵盖了基因的细胞组分 ( cellular component)、分子功能( molecular function)、生 物学过程( biological process Et the Gene Ontology gene or proten name回 Welcome to the Gene Ontology website! The Gene Ontology project is a major bioinformatics initiative with the aim of standardizing the representation of gene and gene product attributes across specles and databases. The project provides a controlled vocabulary of terms for describing gene Docmentation oduct characteristics and gene product annotation data from GO Consortium members, as well as tools to access and process this data. Read more about the Gene ontology The Gene Ontology project very much encourages input from the community into both the content of the GO and annotation onboctco using G( e very happy to work with others to ensure that the Go is both complete and accurate, and we aiso very much News RssT cabo encourage communities to submit Go annotations for inclusion in the Go database. Please contact us Search the Gene Ontology Database Search for genes, proteins or Go terms using AmiGO: AmiGO is the official Go browser and search engine. Browse the Gene Ontology with AmiGo
一、基因本体(gene ontology, GO)数据库 基因本体数据库是GO组织(Gene Ontology Consortium) 在2000年构建的一个结构化的标准生物学模型,旨在建立基因 及其产物知识的标准词汇体系 ,涵盖了基因的细胞组分 (cellular component)、分子功能(molecular function)、生 物学过程(biological process)
GO数据库收录的基因组数据列表 ■GO数据库最初收录的基因信息来源于3个模式生 物数据库:果蝇、酵母和小鼠,随后相继收录了 更多数据,其中包括国际上主要的植物,动物和 微生物基因组数据库。 ■GO术语在多个合作数据库中的统一使用,促进了 各类数据库对基因描述的一致性
◼ GO数据库最初收录的基因信息来源于3个模式生 物数据库:果蝇、酵母和小鼠,随后相继收录了 更多数据,其中包括国际上主要的植物,动物和 微生物基因组数据库。 ◼ GO术语在多个合作数据库中的统一使用,促进了 各类数据库对基因描述的一致性。 GO数据库收录的基因组数据列表
机构简称收录的基因组数据网站 BBOP 果蝇 http://www.berkeleybop.org BHF-UCL 心血管基因 http://www.cardiovasculargeneontolo gy. com dictyBase 粘菌盘基网柄菌 http:/dictybase.org Ecoliwiki 大肠杆菌 http://ecoliwki.net FlyBase 果蝇 http://flybase.bioindianaedu GeneDB 裂殖酵母 http://www.genedb.org 恶性疟原虫 硕大利什曼原虫 布氏锥虫 GOA UniProt和InterPro注释http://www.ebi.ac.uk/goa Gramene 农作物基因数据库 http://www.gramene.org MGD and gX小家鼠 http://www.informatics.jax.org RGD 褐家鼠 http://rgd.mewedu Reactome 生物过程知识库 http://www.genomeknowledge.org SGD 芽殖酵母 http://www.yeastgenome.org 酿酒酵母 TAIR 拟南芥 http://www.arabidopsis.org IGS 基因组研究的工具和数据http://wwwigs.umaryland.edu JCVI 若千种细菌基因组数据库http://wwwjcvi.org WormBase 线虫 http://www.warmbaseorg ZFIN 斑马鱼 http://zfin.org
GO注释体系特点 GO通过控制注释词汇的层次结构使得硏究人员能够从不同层面查询 和使用基因注释信息。 从整体上来看GO注释系统是一个有向无环图( Directed cyclIc Graphs)包含三个分支即:生物学过程( (biological process)),分子功能 ( molecular function)和细胞组分 (cellular component。 注释系统中每一个结点(node)都是基因或蛋白的一种描术结点之间保 持严格的关系即"isa”或" part of。 DNA metabolism DNA degradatio DNA recombination DNA packag + DNA repair DNA replication mitochondrial genome maintenance DNA-dependent DNA replication DNA-dependent DNA replication DNA Hgation pre-repllcative compl 加 DNA strand elongation formation and maintenance 9 Logging strand
GO注释体系特点 ◼ GO通过控制注释词汇的层次结构使得研究人员能够从不同层面查询 和使用基因注释信息。 ◼ 从整体上来看GO注释系统是一个有向无环图(Directed Acyclic Graphs),包含三个分支,即: 生物学过程(biological process),分子功能 (molecular function)和细胞组分(cellular component)。 ◼ 注释系统中每一个结点(node)都是基因或蛋白的一种描述,结点之间保 持严格的关系,即“is a”或“part of
使用GO数据库 1.用关键词检索GO数据库 ■检索GO数据库通常先进入 Amigo的首页。在GO数据库中,每条记录 都有一个数据标识号 GO: XXXXXX和对应的术语。因此检索时需要知 道待查基因的数字标识号或术语,将它们直接输入框中检索即可。如 果检索的基因或蛋白质存在别名,可在检索框下勾选“ gene or proteins”,并在检索框中输入别名检索;" exact match'表示是否完全 匹配,可供选择。 the Gene Ontology AmiGo Search Browse BLAST More Tools Help Search the Gene ontology database o terms c genes or proteins r exact match 提交查询内容 AmIGo Version:1.7 go database release 2010-02-20 Try AmiGo Labs Cite this data· Terms of use· o helpdesk Copyright 1999-2009 the Gene Ontology
1. 用关键词检索GO数据库 ◼ 检索GO数据库通常先进入AmiGO的首页。在GO数据库中,每条记录 都有一个数据标识号GO:XXXXXX和对应的术语。因此检索时需要知 道待查基因的数字标识号或术语,将它们直接输入框中检索即可。如 果检索的基因或蛋白质存在别名,可在检索框下勾选“gene or proteins”,并在检索框中输入别名检索;“exact match”表示是否完全 匹配,可供选择。 一、使用GO数据库
举例 这里以检索神经源性分化因子6( NEUROD6)为例。在检索框 中输入“ NEURODO63并勾选" gene and proteins和" exact match运行后所得基因产物检索结果如图所示。 Search GO NEUROD6 C Go terms genes or proteins exact match[提查谢内容了 Gene product search results 4 results for NEUROD6 in genes or proteins fields symbol, full name(s) and synonyms V Filter search results冒 iiter Gene Products. Filter Gene Products by Associations Set tilters Gene Product Type Data source Ontology Remove all filters ological Results are sorted by relevance, To change the sort order, dick on the column headers. set a LCaa Peform an action with this page's selected gene products.v rel Symbol, full name Species Neuron 8 associations gene from Mus musculus neurogenic differentiation 6 Neuron 3 associations gene from Rattus norvegicus neurogenic differentiation 6 INEUROD6 7 associations protein from Bos taurus Neurogenicdifferentiation factor 6 neurons 7 associations protein from Homo sapiens Neurogenic differentiation factor 6 SEles a Clear al Perform an action with this page's selected gene products. v Gel
◼ 这里以检索神经源性分化因子6(NEUROD6)为例。在检索框 中输入“NEUROD6”并勾选“gene and proteins”和“exact match”,运行后所得基因产物检索结果如图所示。 举例
此图显示了该基因产物的基本信息,包括类型、物种 别名来源和序列 Search Go a terms genes or proteins exact match 提交查询内容 NEURoD6 Gene product information↓7 term associations→ Information Symbol NEURODE Name(s) Neurogenic differentiation factor 6 Homo sapiens(human) synonyms ATOH2 IPI00102358 Myo51 NDF6 HUMAN NEUROD6 Database UniProtKB/Swiss-Prot, UniProtKB/Swiss-Prot: Q96NK8 Sequence No peptide sequence available ack to top
人民卫生出版社8年制及7年制临床医学等专业用《生物信息学》 此图显示了该基因产物的基本信息,包括类型、物种、 别名来源和序列