系统生物学:整合各种组学的信息和方法 姓名:王玉锋学号:061023050 20世纪生物学经历了由宏观到微观的发展过程,由形态、表型的描述逐步分解、细 化到生物体的各种分子及其功能的研究。70年代出现的基因工程技术极大地加速和扩展 了分子生物学的发展;90年代启动的人类基因组计划是生命科学史上第一个大科学工程, 开始了对生物全面、系统研究的探索:;2003年已完成了人和各种模式生物体基因组的测 序,第一次揭示了人类的生命密码。人类基因组计划和随后发展的各种组学技术把生物学 带入了系统科学的时代。 系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子 及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。也就是说, 系统生物学是以整体性研究为特征的一种大科学。系统生物学将在基因组序列的基础上完 成由生命密码到生命过程的研究,这是一个逐步整合的过程,由生物体内各种分子的鉴别 及其相互作用的研究到途径、网络、模块,最终完成整个生命活动的路线图。 Genomics Transcriptome Proteome Interactome Phenome Localizome Comic mapping approaches) Data integration Synthetic Modeling Systematic biology perturbation TRENDS in Genetics 借助于基因组和转录组的序列、功能基因组和蛋白质组的方法,可以绘制特定有机体 的转录组图、蛋白质组图、相互作用图谱、表型组图及所有转录物和蛋白的定位图。这种 整合的组学信息可以帮助我们消除单种组学研究方法中带来的假阳性和假阴性,给出基因 产物及其相互作用和关系的更好的功能性注释,有利于相关的生物性假设的生成。基于这 些整合数据的计算学的方法可以模拟生物过程的进程。系统生物学可以被看作是个种组学 方法的整合、数据的整合、生物的系统化和模型化 系统生物学的特点: 和以往系统科学研究复杂系统相比,系统生物学的硏究将更为复杂和困难。非生物的
系统生物学:整合各种组学的信息和方法 姓名:王玉锋 学号:061023050 20 世纪生物学经历了由宏观到微观的发展过程,由形态、表型的描述逐步分解、细 化到生物体的各种分子及其功能的研究。70 年代出现的基因工程技术极大地加速和扩展 了分子生物学的发展;90 年代启动的人类基因组计划是生命科学史上第一个大科学工程, 开始了对生物全面、系统研究的探索;2003 年已完成了人和各种模式生物体基因组的测 序,第一次揭示了人类的生命密码。人类基因组计划和随后发展的各种组学技术把生物学 带入了系统科学的时代。 系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子 及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。也就是说, 系统生物学是以整体性研究为特征的一种大科学。系统生物学将在基因组序列的基础上完 成由生命密码到生命过程的研究,这是一个逐步整合的过程,由生物体内各种分子的鉴别 及其相互作用的研究到途径、网络、模块,最终完成整个生命活动的路线图。 借助于基因组和转录组的序列、功能基因组和蛋白质组的方法,可以绘制特定有机体 的转录组图、蛋白质组图、相互作用图谱、表型组图及所有转录物和蛋白的定位图。这种 整合的组学信息可以帮助我们消除单种组学研究方法中带来的假阳性和假阴性,给出基因 产物及其相互作用和关系的更好的功能性注释,有利于相关的生物性假设的生成。基于这 些整合数据的计算学的方法可以模拟生物过程的进程。系统生物学可以被看作是个种组学 方法的整合、数据的整合、生物的系统化和模型化。 系统生物学的特点: 和以往系统科学研究复杂系统相比,系统生物学的研究将更为复杂和困难。非生物的
复杂系统一般由相对简单的元件组合产生复杂的功能和行为,而生物体是由大量结构和功 能不同的元件组成的复杂系统,并由这些元件选择性和非线性的相互作用产生复杂的功能 和行为。因此,我们要建立多层次的组学技术平台,研究和鉴别生物体内所有分子,研究 其功能和相互作用,在各种技术平台产生的大量数据的基础上,通过计算生物学用数学语 言定量描述和预测生物学功能和生物体表型和行为。 系统生物学也将使生物学研究发生结构性的变化。长期以来,生物学硏究是在规模较 小的实验室进行的,系统生物学研究将由各种组学组成的大科学工程和小型生物学实验室 有机结合实施的。系统生物学研究也将在更大范围和更高层次进行学科交叉和国际合作, 如人类基因组计划、人类单体型图谱计划、人类表观基因组学计划等。 系统生物学的技术平台: 系统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作 用组学和表型组学等。基因组学、转录组学、蛋白质组学、代谢组学分别在DNA、mRNA 蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能。相互作用组学系统研究各种分 子间的相互作用,发现和鉴别分子机器、途径和网络,构建类似集成电路的生物学模块, 并在研究模块的相互作用基础上绘制生物体的相互作用图谱。表型组学是生物体基因型和 表型的桥梁,目前还仅在细胞水平开展表型组学研究。 计算生物学可分为知识发现和模拟分析两部分。知识发现也称为数据开采,是从系统 生物学各个组学实验平台产生的大量数据和信息中发现隐含在里面的规律并形成假设。模 拟分析是用计算机验证所形成的假设,并对体内、外的生物学实验进行预测,最终形成可 用于各种生物学研究和预测的虚拟系统。 系统生物学的工作流程: 系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有组分 进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内 和细胞间的作用机理,以此构造出一个初步的系统模型。第二步是系统地改变被研究对象 的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构 所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得 到的有关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比 较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新 的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精 练。系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的 真实性。 1.系统生物学的灵魂整合 首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等) 整合在一起进行硏究。系统生物学硏究所的第一篇硏究论文,就是整合酵母的基因组分析 和蛋白质组分析,研究酵母的代谢网络。由于不同生物分子的研究难度不一样,技术发展 程度不一样,目前对它们的研究水平有较大的差距。例如,基因组和基因表达方面的研究
复杂系统一般由相对简单的元件组合产生复杂的功能和行为,而生物体是由大量结构和功 能不同的元件组成的复杂系统,并由这些元件选择性和非线性的相互作用产生复杂的功能 和行为。因此,我们要建立多层次的组学技术平台,研究和鉴别生物体内所有分子,研究 其功能和相互作用,在各种技术平台产生的大量数据的基础上,通过计算生物学用数学语 言定量描述和预测生物学功能和生物体表型和行为。 系统生物学也将使生物学研究发生结构性的变化。长期以来,生物学研究是在规模较 小的实验室进行的,系统生物学研究将由各种组学组成的大科学工程和小型生物学实验室 有机结合实施的。系统生物学研究也将在更大范围和更高层次进行学科交叉和国际合作, 如人类基因组计划、人类单体型图谱计划、人类表观基因组学计划等。 系统生物学的技术平台: 系统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作 用组学和表型组学等。基因组学、转录组学、蛋白质组学、代谢组学分别在DNA、mRNA、 蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能。相互作用组学系统研究各种分 子间的相互作用,发现和鉴别分子机器、途径和网络,构建类似集成电路的生物学模块, 并在研究模块的相互作用基础上绘制生物体的相互作用图谱。表型组学是生物体基因型和 表型的桥梁,目前还仅在细胞水平开展表型组学研究。 计算生物学可分为知识发现和模拟分析两部分。知识发现也称为数据开采,是从系统 生物学各个组学实验平台产生的大量数据和信息中发现隐含在里面的规律并形成假设。模 拟分析是用计算机验证所形成的假设,并对体内、外的生物学实验进行预测,最终形成可 用于各种生物学研究和预测的虚拟系统。 系统生物学的工作流程: 系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有组分 进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内 和细胞间的作用机理,以此构造出一个初步的系统模型。第二步是系统地改变被研究对象 的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构 所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得 到的有关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比 较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新 的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精 练。系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的 真实性。 1. 系统生物学的灵魂——整合 首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等) 整合在一起进行研究。系统生物学研究所的第一篇研究论文,就是整合酵母的基因组分析 和蛋白质组分析,研究酵母的代谢网络。由于不同生物分子的研究难度不一样,技术发展 程度不一样,目前对它们的研究水平有较大的差距。例如,基因组和基因表达方面的研究
已经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的代谢组分的研究就更不 成熟。 其次,对于多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各 个层次的整合。《科学》周刊系统生物学专集中一篇题为“心脏的模型化——从基因到细胞、 到整个器官”的论文,很好地体现了这种整合性。我们知道,系统科学的核心思想是:“整 体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质 如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的 挑战。 整合性的第三层含义是指研究思路和方法的整合。经典的分子生物学研究是一种垂直 型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在DNA水平上寻找特定的 基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究 蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。基因组学、蛋白质组学 和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。 而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的硏 究。此外,系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学 计算机科学等各种学科的共同参与。 2.系统生物学的基础信息 分子生物学时代,研究者们把生命视为一架精密的机器,由基因和蛋白质根据物理、 化学的规律来运转。在后基因组时代,科学家把生命视为信息的载体,一切特性都可以从 信息的流动中得到实现。 首先,生物学研究的核心—基因组,是数字化的(dgta)。因此生物学可以被完全 破译。 其次,生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因, 第二类信息是指控制基因行为的调控网络。 再次,生物信息是有等级次序的,而且沿着不同的层次流动。一般说来,生物信息以 这样的方向进行流动:DNA→mRNA→蛋白质→蛋白质相互作用网络→细胞→器官→个体 →群体。这里要注意的是,每个层次信息都对理解生命系统的运行提供有用的视角。因此, 系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。 根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或 部分之间的关系。这些相互作用或者关系,从本质上说就是信息。换一个角度来说,生命 是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量, 以抵消其熵増过程。生命系统是一个信息流的过程,系统生物学就是要硏究并揭示这种信 息的运行规律。 3.系统生物学的钥匙干涉( perturbation) 系统生物学一方面要了解生物系统的结构组成,另一方面是要揭示系统的行为方式。 相比之下,后一个任务更为重要。系统生物学研究的并非一种静态的结构,而是要在人为 控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力
已经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的代谢组分的研究就更不 成熟。 其次,对于多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各 个层次的整合。《科学》周刊系统生物学专集中一篇题为“心脏的模型化——从基因到细胞、 到整个器官”的论文,很好地体现了这种整合性。我们知道,系统科学的核心思想是:“整 体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质。 如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的 挑战。 整合性的第三层含义是指研究思路和方法的整合。经典的分子生物学研究是一种垂直 型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在 DNA 水平上寻找特定的 基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究 蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。基因组学、蛋白质组学 和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。 而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研 究。此外,系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、 计算机科学等各种学科的共同参与。 2. 系统生物学的基础——信息 分子生物学时代,研究者们把生命视为一架精密的机器,由基因和蛋白质根据物理、 化学的规律来运转。在后基因组时代,科学家把生命视为信息的载体,一切特性都可以从 信息的流动中得到实现。 首先,生物学研究的核心——基因组,是数字化的(digital)。因此生物学可以被完全 破译。 其次,生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因, 第二类信息是指控制基因行为的调控网络。 再次,生物信息是有等级次序的,而且沿着不同的层次流动。一般说来,生物信息以 这样的方向进行流动:DNA→mRNA→蛋白质→蛋白质相互作用网络→细胞→器官→个体 →群体。这里要注意的是,每个层次信息都对理解生命系统的运行提供有用的视角。因此, 系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。 根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或 部分之间的关系。这些相互作用或者关系,从本质上说就是信息。换一个角度来说,生命 是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量, 以抵消其熵增过程。生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信 息的运行规律。 3. 系统生物学的钥匙——干涉(perturbation) 系统生物学一方面要了解生物系统的结构组成,另一方面是要揭示系统的行为方式。 相比之下,后一个任务更为重要。系统生物学研究的并非一种静态的结构,而是要在人为 控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力
学特征。 凡是实验科学都有这样一种特征:人为地设定某种或某些条件去作用于被实验的对 象,从而达到实验的目的。这种对实验对象的人为影响就是干涉。传统生物学采用非干涉 方法如形态观察或分类研究生物体。20世纪形成的分子生物学等实验生物学的特点就是, 科学家可以在实验室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白 质,由此研究其性质和功能。系统生物学同样也是一门实验性科学,也离不开干涉这一重 要的工具 系统生物学中干涉的特点有 首先,干涉应该是有系统性的。例如人为诱导基因突变,过去大多是随机的;而在进 行系统生物学研究时,应该采用的是定向的突变技术 其次,系统生物学需要高通量的干涉能力,如髙通量的遗传变异。现有技术已经能做 到在短时间内,把酵母的全部6000多个基因逐一进行突变。对于较为复杂的多细胞生物, 可以通过RNA干涉新技术来实现大规模的基因定向突变。 需要注意的是,以测定基因组全序列或全部蛋白质组成的基因组研究或蛋白质组研究 等“规模型大科学”,并不属于经典的实验科学。这类工作中并不需要干涉,其目标只是把 系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究 称为“发现的科学”,而把上述依赖于干涉的实验科学称为“假设驱动的科学”,因为选择干 涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要“发现的科学” 也需要“假设驱动的科学”。首先要选择一种条件(千涉),然后利用“发现的科学”的方法, 对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发 现的科学ˆ研究手段进行新硏究。这两种不同研究策略和方法的互动和整合,是系统生物 学成功的保证。 在注重这两类研究手段的同时,不应该忽略系统生物学的另一个特点—对理论的依 赖和建立模型的需求。建模过程贯穿在系统生物学硏究的每一个阶段。离开了数学和计算 机科学,就不会有系统生物学。 系统生物学研究在破译生命密码和应用方面都取得了较大进展。啤酒酵母是人类基因 组计划中的一种模式生物,模式生物的系统生物学研究将推动更复杂系统的研究,加速由 生命密码到生命的研究进程。 系统生物学使生命科学由描述式的科学转变为定量描述和预测的科学,已在预测医 学、预防医学和个性化医学中得到应用,如用代谢组学的生物指纹预测冠心病人的危险程 度和肿瘤的诊断和治疗过程的监控;用基因多态性图谱预测病人对药物的应答,包括毒副 作用和疗效。表型组学的细胞芯片和代谢组学的生物指纹将广泛用于新药的发现和开发, 使新药的发现过程由高通量逐步发展为高内涵,以降低居髙不下的新药硏发投入。美国能 源部2002年启动了21世纪系统生物学技术平台,以推动环境生物技术和能源生物技术 产业的发展。系统生物学将不仅推动生命科学和生物技术的发展,而且对整个国民经济 社会和人类本身产生重大和深远的影响
学特征。 凡是实验科学都有这样一种特征:人为地设定某种或某些条件去作用于被实验的对 象,从而达到实验的目的。这种对实验对象的人为影响就是干涉。传统生物学采用非干涉 方法如形态观察或分类研究生物体。20 世纪形成的分子生物学等实验生物学的特点就是, 科学家可以在实验室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白 质,由此研究其性质和功能。系统生物学同样也是一门实验性科学,也离不开干涉这一重 要的工具。 系统生物学中干涉的特点有: 首先,干涉应该是有系统性的。例如人为诱导基因突变,过去大多是随机的;而在进 行系统生物学研究时,应该采用的是定向的突变技术。 其次,系统生物学需要高通量的干涉能力,如高通量的遗传变异。现有技术已经能做 到在短时间内,把酵母的全部 6000 多个基因逐一进行突变。对于较为复杂的多细胞生物, 可以通过 RNA 干涉新技术来实现大规模的基因定向突变。 需要注意的是,以测定基因组全序列或全部蛋白质组成的基因组研究或蛋白质组研究 等“规模型大科学”,并不属于经典的实验科学。这类工作中并不需要干涉,其目标只是把 系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究 称为“发现的科学”,而把上述依赖于干涉的实验科学称为“假设驱动的科学”,因为选择干 涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要“发现的科学”, 也需要“假设驱动的科学”。首先要选择一种条件(干涉),然后利用“发现的科学”的方法, 对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发 现的科学”研究手段进行新研究。这两种不同研究策略和方法的互动和整合,是系统生物 学成功的保证。 在注重这两类研究手段的同时,不应该忽略系统生物学的另一个特点——对理论的依 赖和建立模型的需求。建模过程贯穿在系统生物学研究的每一个阶段。离开了数学和计算 机科学,就不会有系统生物学。 系统生物学研究在破译生命密码和应用方面都取得了较大进展。啤酒酵母是人类基因 组计划中的一种模式生物,模式生物的系统生物学研究将推动更复杂系统的研究,加速由 生命密码到生命的研究进程。 系统生物学使生命科学由描述式的科学转变为定量描述和预测的科学,已在预测医 学、预防医学和个性化医学中得到应用,如用代谢组学的生物指纹预测冠心病人的危险程 度和肿瘤的诊断和治疗过程的监控;用基因多态性图谱预测病人对药物的应答,包括毒副 作用和疗效。表型组学的细胞芯片和代谢组学的生物指纹将广泛用于新药的发现和开发, 使新药的发现过程由高通量逐步发展为高内涵,以降低居高不下的新药研发投入。美国能 源部 2002 年启动了 21 世纪系统生物学技术平台,以推动环境生物技术和能源生物技术 产业的发展。系统生物学将不仅推动生命科学和生物技术的发展,而且对整个国民经济、 社会和人类本身产生重大和深远的影响