以信息系统的观点了解基因组 清华大学生物信息研究所 李衍达 2002年4月于电子科技大学 x
以信息系统的观点了解基因组 清华大学生物信息研究所 李衍达 2002年4月 于 电子科技大学
后基因组时代对我们提出 的要求 x
一、后基因组时代对我们提出 的要求
HGP的完成,宣告后基因组时代的到来。 ●随着HGP计划的进行与完成,核酸与蛋 白质的数据成指数增长。大量的生物数 据等待人们去分析,生物信息学成为研 究的焦点。 ●对数据的分析,解释远远落后于实验的 速度。 急需应用数学、信息科学、化学 计算机科学来分析理解数据,更深 入地理解生命现象
⚫ HGP的完成,宣告后基因组时代的到来。 ⚫ 随着HGP计划的进行与完成,核酸与蛋 白质的数据成指数增长。大量的生物数 据等待人们去分析,生物信息学成为研 究的焦点。 ⚫ 对数据的分析,解释远远落后于实验的 速度。 急需应用数学、信息科学、化学、 计算机科学来分析理解数据,更深 入地理解生命现象
表1.1,图11 Gen Bank中数据增长的统计 Year Base Pairs Sequences 1982 Growth of Gen Bank 19832274029 19843368765 4175 10 11000 19855204420 19869615371 198715514776 14584 7 8000 19882380000020579 19893476258528791 199049179285 39533 5000 19917194742655627 E<z6●的 199210100848678608 3500m 1993157152442143492 Base Pairs equences 1994|217102462215273 1995384939485555694 0 19966519729841021211 89时9小99999s9p9 199711603006871765847 99820087617842837897 199938411630114864570 20011010628106023
表 1.1, 图 1.1 GenBank 中数据增长的统计 Year Base Pairs Sequences 1982 680338 606 1983 2274029 2427 1984 3368765 4175 1985 5204420 5700 1986 9615371 9978 1987 15514776 14584 1988 23800000 20579 1989 34762585 28791 1990 49179285 39533 1991 71947426 55627 1992 101008486 78608 1993 157152442 143492 1994 217102462 215273 1995 384939485 555694 1996 651972984 1021211 1997 1160300687 1765847 1998 2008761784 2837897 1999 3841163011 4864570 2000 11101066288 10106023
随着HGP的完成,出现了大量的课题。但是, 后基因组时代的核心任务是了解基因组与蛋白 质组的功能,或者说是解读遗传密码。这是揭 示生命奥秘的关键的一步。 ◇人们认识到以往一个基因、一个蛋白质的研 究并不能解释基因的功能。必须在众多基因 与蛋白质的相互作用中了解其功能。 即更注重从系统的角度,认识基因之间,蛋白 质之间,不同转录、表达现象之间的联系,以 及从这种联系构成的系统整体特征去了解其功 能
⚫ 随着HGP的完成,出现了大量的课题。但是, 后基因组时代的核心任务是了解基因组与蛋白 质组的功能,或者说是解读遗传密码。这是揭 示生命奥秘的关键的一步。 人们认识到以往一个基因、一个蛋白质的研 究并不能解释基因的功能。必须在众多基因 与蛋白质的相互作用中了解其功能。 ⚫ 即更注重从系统的角度,认识基因之间,蛋白 质之间,不同转录、表达现象之间的联系,以 及从这种联系构成的系统整体特征去了解其功 能
DNA genome mRNA transcripton Protein proteom f f 图12分子生物学研究思路的转变大x
图1.2 分子生物学研究思路的转变
●细胞是揭示生命奥秘的基础,细胞研究的三个 基本问题是: (1)细胞的基因组如何在时间、空间上有序 的表达; (2)细胞基因组表达的产物——结构蛋白质 核酸,脂与多糖等是如何逐级装配成各种细 胞器与组织的,自组装的调控程序与机理是 什么? (3)活性分子,信号分子是如何调节生命过 程的。包括染色体、DNA与蛋白质如何相互 作用,细胞信号传递过程与路径的分析饿x
⚫ 细胞是揭示生命奥秘的基础,细胞研究的三个 基本问题是: (1)细胞的基因组如何在时间、空间上有序 的表达; (2)细胞基因组表达的产物——结构蛋白质, 核酸,脂与多糖等是如何逐级装配成各种细 胞器与组织的,自组装的调控程序与机理是 什么? (3)活性分子,信号分子是如何调节生命过 程的。包括染色体、DNA与蛋白质如何相互 作用,细胞信号传递过程与路径的分析等
基因组,蛋白质组功能的研究与上述 三个基本问题是密切相关的,进行上 述问题的研究需要对DNA整体序列 的理解
⚫ 基因组,蛋白质组功能的研究与上述 三个基本问题是密切相关的,进行上 述问题的研究需要对DNA整体序列 的理解
生物信息学研究的特点 x
二、生物信息学研究的特点
生物信息学的根本目标 揭示基因组信息结构的复杂性及遗传语言的 根本规律 特点: 基因组 信息结构 复杂性
⚫ 生物信息学的根本目标 揭示基因组信息结构的复杂性及遗传语言的 根本规律 ⚫ 特点: 基因组 信息结构 复杂性