正在加载图片...
方面由于基因表达数据量非常庞大,而且数据中蕴含着丰富的生物学知识,另一方面由 于这些数据没有注释,迫切需要一种标准来描述和存贮DNA微阵列基因表达数据,同时 建立公共的DNA微阵列数据仓库。欧洲生物信息学研究所(EBI)与德国肿瘤研究中心 (DKFZ)在1999年成立了MGED讨论组( The Microarray Gene Expression Data) MGED(htp/www.mgedorg/)是一个国际性的成员联盟,参与人员包括生物学家、计算 机科学家、数据分析学家。它的目标是促进由功能基因组学和蛋白组学研究产生的微阵列数 据的共享。当前集中于建立微阵列数据注释和交换的标准,推动微阵列数据库建设和相关软 件来实现这些标准,促进高质量的、经过注释的基因表达数据在生命科学领域的共享。该组 织开发的微阵列数据标准称为MAME( the minimum information about a microarray experiment),是对于解释和验证结果所必需的微阵列实验的最小信息描述。MAME不是 微阵列实验必须遵循的教条,而是一组指导方针,它将帮助微阵列数据库和数据分析工具的 开发。同时,MGED组织开发了微阵列基因表达标记语言( MAGE-ML, Microarray Gene Expression- Markup Language),它是一种语言,用来描述跟基于实验的微阵列信息的通 讯。MAGE-ML基于ⅹML,可以描述微阵列设计、制造、实验组织和实施信息、基因表 达数据等。MMAE标准和 MAGE-ML语言受到了从事DNA微阵列开发和应用研究的 科研人员和组织的广泛关注。美国NCBI的 Gene Expression Omnibus(GEO)、英国的EBI 的Aπay上 xpress数据库都采用了该标准,斯坦福微阵列数据库( Stanford Microarray Database,SMD)也正在兼容该标准 目前,收集、存贮微阵列基因表达数据的最有影响的数据库和网站是GEO Array Express和SMD。 GEO(htp/www.ncbinlm.nih.govlgeo)是由NCBI在2000年开发的一个基因表达和 杂交微阵列数据仓库,同时作为获取来自不同生物体的基因表达数据的在线资源。到2004 年3月,数据仓库中包含内容有605个 Platform,14391个 Sample,816个 Serial Platform是关于物理反应物的信息, Sample是关于待检测的样本信息和使用单个 Platform 生的数据。 Series是关于样本集的信息,反映样本间的相关性和组织。 ArrayExpresshttp:/www.ebi.ac.uk/arravexpress/)是基于基因表达数据的微阵列公共知识 库,目的是存储被注释的数据,当前包含多个基因表达数据集和与实验相关的原始图像集 Array Express数据库接受MAGE-ML格式的数据递交或者通过 MIAMExpress的基于 web界面注释和递交的数据。 Array Express提供一个简单的基于web的数据查询界面, 并直接与 Expession Profiler数据分析工具相连,可以进行表达数据聚类,和其它类型的web 数据挖掘,并将进一步开发多个实验和数据库间的交叉查询。 Array Express数据库中的数 据将与所有由EBI维护的或在线的数据库相联接。 SMD(htp/ genome-www5 stanford. edu/)是一个使用 Oracle作为数据库管理软件的关 系数据库。SMD存储微阵列实验的原始数据、归一化数据和对应的图像文件。自从2002 年1月1日起,到2004年4月己包括85篇学术论文,超过3500个双色点样cDNA 微阵列的实验数据,并且每年增加1000个微阵列实验的数据。另外,SMD提供数据获 取、分析和可视化的界面,目前包括层次聚类和自组织映射等方法,还将加入k-平均聚类 单值分解和丢失值归纳等方法 除了以上3个综合性的基因表达数据仓库外,还有一些专门的基因表达数据库,例如 Ymd(YaleMicroarrayDatabasehttp://info.medyaleedumicroarrayArraydb一方面由于基因表达数据量非常庞大,而且数据中蕴含着丰富的生物学知识,另一方面由 于这些数据没有注释,迫切需要一种标准来描述和存贮 DNA 微阵列基因表达数据,同时 建立公共的 DNA 微阵列数据仓库。欧洲生物信息学研究所( EBI )与德国肿瘤研究中心 (DKFZ) 在 1999 年成立了 MGED 讨论组 (The Microarray Gene Expression Data) 。 MGED ( http://www.mged.org/)是一个国际性的成员联盟,参与人员包括生物学家、计算 机科学家、数据分析学家。它的目标是促进由功能基因组学和蛋白组学研究产生的微阵列数 据的共享。当前集中于建立微阵列数据注释和交换的标准,推动微阵列数据库建设和相关软 件来实现这些标准,促进高质量的、经过注释的基因表达数据在生命科学领域的共享。该组 织开发的微阵列数据标准称为 MIAME(the minimum information about a microarray experiment) ,是对于解释和验证结果所必需的微阵列实验的最小信息描述。 MIAME 不是 微阵列实验必须遵循的教条,而是一组指导方针,它将帮助微阵列数据库和数据分析工具的 开发。同时, MGED 组织开发了微阵列基因表达标记语言( MAGE-ML , Microarray Gene Expression - Markup Language ),它是一种语言,用来描述跟基于实验的微阵列信息的通 讯。 MAGE-ML 基于 XML ,可以描述微阵列设计、制造、实验组织和实施信息、基因表 达数据等。 MIMAE 标准和 MAGE-ML 语言受到了从事 DNA 微阵列开发和应用研究的 科研人员和组织的广泛关注。美国 NCBI 的 Gene Expression Omnibus (GEO) 、英国的 EBI 的 ArrayExpress 数据库都采用了该标准,斯坦福微阵列数据库( Stanford Microarray Database , SMD )也正在兼容该标准。 目前,收集、存贮微阵列基因表达数据的最有影响的数据库和网站是 GEO 、 ArrayExpress 和 SMD 。 GEO ( http://www.ncbi.nlm.nih.gov/geo)是由 NCBI 在 2000 年开发的一个基因表达和 杂交微阵列数据仓库,同时作为获取来自不同生物体的基因表达数据的在线资源。到 2004 年 3 月,数据仓库中包含内容有 605 个 Platform , 14391 个 Sample , 816 个 Serial 。 Platform 是关于物理反应物的信息,Sample是关于待检测的样本信息和使用单个Platform产 生的数据。Series 是关于样本集的信息,反映样本间的相关性和组织。 ArrayExpress( http://www.ebi.ac.uk/arrayexpress/) 是基于基因表达数据的微阵列公共知识 库,目的是存储被注释的数据,当前包含多个基因表达数据集和与实验相关的原始图像集。 ArrayExpress 数据库接受 MAGE-ML 格式的数据递交或者通过 MIAMExpress 的基于 Web 界面注释和递交的数据。 ArrayExpress 提供一个简单的基于 Web 的数据查询界面, 并直接与Expession Profiler 数据分析工具相连,可以进行表达数据聚类,和其它类型的 Web 数据挖掘,并将进一步开发多个实验和数据库间的交叉查询。 ArrayExpress 数据库中的数 据将与所有由 EBI 维护的或在线的数据库相联接。 SMD ( http://genome-www5.stanford.edu/)是一个使用 Oracle 作为数据库管理软件的关 系数据库。 SMD 存储微阵列实验的原始数据、归一化数据和对应的图像文件。自从 2002 年 1 月 1 日起,到 2004 年 4 月已包括 85 篇学术论文,超过 3500 个双色点样 cDNA 微阵列的实验数据,并且每年增加 1000 个微阵列实验的数据。另外, SMD 提供数据获 取、分析和可视化的界面,目前包括层次聚类和自组织映射等方法,还将加入 k- 平均聚类、 单值分解和丢失值归纳等方法。 除了以上 3 个综合性的基因表达数据仓库外,还有一些专门的基因表达数据库,例如 YMD (Yale Microarray Database , http://info.med.yale.edu/ microarray/) 、 ArrayDB
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有