正在加载图片...
探针,代表了33000个人类基因。寡核苷酸芯片主要用于DNA多态性检测和基因表达分 析,还可以用于微生物基因组的再测序 寡核苷酸探针的长度通常为20-25bp,在检测mRNA丰度时可能存在寡核苷酸之间的 非特异性交叉杂交,这可能会掩盖杂交信号:此外,对于特定的寡核苷酸,信号强度对于寡 核苷酸的碱基组成比较敏感的。对于第一个问题, Affymetrix公司的解决办法是采用匹配/ 失配(PMMM)探针对的方法,即在设计一个特异的寡核苷酸(匹配)时,同时设计 个非特异的寡核苷酸探针,该探针仅仅在中间位置有一个碱基替换(失配),这样可以用 A与MM之间的差值作为信号强度。为了解决第二个问题,在设计探针时,对于每一个 待检测的mRNA包含多个寡核苷酸探针,例如设计11-20对探针来检测一个转录本。 与cDNA微阵列不同的是,杂交实验中与寡核苷酸芯片杂交的是单个样本,而不是 cDNA微阵列实验中测量样本与对照样本的混合物。寡核苷酸芯片的检测结果有两种, 种用P/AM( Present/Absent/Dont Know)表示,表示有/无/不确定,另一种用荧光 信号强度值表示。PAM可以用来判断样本中有无特定基因的表达,这个结果对于部分实 验,特别是一些定性实验是有意义的,例如判断肿瘤与正常细胞的基因表达差异。当需要对 几个不同条件下的基因表达情况进行分析时,对基因表达的相对变化更感兴趣,所以多采用 荧光强度值。有时实验结果中有负值,这是由于前景信号小于背景信号或者背景/阴性控 制样本的定义不正确造成的, Affymetriⅸx公司的芯片分析系统会将负值修改成某一固定值。 在分析多个实验条件下的基因表达数据时,与cDNA微阵列数据一样,也是一系列测量 样本与对照样本之间的信号强度比率或比率的对数值。实验得到的信号强度也是经过归一化 的数值,归一化的方法很多,而且一般都包含在芯片扫描系统的图像处理软件中 cDNA微阵列或基因芯片在用于基因表达分析时的一个最大优点是高通量性,在一次芯 片实验中可以对成千上万个基因的表达进行并行测量。由于实验环节较多,虽然在设计芯片 时可以通过添加阴性和阳性探针等手段来评价数据的质量,但是需要提醒的是,数据的可靠 性仍然是对数据进行后续分析时必须考虑的一个问题。 713基因表达数据的网络资源 大量基于DNA微阵列实验的基因表达数据是公开发布在 Internet网上的,尤其是学术 机构在发表论文时所用的实验数据都可以免费提供给全世界的研究人员下载使用。作为学术 论文的补充资料在网上发布的数据主要是文本文件或 Excel格式的文件,这些数据往往都 是经过归一化处理后的 Ratio值或log2(Rato),对于寡核苷酸芯片数据有的是P/AM表 ,有的是荧光强度值。因为这些数据文件没有包含原始的实验方案、实验材料、原始扫描 图像、图像处理方法和数据归一化方法等信息,对于要比较或整合分析来自不同研究小组的 基因表达数据是非常困难的。主要原因是DNA微阵列并不是在任何客观的个体上测量基 因表达水平,大多数测量值仅仅是基因表达的相对变化,而且使用的并不是一个标准化的对 照样本。同时,基因表达数据比基因组序列数据要复杂的多,这些数据仅仅在有具体的关于 实验条件的描述时才是有意义的,对于不同的细胞类型,在不同的条件下都有一套转录本。 因此,基于DNA微阵列的基因表达数据存储量是非常大的,对于具有20000个探针的微 阵列实验,以10um的分辨率扫描,产生3千万个离散的数据点,如果以tif'文件贮存, 将占用约60Mb的硬盘空间探针,代表了 33000 个人类基因。寡核苷酸芯片主要用于 DNA 多态性检测和基因表达分 析,还可以用于微生物基因组的再测序。 寡核苷酸探针的长度通常为 20-25bp ,在检测 mRNA 丰度时可能存在寡核苷酸之间的 非特异性交叉杂交,这可能会掩盖杂交信号;此外,对于特定的寡核苷酸,信号强度对于寡 核苷酸的碱基组成比较敏感的。对于第一个问题, Affymetrix 公司的解决办法是采用匹配 / 失配( PM/MM )探针对的方法,即在设计一个特异的寡核苷酸 ( 匹配 ) 时,同时设计 一个非特异的寡核苷酸探针,该探针仅仅在中间位置有一个碱基替换(失配),这样可以用 PM 与 MM 之间的差值作为信号强度。为了解决第二个问题,在设计探针时,对于每一个 待检测的 mRNA 包含多个寡核苷酸探针,例如设计 11-20 对探针来检测一个转录本。 与 cDNA 微阵列不同的是,杂交实验中与寡核苷酸芯片杂交的是单个样本,而不是 cDNA 微阵列实验中测量样本与对照样本的混合物。寡核苷酸芯片的检测结果有两种,一 种用 P/A/M ( Present/Absent/Don't Know )表示,表示有 / 无 / 不确定,另一种用荧光 信号强度值表示。 P/A/M 可以用来判断样本中有无特定基因的表达,这个结果对于部分实 验,特别是一些定性实验是有意义的,例如判断肿瘤与正常细胞的基因表达差异。当需要对 几个不同条件下的基因表达情况进行分析时,对基因表达的相对变化更感兴趣,所以多采用 荧光强度值。有时实验结果中有负值,这是由于前景信号小于背景信号或者背景 / 阴性控 制样本的定义不正确造成的, Affymetrix 公司的芯片分析系统会将负值修改成某一固定值。 在分析多个实验条件下的基因表达数据时,与 cDNA 微阵列数据一样,也是一系列测量 样本与对照样本之间的信号强度比率或比率的对数值。实验得到的信号强度也是经过归一化 的数值,归一化的方法很多,而且一般都包含在芯片扫描系统的图像处理软件中。 cDNA 微阵列或基因芯片在用于基因表达分析时的一个最大优点是高通量性,在一次芯 片实验中可以对成千上万个基因的表达进行并行测量。由于实验环节较多,虽然在设计芯片 时可以通过添加阴性和阳性探针等手段来评价数据的质量,但是需要提醒的是,数据的可靠 性仍然是对数据进行后续分析时必须考虑的一个问题。 7.1.3 基因表达数据的网络资源 大量基于 DNA 微阵列实验的基因表达数据是公开发布在 Internet 网上的,尤其是学术 机构在发表论文时所用的实验数据都可以免费提供给全世界的研究人员下载使用。作为学术 论文的补充资料在网上发布的数据主要是文本文件或 Excel 格式的文件,这些数据往往都 是经过归一化处理后的 Ratio 值或 log 2 (Ratio) ,对于寡核苷酸芯片数据有的是 P/A/M 表 示,有的是荧光强度值。因为这些数据文件没有包含原始的实验方案、实验材料、原始扫描 图像、图像处理方法和数据归一化方法等信息,对于要比较或整合分析来自不同研究小组的 基因表达数据是非常困难的。主要原因是 DNA 微阵列并不是在任何客观的个体上测量基 因表达水平,大多数测量值仅仅是基因表达的相对变化,而且使用的并不是一个标准化的对 照样本。同时,基因表达数据比基因组序列数据要复杂的多,这些数据仅仅在有具体的关于 实验条件的描述时才是有意义的,对于不同的细胞类型,在不同的条件下都有一套转录本。 因此,基于 DNA 微阵列的基因表达数据存储量是非常大的,对于具有 20000 个探针的微 阵列实验,以 10um 的分辨率扫描,产生 3 千万个离散的数据点,如果以 tiff 文件贮存, 将占用约 60Mb 的硬盘空间
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有