正在加载图片...
第1期 尹宁,等:采用最小误差阙值分割算法的基因芯片图像分析 ·29 玻片不洁、光线不均以及杂交反应不彻底等因素的 最佳阈值选为使J()最小化的t*,t·= 影响2],如何滤除噪声,并且完整地保留基因样点 arg。mJ().本文根据上述的分割算法原理,对 的边缘特征是基因芯片图像分析的关键步骤.目前 基因芯片图像进行图像分割处理.图1为上述算法 基因样点分割算法3)]主要有模板匹配45)、阈值分 与其他常见的基因芯片图像分割算法的实验对 割以及特殊理论(如形态学分割6、模糊聚类分割 比图. 算法)等.通过对一些算法的比较,本文选用了最 针对基因芯片图像的特点进行仿真实验,综合 小误差阈值分割算法对基因样点进行分割处理得到 观察3种阈值分割方法得到的图像,可以看出迭代 了较好的效果.尤其是针对基因芯片图像中基因样 法和最大类间差阈值分割算法(Osu算法)[9)较为 点模糊、与背景对比度不清晰的情况,分割处理的效 简单,处理速度快;但是得到的分割图片中,基因样 果良好,可以完整地分割基因样点并保留其边缘细 点的缺损比较多,对于与背景灰度靠近的样点往往 节特征,大大提高了基因芯片识别的效果。 不能识别.最小阈值分割算法虽然有些复杂但是能 1最小误差阈值分割算法 得到较好的效果,能够更完整地分割出基因芯片中 的基因样点区域,为后续求得基因样点的平均灰度 最小误差阈值法[8]是基于Bayes理论,由Kit 值提供了很好的支持 ler和lingworth提出的,国际上有很多学者对该算 法进行了研究,目前已经提出了很多最小误差阈值 算法的改进算法以及二维扩展算法等.通常为了更 加清楚地描述该方法,大多选用信息论中的相对嫡 的概念进行解释。 设I为一幅大小为M×N的数字图像,图像上 u D L 各点的像素值由函数f(x,y)来表示,x、y为该点的 (a)分料前的基因芯片图 b)迭代园值分制结果 横纵坐标值,且fx,y)∈G={0,1,…,L-1}.图像 的灰度直方图用(g)来表示,它可以看成是由目标 和背景2个区域像素组成的混合总体的概率密度 函数: p(g)=∑P:×p(g/i). 。w ●●●●●0●●●●●●0● 0 (c)Ostu分割结果 (d)最小误差阈值分割结果 式中:P:是子分布的先验概率,p(g)的2个子分布 p(gi)分别服从均值为、方差为σ:的正态分布: 图1几种分割算法的比较 Fig.1 Comparison of several segmentation algorithms Ψ2 2 实验结果及分析 对于阈值t∈G,最小误差阈值方法给出函数: J(t)=1+2[Po(t)Ingo(t)+P(t)Ino(t)]- 应用上述的最小误差阈值算法,本文构建了一 2[Po(t)InPo(t)+P(t)InP(t)] 个基因芯片分析体系,主要分为图像预处理、图像识 式中: 别以及数据提取和分析3个步骤.为了测试基因芯 P()=)P()) 片分析结果,选用凡敏等制备完成的基因芯片(基 g■0 g+1 孔肯亚病毒与辛德毕斯病毒特异性检测基因芯 L-1 片[)作为实验样本,具体处理步骤如下】 h(t)=Σh(g)g/P,(t)h(d)=∑h(g)g/P,(e), s-+ 2.1图像预处理与识别 o(e)=【∑(g-(t)2h(g)]P(), 通过芯片扫描仪得到的基因芯片图像是彩色图 80 像,如图2所示.为了便于后续处理并且提高图像质 J oi(e)=[∑(g-4(e)2h(g)]/P(). 量,首先要进行图像预处理,其中包括图像灰度化、 g=+1 自适应中值滤波1-2]以及适当的对比度增强处理
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有