正在加载图片...
·806· 工程科学学报,第37卷,第6期 F.(i,》=Na 1 T(i,] (4) 间中,并构造最优超平面,使得对未知样本的分类能力 更强. 式中,[T(i,],表示第k个人眼图像上第(i,j)子块 支持向量机可以通过两类问题的组合实现,通常 的方差图像,N为人眼图像个数(这里,N=30).构建 有两种:(1)一个分类器区分每一类与其他所有分类 的人眼方差滤波器如图3所示. (多分类):(2)一个分类器区分两个类别(两分类) 根据本论文研究内容,主要区分人眼和非人眼图像,因 此这里采用第二种方式。假设存在一个超平面,将其 分为两类,分别表示为正类(人眼图像)和负类(非人 眼图像).设定一组有标示的训练样本集(x,y:),其 图3人眼方差滤波器 中x,代表输入的人眼图像、非人眼或不完全人眼图像 Fig.3 Eye variance filter (统称为非人眼图像)数据特征矢量,y:是代表所属分 使用方差滤波器搜索潜在人眼区域时,需要计算 类,值为-1和+1.分类可以表示如下: 方差滤波器与可能存在人眼图像的相关系数,计算公 y:(wx,+0。-1)≥0 (6) 式为 式中,w是超平面的法向,。是超平面到原点的距离. R(T.F)= E([(T;-E(T)[F.-E(F.)] (5) 超平面空间可以表示为 DTDF f(x)=sgn(wx+w). (7) 式中,T表示第(i,j)子块的方差图像T(i,j),E和D 根据给定的w和。,输入一个矢量x,根据式(6) 分别为子块图像的灰度数学期望值和方差值 计算出大于0还是小于0,然后使用符号函数sg知(w· 区分人眼图像与非人眼图像需要确定方差滤波器 x+0)得出-1或+1,即归为两类.由于本文使用的 阈值.因此,随机从自建人眼数据库中手动抽取出人 图像数据并不是很好的线性可分情况,因此需要使用 眼周边30幅大小为48×24非人眼图像,使用式(2)和 核函数的非线性变换,将数据转换到某个高维空间进 式(3)得到30幅非人眼图像的方差.然后,根据式(5) 行分析.通常核函数有高斯核函数、多项式核函数和 计算出图像方差滤波器与人眼图像和非人眼图像的相 径向基核函数,本文采用径向基核函数: 关系数,如图4所示,箭头所指的横线是人眼图像和非 人眼图像的区分线,即阈值为0.3.很明显看出,大于 f)=g[ wyK(xx)+w (8) 0.3为人眼图像,小于0.3为非人眼图像.尽管有部分 其中,K(x,x)=exp{-(Ix-x:2)/a2},o为径向基 非人眼图像的相关系数超过0.3,但是可以看出方差 和参数 滤波器成功过滤掉大部分非人眼图像 1.4主成分分析 由于图像数据量较大,因此使用主成分分析的方 1.0 法对图像数据降维处理,处理后得到的主成分图像数 0.8 人眼图像 非人眼图像 据用于训练支持向量机.主成分分析是模式识别中一 种有效的特征提取方法,目的是使用少量特征对样本 0.4 进行描述,降低样本空间维数,同时又尽可能多的保留 0.2 样本空间的信息量网.本论文所使用的主成分分析算 阙值0.3 法如下 -0.2 将大小为48×24的训练图像按列展开,形成 -0.4 051015202530354045505560 48×24维的向量x,(i=1,2,…,M),其中M为样本数 人眼图像数量 (M=2000),则样本的协方差矩阵计算公式为 图4方差滤波器与人眼/非人眼图像的相关系数确定滤波器 阅值 8=品宫球=动 (9) Fig.4 Determining the threshold by correlation between the eye vari- 其中无=x-,重=G,x2,…,xw],x为所有样本的 ance filter and eye/non-eye images 总体平均量.求解S,的特征值,按照降序方式排列, 1.3支持向量机 定义前K(K≤48×24)个最大值对应的特征向量 支持向量机是基于统计学理论的学习方法,最早 B,(=1,2,…,K)为主元,要求主元保留数据信息量的 是由Va即nik等提出,成功应用于人脸、语音、文字、图 97%,也即K个特征值信息量占所有特征值信息量的 像和信息的检测和识别圆.支持向量机主要思想是将 97%.然后,将K个向量张成一个空间,每幅图像样本 非线性可分样本向量经非线性变换映射到一个高维空 向量向这一子空间投影,形成K个投影分量,就把图工程科学学报,第 37 卷,第 6 期 Fe(i,j) = 1 N ∑ N k = 1 [T(i,j)]k . (4) 式中,[T(i,j)]k 表示第 k 个人眼图像上第( i,j) 子块 的方差图像,N 为人眼图像个数(这里,N = 30). 构建 的人眼方差滤波器如图 3 所示. 图 3 人眼方差滤波器 Fig. 3 Eye variance filter 使用方差滤波器搜索潜在人眼区域时,需要计算 方差滤波器与可能存在人眼图像的相关系数,计算公 式为 R(T,Fe) = E{[(Tij - E(Tij )][Fe - E(Fe)]} 槡D(Tij )D(Fe) . (5) 式中,Tij表示第( i,j) 子块的方差图像 T( i,j),E 和 D 分别为子块图像的灰度数学期望值和方差值. 区分人眼图像与非人眼图像需要确定方差滤波器 阈值. 因此,随机从自建人眼数据库中手动抽取出人 眼周边 30 幅大小为 48 × 24 非人眼图像,使用式(2)和 式(3)得到30 幅非人眼图像的方差. 然后,根据式(5) 计算出图像方差滤波器与人眼图像和非人眼图像的相 关系数,如图 4 所示,箭头所指的横线是人眼图像和非 人眼图像的区分线,即阈值为 0. 3. 很明显看出,大于 0. 3 为人眼图像,小于 0. 3 为非人眼图像. 尽管有部分 非人眼图像的相关系数超过 0. 3,但是可以看出方差 滤波器成功过滤掉大部分非人眼图像. 图 4 方差滤波器与人眼/非人眼图像的相关系数确定滤波器 阈值 Fig. 4 Determining the threshold by correlation between the eye vari￾ance filter and eye /non-eye images 1. 3 支持向量机 支持向量机是基于统计学理论的学习方法,最早 是由 Vapnik 等提出,成功应用于人脸、语音、文字、图 像和信息的检测和识别[8]. 支持向量机主要思想是将 非线性可分样本向量经非线性变换映射到一个高维空 间中,并构造最优超平面,使得对未知样本的分类能力 更强. 支持向量机可以通过两类问题的组合实现,通常 有两种:(1) 一个分类器区分每一类与其他所有分类 (多分类);(2) 一个分类器区分两个类别(两分类). 根据本论文研究内容,主要区分人眼和非人眼图像,因 此这里采用第二种方式. 假设存在一个超平面,将其 分为两类,分别表示为正类(人眼图像) 和负类(非人 眼图像). 设定一组有标示的训练样本集( xi,yi ),其 中 xi 代表输入的人眼图像、非人眼或不完全人眼图像 (统称为非人眼图像)数据特征矢量,yi 是代表所属分 类,值为 - 1 和 + 1. 分类可以表示如下: yi(w·xi + w0 - 1)≥0. (6) 式中,w 是超平面的法向,w0 是超平面到原点的距离. 超平面空间可以表示为 f(x) = sgn(w·x + w0 ). (7) 根据给定的 w 和 w0,输入一个矢量 x,根据式(6) 计算出大于 0 还是小于 0,然后使用符号函数 sgn(w· x + w0 )得出 - 1 或 + 1,即归为两类. 由于本文使用的 图像数据并不是很好的线性可分情况,因此需要使用 核函数的非线性变换,将数据转换到某个高维空间进 行分析. 通常核函数有高斯核函数、多项式核函数和 径向基核函数,本文采用径向基核函数: f(x) [ = sgn ∑ N i = 1 wiyiK(xi,x) + w0 ] . (8) 其中,K(xi,x) = exp{ - ( | x - xi | 2 ) /σ2 },σ 为径向基 和参数. 1. 4 主成分分析 由于图像数据量较大,因此使用主成分分析的方 法对图像数据降维处理,处理后得到的主成分图像数 据用于训练支持向量机. 主成分分析是模式识别中一 种有效的特征提取方法,目的是使用少量特征对样本 进行描述,降低样本空间维数,同时又尽可能多的保留 样本空间的信息量[9]. 本论文所使用的主成分分析算 法如下. 将大小 为 48 × 24 的训练图像按列展开,形 成 48 × 24维的向量 xi(i = 1,2,…,M),其中 M 为样本数 (M = 2000),则样本的协方差矩阵计算公式为 St = 1 M ∑ M i = 1 xixT i = 1 M ΦtΦT t . (9) 其中 xi = xi - x,Φt =[x1,x2,…,xM],x 为所有样本的 总体平均量. 求解 St 的特征值,按照降序方式排列, 定义前 K ( K ≤48 × 24 ) 个最大值对应的特征向量 βj (j = 1,2,…,K)为主元,要求主元保留数据信息量的 97% ,也即 K 个特征值信息量占所有特征值信息量的 97% . 然后,将 K 个向量张成一个空间,每幅图像样本 向量向这一子空间投影,形成 K 个投影分量,就把图 ·806·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有