正在加载图片...
·508. 智能系统学报 第8卷 支持向量机分类器 max 分类器是性别识别模型的重要组成部分,最邻 式中: 近值分类器和K临近值分类器对已知分界面要求 ∑9.=0,0≤g,≤V.二次函数存在惟一 较高,如果一张图像或者K张图像的类别标记错 最优解,设g”为最优解,可得: 误,对于属于二分类的性别识别问题,有可能造成整 a' ∑gf 个模型的失效.本文选用SV]作为性别识别模型 当9:”非零时,即为支持向量.根据式(7),可以 的分类器,SVM基于统计理论寻找最优分类面. 求出分类阈值b·,进而得到最优分类面函数为 性别识别中,只有男和女2个类别,类别属性为 {1,-1},假定性别特征直接线性可分,则存在 fx,g=sg(∑gf(x*)+6} =t fx)=ax:+b≥1. 实验证明,性别特征线性不可分,将现有的性别 式中:x:为训练的人脸图像性别特征数据.当 特征引入高维空间,使之线性可分.寻找最优分类面 ax:+b≥1时,x:属于男性;当ax:+b≤-1时,x 只使用空间点积运算,可以引入核函数K(x:,x)= 属于女性 p(x:)p(x),此时凸二次规划问题变为 为减少分类面的重复,(a,b)遵循约束: 1 max mini=1.2.ax;+=1. 点x到最优分类面的距离为 最优分类面函数变为 dx,a,b)=a,+b、1 fx,9)=sg(∑9fK(x*)+b} i=1 SVM常用的核函数有:线性核函数(linear)、多 2个类别的间隔为2/‖a川时,分类间隔最大, 项式核函数(polynomial)、径向基核函数(RBF)和多 即Ia‖2最小,所以使‖a‖2/2最小的分类面即 层感知机核函数(MLP).而核函数的选择目前还缺 是最佳分类面. 乏指导原则,经过实验分析,多项式核函数偏向男性 但训练库的人脸性别特征不明显时,经验风险 识别,径向基核函数偏向女性识别,多层感知机核函 不能保证为零,可以引入松弛因子飞,线性分类面可 数的识别率不稳定,只有线性核函数能够较好地完 以描述为 成本文所述性别识别分类任务,因此,选用基于线性 f(ax:+b)≥1-专. 核函数的SVM作为分类器 当0≤专≤1时,样本分类正确:专>1时,样本 本文算法实现过程 被错分.使式(5)获得最优分类面: 71a3+vΣ5 图3为本文算法流程示意图,步骤如下: (5) 1)1200张训练图像利用特征脸方法训练特征 式中:H是惩罚因子,为正常数 空间,前N个最大特征值对应的特征向量构成特征 定义Lagrange函数: 子空间E:,将1200张图像数据投影到PCA投影空 M 间(特征子空间),获得第1次特征提取数据; uabg=+v宫&-立aas+6-1. 2)对第1次特征提取的数据进行OLDA运算, i=1 i 前L个最大特征值对应的特征向量构成OLDA投影 (6) 空间(特征子空间L),将第1次特征提取数据投影 式中:q:为Lagrange算子,为非负数.对式(6)分别 到特征子空间L,获得全局特征: 进行参数求导,得: 3)对训练图像进行ULBP运算,获得局部特征, aL =0≥a= 并将全局特征与其级联,获得图像性别特征; da i=1 4)1200张训练集图片可以得到1200个图像 aL 性别特征数据,用基于线性核函数的支持向量机训 ab =0≥】 6=0 练图像性别特征,得到高维空间分类面 aL 5)测试集的200张人脸图像先向特征子空间 =0≥q:[f(a·x:+b-1)]=0 8q: E:投影,再向特征子空间L投影,得到测试集的全 将式(7)所示的最优分类面的求解问题转化为 局特征: 凸二次规划问题: 6)对测试图像进行ULBP运算,获得测试图像3 支持向量机分类器 分类器是性别识别模型的重要组成部分,最邻 近值分类器和 K 临近值分类器对已知分界面要求 较高,如果一张图像或者 K 张图像的类别标记错 误,对于属于二分类的性别识别问题,有可能造成整 个模型的失效.本文选用 SVM [19]作为性别识别模型 的分类器,SVM 基于统计理论寻找最优分类面. 性别识别中,只有男和女 2 个类别,类别属性为 {1,-1} ,假定性别特征直接线性可分,则存在 f(x) = axi + b ≥ 1 . 式中: xi 为 训 练 的 人 脸 图 像 性 别 特 征 数 据. 当 axi + b ≥1 时, xi 属于男性;当 axi + b ≤- 1 时, xi 属于女性. 为减少分类面的重复, (a,b) 遵循约束: mini = 1,2,…,M axi + b = 1. 点 x 到最优分类面的距离为 d(x,a,b) = axi + b a ≥ 1 a . 2 个类别的间隔为 2 / ‖a‖ 时, 分类间隔最大, 即 ‖a‖2 最小,所以使 ‖a‖2 / 2 最小的分类面即 是最佳分类面. 但训练库的人脸性别特征不明显时,经验风险 不能保证为零,可以引入松弛因子 ξ ,线性分类面可 以描述为 f i axi ( + b) ≥ 1 - ξ . 当0 ≤ ξ ≤ 1 时,样本分类正确; ξ > 1 时,样本 被错分.使式(5)获得最优分类面: 1 2 ‖a‖2 + ∀∑ M i-1 ξ . (5) 式中: ∀ 是惩罚因子,为正常数. 定义 Lagrange 函数: L(a,b,q) = 1 2 a 2 + ∀∑ M i =1 ξ -∑ M i =1 qi f i axi [ ( + b - 1) ] . (6) 式中: qi 为 Lagrange 算子,为非负数.对式(6) 分别 进行参数求导,得: ∂L ∂a = 0 ≥ a = ∑ M i = 1 qi f i xi, ∂L ∂b = 0 ≥ ∑ M i = 1 qi f i = 0, ∂L ∂qi = 0 ≥ qi f i a·xi [ ( + b - 1) ] = 0. ì î í ï ï ï ï ï ï ï ï (7) 将式(7)所示的最优分类面的求解问题转化为 凸二次规划问题: max ∑ M i = 1 qi - 1 2 ∑ M i = 1 ∑ M j = 1 qi qj f i f j xi xj ( ) . 式中: ∑ M i = 1 qi f i = 0, 0 ≤ qi ≤ ∀ .二次函数存在惟一 最优解,设 q ∗ i 为最优解,可得: a ∗ = ∑ M i = 1 q ∗ i f i xi . 当 q ∗ i 非零时,即为支持向量.根据式(7),可以 求出分类阈值 b ∗ ,进而得到最优分类面函数为 f(x,q) = sgn ∑ n i = 1 q ∗ i f i x( i∗x) + b ∗ { } . 实验证明,性别特征线性不可分,将现有的性别 特征引入高维空间,使之线性可分.寻找最优分类面 只使用空间点积运算,可以引入核函数 K(xi,xj) = φ(xi)φ xj ( ) ,此时凸二次规划问题变为 max ∑ M i = 1 qi - 1 2 ∑ M i = 1 ∑ M j = 1 qi qj f i f jK xi xj ( ) . 最优分类面函数变为 f(x,q) = sgn ∑ n i = 1 q ∗ i f iK x( i∗x) + b ∗ { } . SVM 常用的核函数有:线性核函数( linear)、多 项式核函数(polynomial)、径向基核函数(RBF)和多 层感知机核函数(MLP).而核函数的选择目前还缺 乏指导原则,经过实验分析,多项式核函数偏向男性 识别,径向基核函数偏向女性识别,多层感知机核函 数的识别率不稳定,只有线性核函数能够较好地完 成本文所述性别识别分类任务,因此,选用基于线性 核函数的 SVM 作为分类器 4 本文算法实现过程 图 3 为本文算法流程示意图,步骤如下: 1)1 200 张训练图像利用特征脸方法训练特征 空间,前 N 个最大特征值对应的特征向量构成特征 子空间 Ek,将 1 200 张图像数据投影到 PCA 投影空 间(特征子空间),获得第 1 次特征提取数据; 2)对第 1 次特征提取的数据进行 OLDA 运算, 前 L 个最大特征值对应的特征向量构成 OLDA 投影 空间(特征子空间 L),将第 1 次特征提取数据投影 到特征子空间 L,获得全局特征; 3)对训练图像进行 ULBP 运算,获得局部特征, 并将全局特征与其级联,获得图像性别特征; 4)1 200 张训练集图片可以得到 1 200 个图像 性别特征数据,用基于线性核函数的支持向量机训 练图像性别特征,得到高维空间分类面; 5)测试集的 200 张人脸图像先向特征子空间 Ek 投影,再向特征子空间 L 投影,得到测试集的全 局特征; 6)对测试图像进行 ULBP 运算,获得测试图像 ·508· 智 能 系 统 学 报 第 8 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有