正在加载图片...
第3期 花小朋,等:一种改进的投影孪生支持向量机 .387. WPTSVM是PTSVM的推广算法。证毕。 第2类超平面的优化准则为 定理3说明了本文提出的WPTSVM算法继承 了PTSVM的优点。进一步比较式(7)和(2)可知, min(K(B.C)u:-e(BC) PTSVM仅仅考虑类内样本的全局信息,而WPTSVM (K(B,CT)u,-e,eE2K(B,CT)u2)C2ein, 用加权均值代替PTSVM中标准均值,可以在一定 s.t.F((K(A.C")uz -eeEK(B.CT)u2)+ 程度上提高算法的局部学习能力,因为基于近邻图 n≥F"e1,n≥0 (12) 的加权均值比起标准均值更能体现样本空间的局部 通过引入拉格朗日函数,可按照类似上述 结构)。除此之外,WPTSVM还在优化目标函数中 WPTSVM算法的推导过程分别得出式(11)和(12) 引入了样本权值,权值越大,说明该样本越重要,对 的对偶形式,然后通过二次规划求解可求得投影矢 保持训练样本集潜在局部信息的贡献程度越大。图 量u,和u2。NWPTSVM的决策函数为 1给出了WPTSVM与PTSVM在人造数据集上的分 (d,→x∈第1类 类决策面。不难看出,WPTSVM的决策面能够在一 label(x)=argmind. (d2→xe第2类 定程度上体现样本集内在局部流形结构,而PTSVM (13) 相对较弱。 1.09w 式中d.=K(x',C),- 9K9)r.c)m。 =1 0.6 PTSVM 3实验分析 0.2 -0.2 实验选用人造数据集和真实数据集,进一步验 -0.6 WPTSVM 证本文WPTSVM方法的有效性。实验环境: -1.0 2.3 GHz CPU,2GB内存,实验软件MATLAB7.1。 -0.8-0.6-0.4-0.200.20.40.60.81.0 3.1复杂交叉数据集 图1两种算法人造数据集上的比较 相对于经典SVM,线性模式下对XOR问题的 Fig.1 Comparision of two algorithms on artificial dataset 测试能力是非平行超平面分离器优势之一[3。因 2.3.2训练时间复杂度 此,本节首先验证MPTSVM测试交叉数据集的能 从二次规划求解角度分析,PTSVM在训练阶段 力。图2给出一种较复杂的人造交叉数据集:Comx- 要针对每类中全部样本进行求解,所以计算复杂度 or)。表1给出了TWSVM,.PTSVM和WPTSVM三 为o(m+m2),而WPTSVM优化准则中约束条件指 种算法在该测试数据集上10折交叉验证结果。参 明只对=1的样本(边界样本)进行二次规划求 数C,与C,的搜索范围为{21i=-8,-6,…,+8}: 解,计算复杂度为o(m-y+m2-v),其中m1-w,m2-w WPTSVM中类内近邻参数k,的搜索范围为{1,2, 分别为第1类样本及第2类样本中相应边界样本点 …,9},类间近邻参数k2=5,热核参数t的搜索范围 数。诚然,WPTSVM在训练阶段要事先求出每个样 为{2Ii=-1,0,…,8}。从表1实验结果来看,PTS 本的类内权重及类间权重,计算复杂度分别为0 VM分类性能优于TWSVM,而本文WPTSVM则具 (m+m)和o(2m1·m2)。 有更佳的分类性能。 2.3.3构造非线性分类算法 1.0 针对线性不可分情况,本文进一步提出基于核 0.6 PTSVM 空间的非线性WPTSVM算法一NWPTSVM。 0.2 定义4 NWPTSVM的第1类超平面的优化准 则为 WPTSVM -0.6 mi5Ka.c'4,-eeiE"(A.c)'D" -1.0 -0.8-0.6-0.4-0.200.2040.60.81.0 (K(A,C)u-eeE(K(A,C")u)+Ce, s.t.-F (K(B.CT)u:-ezeEK(A.CT)u)+ 图2复杂交叉数据集 专≥F2e2,5≥0 (11) Fig.2 Compxor datasetWPTSVM 是 PTSVM 的推广算法。 证毕。 定理 3 说明了本文提出的 WPTSVM 算法继承 了 PTSVM 的优点。 进一步比较式(7)和(2)可知, PTSVM 仅仅考虑类内样本的全局信息,而 WPTSVM 用加权均值代替 PTSVM 中标准均值,可以在一定 程度上提高算法的局部学习能力,因为基于近邻图 的加权均值比起标准均值更能体现样本空间的局部 结构[13] 。 除此之外,WPTSVM 还在优化目标函数中 引入了样本权值,权值越大,说明该样本越重要,对 保持训练样本集潜在局部信息的贡献程度越大。 图 1 给出了 WPTSVM 与 PTSVM 在人造数据集上的分 类决策面。 不难看出,WPTSVM 的决策面能够在一 定程度上体现样本集内在局部流形结构,而 PTSVM 相对较弱。 图 1 两种算法人造数据集上的比较 Fig.1 Comparision of two algorithms on artificial dataset 2.3.2 训练时间复杂度 从二次规划求解角度分析,PTSVM 在训练阶段 要针对每类中全部样本进行求解,所以计算复杂度 为 o(m 3 1 +m 3 2 ),而 WPTSVM 优化准则中约束条件指 明只对 f (c) l = 1 的样本(边界样本)进行二次规划求 解,计算复杂度为 o(m 3 1-SV +m 3 2-SV ),其中 m1-SV ,m2-SV 分别为第 1 类样本及第 2 类样本中相应边界样本点 数。 诚然,WPTSVM 在训练阶段要事先求出每个样 本的类内权重及类间权重,计算复杂度分别为 o (m 2 1 +m 2 2 )和 o(2m1·m2 )。 2.3.3 构造非线性分类算法 针对线性不可分情况,本文进一步提出基于核 空间的非线性 WPTSVM 算法———NWPTSVM。 定义 4 NWPTSVM 的第 1 类超平面的优化准 则为 min 1 2 K(A,C T )u1 - e1 e T 1E (1)K(A,C T )u1 ( ) TD (1)· K(A,C T )u1 - e1 e T 1E (1)K(A,C T )u1 ( ) + C1 e T 2 ξ, s.t. - F (2) K(B,C T )u1 - e2 e T 1E (1)K(A,C T )u1 ( ) + ξ ≥ F (2) e2 ,ξ ≥ 0 (11) 第 2 类超平面的优化准则为 min 1 2 K(B,C T )u2 - e2 e T 2E (2)K(B,C T )u2 ( ) TD (2)· K(B,C T )u2 - e2 e T 2E (2)K(B,C T )u2 ( ) + C2 e T 1η, s.t. F (1) K(A,C T )u2 - e1 e T 2E (2)K(B,C T )u2 ( ) + η ≥ F (1) e1 ,η ≥ 0 (12) 通 过 引 入 拉 格 朗 日 函 数, 可 按 照 类 似 上 述 WPTSVM 算法的推导过程分别得出式(11)和(12) 的对偶形式,然后通过二次规划求解可求得投影矢 量 u1 和 u2 。 NWPTSVM 的决策函数为 label(x) = argmin c = 1,2 {dc} = d1⇒x ∈ 第 1 类 {d2⇒x ∈ 第 2 类 (13) 式中 dc = K(x T ,C T )ui -∑ mc j = 1 λ (c) j K((x (c) j ) T ,C T )ui 。 3 实验分析 实验选用人造数据集和真实数据集,进一步验 证本 文 WPTSVM 方 法 的 有 效 性。 实 验 环 境: 2.3 GHz CPU,2 GB 内存,实验软件 MATLAB 7.1。 3.1 复杂交叉数据集 相对于经典 SVM,线性模式下对 XOR 问题的 测试能力是非平行超平面分离器优势之一[3⁃5] 。 因 此,本节首先验证 MPTSVM 测试交叉数据集的能 力。 图 2 给出一种较复杂的人造交叉数据集:Comx⁃ or [7] 。 表 1 给出了 TWSVM、PTSVM 和 WPTSVM 三 种算法在该测试数据集上 10 折交叉验证结果。 参 数 C1与 C2 的搜索范围为{2 i | i = - 8,- 6,…,+ 8}; WPTSVM 中类内近邻参数 k1 的搜索范围为{ 1,2, …,9},类间近邻参数 k2 = 5,热核参数 t 的搜索范围 为{2 i | i = -1,0,…,8}。 从表 1 实验结果来看,PTS⁃ VM 分类性能优于 TWSVM,而本文 WPTSVM 则具 有更佳的分类性能。 图 2 复杂交叉数据集 Fig.2 Compxor dataset 第 3 期 花小朋,等:一种改进的投影孪生支持向量机 ·387·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有