ＷＰＴＳＶＭ是ＰＴＳＶＭ的推广算法。证毕。定理３说明了本文提

正在加载图片...

第3期花小朋，等：一种改进的投影孪生支持向量机 .387. WPTSVM是PTSVM的推广算法。证毕。第2类超平面的优化准则为定理3说明了本文提出的WPTSVM算法继承了PTSVM的优点。进一步比较式(7)和(2)可知， min(K(B.C)u:-e(BC) PTSVM仅仅考虑类内样本的全局信息，而WPTSVM (K(B,CT)u,-e,eE2K(B,CT)u2)C2ein, 用加权均值代替PTSVM中标准均值，可以在一定 s.t.F((K(A.C")uz -eeEK(B.CT)u2)+ 程度上提高算法的局部学习能力，因为基于近邻图 n≥F"e1,n≥0 (12) 的加权均值比起标准均值更能体现样本空间的局部通过引入拉格朗日函数，可按照类似上述结构)。除此之外，WPTSVM还在优化目标函数中 WPTSVM算法的推导过程分别得出式(11)和(12) 引入了样本权值，权值越大，说明该样本越重要，对的对偶形式，然后通过二次规划求解可求得投影矢保持训练样本集潜在局部信息的贡献程度越大。图量u,和u2。NWPTSVM的决策函数为 1给出了WPTSVM与PTSVM在人造数据集上的分 (d,→x∈第1类类决策面。不难看出，WPTSVM的决策面能够在一 label(x)=argmind. (d2→xe第2类定程度上体现样本集内在局部流形结构，而PTSVM (13) 相对较弱。 1.09w 式中d.=K(x',C),- 9K9)r.c)m。 =1 0.6 PTSVM 3实验分析 0.2 -0.2 实验选用人造数据集和真实数据集，进一步验 -0.6 WPTSVM 证本文WPTSVM方法的有效性。实验环境： -1.0 2.3 GHz CPU,2GB内存，实验软件MATLAB7.1。 -0.8-0.6-0.4-0.200.20.40.60.81.0 3.1复杂交叉数据集图1两种算法人造数据集上的比较相对于经典SVM,线性模式下对XOR问题的 Fig.1 Comparision of two algorithms on artificial dataset 测试能力是非平行超平面分离器优势之一[3。因 2.3.2训练时间复杂度此，本节首先验证MPTSVM测试交叉数据集的能从二次规划求解角度分析，PTSVM在训练阶段力。图2给出一种较复杂的人造交叉数据集：Comx- 要针对每类中全部样本进行求解，所以计算复杂度 or)。表1给出了TWSVM,.PTSVM和WPTSVM三为o(m+m2),而WPTSVM优化准则中约束条件指种算法在该测试数据集上10折交叉验证结果。参明只对=1的样本（边界样本）进行二次规划求数C,与C,的搜索范围为{21i=-8,-6,…,+8}: 解，计算复杂度为o(m-y+m2-v),其中m1-w,m2-w WPTSVM中类内近邻参数k,的搜索范围为{1,2，分别为第1类样本及第2类样本中相应边界样本点 …,9},类间近邻参数k2=5,热核参数t的搜索范围数。诚然，WPTSVM在训练阶段要事先求出每个样为{2Ii=-1,0,…,8}。从表1实验结果来看，PTS 本的类内权重及类间权重，计算复杂度分别为0 VM分类性能优于TWSVM,而本文WPTSVM则具 (m+m)和o(2m1·m2)。有更佳的分类性能。 2.3.3构造非线性分类算法 1.0 针对线性不可分情况，本文进一步提出基于核 0.6 PTSVM 空间的非线性WPTSVM算法一NWPTSVM。 0.2 定义4 NWPTSVM的第1类超平面的优化准则为 WPTSVM -0.6 mi5Ka.c'4,-eeiE"(A.c)'D" -1.0 -0.8-0.6-0.4-0.200.2040.60.81.0 (K(A,C)u-eeE(K(A,C")u)+Ce, s.t.-F (K(B.CT)u:-ezeEK(A.CT)u)+ 图2复杂交叉数据集专≥F2e2,5≥0 (11) Fig.2 Compxor datasetＷＰＴＳＶＭ是ＰＴＳＶＭ的推广算法。证毕。定理３说明了本文提出的ＷＰＴＳＶＭ算法继承了ＰＴＳＶＭ的优点。进一步比较式（７）和（２）可知，ＰＴＳＶＭ仅仅考虑类内样本的全局信息，而ＷＰＴＳＶＭ用加权均值代替ＰＴＳＶＭ中标准均值，可以在一定程度上提高算法的局部学习能力，因为基于近邻图的加权均值比起标准均值更能体现样本空间的局部结构［１３］。除此之外，ＷＰＴＳＶＭ还在优化目标函数中引入了样本权值，权值越大，说明该样本越重要，对保持训练样本集潜在局部信息的贡献程度越大。图１给出了ＷＰＴＳＶＭ与ＰＴＳＶＭ在人造数据集上的分类决策面。不难看出，ＷＰＴＳＶＭ的决策面能够在一定程度上体现样本集内在局部流形结构，而ＰＴＳＶＭ相对较弱。图１两种算法人造数据集上的比较Ｆｉｇ．１Ｃｏｍｐａｒｉｓｉｏｎｏｆｔｗｏａｌｇｏｒｉｔｈｍｓｏｎａｒｔｉｆｉｃｉａｌｄａｔａｓｅｔ２．３．２训练时间复杂度从二次规划求解角度分析，ＰＴＳＶＭ在训练阶段要针对每类中全部样本进行求解，所以计算复杂度为ｏ（ｍ３１＋ｍ３２），而ＷＰＴＳＶＭ优化准则中约束条件指明只对ｆ（ｃ）ｌ＝１的样本（边界样本）进行二次规划求解，计算复杂度为ｏ（ｍ３１－ＳＶ＋ｍ３２－ＳＶ），其中ｍ１－ＳＶ，ｍ２－ＳＶ分别为第１类样本及第２类样本中相应边界样本点数。诚然，ＷＰＴＳＶＭ在训练阶段要事先求出每个样本的类内权重及类间权重，计算复杂度分别为ｏ（ｍ２１＋ｍ２２）和ｏ（２ｍ１·ｍ２）。２．３．３构造非线性分类算法针对线性不可分情况，本文进一步提出基于核空间的非线性ＷＰＴＳＶＭ算法———ＮＷＰＴＳＶＭ。定义４ＮＷＰＴＳＶＭ的第１类超平面的优化准则为ｍｉｎ１２Ｋ（Ａ，ＣＴ）ｕ１－ｅ１ｅＴ１Ｅ（１）Ｋ（Ａ，ＣＴ）ｕ１ ( ) ＴＤ（１）· Ｋ（Ａ，ＣＴ）ｕ１－ｅ１ｅＴ１Ｅ（１）Ｋ（Ａ，ＣＴ）ｕ１ ( ) ＋Ｃ１ｅＴ２ ξ，ｓ．ｔ．－Ｆ（２）Ｋ（Ｂ，ＣＴ）ｕ１－ｅ２ｅＴ１Ｅ（１）Ｋ（Ａ，ＣＴ）ｕ１ ( ) ＋ ξ ≥ Ｆ（２）ｅ２，ξ ≥ ０（１１）第２类超平面的优化准则为ｍｉｎ１２Ｋ（Ｂ，ＣＴ）ｕ２－ｅ２ｅＴ２Ｅ（２）Ｋ（Ｂ，ＣＴ）ｕ２ ( ) ＴＤ（２）· Ｋ（Ｂ，ＣＴ）ｕ２－ｅ２ｅＴ２Ｅ（２）Ｋ（Ｂ，ＣＴ）ｕ２ ( ) ＋Ｃ２ｅＴ１η，ｓ．ｔ．Ｆ（１）Ｋ（Ａ，ＣＴ）ｕ２－ｅ１ｅＴ２Ｅ（２）Ｋ（Ｂ，ＣＴ）ｕ２ ( ) ＋ η ≥ Ｆ（１）ｅ１，η ≥ ０（１２）通过引入拉格朗日函数，可按照类似上述ＷＰＴＳＶＭ算法的推导过程分别得出式（１１）和（１２）的对偶形式，然后通过二次规划求解可求得投影矢量ｕ１和ｕ２。ＮＷＰＴＳＶＭ的决策函数为ｌａｂｅｌ（ｘ）＝ａｒｇｍｉｎｃ＝１，２｛ｄｃ｝＝ｄ１⇒ｘ ∈ 第１类 {ｄ２⇒ｘ ∈ 第２类（１３）式中ｄｃ＝Ｋ（ｘＴ，ＣＴ）ｕｉ－∑ ｍｃｊ＝１ λ （ｃ）ｊＫ（（ｘ（ｃ）ｊ）Ｔ，ＣＴ）ｕｉ。３实验分析实验选用人造数据集和真实数据集，进一步验证本文ＷＰＴＳＶＭ方法的有效性。实验环境：２．３ＧＨｚＣＰＵ，２ＧＢ内存，实验软件ＭＡＴＬＡＢ７．１。３．１复杂交叉数据集相对于经典ＳＶＭ，线性模式下对ＸＯＲ问题的测试能力是非平行超平面分离器优势之一［３⁃５］。因此，本节首先验证ＭＰＴＳＶＭ测试交叉数据集的能力。图２给出一种较复杂的人造交叉数据集：Ｃｏｍｘ⁃ ｏｒ［７］。表１给出了ＴＷＳＶＭ、ＰＴＳＶＭ和ＷＰＴＳＶＭ三种算法在该测试数据集上１０折交叉验证结果。参数Ｃ１与Ｃ２的搜索范围为｛２ｉ｜ｉ＝－８，－６，…，＋８｝；ＷＰＴＳＶＭ中类内近邻参数ｋ１的搜索范围为｛１，２， …，９｝，类间近邻参数ｋ２＝５，热核参数ｔ的搜索范围为｛２ｉ｜ｉ＝－１，０，…，８｝。从表１实验结果来看，ＰＴＳ⁃ ＶＭ分类性能优于ＴＷＳＶＭ，而本文ＷＰＴＳＶＭ则具有更佳的分类性能。图２复杂交叉数据集Ｆｉｇ．２Ｃｏｍｐｘｏｒｄａｔａｓｅｔ第３期花小朋，等：一种改进的投影孪生支持向量机 ·３８７·

<<向上翻页向下翻页>>

点击下载：【机器学习】一种改进的投影孪生支持向量机编辑部