第8卷第3期 智能系统学报 Vol.8 No.3 2013年6月 CAAI Transactions on Intelligent Systems Jum.2013 D0I:10.3969/i.issn.1673-4785.201211026 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20130515.0842.003.html 支持向量回归机多项式光滑函数的逼近精度 冯能山,熊金志 (东莞理工学院计算机学院,广东东莞523808) 摘要:为了解决支持向量回归机多项式光滑函数的逼近精度问题,根据该类光滑函数的复杂性,提出五步求的基 本思路:首先把多项式光滑函数的逼近精度问题表示为一个求逼近函数的最大值问题,接着证明这个逼近函数是一 个对称函数,然后分别求出逼近函数在[0,s]和(ε,+0)上的最大值,最后对这2个最大值进行比较,得出光滑函 数的逼近精度通过实例计算,结果证明了该方法的有效性和正确性,解决了无穷多个多项式光滑函数的逼近精度问 题,为光滑支持向量回归机提供了基本的理论支持. 关键词:支持向量回归机:多项式光滑函数:逼近精度:对称函数 中图分类号:TP18文献标志码:A文章编号:1673-4785(2013)03-0266-05 中文引用格式:冯能山,熊金志.支持向量回归机多项式光滑函数的逼近精度[J].智能系统学报,2013,8(3】:266-270 英文引用格式:FENG Nengshan,,XIONG Jinzhi.The approximation accuracies of polynomial smoothing functions for support vec tor regression[J].CAAI Transactions on Intelligent Systems,2013,8(3):266-270. The approximation accuracies of polynomial smoothing functions for support vector regression FENG Nengshan,XIONG Jinzhi Computer College,Dongguan University of Technology,Dongguan 523808,China) Abstract:In order to solve the problem of polynomial smoothing function's approximation accuracies for support vector regression,the researcher proposes to solve the problem utilizing a five step approach,according to the com- plexity of smooth functions.The first step,examines the problem of the approximation accuracy in the polynomial smoothing function represented by solving the maximum value of an approximation function;second,the function was verified to be a symmetric function;third,the maximum values of the approximation function were derived re- spectively at the intervals [0,s]and (s,+o);fourth,the two maximum values were compared,and finally the approximation accuracy was obtained.Through the calculation with examples,the correctness and effectiveness of the method was validated,and the approximation accuracy problem of the infinite polynomial smoothing functions was systematically solved in this paper,which offers basic theoretical support for smooth support vector regression. Keywords:support vector regression;polynomial smoothing function;approximation accuracies;symmetric function 光滑函数在支持向量机中得到了成功应用,特机在一定程度上改善了回归效果.为使支持向量回 别是对分类问题获得了良好的效果】对回归问 归机的效果得到进一步改善,针对原支持向量回归 题,国内外学者进行了深入研究,如Lee等找到一 机中ε-不敏感损失函数的平方项不光滑的问题, 类p2-函数,并作为光滑函数对回归问题中的目标函2008年笔者又提出了一类多项式光滑函数).这类 数进行光滑处理,提出ε不敏感的光滑支持向量回 多项式光滑函数的形式复杂,具有以下3个显著特 归机模型.其实验结果表明,这种光滑支持向量回归 点:1)这种多项式光滑函数有无穷多个:2)每个多 项式光滑函数都是某个多项式函数的复合函数:3) 收稿日期:2012-11-02.网络出版日期:2013-05-15. 基金项目:广东省自然科学基金资助项目(9151170003000017):东莞 每个多项式光滑函数都是三段函数[s6].按照光滑技 市科技计划资助项目(2012108102027) 通信作者:熊金志.E-mail:dgxiongjinzhi(@126.com 术的基本思路,用多项式光滑函数对原支持向量回
第 8 卷第 3 期 智 能 系 统 学 报 Vol.8 №.3 2013 年 6 月 CAAI Transactions on Intelligent Systems Jun. 2013 DOI:10.3969 / j.issn.1673⁃4785.201211026 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20130515.0842.003.html 支持向量回归机多项式光滑函数的逼近精度 冯能山,熊金志 (东莞理工学院 计算机学院,广东 东莞 523808) 摘 要:为了解决支持向量回归机多项式光滑函数的逼近精度问题,根据该类光滑函数的复杂性,提出五步求的基 本思路:首先把多项式光滑函数的逼近精度问题表示为一个求逼近函数的最大值问题,接着证明这个逼近函数是一 个对称函数,然后分别求出逼近函数在 [0,ε] 和 (ε, + ¥) 上的最大值,最后对这 2 个最大值进行比较,得出光滑函 数的逼近精度.通过实例计算,结果证明了该方法的有效性和正确性,解决了无穷多个多项式光滑函数的逼近精度问 题,为光滑支持向量回归机提供了基本的理论支持. 关键词:支持向量回归机;多项式光滑函数;逼近精度;对称函数 中图分类号: TP18 文献标志码:A 文章编号:1673⁃4785(2013)03⁃0266⁃05 中文引用格式:冯能山,熊金志.支持向量回归机多项式光滑函数的逼近精度[J].智能系统学报, 2013, 8(3): 266⁃270. 英文引用格式:FENG Nengshan, XIONG Jinzhi. The approximation accuracies of polynomial smoothing functions for support vec⁃ tor regression[J].CAAI Transactions on Intelligent Systems, 2013, 8(3): 266⁃270. The approximation accuracies of polynomial smoothing functions for support vector regression FENG Nengshan, XIONG Jinzhi (Computer College, Dongguan University of Technology, Dongguan 523808, China) Abstract:In order to solve the problem of polynomial smoothing function’ s approximation accuracies for support vector regression, the researcher proposes to solve the problem utilizing a five step approach, according to the com⁃ plexity of smooth functions. The first step, examines the problem of the approximation accuracy in the polynomial smoothing function represented by solving the maximum value of an approximation function; second, the function was verified to be a symmetric function; third, the maximum values of the approximation function were derived re⁃ spectively at the intervals [0,ε] and (ε, + ¥) ; fourth, the two maximum values were compared, and finally the approximation accuracy was obtained. Through the calculation with examples, the correctness and effectiveness of the method was validated, and the approximation accuracy problem of the infinite polynomial smoothing functions was systematically solved in this paper, which offers basic theoretical support for smooth support vector regression. Keywords:support vector regression; polynomial smoothing function; approximation accuracies; symmetric function 收稿日期:2012⁃11⁃02. 网络出版日期:2013⁃05⁃15. 基金项目:广东省自然科学基金资助项目(9151170003000017);东莞 市科技计划资助项目(2012108102027). 通信作者:熊金志. E⁃mail:dgxiongjinzhi@ 126.com. 光滑函数在支持向量机中得到了成功应用,特 别是对分类问题获得了良好的效果[1⁃3] .对回归问 题,国内外学者进行了深入研究,如 Lee 等[4]找到一 类 p 2 ε ⁃函数,并作为光滑函数对回归问题中的目标函 数进行光滑处理,提出 ε⁃不敏感的光滑支持向量回 归机模型.其实验结果表明,这种光滑支持向量回归 机在一定程度上改善了回归效果.为使支持向量回 归机的效果得到进一步改善,针对原支持向量回归 机中 ε⁃不敏感损失函数的平方项不光滑的问题, 2008 年笔者又提出了一类多项式光滑函数[5] .这类 多项式光滑函数的形式复杂,具有以下 3 个显著特 点:1)这种多项式光滑函数有无穷多个;2) 每个多 项式光滑函数都是某个多项式函数的复合函数;3) 每个多项式光滑函数都是三段函数[5⁃6] .按照光滑技 术的基本思路,用多项式光滑函数对原支持向量回
第3期 冯能山,等:支持向量回归机多项式光滑函数的逼近精度 ·267· 归机模型进行光滑处理,可以得到支持向量机的光 键作用,因此光滑函数与!·2的逼近精度是光滑 滑模型,从而提高回归速度,而这个过程必须用到多 支持向量回归机的一个重要理论问题),也是本文 项式光滑函数的逼近精度[4.因此,多项式光滑函数 要研究的问题.为便于研究,下面列出支持向量回归 的逼近精度是光滑支持向量回归机必须解决的一个 机的多项式光滑函数 重要问题.该问题是否存在一个统一的求解方法,多 1.3光滑函数 年来一直是一个尚待解决的问题,刀对此,本文提 文献[5]已对ε-不敏感损失函数1xl,及其平方 出五步求的基本思路,并用二分法试图系统解决这 函数1x2的多项式光滑函数进行了定义和说明,在 个问题 此不再赘述.为便于分析,先给出支持向量回归机的 1支持向量回归机及其光滑函数 多项式光滑函数 引理1)设p(x,k)是正号函数x,的d阶多 1.1回归问题 项式光滑函数,令函数P(x,k)满足: 对数据集S={(x1,y1),(x22),…,(xmyn)} pi(x,k)=pa (x-s,k)2+pa(-x-s,k)2, R"×R,令矩阵A=[x1x2…xm],x:是一个n维向量, (3) 每个x:对应有一个观测值y.显然A∈Rm,S= 则p(x,k)是Ixl2的d阶多项式光滑函数 {(A:y:)lA:∈R,y:eR},i=1,2,…,m,其中A:是 可见,Ix12的光滑函数p(x,k)是正号函数x, 矩阵A的第i个向量.回归的目的是利用给定的数 的光滑逼近p(x,k)的复合函数,而Pu(x,k)由文献 据集S,训练出一个回归函数f(x),使f(x)能对新的 [6]知有无穷多个,皆可由一个递推公式求出. 输入x较准确地预测出输出y,这就是回归问题.采 因此,由引理1可求得一类的1x12具有d阶光 用的标准是ε-不敏感损失函数:1y-f代x)I.= 滑的多项式光滑函数: max{0,ly-f(x)1-e}.对于线性回归的情形,f(x)= {p(x,k),d=1,2,…{ (4) w'x+b,其中w∈R”是一个待定向量,b是一个待定 显然,这种光滑函数有无穷多个,下面以d=1, 常量[89 2,3,4,5为例分别求出1x12的前5个光滑函数. 1.2支持向量回归机 1)当d=1时,1x12的光滑函数为 上述回归问题可表示为无约束最优化问题: Pi(x,k)=P1(x-6,k)2+P1(-x-E,k)2.(5) 1 0R2(w'w+6)+ min ∑1A,w+b-:12 式中: 21 Pi(x,k)= (1) 1 式中:C为一个大于0的惩罚参数.式(1)称为无约 X≥ 束的支持向量回归机模型.由于式(1)中!·2不光 k 1,11 滑,导致此模型的目标函数不光滑.因此该支持向量 】x2+。x+Ak,k下、 回归机不能用快速的Newton-Armijo算法进行求解, 1 使得模型的精度和效率受到影响.为此,用一类d阶 0,x≤-K 光滑的多项式函数p(x,k)作为光滑函数,逼近上 2)当d=2时,IxI2的光滑函数为 述支持向量回归机模型的!·2,得到 P2(x,k)=P2(x-6,k)2+P2(-x-E,k)2.(6) 「.,2(ww+6)+ 1 )min 式中: P2(x,k)= C(A +b-y:k) 2台 (2) 1 x,x≥ 因此该支持向量回归机是光滑的,可用快速的 1 1 Newton-Armijo算法进行求解,从而提高模型的精度 16x+1)(-3),-石<x<: 和效率称式(2)为d阶多项式光滑的支持向量回归 机,多项式函数p(x,k)称为支持向量回归机的多 项式光滑函数). 3)当d=3时,lxl2的光滑函数为 容易看出,在把原支持向量回归机模型变换为 P(x,k)=P3(x-6,k)2+P3(-x-E,k)2 光滑的支持向量回归机的过程中,光滑函数起了关 式中:
归机模型进行光滑处理,可以得到支持向量机的光 滑模型,从而提高回归速度,而这个过程必须用到多 项式光滑函数的逼近精度[4] .因此,多项式光滑函数 的逼近精度是光滑支持向量回归机必须解决的一个 重要问题.该问题是否存在一个统一的求解方法,多 年来一直是一个尚待解决的问题[5,7] .对此,本文提 出五步求的基本思路,并用二分法试图系统解决这 个问题. 1 支持向量回归机及其光滑函数 1.1 回归问题 对数据集 S = {(x1,y1),(x2,y2),…,(xm,ym)}⊆ R n×R,令矩阵 A= [x1 x2… xm ],xi 是一个 n 维向量, 每个 xi 对应有一个观测值 yi . 显然 A∈R n×m , S = {(Ai,yi) |Ai∈R n ,yi∈R},i = 1,2,…,m,其中 Ai 是 矩阵 A 的第 i 个向量.回归的目的是利用给定的数 据集 S,训练出一个回归函数 f(x),使f(x)能对新的 输入 x 较准确地预测出输出 y,这就是回归问题.采 用 的 标 准 是 ε⁃不 敏 感 损 失 函 数: | y-f(x) | ε = max{0, | y-f(x) | -ε}.对于线性回归的情形,f( x) = w T x+b,其中 w∈R n 是一个待定向量,b 是一个待定 常量[8⁃9] . 1.2 支持向量回归机 上述回归问题可表示为无约束最优化问题[5] : min (w,b)∈Rn+1 1 2 (w Tw + b 2 ) + C 2 ∑ m i = 1 | Aiw + b - yi | 2 ε . (1) 式中:C 为一个大于 0 的惩罚参数.式(1)称为无约 束的支持向量回归机模型.由于式(1)中 | · | 2 ε 不光 滑,导致此模型的目标函数不光滑.因此该支持向量 回归机不能用快速的 Newton⁃Armijo 算法进行求解, 使得模型的精度和效率受到影响.为此,用一类 d 阶 光滑的多项式函数 p 2 dε( x,k)作为光滑函数,逼近上 述支持向量回归机模型的|·| 2 ε ,得到 min (w,b)∈Rn+1 φdε,k(w,b) ∶ = min (w,b)∈Rn+1 1 2 (w Tw + b 2 ) + C 2 ∑ m i = 1 p 2 dε(Aiw + b - yi,k) (2) 因此该支持向量回归机是光滑的,可用快速的 Newton⁃Armijo 算法进行求解,从而提高模型的精度 和效率.称式(2)为 d 阶多项式光滑的支持向量回归 机,多项式函数 p 2 dε( x,k)称为支持向量回归机的多 项式光滑函数[5] . 容易看出,在把原支持向量回归机模型变换为 光滑的支持向量回归机的过程中,光滑函数起了关 键作用,因此光滑函数与 | · | 2 ε 的逼近精度是光滑 支持向量回归机的一个重要理论问题[5] ,也是本文 要研究的问题.为便于研究,下面列出支持向量回归 机的多项式光滑函数. 1.3 光滑函数 文献[5]已对 ε⁃不敏感损失函数| x | ε 及其平方 函数| x | 2 ε 的多项式光滑函数进行了定义和说明,在 此不再赘述.为便于分析,先给出支持向量回归机的 多项式光滑函数. 引理 1 [5] 设 pd(x,k)是正号函数 x+的 d 阶多 项式光滑函数,令函数 p 2 dε(x,k)满足: p 2 dε(x,k) = pd (x - ε,k) 2 + pd ( - x - ε,k) 2 , (3) 则 p 2 dε(x,k)是| x | 2 ε 的 d 阶多项式光滑函数. 可见, | x | 2 ε 的光滑函数 p 2 dε(x,k)是正号函数 x+ 的光滑逼近 pd(x,k)的复合函数,而 pd(x,k)由文献 [6]知有无穷多个,皆可由一个递推公式求出. 因此,由引理 1 可求得一类的 | x | 2 ε 具有 d 阶光 滑的多项式光滑函数: {p 2 dε(x,k),d = 1,2,…}. (4) 显然,这种光滑函数有无穷多个,下面以 d = 1, 2,3,4,5 为例分别求出| x | 2 ε 的前 5 个光滑函数. 1)当 d = 1 时, | x | 2 ε 的光滑函数为 p 2 1ε(x,k) = p1(x - ε,k) 2 + p1( - x - ε,k) 2 . (5) 式中: p1(x,k) = x, x ≥ 1 k ; k 4 x 2 + 1 2 x + 1 4k , - 1 k < x < 1 k ; 0, x ≤- 1 k . ì î í ï ï ï ï ï ï ïï 2)当 d = 2 时, | x | 2 ε 的光滑函数为 p 2 2ε(x,k) = p2(x - ε,k) 2 + p2( - x - ε,k) 2 . (6) 式中: p2(x,k) = x, x ≥ 1 k ; - 1 16k (kx + 1) 3 (kx - 3), - 1 k < x < 1 k ; 0, x ≤- 1 k . ì î í ï ï ï ï ï ï ïï 3)当 d = 3 时, | x | 2 ε 的光滑函数为 p 2 3ε(x,k) = p3(x - ε,k) 2 + p3( - x - ε,k) 2 . 式中: 第 3 期 冯能山,等:支持向量回归机多项式光滑函数的逼近精度 ·267·
·268· 智能系统学报 第8卷 P3(x,k)= 1)F(x,k)是x的对称函数: x, x≥k 2)F(x,k)≤ra/2 其中ra为一个与p(x,k)的光滑阶数d相关的误 +x-+5列.-E时,-x+ε<0,显然有-x-E<-x+E<0,因 p(x,k)=P5(x-E,k)2+P5(-x-E,k)2 此(-x-e),=0.因Pa(x,k)是单调增函数[6,可知 式中: P(-x-8,k)≤P(0,k).由二分法可算出Pu(x,k) P5(x,k)= 与正号函数x,的逼近精度:Pa(x,k)2-x子≤sa/k2,其 1 x,x≥ 中s4为一个与p(x,k)的光滑阶数d相关的系数 由文献[4]知,1x12=(x-8)+(-x-e),因此 512k+1)(kx-42x3+1022x2- 1 Fi(x,k)=pi(x,k)-1x12= 1 1 P(x-E,k)2-(x-E)3+P(-x-6,k)2, 122kx+63),-本<t< 即 Fae(x,k)sa/k2 +p(0,k)2. (9) 0,x≤- 综合①、②,取式(8)和(9)中右端的最大值,令 ra max2kpa(0,k)2,sa +kpa(0,k)2, 2多项式光滑函数的逼近精度及其求 可得 解步骤 F(x,k)≤Ta/k2,x∈R (10) 证毕. 2.1任意阶多项式光滑函数的逼近精度 2.2 求逼近精度的一般步骤 支持向量回归机的任意阶多项式光滑函数 这无穷多个多项式光滑函数有一个共同特征: P(x,k),其具体形式皆可由式(4)推出,这种光滑 都是正号函数x,的光滑逼近P(x,k)形如式(5)的 函数显然有无穷多个.这无穷多个光滑函数逼近ε 复合函数,而p(x,k)皆可由文献[6]的递推公式求 不敏感损失函数的平方项1x2的精度问题,显然皆 出.上文求出了任意阶光滑函数的逼近精度的表达 可描述为求p(x,k)-|x12的最大值问题记 式(10),下面对这些求解过程进行归纳和总结,可 F(x,k)=p2(x,k)-x12, (7) 发现求解的一般规律.根据这个规律,提出五步求的 称F(x,k)为光滑函数p(x,k)的误差函数,这种 基本思路,即求逼近精度的一般步骤。 误差函数显然也有无穷多个,且与光滑函数 1)把求光滑函数P(x,k)的逼近精度问题表示 P(x,k)一一对应. 为一个在整个x轴上求误差函数F(x,k)的最大值 定理1误差函数F(x,k)由式(7)给出,则 问题:
p3(x,k) = x, x ≥ 1 k ; 1 32k (kx + 1) 4 (k 2 x 2 - 4kx + 5), - 1 k < x < 1 k ; 0, x ≤- 1 k . ì î í ï ï ï ï ï ï ïï 4)当 d = 4 时, | x | 2 ε 的光滑函数为 p 2 4ε(x,k) = p4(x - ε,k) 2 + p4( - x - ε,k) 2 . 式中: p4(x,k) = x, x ≥ 1 k ; - 1 256k (kx + 1) 5 (5k 3 x 3 - 25k 2 x 2 + 47kx - 35), - 1 k < x < 1 k ; 0, x ≤- 1 k . ì î í ï ï ï ï ï ï ï ï ï ï 5)当 d = 5 时, | x | 2 ε 的光滑函数为 p 2 5ε(x,k) = p5(x - ε,k) 2 + p5( - x - ε,k) 2 . 式中: p5(x,k) = x, x ≥ 1 k ; 1 512k (kx + 1) 6 (k 4 x 4 - 42k 3 x 3 + 102k 2 x 2 - 122kx + 63), - 1 k < x < 1 k ; 0, x ≤- 1 k . ì î í ï ï ï ï ï ï ï ï ï ï 2 多项式光滑函数的逼近精度及其求 解步骤 2.1 任意阶多项式光滑函数的逼近精度 支持向量回归机的任意阶多项式光滑函数 p 2 dε(x,k),其具体形式皆可由式(4)推出,这种光滑 函数显然有无穷多个.这无穷多个光滑函数逼近 ε⁃ 不敏感损失函数的平方项 | x | 2 ε 的精度问题,显然皆 可描述为求 p 2 dε(x,k)- | x | 2 ε 的最大值问题.记 Fdε(x,k) = p 2 dε(x,k) -| x | 2 ε , (7) 称 Fdε(x,k)为光滑函数 p 2 dε(x,k)的误差函数,这种 误差 函 数 显 然 也 有 无 穷 多 个, 且 与 光 滑 函 数 p 2 dε(x,k)一一对应. 定理 1 误差函数 Fdε(x,k)由式(7)给出,则 1)Fdε(x,k)是 x 的对称函数; 2)Fdε(x,k)≤rd / k 2 . 其中 rd 为一个与 p 2 dε( x,k)的光滑阶数 d 相关的误 差系数. 证明 1)将-x 代入式(7),结合式(5),可得 Fdε( - x,k) = p 2 dε( - x,k) -| - x | 2 ε = p 2 dε(x,k) -| x | 2 ε = Fdε(x,k), 可见 Fdε( x,k) 是对称函数. 因此在整个 x 轴上求 Fdε(x,k)的最大值问题可转换成在 x 轴的右半轴上 求 Fdε(x,k)的最大值问题. 2)把 x 轴的右半轴分成 2 个区间进行证明: ①当 0≤x≤ε 时,显然| x | ε = 0.因此 Fdε(x,k) = p 2 d ε(x,k) -| x | 2 ε = pd(x - ε,k) 2 + pd( - x - ε,k) 2 . 此时显然有 x-ε≤0 和-x-ε≤0,因 pd(x,k) 2 是单调 增函数[6] ,可得 Fdε(x,k) ≤ 2pd(0,k) 2 . (8) ②当 x>ε 时,-x+ε<0,显然有-x-ε<-x+ε<0,因 此(-x-ε) + = 0.因 pd ( x,k) 是单调增函数[6] ,可知 pd(-x-ε,k)≤pd(0,k).由二分法可算出 pd ( x,k) 2 与正号函数 x+的逼近精度:pd( x,k) 2 -x 2 +≤sd / k 2 ,其 中 sd 为一个与 p 2 dε(x,k)的光滑阶数 d 相关的系数. 由文献[4]知, | x | 2 ε = (x-ε) 2 + +(-x-ε) 2 + ,因此 Fdε(x,k) = p 2 dε(x,k) -| x | 2 ε = pd(x - ε,k) 2 - (x - ε) 2 + + pd( - x - ε,k) 2 , 即 Fdε(x,k) ≤ sd / k 2 + pd(0,k) 2 . (9) 综合①、②,取式(8)和(9)中右端的最大值,令 rd = max{2k 2 pd(0,k) 2 ,sd + k 2 pd(0,k) 2 }, 可得 Fdε(x,k) ≤ rd / k 2 ,x ∈ R. (10) 证毕. 2.2 求逼近精度的一般步骤 这无穷多个多项式光滑函数有一个共同特征: 都是正号函数 x+的光滑逼近 pd( x,k)形如式(5)的 复合函数,而 pd(x,k)皆可由文献[6]的递推公式求 出.上文求出了任意阶光滑函数的逼近精度的表达 式(10),下面对这些求解过程进行归纳和总结,可 发现求解的一般规律.根据这个规律,提出五步求的 基本思路,即求逼近精度的一般步骤. 1)把求光滑函数 p 2 dε(x,k)的逼近精度问题表示 为一个在整个 x 轴上求误差函数 Fdε(x,k)的最大值 问题: ·268· 智 能 系 统 学 报 第 8 卷
第3期 冯能山,等:支持向量回归机多项式光滑函数的逼近精度 ·269· F(x,k)=p2(x,k)-x12; 时-x+Ee时误差函数F(x,k)的最大值; 1x2=(x-e)2+(-x-e),因此 5)对这2个最大值进行比较,最大者即为光滑 Fi(x,k)=pie(x,k)-1x12= 函数的逼近精度. P1(x-e,k)2-(x-e)+P1(-x-E,k)2≤ 2.3一阶多项式光滑函数的逼近精度 仿照定理1及求任意阶多项式光滑函数的逼近 11+p(0,k)2=0.1534/ 1 精度的基本思想和步骤,下面具体求出一阶多项式 5)对这2个最大值进行比较,最大者即为光滑 光滑函数的逼近精度. 函数的逼近精度.综合4)和5)的结果易知,11= 推论1一阶多项式光滑函数的逼近精度为 0.1534,F.(x,k)≤0.1534/k2.0.1534/k2即为一 0.1534/k2 阶多项式光滑函数的逼近精度, 证明 证毕 1)把求光滑函数P(x,k)的逼近精度问题表示 2.4二阶至五阶多项式光滑函数的逼近精度 为一个在整个x轴上求误差函数F(x,k)的最大值 支持向量回归机的二阶多项式光滑函数的形式 问题.支持向量回归机的一阶多项式光滑函数的形 如式(6).仿照上面求一阶多项式光滑函数的逼近精 式如式(5).把多项式光滑函数应用于支持向量回归 度的基本思想和步骤,可把二阶多项式光滑函数逼 机,首先必须解决多项式光滑函数逼近ε-不敏感损 近ε-不敏感损失函数的平方项Ix2的精度问题描 失函数的平方项Ix?的精度问题.该问题可描述为 述为求p(x,k)-x2的最大值问题.记 个求p(x,k)-lx2的最大值问题,记 F2(x,k)=P2(x,k)-lx12, Fi(x,k)=pi(x,k)-1x12, (11) 称F(x,k)为光滑函数p2(x,k)的误差函数 称F(x,k)为光滑函数p(x,k)的误差函数因此, 推论2二阶多项式光滑函数的逼近精度为 求多项式光滑函数逼近ε不敏感损失函数的平方 0.08779/k2. 项Ix2的精度问题,就可转换成求F(x,k)的最大 证明过程与定理1及推论1类似,在此省略。 值问题 以上内容求出了一阶和二阶光滑函数的逼近精 2)证明F(x,k)是对称函数,把在整个x轴上 度,同理以同样的步骤,可求出三阶、四阶和五阶光 求F(x,k)的最大值问题转换成在x轴的右半轴上 滑函数的逼近精度,求解过程省略.表1列出一阶至 求F(x,k)的最大值问题将-x代入式(11),结合 五阶多项式光滑函数的逼近精度. 式(5),可得 表1多项式光滑函数的逼近精度 F(-x,k)=P(-x,k)-|-xl2= Table 1 The approximation accuracies of polynomial pie(x,k)-IxI2=F(x,k). smoothing functions 可见F(x,k)是对称函数.因此在整个x轴上求 光滑函数 光滑阶数d 误差系数r 逼近精度 F(x,k)的最大值问题就转换成了在x轴的右半轴 pie(x,k) 0.15340 0.15340/k2 上求F(x,k)的最大值问题 pi(x,k) 2 0.08778 3)求当0≤x≤8时误差函数F(x,k)的最大 0.08778/k2 值.此时显然|xl,=0.因此 pi(x,k) 3 0.03578 0.03578/k2 Fi(x,k)=pie(x,k)-1x12= pi(x,k) 4 0.02763 0.02763/k2 P1(x-E,k)2+P1(-x-E,k)2, p(x.k) 5 0.02433 0.02433/2 此时显然有x-s≤0和-x-g≤0,因P1(x,k)2是单调 因此,依照上述五步求的基本思路和步骤,可求 增函数3,6,可得 出支持向量回归机无穷多个光滑函数的逼近精度. F(x)≤24,(0.62=2(02=0125/ 3结束语 4)求当x>e时误差函数F(x,k)的最大值.此 为求支持向量回归机光滑函数的逼近精度,首
Fdε(x,k) = p 2 dε(x,k) -| x | 2 ε ; 2)证明 Fdε(x,k)是对称函数,把在整个 x 轴上 求 Fdε(x,k)的最大值问题转换成在 x 轴的右半轴上 求 Fdε(x,k)的最大值问题; 3)求当 0≤x≤ε 时误差函数 Fdε(x,k)的最大值; 4)求当 x>ε 时误差函数 Fdε(x,k)的最大值; 5)对这 2 个最大值进行比较,最大者即为光滑 函数的逼近精度. 2.3 一阶多项式光滑函数的逼近精度 仿照定理 1 及求任意阶多项式光滑函数的逼近 精度的基本思想和步骤,下面具体求出一阶多项式 光滑函数的逼近精度. 推论 1 一阶多项式光滑函数的逼近精度为 0.153 4 / k 2 . 证明 1)把求光滑函数 p 2 1ε(x,k)的逼近精度问题表示 为一个在整个 x 轴上求误差函数 F1ε(x,k)的最大值 问题.支持向量回归机的一阶多项式光滑函数的形 式如式(5).把多项式光滑函数应用于支持向量回归 机,首先必须解决多项式光滑函数逼近 ε⁃不敏感损 失函数的平方项| x | 2 ε 的精度问题.该问题可描述为 一个求 p 2 1ε(x,k)- | x | 2 ε 的最大值问题,记 F1ε(x,k) = p 2 1ε(x,k) -| x | 2 ε , (11) 称 F1ε(x,k)为光滑函数 p 2 1ε(x,k)的误差函数.因此, 求多项式光滑函数逼近 ε⁃不敏感损失函数的平方 项| x | 2 ε 的精度问题,就可转换成求 F1ε(x,k)的最大 值问题. 2)证明 F1ε(x,k)是对称函数,把在整个 x 轴上 求 F1ε(x,k)的最大值问题转换成在 x 轴的右半轴上 求F1ε(x,k)的最大值问题.将-x 代入式(11),结合 式(5),可得 F1ε( - x,k) = p 2 1ε( - x,k) -| - x | 2 ε = p 2 1ε(x,k) -| x | 2 ε = F1ε(x,k). 可见 F1ε( x,k) 是对称函数. 因此在整个 x 轴上求 F1ε(x,k)的最大值问题就转换成了在 x 轴的右半轴 上求 F1ε(x,k)的最大值问题. 3)求当 0≤x≤ε 时误差函数 F1ε( x,k) 的最大 值.此时显然 | x | ε = 0.因此 F1ε(x,k) = p 2 1ε(x,k) -| x | 2 ε = p1(x - ε,k) 2 + p1( - x - ε,k) 2 , 此时显然有 x-ε≤0 和-x-ε≤0,因 p1(x,k) 2 是单调 增函数[3,6] ,可得 F1ε(x,k) ≤ 2p1(0,k) 2 = 2( 1 4k ) 2 = 0.125 / k 2 . 4)求当 x>ε 时误差函数 F1ε( x,k)的最大值.此 时-x+ε<0,显然有-x-ε<-x+ε<0 ,因此( -x-ε) + = 0.因 p1(x,k)是单调增函数[3,6] ,可知 p1(-x-ε,k)≤ p1(0,k).由二分法[10]可算出 p1(x,k)与正号函数 x+ 的逼近精度[3] : p1(x,k) 2 -x 2 +≤ 1 11k 2 .由文献[5]知, | x | 2 ε = (x-ε) 2 + +(-x-ε) 2 + ,因此 F1ε(x,k) = p 2 1ε(x,k) -| x | 2 ε = p1(x - ε,k) 2 - (x - ε) 2 + + p1( - x - ε,k) 2 ≤ 1 11k 2 + p1(0,k) 2 = 0.153 4 / k 2 . 5)对这 2 个最大值进行比较,最大者即为光滑 函数的逼近精度. 综合 4) 和 5) 的结果易知, r1 = 0.153 4,F1ε(x,k)≤0.153 4 / k 2 . 0.153 4 / k 2 即为一 阶多项式光滑函数的逼近精度. 证毕. 2.4 二阶至五阶多项式光滑函数的逼近精度 支持向量回归机的二阶多项式光滑函数的形式 如式(6).仿照上面求一阶多项式光滑函数的逼近精 度的基本思想和步骤,可把二阶多项式光滑函数逼 近 ε⁃不敏感损失函数的平方项 | x | 2 ε 的精度问题描 述为求 p 2 2ε(x,k)- | x | 2 ε 的最大值问题.记 F2ε(x,k) = p 2 2ε(x,k) -| x | 2 ε , 称 F2ε(x,k)为光滑函数 p 2 2ε(x,k)的误差函数. 推论 2 二阶多项式光滑函数的逼近精度为 0.087 79 / k 2 . 证明过程与定理 1 及推论 1 类似,在此省略. 以上内容求出了一阶和二阶光滑函数的逼近精 度,同理以同样的步骤,可求出三阶、四阶和五阶光 滑函数的逼近精度,求解过程省略.表 1 列出一阶至 五阶多项式光滑函数的逼近精度. 表 1 多项式光滑函数的逼近精度 Table 1 The approximation accuracies of polynomial smoothing functions 光滑函数 光滑阶数 d 误差系数 rd 逼近精度 p 2 1ε(x,k) 1 0.153 40 0.153 40 / k 2 p 2 2ε(x,k) 2 0.087 78 0.087 78 / k 2 p 2 3ε(x,k) 3 0.035 78 0.035 78 / k 2 p 2 4ε(x,k) 4 0.027 63 0.027 63 / k 2 p 2 5ε(x,k) 5 0.024 33 0.024 33 / k 2 因此,依照上述五步求的基本思路和步骤,可求 出支持向量回归机无穷多个光滑函数的逼近精度. 3 结束语 为求支持向量回归机光滑函数的逼近精度,首 第 3 期 冯能山,等:支持向量回归机多项式光滑函数的逼近精度 ·269·
·270· 智能系统学报 第8卷 先把求光滑函数的逼近精度问题转化成求误差函数 functions for support vector regressions[].Pattern Recog- 的最大值问题:然后证明该误差函数是对称函数,把 nition and Artificial Intelligence,2008,21(3):273-279. 这个最大值问题转换成在x轴的右半轴上求最大值 [6]熊金志,胡金莲,袁华强,等.一类光滑支持向量机新函数 的问题:而后分别求当0≤x≤ε时和x>e时误差函 的研究[J].电子学报,2007,35(2):366-370 数的最大值:最后对这2个最大值进行比较,求出光 XIONG Jinzhi,HU Jinlian,YUAN Huagiang,et al.Re- search on a new class of functions for smoothing support vec- 滑函数的逼近精度.以多个多项式光滑函数为例,解 tor machines Acta Electronica Sinica,2007,35(2): 决了它们的逼近精度问题在此基础上,总结出求此 366-370. 类精度问题的一般规律,对无穷多个光滑函数的精 [7]熊金志,徐建敏,袁华强.多项式光滑的支持向量回归机 度问题提出了五步求的基本思路.研究结果表明:对 一般模型的收敛性研究[J].计算机研究与发展,2011, 支持向量回归机的无穷多个多项式光滑函数,都可 48(3):464-470. 按照本文的思路和步骤,分5个步骤用二分法解决 XIONG Jinzhi,XU Jianmin,YUAN Huagiang.Conver- 其逼近精度问题.该方法成功解决了支持向量回归 genceness of a general formulation for polynomial smooth 机中一个尚待解决的问题,即支持向量回归机无穷 support vector regressions[J].Journal of Computer Research 多个光滑函数的逼近精度问题,为光滑支持向量回 and Development,2011,48(3):464-470. 归机的进一步研究工作提供了基本的理论支持. [8]李国正,王猛,曾华军支持向量机导论[M].北京:电子 工业出版社,2004:89-99. 参考文献: [9]邓乃扬,田英杰数据挖掘的新方法一支持向量机[M] 北京:科学出版社,2008:111-122 [1]LEE Y J,MANGASARIAN O L.SSVM:a smooth support [10]李庆扬.王能超,易大义.数值分析[M].5版.北京:清华 vector machine for classification[].Computational Optimi- 大学出版社,2011:125-136. zation and Applications,2001,22(1):5-21. 作者简介: [2]CHANG CC,CHIEN L J,LEE Y J.A novel framework for 冯能山,男,1972年生,讲师,博士 multi-class classification via ternary smooth support vector 研究生,主要研究方向为人工智能、软 machine[J].Pattern Recognition,2011,44(6):1235- 件工程。 1244. [3]钱晓山,阳春华.基于GEP的最小二乘支持向量机模型 参数选择[J].智能系统学报,2012,7(3):225-229. QIAN Xiaoshan,YANG Chunhua.A parameter selection method of a least squares support vector machine based on 熊金志,男,1964年生,教授,中国 gene expression programming[J].CAAI Transactions on In- 计算机学会高级会员,东莞市科技创新 telligent Systems,2012,7(3):225-229. 团队核心成员,主要研究方向为人工智 [4]LEE Y J,HSIEH W F,HUANG C M.e-SSVR:a smooth 能.作为核心成员承担国家自然科学基 support vector machine for s-insensitive regression [J] 金项目2项,主持广东省科研项目3 IEEE Transactions on Knowledge and Data Engineering, 项、东莞市科研项目1项获广东省科技 2005,17(5):5-22. 进步二等奖和三等奖各1项、东莞市科技进步一等奖2项。 [5]熊金志,胡金莲,袁华强,等.支持向量回归机的光滑函数 发表学术论文40余篇,被SCI、EI、ISTP检索10余篇. 研究[J].模式识别与人工智能,2008,21(3):273-279. XIONG Jinzhi,HU Jinlian,YUAN Huaqiang,et al.Smoothing
先把求光滑函数的逼近精度问题转化成求误差函数 的最大值问题;然后证明该误差函数是对称函数,把 这个最大值问题转换成在 x 轴的右半轴上求最大值 的问题;而后分别求当 0≤x≤ε 时和 x>ε 时误差函 数的最大值;最后对这 2 个最大值进行比较,求出光 滑函数的逼近精度.以多个多项式光滑函数为例,解 决了它们的逼近精度问题.在此基础上,总结出求此 类精度问题的一般规律,对无穷多个光滑函数的精 度问题提出了五步求的基本思路.研究结果表明:对 支持向量回归机的无穷多个多项式光滑函数,都可 按照本文的思路和步骤,分 5 个步骤用二分法解决 其逼近精度问题.该方法成功解决了支持向量回归 机中一个尚待解决的问题,即支持向量回归机无穷 多个光滑函数的逼近精度问题,为光滑支持向量回 归机的进一步研究工作提供了基本的理论支持. 参考文献: [1]LEE Y J, MANGASARIAN O L. SSVM: a smooth support vector machine for classification[J]. Computational Optimi⁃ zation and Applications, 2001, 22(1): 5⁃21. [2]CHANG C C, CHIEN L J, LEE Y J. A novel framework for multi⁃class classification via ternary smooth support vector machine[ J]. Pattern Recognition, 2011, 44 ( 6): 1235⁃ 1244. [3]钱晓山,阳春华.基于 GEP 的最小二乘支持向量机模型 参数选择[J].智能系统学报, 2012, 7(3): 225⁃229. QIAN Xiaoshan, YANG Chunhua. A parameter selection method of a least squares support vector machine based on gene expression programming[J]. CAAI Transactions on In⁃ telligent Systems, 2012, 7(3): 225⁃229. [4]LEE Y J, HSIEH W F, HUANG C M. ε⁃SSVR: a smooth support vector machine for ε⁃insensitive regression [ J ]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(5): 5⁃22. [5]熊金志,胡金莲,袁华强,等.支持向量回归机的光滑函数 研究[J].模式识别与人工智能, 2008, 21(3): 273⁃279. XIONG Jinzhi, HU Jinlian, YUAN Huaqiang, et al. Smoothing functions for support vector regressions[ J]. Pattern Recog⁃ nition and Artificial Intelligence, 2008, 21(3): 273⁃279. [6]熊金志,胡金莲,袁华强,等.一类光滑支持向量机新函数 的研究[J].电子学报, 2007, 35(2): 366⁃370. XIONG Jinzhi, HU Jinlian, YUAN Huaqiang, et al. Re⁃ search on a new class of functions for smoothing support vec⁃ tor machines[ J]. Acta Electronica Sinica, 2007, 35( 2): 366⁃370. [7]熊金志,徐建敏,袁华强.多项式光滑的支持向量回归机 一般模型的收敛性研究[ J].计算机研究与发展, 2011, 48(3): 464⁃470. XIONG Jinzhi, XU Jianmin, YUAN Huaqiang. Conver⁃ genceness of a general formulation for polynomial smooth support vector regressions[J]. Journal of Computer Research and Development, 2011, 48(3): 464⁃470. [8]李国正,王猛,曾华军.支持向量机导论[M].北京:电子 工业出版社, 2004: 89⁃99. [9]邓乃扬,田英杰.数据挖掘的新方法—支持向量机[M]. 北京:科学出版社, 2008: 111⁃122. [10]李庆扬,王能超,易大义.数值分析[M].5 版.北京:清华 大学出版社, 2011: 125⁃136. 作者简介: 冯能山,男,1972 年生,讲师,博士 研究生,主要研究方向为人工智能、软 件工程. 熊金志,男,1964 年生,教授,中国 计算机学会高级会员,东莞市科技创新 团队核心成员,主要研究方向为人工智 能.作为核心成员承担国家自然科学基 金项目 2 项,主持广东省科研项目 3 项、东莞市科研项目 1 项.获广东省科技 进步二等奖和三等奖各 1 项、东莞市科技进步一等奖 2 项. 发表学术论文 40 余篇,被 SCI、EI、ISTP 检索 10 余篇. ·270· 智 能 系 统 学 报 第 8 卷