·434· 智能系统学报 第3卷 0.1 0.1 0.11 0.1 0.1 0.1 0.1 0 20 >0 .0 0 m0 0 -0.1 0.1 0.1 -0.1 -0.1 -0.1 -0.1 0 0.1 -0.1 0.1-010 0.1-0.100.1-0.100.1-0.100.1-0.100.1 0.1 0.1 0.1 0 -0. -0.11 1 0.1 -0.10 0.10.190.1-0.100.-0.100.10.100.-0100.-0.100.1 0.1 0.1m 0.1 0.1 0.1r 0.1 0 0 0 0 -0. -0.1 -0.1 -0.1 -0.19 -0.1 -0.1 -0.100.1-0.100.1-0.100.1-0.100.1-0.100.1-0.100.-0.100.1 0. 0.1 0.1 0.1 0.i 0 1 0 0.1 0.1 0.1 0.1 0.1 0.1 0 0 0.1 0.1 -0.1 0.1-0.1 0 0.1 -0.10 0.1 -0.10 0.1 -0.10 0.1 (a)bcalsize =1 X12 (b)localsize =2 X12(c)localsize =3 X12(d)localsize =4 X12(e)bcalsize =5 X12 (f)localsize =7 X12(g)localsize =10 X12 图8嵌入效果与局部区域参数的关系 Fig 8 The relationship of Embedding results and bcal regon parameters 表15种方法在5种样本规模上的平均运行时间比较 Tablel Average runn ng tme of the com pared approaches on five knds of data sets /s 样本规模 算法 500 1000 1500 2000 2500 LLE 05876 25406 25628 9.3686 71748 HLLE 1.6530 182376 182342 727156 55.5372 GL-HLLE 3.54018 596810 600816 2458220 1821720 GA-HLLE 631216 1396746 141.8374 5846248 4423280 ISOMAP 102501 2798500 2830417 11510333 8620500 MAP等有更强的鲁棒性.标准数据集上的实验结果 4结束语 验证了所提方法的有效性.GL-HLLE的思想还可用 提出了基于局部测地距离估计的Hessian局部 于改进.其他基于邻域的流形学习算法包括LE和 线性嵌入算法GL-HLLE算法采用Hessian局部线 ISOMAP GL-HLLE的缺陷是与HLLE一样,对观察 性嵌入的概念框架,但采用局部估计的测地距离而 数据的维数敏感,对文本之类高达上万维的观察数 不是欧氏距离来确定局部邻域,从而减少数据流形 据不合适,需要采取进一步的措施 弯曲对邻域选择的影响.它与基于全局测地距离估 计的算法相比,性能上没有明显差别,但时间复杂度 参考文献: 上却显著减少.GHLE在性能上比HⅢLE明显增 [1]TENENBAUM J B,De SLVA V,LANGFORD J C A glb- 强,但增加的运行时间不明显.算法可认为是全局和 al geometric framework for nonlinear dmensonality reduction 局部方法的综合,比现有方法如HLE、LLE和SO [J].Science,2000,290(12):2319-2323 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net( a) localsize = 1 ×12 ( b) localsize = 2 ×12 ( c) localsize = 3 ×12 ( d) localsize = 4 ×12 ( e) localsize = 5 ×12 ( f) localsize = 7 ×12 ( g) localsize = 10 ×12 图 8嵌入效果与局部区域参数的关系 Fig. 8 The relationship of Embedding results and local region parameters 表 1 5种方法在 5种样本规模上的平均运行时间比较 Table1 Average runn ing tim e of the com pared approaches on five k inds of da ta sets /s 算法 样本规模 500 1000 1500 2000 2500 LLE 0. 587 6 2. 540 6 2. 562 8 9. 368 6 7. 174 8 HLLE 1. 653 0 18. 237 6 18. 234 2 72. 715 6 55. 537 2 GL - HLLE 3. 540 18 59. 681 0 60. 081 6 245. 822 0 182. 172 0 GA - HLLE 6. 3121 6 139. 674 6 141. 837 4 584. 624 8 442. 328 0 ISOMAP 10. 250 1 279. 850 0 283. 041 7 1 151. 033 3 862. 050 0 4 结束语 提出了基于局部测地距离估计的 Hessian局部 线性嵌入算法 GL2HLLE. 算法采用 Hessian局部线 性嵌入的概念框架 ,但采用局部估计的测地距离而 不是欧氏距离来确定局部邻域 ,从而减少数据流形 弯曲对邻域选择的影响. 它与基于全局测地距离估 计的算法相比 ,性能上没有明显差别 ,但时间复杂度 上却显著减少. GL2HLLE在性能上比 HLLE明显增 强 ,但增加的运行时间不明显. 算法可认为是全局和 局部方法的综合 ,比现有方法如 HLLE、LLE和 ISO2 MAP等有更强的鲁棒性. 标准数据集上的实验结果 验证了所提方法的有效性. GL2HLLE的思想还可用 于改进. 其他基于邻域的流形学习算法包括 LLE和 ISOMAP. GL2HLLE的缺陷是与 HLLE一样 ,对观察 数据的维数敏感 ,对文本之类高达上万维的观察数 据不合适 ,需要采取进一步的措施. 参考文献 : [ 1 ]TENENBAUM J B, De SILVA V, LANGFORD J C. A glob2 al geometric framework for nonlinear dimensionality reduction [J ]. Science, 2000, 290 (12) : 231922323. ·434· 智 能 系 统 学 报 第 3卷