正在加载图片...
第5期 文贵华,等:局部测地距离估计的Hessian局部线性嵌入 ·433· 0.5 -0.05 -1012 0 5 4234 -101 44-202 (a)原始数据 (b)LLE (c)ISOMAP (a)原始数据 (b)LLE (c)ISOMAP 0.05 0.05 其0.05 0.05 0.05 0.02 30 0 -0.05 0.05 -0.05 0 0.02 +4°-0.05 -0.04 -0.10-0.050 -0.0500.05 -0.0500.05 0.05Cr -0.06 -0.0500.05 -0.0200.020.04-0.0500.05 (d)HLLE (e)GA-HLLE (n)GL-HLLE (d)HLLE (e)GA-HLLE (f)GL-HLLE 图4几种算法在数据集S-cuve上的结果 图6几种算法在数据集3 D clusters上的结果 Fig 4 Embedding results of the compared appoaches Fig 6 Embedding results of the compared appoaches on S-curve data on 3D clusters data 102-2 0.5 -15 -101 -10010 x0.5050 -1012 -10 1 (a)原始数据 (b)LLE (c)ISOMAP (a)原始数据 (b)LLE (c)ISOMAP 0.05 0.05 0.05 0 0.05 0.05 0.05 -0.05 -0.05 -0.05 -0.10 -0.0500.05 -0.0500.05 -0.0500.05 -0.05 -0.05 -0.05 (d)HLLE (e)GA-HLLE (GL-HLLE -0.0500.05 -0.0500.05 -0.0500.05 (d)HLLE (e)GA-HLLE (f)GL-HLLE 图5几种算法在数据集Tomoidal Helix上的结果 Fig 3 Embedding results of the compared app roaches on 图7几种算法在数据集win Peaks.上的结果 Toroidal Helix data Fig 7 Embedding results of the compared app roaches on Twin Peaks data 3.2局部区域参数的选择 1500、2000、2500个点的5类规模的数据样本,每 相对于GA-HLLE,GL-HLLE引入了确定局部 类规模的样本随机采样5次,记录LE HLLE、SO 区域的参数m,与估计测地距离的局部区域大小L MAP、GA-HLLE和G-HLLE5种方法分别运行这5 的关系是L=m从其中k为用于线性重构造的邻 个样本的平均时间作为该规模的时间,则5种方法 域.幸运的是m的取值一般小于10图8的结果表 在5类规模数据上的平均时间如表1所示.不难发 明m=3时GHLE在几个数据集上均己经取得 现,GHLE和HLE的运行时间很接近,但是GA 较好的效果,m>3时增加的效果不明显,这说明m HLE的运行时间显著高于GL-HLLE,是几种方法 取很小的值就可获得满意的效果,这样m参数的选 中运行最慢的,这说明从嵌入性能上GLE和 取就非常容易,同时在局部区域L内估计测地距离 也自然只需要少量的时间. GA-HLLE相当,但在时间上GL-HLLE却有显著优 33运行时间比较 势,特别是它在嵌入性能上比HLE有显著优越,但 从Swiss Roll Surface上依次采样500、1000、 时间只有很细微的增加 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net图 4几种算法在数据集 S2curve上的结果 Fig. 4 Embedding results of the compared app roaches on S2curve data 图 5几种算法在数据集 Toroidal Helix上的结果 Fig. 3 Embedding results of the compared app roaches on Toroidal Helix data 3. 2 局部区域参数的选择 相对于 GA2HLLE, GL2HLLE引入了确定局部 区域的参数 m ,与估计测地距离的局部区域大小 L 的关系是 L =m ×k,其中 k为用于线性重构造的邻 域. 幸运的是 m 的取值一般小于 10. 图 8的结果表 明 m = 3时 GL2HLLE在几个数据集上均已经取得 较好的效果 , m > 3时增加的效果不明显 ,这说明 m 取很小的值就可获得满意的效果 ,这样 m 参数的选 取就非常容易 ,同时在局部区域 L 内估计测地距离 也自然只需要少量的时间. 3. 3 运行时间比较 从 Swiss Roll Surface上依次采样 500、1 000、 图 6几种算法在数据集 3D clusters上的结果 Fig. 6 Embedding results of the compared app roaches on 3D clusters data 图 7几种算法在数据集 Twin Peaks上的结果 Fig. 7 Embedding results of the compared app roaches on Twin Peaks data 1 500、2 000、2 500个点的 5类规模的数据样本 ,每 类规模的样本随机采样 5次 ,记录 LLE、HLLE、ISO2 MAP、GA2HLLE和 GL2HLLE5种方法分别运行这 5 个样本的平均时间作为该规模的时间 ,则 5种方法 在 5类规模数据上的平均时间如表 1所示. 不难发 现 , GL2HLLE和 HLLE的运行时间很接近 ,但是 GA2 HLLE的运行时间显著高于 GL2HLLE,是几种方法 中运行最慢的 ,这说明从嵌入性能上 GL2HLLE和 GA2HLLE相当 ,但在时间上 GL2HLLE却有显著优 势 ,特别是它在嵌入性能上比 HLLE有显著优越 ,但 时间只有很细微的增加. 第 5期 文贵华 ,等 :局部测地距离估计的 Hessian局部线性嵌入 ·433·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有