正在加载图片...
478 智能系统学报 第5卷 法存在着不同的缺憾.为此,本文提出了一种结合2 类算法的优点的流形对齐算法,从而能够在不引入 器10=k及.)-o 过强的假设的前提下,兼顾处理Out-of-sample数据 这样,优化目标从直接寻找最优的满足对应关 问题, 系保持目标的低维嵌入和Y,转化为寻找最优的 满足对应关系保持目标的显式映射方程x=f(x)和 2基于线性耦合映射的流形对齐 y=∫,(y).这样的数学描述使得本文的方法具有了 为克服流形对齐算法处理Out-of-sample数据 直接处理Out-of-sample的数据能力,即通过显式的 时需要重新训练的问题,提出一种基于线性耦合映 映射函数能直接将新的数据投影到公共流形上去而 射的流形对齐方法.本文方法通过引入显式的映射 不需要重新进行训练优化. 函数为直接处理训练集之外的新数据提供了可能. 2.2流形结构保持正则化 下面首先给出本文方法的问题描述 从流形对齐的角度出发,低维空间的低维嵌入 如前所述,流形对齐的基本任务就是找到不同 仅仅保持已知的对应关系(对应关系保持目标)并 数据集合所对应的公共低维嵌入.对于数据集合X 不够.因为,原始高维空间的数据点之间的流形结构 和Y,通过显式的映射函数f:R→R和f: 对于寻找公共低维流形同样非常重要;所以,公共低 RP,→R找到原始数据点在公共流形上的低维嵌 维流形M。低维嵌入需要保持原始高维空间点之间 入.同时,这些嵌入要满足已知的通过人工标注得到 的局部结构,称之为流形结构保持约束.对于流形结 的对应关系.如文献[4]中提到的,流形对齐需要满 构保持约束来讲,可以采用大部分流形学习降维算 足一个目标和一个约束: 法中的流形结构保持的优化目标形式.但是,对于具 1)需要满足已知的来自不同流形上的数据点 体的问题需要选择适当的流形结构保持约束.为了 之间的对应关系,称之为“对应关系保持目标” 论述方便起见,采用了基于图模型的流形结构保持 2)同时,公共流形需要保持原始高维数据点各自 约束的数学形式,即 的流形结构,本文中称之为“流形结构保持约束” 五=器1-, 下面将详细地介绍对应关系保持目标和流形结 构保持约束的具体数学形式化,以及最终的基于线 4=成名-% 性耦合映射的流形对齐算法。 式中:边权矩阵S和S分别用来描述数据集合X 2.1对应关系保持目标 和Y上的局部近邻关系.将显式的映射函数引入到 所谓对应关系保持目标是指在公共流形M。上 流形结构保持约束中,从而得到关于映射函数的流 的来自不同高维空间的数据点的低维嵌人和Y, 形约束正则化形式: 应该满足已知的X和Y之间的对应关系.为了描述 更一般的情况,这里使用了一个二元组集合来代表 J)=元器1()-f)1 这种对应关系.对应关系集合C中包含了所有的已 知的对应点对,其中(i,)∈C表示了数据集合X中 )=名6w)-1% 的第i个数据点x:和数据集合Y中的第j个数据点 至此,基于显式映射函数的流形结构保持约束 Y,之间存在对应关系. 的数学形式化完成。 如何在低维嵌入空间的公共流形上中保持这种 2.3流形对齐的优化目标 已标注的对应关系呢?显然,对应关系就意味着对 在2.1和2.2中,分别给出了对应关系保持目 应高维数据点对的低维表示在公共流形上是无限接 标和流形结构保持约束的具体数学表达,现在需要 近的.这一直观的目标可以通过最小化下面的目标 将这2个目标统一到一个目标函数下,通过简单的 函数来实现.对应关系保持目标函数如下: 加权和的形式给出最终的流形对齐的目标函数: 粤》=长A。医*另 )=Jc()+a)+a,J(f). ,(1) 式中:和α,是加权系数,为了平衡流形结构保持 式中:K=|C1,本文中引入了2个显式的映射方程 约束之间以及对应关系保持目标和流形结构保持约 x=f(x)和y=f,(y)后,式(1)有了如下新的形式: 束之间的比重.这个加权系数对于不同的问题有不
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有