人工智能基础：流形学习与基于线性耦合映射的流形对齐

团购合买资源类别：文库，文档格式：PDF，文档页数：6，文件大小：700KB

第5卷第6期智能系统学报 Vol.5 No.6 2010年12月 CAAI Transactions on Intelligent Systems Dec.2010 doi:10.3969/j.issn.1673-4785.2010.06.002 流形学习与基于线性耦合映射的流形对齐姜峰，李博，姚鸿勋，刘绍辉 (哈尔滨工业大学计算机学院，黑龙江哈尔滨150001) 摘要：从一些具有代表性的经典流形学习方法的回顾来看，传统的流形学习主要处理来自单一流形的数据的降维问题.随着流形学习研究的不断深入，以多流形作为研究对象的流形学习问题逐步引起了研究者的注意.提出了一种基于线性耦合映射的流形对齐算法.算法克服非线性流形对齐算法不能够直接处理Out-of-sample数据的问题.同时，与已有的线性流形对齐算法相比，该算法不需要假设流形间满足仿射变换关系，因而能够更加灵活地处理一些比较实际的流形对齐问题。关键词：流行学习；流行对齐；线性耦合中图分类号：TP18文献标志码：A文章编号：16734785(2010)06047606 Manifold learning and manifold alignment based on coupled linear projections JIANG Feng,LI Bo,YAO Hong-xun,LIU Shao-hui School of Computer Science,Harbin Institute of Technology,Harbin 150001,China) Abstract:Traditional manifold learning mainly deals with data dimensionality reduction problems from a single manifold.Through further development,manifold learning focusing on the multi-manifold has drawn the attention of many scholars.An algorithm of manifold alignment based on coupled projections was proposed.The proposed meth- od using the coupled linear projections dealt with an out-of-sample data set without re-training.Compared to other linear methods,it handled some real problems of manifold alignment with flexibility since the proposed method did not need any assumptions about the relationship of affine transformation between the manifolds. Keywords:manifold learning;manifold alignment;coupled projection 近年来随着有关流形学习算法的研究不断深究刚刚起步，所以无论是流形对齐理论研究还是流入，相关算法在高维数据降维和数据可视化等方面形对齐算法在实际的模式识别、计算机视觉问题上取得了巨大成功14].流形学习算法在机器学习、模的应用研究都还有很长的路要走，为了克服非线性式识别、计算机视觉等领域得到了广泛推广，成为上流形对齐算法在处理Out-of-sample数据的先天不述领域的研究热点.然而，从一些具有代表性的经典足6]，本文提出了一种基于线性耦合映射的流形对流形学习方法的回顾来看5，传统的流形学习主要齐算法.与一些已有的线性流形对齐算法不同，本文处理来自单一流形的数据的降维问题.随着流形学提出线性耦合映射并不需要对流形间的关系进行很习研究的不断深入，以多流形作为研究对象的流形强的模型假设，因此也能更加灵活地处理一些较为学习问题逐步引起了研究者的注意.“流形对齐”就实际的流形对齐问题是多流形学习中的一个代表性问题，具有重要的理 1流形对齐的研究进展论价值和广泛的应用前景.近年来，流形对齐算法的研究已经取得了一定进展，涌现出了一些非线性和 1.1问题描述线性的流形对齐算法.然而，因为有关流形对齐的研流形对齐的研究对象是来自不同流形上的多个采样（数据）集合.为了便于理解，以2个流形的流收稿日期：2009-1205. 基金项目：黑龙江省自然科学基金资助项目(200812) 形对齐问题为例进行阐述，在高维空间的存在2个通信作者：姜峰.E-mail:iang@hit.edu.cn. 流形MCR:和M,CR”,在其上分别采样得到2

第6期姜峰，等：流形学习与基于线性耦合映射的流形对齐 ·477 个采样集合，记为式中：h=[g]T,e=[11…1]T是大小为 X={x,x,…,xw}CR (N+N,)×1的全1的列向量.这样最小化问题最终 Y={y1,2,…,y,}CR. 可以通过特征值分解的来解析求解作者在不同物体在流形对齐问题中，一般情况下会认为不同的的姿态数据库上检验了非线性流形对齐算法的性能. 流形MCR和M,CR”背后存在着一个彼此共享文献[1]给出的是非线性流形对齐算法中的代的、本质的公共流形McCR”.例如，不同分辨率的表算法.其他一些流形对齐的相关工作还有文献[8- 人脸图像组成的流形实际上是共享着一个人脸公共 9]等.其中，文献[8]主要完成将一个流形对齐到另流形.这些来自不同流形上的采样点在公共流形上一个目标流形上去的任务，而文献[9]主要是利用有一个对应的像点.对于X={x,2,…,xw,}CM 具有有序关系的信息来进行半监督流形对齐的.此和M,CR”来讲，在M。上有一个集合X={x, 外，一些相关的技术（如高斯过程等10）对从其他 2,…,xN,}CM。与之对应.同样，Y={y,2,…, 方面理解流形对齐也会有所帮助， 1.3线性流形对齐 yw{CM。对应于采样点集合Y={1,2,…,xN,}C 非线性流形对齐算法在处理Out-of-sample数 M,如果x:和y:在公共流形M。上有相同的像点，据点时[6]，需要重新进行训练.这是由于非线性算则称x:和y:对应.而流形对齐的任务恰恰就是要找法不能得到显式的映射，即从高维空间数据点到相到来自不同流形的采样点之间的对应关系。应的低维嵌入的映射函数.为此，文献[11]中给出 1.2非线性流形对齐了一种可能的解决方案.这种方法可以简要地总结在文献[7]中，作者从半监督学习的角度阐述如下：和形式化了流形对齐问题及其若干应用，并给出了 1)通过线性流形学习的方法对数据集合X和Y 相应的解法.对于给定2个高维空间的数据集合进行降维，找到各自的低维嵌入？和Y,即x= X={1,2,…,x}CR0,和Y={1y…,%,}C g.(x),gR0:→R,xeR”,xeR;y=g,(y）,g, R“.如前所述，这些来自于嵌入在高维空间的低维 RP,→R,yeR,y∈R; 流形上的采样点集合，可以通过基于图模型的流形 2)通过基于Procructes分析的回归算法对2个学习方法来找到其对应的低维嵌入.用G=(v,,w) 低维嵌人集合X和Y进行对齐，即来表示由顶点集合)和边集合专构成的图.以拉普拉斯特征映射(Laplacian eigenmap）为例，通过最小 inL(Q,)=∑I年-x-s(y-)Q2. 化下面的目标：式中：x=mean(X),y=mean(Y).如作者在文献 ff=∑(f-f)S [11]中所述，如果在1)中选择具有显式的映射函数的线性流形降维方法，然后配合2)基于线性回归的来学习得到一个实值方程∫：)→R这里S表示相似流形对齐方法，那么算法就能直接处理Out-of-sam 度矩阵，L表示广义图拉普拉斯矩阵。 ple的问题.然而，这种将降维和对齐割裂成2个步这样对于2个数据集合X和Y,分别定义实值骤的方式显然很难达到最优解，而且其中包含太多方程∫和g,以及对应的广义拉普拉斯矩阵L和的参数选择.例如1)中降维的维数选择就会影响到 L.在半监督对应学习的框架下，最终流形对齐的目最后的流形对齐效果.此外基于Procructes分析的标被形式化为回归算法，具有较强的前提假设，即假设2个流形之 L(f,g)=u∑If-g:‖2+fLf+gLg 间只存在尺度、平移和旋转这样的仿射变换.显然这式中：C是一个对应标注集合.如果i∈C,则表示已种前提条件在实际问题中很难得到满足知集合X中第i个数据点x:和集合Y中第i个数据在前文中回顾了一些现有的具有代表性的流形点y:为对应点.对于这样一个病态优化目标，文献对齐算法，对于非线性流形对齐算法来讲，处理Out- [7]将最小化目标转化为一个最小化广义瑞利商的 of-sample数据的先天不足，限制了该类方法的适用问题，即范围.而对于文献[11]中提出的线性流形对齐算 L(f,8) 法，过强的前提假设导致算法只能够处理特定的流 min L(h) ff+8g ,.t.hTe=0. 形对齐问题.从上述两方面来讲已有的流形对齐算

478 智能系统学报第5卷法存在着不同的缺憾.为此，本文提出了一种结合2 类算法的优点的流形对齐算法，从而能够在不引入器10=k及.)-o 过强的假设的前提下，兼顾处理Out-of-sample数据这样，优化目标从直接寻找最优的满足对应关问题，系保持目标的低维嵌入和Y,转化为寻找最优的满足对应关系保持目标的显式映射方程x=f(x)和 2基于线性耦合映射的流形对齐 y=∫，(y).这样的数学描述使得本文的方法具有了为克服流形对齐算法处理Out-of-sample数据直接处理Out-of-sample的数据能力，即通过显式的时需要重新训练的问题，提出一种基于线性耦合映映射函数能直接将新的数据投影到公共流形上去而射的流形对齐方法.本文方法通过引入显式的映射不需要重新进行训练优化. 函数为直接处理训练集之外的新数据提供了可能. 2.2流形结构保持正则化下面首先给出本文方法的问题描述从流形对齐的角度出发，低维空间的低维嵌入如前所述，流形对齐的基本任务就是找到不同仅仅保持已知的对应关系（对应关系保持目标）并数据集合所对应的公共低维嵌入.对于数据集合X 不够.因为，原始高维空间的数据点之间的流形结构和Y,通过显式的映射函数f:R→R和f: 对于寻找公共低维流形同样非常重要；所以，公共低 RP,→R找到原始数据点在公共流形上的低维嵌维流形M。低维嵌入需要保持原始高维空间点之间入.同时，这些嵌入要满足已知的通过人工标注得到的局部结构，称之为流形结构保持约束.对于流形结的对应关系.如文献[4]中提到的，流形对齐需要满构保持约束来讲，可以采用大部分流形学习降维算足一个目标和一个约束：法中的流形结构保持的优化目标形式.但是，对于具 1)需要满足已知的来自不同流形上的数据点体的问题需要选择适当的流形结构保持约束.为了之间的对应关系，称之为“对应关系保持目标” 论述方便起见，采用了基于图模型的流形结构保持 2)同时，公共流形需要保持原始高维数据点各自约束的数学形式，即的流形结构，本文中称之为“流形结构保持约束” 五=器1-，下面将详细地介绍对应关系保持目标和流形结构保持约束的具体数学形式化，以及最终的基于线 4=成名-% 性耦合映射的流形对齐算法。式中：边权矩阵S和S分别用来描述数据集合X 2.1对应关系保持目标和Y上的局部近邻关系.将显式的映射函数引入到所谓对应关系保持目标是指在公共流形M。上流形结构保持约束中，从而得到关于映射函数的流的来自不同高维空间的数据点的低维嵌人和Y, 形约束正则化形式：应该满足已知的X和Y之间的对应关系.为了描述更一般的情况，这里使用了一个二元组集合来代表 J)=元器1(）-f)1 这种对应关系.对应关系集合C中包含了所有的已知的对应点对，其中(i,)∈C表示了数据集合X中）=名6w）-1% 的第i个数据点x:和数据集合Y中的第j个数据点至此，基于显式映射函数的流形结构保持约束 Y,之间存在对应关系. 的数学形式化完成。如何在低维嵌入空间的公共流形上中保持这种 2.3流形对齐的优化目标已标注的对应关系呢？显然，对应关系就意味着对在2.1和2.2中，分别给出了对应关系保持目应高维数据点对的低维表示在公共流形上是无限接标和流形结构保持约束的具体数学表达，现在需要近的.这一直观的目标可以通过最小化下面的目标将这2个目标统一到一个目标函数下，通过简单的函数来实现.对应关系保持目标函数如下：加权和的形式给出最终的流形对齐的目标函数：粤》=长A。医*另 )=Jc()+a)+a,J(f). ，(1) 式中：和α，是加权系数，为了平衡流形结构保持式中：K=|C1,本文中引入了2个显式的映射方程约束之间以及对应关系保持目标和流形结构保持约 x=f(x)和y=f,(y)后，式(1)有了如下新的形式：束之间的比重.这个加权系数对于不同的问题有不

第6期姜峰，等：流形学习与基于线性耦合映射的流形对齐 ·479… 同的具体选择，通常情况下采用a=1和&，=1的 minTr(PZOZ'P),s.t.PZZP =I and pTZe =0. 设置.对于显式的映射函数，这里采用线性变换的形对于这种形式的目标优化，P可以通过求解广义特式，如∫(x)=Px(y)=Py.P和P,是2个变换征值分解问题EP=EP来得到，式中：E=Z2Z, 矩阵，其大小分别为D×d和D.×d F=ZZ". 显然如何优化这样一个联合目标函数成为解决流形对齐的关键.首先来看一种最简单的情形，即数 3实验据集合X和数据集合Y中具有相同数目的采样点为了验证提出的基于线性耦合映射的流形对齐且具有一一对应的关系.也就是说N=N。,另外当算法的性能，实验部分分别测试了本文方法在处理且仅当i=j时，(i,)∈C.下面通过线性代数的知识姿态流形对齐和光照流形对齐任务时的有效性.实将目标函数变换到矩阵形式.首先，来看流形对齐目验分别在人脸姿态数据集Face-10、物体姿态数据集标函数的第1项，对应关系保持目标J(ff).通过 COL-20I2以及人脸光照数据集Extended Yale Face 等价推导能得到 Database B13]上进行.在姿态实验中，流形对齐的任 (PP)=为1P-PI2=卡务是找到来自不同人的头部姿态序列图像之间的对应关系，甚至是找到不同物体的姿态序列图像之间 Tr(P:XX'P:+P'Y'P,-PIXYP,PTYX P). 的对应关系式中：T()是一个矩阵求迹的函数X和Y分别为 3.1数据库数据集合的矩阵表示形式，每个列向量代表了数据集合中的一个高维数据点，矩阵X的大小为D.× N,矩阵Y的大小为D,×N.其次，对流形对齐目标函数中关于流形结构保持约束项进行相类似的推导.由Jx(f)可以得到 J(P)=N.IP-Ps (a)物休姿态数据集 hC01L-20中物体“uck” C01上.20的20种物体的一些姿态图像示例是(Pxp. 式中：矩阵S、D、L分别表示了定义在以集合X 中的数据点为顶点的图模型的边权矩阵、度矩阵、以及广义拉普拉斯矩阵.类似，能够得到如下推导： (C)人脸姿态数据集Fe10巾的不同人的头部 P)=(Prr. 姿态序列图像示例图1姿态数据集图像示例依据上面的等价变换，流形对齐目标函数有了 Fig.1 Example images of pose dataset 新的形式，分别令在人脸姿态数据集FACE-10中，共包含了来自 10个不同人的头部姿态序列图像.这些姿态在 P= -90°~90°连续变化，具体姿态定义可以参见图2 (b)中的姿态的坐标设置.图1(c)中给出了2个不 *N. 同人的头部姿态序列图像示例.不同人的头部姿态 1 I 序列图像的姿态采集间隔并不一致，所以不同序列 N 的采样数目也不固定.图示中给出的2个序列中分这样得到了一个简约的流形对齐能量目标函数别包含了138和134幅图像.实验中，姿态序列的矩阵形式化表达：J(P)=Tr(PZ2ZP). Face-10中的采用了32×32大小的图像.在物体姿为了保证上式优化目标函数的具有惟一且稳定态数据集C0L-20中，共包含了20种不同物体（如的解，需要引入尺度不变约束PZZP=I和平移不图1(a)所示)的姿态序列图像.这些图像是按照图变约束PZe=0.于是，流形对齐的优化目标最终被 2(a)中的物体姿态的坐标设置进行采集而来.因为形式化为一个条件极值问题，即物体姿态序列图像中相邻姿态的采集间隔为5°，所

·480 智能系统学报第5卷以每个姿态序列中包含了72幅图像.图1(b)中给不需要重新进行训练和优化.与已有的线性方法不出了“duck”序列的一些示例图像.实验中，姿态序同，本算法采用一步优化的方式避免了简单地将线列C0L-20采用了16×16大小的图像性降维和低维对齐串联而导致难以达到最优结果的问题.而且，也避免了已有线性算法中对不同流形之间的关系进行假设而导致算法很难适用一般实际情 13 35 -90 -90 90° 况的问题.此外，数学形式上的统一和继承使得本算 9亦 45 法很容易从2个流形对齐推广到多流形对齐.另外， 09 本文提出优化目标最终能够通过解析方法求解，这 (a)物休姿态数据C0L-20 b)人脸姿态数据集FACE-10 也使得本算法具有实现简单、易于推广的特点，的姿态设橙坐标的姿态坐标设置参考文献：图2姿态数据集坐标设置示意图 Fig.2 The coordinate settings of pose dataset [1]TENENBAUM J,SILVA V,LANGFORD J.A global geo- 3.2实验结果及分析 metric framework for nonlinear dimensionality reduction[J]. 首先来看不同流形对齐算法在数据集C0L-20 Science,2000,5500(290):2319-2323. 上的表现.图3分别对比了3种流形对齐算法，包括： [2]ROWEIS S,SAUL L.Nonlinear dimensionality reduction by 1)文献[7]中非线性流形对齐算法；2)文献[11]中基 locally linear embedding[J].Science,2000,5500(290): 2323-2326. 于Procructes分析的线性流形对齐算法；3)本文的基 [3]SAUL L,ROWEIS S.Think globally,fit locally:unsuper- 于线性耦合映射的流形对齐算法.从图43中可以看 vised learning of low dimensional manifolds[J].The Journal 到，1)和本文方法给出了令人满意的流形对齐结果 of Machine Learning Research,2003,4:119-155. 而2)似乎不太适合来完成当前的这2个数据集合的 [4]BELKIN M,NIYOGI P.Laplacian eigenmaps for dimen- 流形对齐任务.参照2)的分析，以及图3(a)和(b)中 sionality reduction and data representation J].Neural 给出的2个数据集合各自的独立低维嵌入，不难发现 Computation,2003,15(6):1373-1396. 2)中关于2个流形关系的近似仿射变换的模型假设 [5]YAN S,XU D,ZHANG B,ZHANG H,YANG Q.Graph 并不适用于图3(a)和(b)中的情形 embedding and extensions:a general framework for dimen- sionality reduction[J].IEEE Transactions on Pattern Anal- ysis and Machine Intelligence,2007,29(1):40-51. [6]BENGIO Y,PAIEMENT J,VINCENT P,et al.Out-of- sample extensions for LIE,Isomap,MDS,eigenmaps,and (a)duck'数据的低维嵌人)hlock'数据的低维嵌入 spectral clustering[C]//Advances in Neural Information Processing Systems.Cambrige:MIT Press,2004:177-184 [7]HAM J,LEE D,SAUL L.Semisupervised alignment of manifolds[C]//Proceedings of the Annual Conference on Uncertainty in Artificial Intelligence.Edinburgh,UK, (©)文献7中非线性（山文献11中的基于（伦）本文方法结果方法的对齐结果 procructes分r的 2005:120-127. 对齐结果 [8 ]CONG Haifeng,PAN Chunhong,YANG Qing.A semi-su- 图3姿态流形对齐效果 pervised framework for mapping data to the intrinsic mani- Fig.3 Pose manifold alignment fold[C]//Tenth IEEE International Conference on Comput- er Vision2005.[S.1.],2005:98-105. 4结束语 [9]XIONG Liang,WANG Fei,ZHANG Changshui.Semi-defi- nite manifold alignment[J].Lecture Notes in Computer Sci- 描述了一种新的基于线性耦合映射的流形对齐 ence,2007,4701:773. 算法.本算法通过流形对齐目标的优化得到了从每 [10]RASMUSSEN C,WILLIAMS C.Gaussian processes for 一个流形到公共流形的显式的映射函数.与非线性 machine learning[M].Cambrige:The MIT Press,2006: 的隐式的映射函数不同，本算法能够直接地解决 101-107. Out-of-sample问题，能够直接处理新的测试数据而 [11]WANG C,MAHADEVAN S.Manifold alignment using

第6期姜峰，等：流形学习与基于线性耦合映射的流形对齐 481 procrustes analysis[C]//Proceedings of the 25th Interna- 李博，男，1980年生，博士研究 tional Conference on Machine Learning.Helsinki,Fin- 生，主要研究方向为模式识别、机器学 1and,2008:1120-1127. 习、图像处理等。 [12]NENE S,NAYAR S,MURASE H.Columbia object image library coil-20)[R].CUCS-006-96,Department of Computer Science,Columbia University. [13]GEORGHIADES A,BELHUMEUR P,KRIEGMAN D. From few to many:illumination cone models for face rec- 姚鸿勋，女，1965年生，教授，博士 ognition under variable lighting and pose[J].IEEE 生导师，主要研究方向为多媒体数据分 Transactions on Patter Analysis and Machine Intelli- 析与理解、信息检索、视频监控、模式识 gence,2001,23(6):643-660. 别.完成国家自然科学基金重点项目1 作者简介：项（评优），国家自然科学基金1项（评姜峰，男，1978年生，硕士生导优)，国家“863”计划重点项目子项目1 师.主要研究方向为模式识别、机器学项，“863”计划项目3项，“863”青年基金1项，信息产业部2 习、图像处理等. 项，国际合作4项.获省部级科技成果奖4项，其中一等奖2 项，二等奖1项，三等奖1项，另获省级教学成果奖2项.已获国家发明专利4项，审理中5项.出版教材5部.已发表国内外学术论文160余篇，被SCI检索32篇，EI检索91篇， ISTP检录61篇. 《仿生智能计算》一书在科学出版社出版由北京航空航天大学博土生导师段海滨撰写的《仿生智能计算》(SBN:978-7030295583)一书已在科学出版社出版.中国工程院院士、北京大学信息科学技术学院首任院长、《智能系统学报》编委会主任、人工智能和计算机软件著名学者何新贵教授认真审阅了书稿，并为该书欣然作序。本书系统、深入地介绍了仿生智能计算的起源、原理、模型、理论及其应用，力图概括国内外在这一学术领域的最新研究进展.全书共分12章，主要包括仿生智能计算的思想起源、研究现状及机制原理；仿生智能计算的数学基础；蚁群算法、微粒群算法、人工蜂群算法、微分进化算法、Memetic算法、文化算法、人工免疫算法、DNA计算的原理、模型、理论和典型应用，以及仿生硬件、仿生智能计算领域研究前沿与展望：附录部分给出了本书各章算法实例的程序源代码，分类整理并给出了相关网站，何新贵院士在序言中对段海滨近年来在仿生智能计算领域的工作给予了高度评价，并对该书作了如下评价： “1)学术上：全书突出基础，强调背景，并着眼学术前沿与发展；2)内容上：取材新颖，覆盖面广，深人浅出，系统性强，注重理论联系实际；3)撰写上：结构严谨，条理清晰，选例恰当，撰写内容符合认知规律，富有启发性.《仿生智能计算》是一本能够帮助读者较快掌握和应用仿生智能计算方法的好书，不仅具有较高的学术价值，而且对工程应用也具有较大的参考价值和指导意义.我确信该书的出版必将对我国智能科学与技术学科的发展和应用、培育创新性科技人才起到重要的推动作用.” 历生得能年图书邮购信息：地址：北京市东黄城根北街16号科学出版社工程技术分社邮编：100717 联系人：孙芳电话：01064006909 传真：010-64030248

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录