正在加载图片...
多维缩放算法将数据映射到2D或3D空间,并保持原始数据结构的基本特征不变。 经典的降维算法,如主成分分析(principal components analysis,PCA)和核主成分分析 (kernel principal components analysis,KPCA)在模式分析中已被广泛应用o-3。PCA是通过从协方 差矩阵中提取最大的几个特征向量组成的单位主方向,并将数据映射到互相正交的主方向上,从而 构成低维的数据主成分。KPCA是从核内积矩阵中求核主方向,计算特征空间中样本点在核主方向 上的投影,实现数据低维可视化,并消除数据噪声和非线性耦合。由于核方法能更好的表示非线性 特征,所以KPCA的多维缩放在处理复杂的数据结构时具有一定的优势。无论PCA、还是KPCA, 从概念上是将数据在低维子空间的表示形式与原始空间中数据之间残差的范数平方和最小化。但是, 这种通过这类高维数据进行缩放方法,容易造成复杂高维数据的内在结构特征在降维后出现畸变。 为了解决非线性数据在降维后易出现畸变问题,提出了新的数据降维方法。该方法将特征空间 的样本点间的平方距离与投影到低维子空间的平方距离的相关性最大化来实现非线性多维缩放。新 方法在对非线性数据多维同等缩放(multi-.dimensional parity scaling,MDPS)过程最大程度地使原 始空间中的样本点之间的距离与经过2D或3D缩放后样本点之间的距离保持同等缩放 给定由核定义的特征空间F中的一个样本集 S=[)b(x…x月 (1) 选择较小的1,如1=2,3,寻求原始数据X从s维特征空间投影到维空间x,使得 (x)-t(x)川≈(x)-(x)=1,2, (2) 其中,川表示模长,π是嵌入在特征空间F中1维低维学空间。 为了建立特征空间中样本对的距离与在低维空间中样本对的投影距离相关性最大化,即累积误 差E()最小化,可求解下面的优化问题 (3) z=1,t⊥js=1,2,1 ta⊥te,d,e=l,2,.,l (4) 其中j表示所有分量均为 1的列向量,ta,t。为t子空间中相互正交的单位向量。 式(3) 的优花问题还可以理解为另一种表达形式 E())) (5) 进一步分析可知多维缩放算法将数据映射到 2D 或 3D 空间,并保持原始数据结构的基本特征不变。 经典的降维算法,如主成分分析(principal components analysis,PCA)和核主成分分析 (kernel principal components analysis,KPCA)在模式分析中已被广泛应用[30-31]。PCA 是通过从协方 差矩阵中提取最大的几个特征向量组成的单位主方向,并将数据映射到互相正交的主方向上,从而 构成低维的数据主成分。KPCA 是从核内积矩阵中求核主方向,计算特征空间中样本点在核主方向 上的投影,实现数据低维可视化,并消除数据噪声和非线性耦合。由于核方法能更好的表示非线性 特征,所以 KPCA 的多维缩放在处理复杂的数据结构时具有一定的优势。无论 PCA、还是 KPCA, 从概念上是将数据在低维子空间的表示形式与原始空间中数据之间残差的范数平方和最小化。但是, 这种通过这类高维数据进行缩放方法,容易造成复杂高维数据的内在结构特征在降维后出现畸变。 为了解决非线性数据在降维后易出现畸变问题,提出了新的数据降维方法。该方法将特征空间 的样本点间的平方距离与投影到低维子空间的平方距离的相关性最大化来实现非线性多维缩放。新 方法在对非线性数据多维同等缩放(multi-dimensional parity scaling, MDPS)过程中,最大程度地使原 始空间中的样本点之间的距离与经过 2D 或 3D 缩放后样本点之间的距离保持同等缩放。 给定由核定义的特征空间 F 中的一个样本集   T S ( ), ( ), , ( ) 1 2 x x x      n (1) 选择较小的 l,如 l = 2,3,寻求原始数据 X 从 s 维特征空间投影到 l 维空间 τ,使得 ( ) ( ) ( ) ( ) , 1,2,..., i j i j   x x x x    ≈   i j n (2) 其中, . 表示模长,τ 是嵌入在特征空间 F 中 l 维低维子空间。 为了建立特征空间中样本对的距离与在低维空间中样本对的投影距离相关性最大化,即累积误 差 E(τ)最小化,可求解下面的优化问题 2 , 1 2 , 1 min ( ) ( ), ( ) ( ) ( ) ( , ) ( ) ( ) x x x x x x x x n i j i j i j n i j i j i j E K              τ   (3) 约束条件为: 2 1 s   , , 1,2,... s    j s l , , 1,2,..., d e     d e l (4) 其中 j 表示所有分量均为 1 的列向量, d e   为 子空间中相互正交的单位向量。 式(3)的优化问题还可以理解为另一种表达形式 2 2 , 1 ( ) (1 ( ) ( ) ) ( ) ( ) n i j i j i j E            x x x x (5) 进一步分析可知 录用稿件,非最终出版稿
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有