正在加载图片...
主元分析(PCA)理论分析及应用 http://www.cad.zju.edu.cn/home/chenlu/pca.htm 2- -对 2-1 它表示了采样点在平均值两侧的分布,对应于图表2()就是采样点云的“胖瘦”。显然的,方差较大,也就 是较“宽”较“胖”的分布,表示了采样点的主要分布趋势,是主信号或主要分量:而方差较小的分布则被认 为是噪音或次要分量。 0 0 00 0 2 o 00 Bo 一 (a) 个 (b) angle of p (degrees) 图表2:()摄像机A的采集数据。图中黑色垂直直线表示一组正交基的方向。 Op是采样点云在长线方向上分布的 方差,而e是数据点在短线方向上分布的方差。(b)对P的基向量进行旋转使SNR和方差最大。 假设摄像机A拍摄到的数据如图表2()所示,圆圈代表采样点,因为运动理论上是只存在于一条直线上,所 以偏离直线的分布都属于噪音。此时SR描述的就是采样点云在某对垂直方向上的概率分布的比值。那么,最 大限度的揭示原数据的结构和关系,找出某条潜在的,最优的x轴,事实上等价寻找一对空间内的垂直直线 (图中黑线表示,也对应于此空间的一组基),使得信噪比尽可能大的方向。容易看出,本例中潜在的x轴就 是图上的较长黑线方向。那么怎样寻找这样一组方向呢?直接的想法是对基向量进行旋转。如图表2b)所示, 随着这对直线的转动SR以及方差的变化情况。应于SVR最大值的一组基P°,就是最优的“主元”方向。在 进行数学中求取这组基的推导之前,先介绍另一个影响因素。 B.冗余 有时在实验中引入了一些不必要的变量。可能会使两种情况:1)该变量对结果没有影响:2)该变量可以 用其它变量表示,从而造成数据冗余。下面对这样的冗余情况进行分析和分类。 a low redundancy high redundancy 图表3:可能冗余数据的频谱图表示。1和分别是两个不同的观测变量。 (比如例子中的不A,》)。最佳拟合线=阿用虚线表示。 如图表3所示,它揭示了两个观测变量之间的关系。()图所示的情况是低冗余的,从统计学上说,这两个观 测变量是相互独立的,它们之间的信息没有冗余。而相反的极端情况如(c),1和高度相关,完全可以用1 第4页共10页 2010-3-1820:53它表示了采样点在平均值两侧的分布,对应于图表 2(a)就是采样点云的“胖瘦”。显然的,方差较大,也就 是较“宽”较“胖”的分布,表示了采样点的主要分布趋势,是主信号或主要分量;而方差较小的分布则被认 为是噪音或次要分量。 图表 2:(a)摄像机A的采集数据。图中黑色垂直直线表示一组正交基的方向。 是采样点云在长线方向上分布的 方差,而 是数据点在短线方向上分布的方差。(b)对 的基向量进行旋转使SNR和方差最大。 假设摄像机A拍摄到的数据如图表 2(a)所示,圆圈代表采样点,因为运动理论上是只存在于一条直线上,所 以偏离直线的分布都属于噪音。此时 描述的就是采样点云在某对垂直方向上的概率分布的比值。那么,最 大限度的揭示原数据的结构和关系,找出某条潜在的,最优的 轴,事实上等价寻找一对空间内的垂直直线 (图中黑线表示,也对应于此空间的一组基),使得信噪比尽可能大的方向。容易看出,本例中潜在的 轴就 是图上的较长黑线方向。那么怎样寻找这样一组方向呢?直接的想法是对基向量进行旋转。如图表 2(b)所示, 随着这对直线的转动 以及方差的变化情况。应于 最大值的一组基 ,就是最优的“主元”方向。在 进行数学中求取这组基的推导之前,先介绍另一个影响因素。 有时在实验中引入了一些不必要的变量。可能会使两种情况:1)该变量对结果没有影响;2)该变量可以 用其它变量表示,从而造成数据冗余。下面对这样的冗余情况进行分析和分类。 图表 3:可能冗余数据的频谱图表示。 和 分别是两个不同的观测变量。 (比如例子中的 , )。最佳拟合线 用虚线表示。 如图表 3所示,它揭示了两个观测变量之间的关系。(a)图所示的情况是低冗余的,从统计学上说,这两个观 测变量是相互独立的,它们之间的信息没有冗余。而相反的极端情况如(c), 和 高度相关, 完全可以用 主元分析(PCA)理论分析及应用 http://www.cad.zju.edu.cn/home/chenlu/pca.htm 第4页 共10页 2010-3-18 20:53
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有