正在加载图片...
·2 智能系统学报 第8卷 法具有更好的性能和优势?由这个问题引出了本文 向量.因此KECA数据转换还可以用平均向量表 对高阶统计量的探讨、分析和证明. 示为 1核熵成分分析(KECA) Φ。=DiE:(P)-V(pn)= 1.1KECA的定义 D赃:m血Im2-Im, KECA是由R.Jenssen提出的一种数据转换和 2核协方差成分分析(KCCA) 降维方法,为了便于阅读,以下采用与文献[15] 相同的数学符号.KECA的提出基于2个概念:一个 最近笔者提出了基于D-vs-E的KCCA数据转 是Renyi熵: 换方法,将其应用于聚类,结果显示KCCA方法在对 高斯核参数的选择上比KECA具有更强的鲁棒性. H(p)=-logV(p)=-log p2(x)dx; 2.1统计量D-vs-E 另一个是Parzen窗密度估计[81: 通过观察矩阵mm',可以建立起V(p。)与mm x)=∑k,(x,). NaeD 的等价关系: 式中:D={x1,2,…,xw.由于k(x,·)的形状对 p'(x)mm'e(x)dt=元(x)dt=.).(2) Parzen窗密度估计的影响并不大f90,为了便于分 这引起了笔者对核特征空间中数据集的协方差 析和计算,可以采用核参数为σ的高斯核函数. V(p)可以用(x)近似地表示为 、((x)-m)((x)-m)T的思考,将式 )=N() (2)中的mm「替换成协方差矩阵,得到式(3): 泰)= pe会e)-me)-mp 式中:N×N的矩阵K中标号为(t,t)的元素等于 ∫2e(x)e(s)e(x)e()r- k(x,x),I是元素全为1的N×1的列向量, 由此,KECA数据转换可以表示为: (x)mm"(x)dx 重。=DiE:.minV(p)-V,(p)= A1,1,,AN,N D时:nn(K-Kh 蓉毛达c地-J2S) r-D 对于高斯核函数,由于k。(x,x)k。(x,x:)= 式中:()=是ED,1=K,K=ED, k(x,x:),所以式(3)可化为 1.2KECA与平均向量的关系 含oa高出-jr 由式(1),KECA也可以看作是降维前后核特征 空间的数据平均向量的欧几里德长度变化的最小化 ∫Pwa(x)dr-∫2(x)d. (4) reD 问题 式中:第1项可以近似地表示为 ,)=W='wl 原aei。aid)=青盒aa. 分)》=la(0 而第2项对应于V(p。),进而对应于H(P。),因此式 (4)可以近似地表示为 式中:m=六,(x,)是核特征空间数据集的平均 向量,设降维后的数据集为 贵会》言,以) Φ。=[Φ.(x1)重.(x2)… Φ.(xw)], 于是式(5)导出了D-vs-E的概念,D-vs-E就是 降维后的熵表示为 核参数为σ/2时的密度总和与熵V(P)的差, (,)=K=Im 2.2KCCA的定义 将式(5)中2项的系数提出并约去,重写为 式中:m=29,(✉)是转挨后的数据血的平均 严和,其中飞是N×N的矩阵,下标为(i,j)的元素
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有