正在加载图片...
.514 智能系统学报 第3卷 4)使用式(12)、(11)分别计算新的隶属矩阵U 其中P=I-DT(DSD)1DS,这里记D= 以及聚类中心m:,返回步骤2) [w,w2…]. 2.3无监督模式下最佳鉴别矢量集 求出的r(r≤d)个最佳鉴别矢量w1,2,…,w 通过上述算法,由式(10)求得最佳鉴别矢量, 构成最佳鉴别矢量集,同样通过 设为ω1,并根据求得的隶属矩阵U和聚类中心m, 由式(5)和(6)求得S和Sb 「w 若已求出(k≥1)个最佳鉴别矢量w1,w2,…, Y= X wk,第k+1个最佳鉴别矢量wk+1是在满足下列正 交条件下的使得式(1)取得最大值的向量 @r w+1w:=0,i=1,2,…,k 实现模式X由d维向r维的投影转换, 参照式(4)知,k+1是下列广义特征方程中最大的 综上所述,对照图1,可以用图3表示最佳鉴别 特征值对应的特征向量: PSp@k-1=ASωk+Ir 矢量集在无监督模式下的扩展方法, 最佳鉴别矢w,(d维→1维) 模糊散i矩阵SS S@=1S.0 w'u=0(1=1,2,,r-1) 模糊Fisher准同函数: max (Je) 最件鉴别矢址集0,:,0,(维→r维) J(w)= oSw PS.@.=AS m. 0s0 图3模糊Fisher准则函数及最佳鉴别矢量、最佳鉴别矢量集求解关系 Fig.3 Relationships between fuzzy Fisher criterion function and unsupervised optimal set of discriminant vectors 名的约当指数(Rand index,RI)I7]作为聚类有效性 3 实验结果及其分析 评价指标 采用UCI16中is,Wdc等4个数据集作为实 RI具体解释如下:定义P,P2分别为原数据集 验数据,这4个数据集基本信息如表1所示, D的类别标记和变换后数据集聚类划分结果,通过 表1实验所用数据集的基本信息 公式 Table 1 Basic information of experimental dataset 数据集 类别数样本数特征数 R(P,P:)=nx(n-1)/2 a +b Iris 3 150 4 来计算这两种划分的一致性.其中:a表示D中任意 Pima indians diabetes 2 768 两个样本d:、d在P、P2中同属于一类的个数;b表 Wine 3 178 13 示d:、d,都不属于同一类的个数;n表示数据集D的 Wdbe 2 569 30 样本个数.显然,I的范围为[0,1],只有在P、P2 3.1聚类有效性 完全一致的情况下,I值为1.I统计的值越小,两 使用FCM和K-means算法分别对使用主成分 种划分差距越大.为了保证比较的准确性和公平性, 分析(principal component analysis,PCA)、最佳鉴别 两种算法分别进行100次,计算测得的R肛均值,并 矢量集(optimal set of discriminant vectors,OSDV)和 绘制FCM和K-means分别对降维数据进行聚类所 无监督最佳鉴别矢量集(unsupervised optimal set of 得RI值和特征维数曲线图以及分别采用PCA,OS discriminant vectors,UOSDV)降维后的数据进行聚 DV和UOSDV降维后2维数据散布图如图4~7和 类,将聚类结果与原数据集类别标记相比较,通过著 表2~5所示
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有