正在加载图片...
数据挖掘论文 基于K中心点算法实现 算法描述 k中心点算法:首先为每一个簇随意选择一个代表对象;剩余的对象其与代 表的对象的距离分配给最近的一个簇。然后反复的用非代表对象来替代代表对 象,以改进聚类的质量。聚类结果的质量用一个代价函数来估算,该函数度量对 象与其参与对象之间的平均相异度。为了确定非代表对象On是否是当前代表 对象O的好的替代,对于每一个非代表对象P,考虑以下四种情况。 第一种情况:P当前隶属于代表对象O。如果O被Oadm所取代作为代表对象, 并且P离其他代表对象O〔≠)最近,则P重新分配给O。 第二种情况:P当前隶属于代表对象O。如果O,被 Orandi所取代作为代表对象 并且P离其他代表对象Oadm最近,则P重新分配给 prandi 第三种情况:P当前隶属于代表对象O,(≠。如果O1被 Orando所取代作为代表 对象,并且P离其他代表对象O最近,则对象的隶属不发生变化。 第四种情况:P当前隶属于代表对象O,〔≠)。如果O,被Oabm所取代作为代表 对象,并且P离其他代表对象Om最近,则P重新分配给 O 下面是我们这次实现这个k中心点算法的具体描述 输入:结果簇的个数k和包含n个对象的数据集合 输出:k个簇的集合,使得所有对象与其最近中心点的相异度总和最小 方法 (1)从n个对象的集合中随意选取k个对象作为初始化的中心点 (2) repeat数据挖掘论文 1 基于 K-中心点算法实现 一、 算法描述 k 中心点算法:首先为每一个簇随意选择一个代表对象;剩余的对象其与代 表的对象的距离分配给最近的一个簇。然后反复的用非代表对象来替代代表对 象,以改进聚类的质量。聚类结果的质量用一个代价函数来估算,该函数度量对 象与其参与对象之间的平均相异度。为了确定非代表对象 Orandom 是否是当前代表 对象 Oj 的好的替代,对于每一个非代表对象 P,考虑以下四种情况。 ➢ 第一种情况:P 当前隶属于代表对象 Oj 。如果 Oj 被 Orandom 所取代作为代表对象, 并且 P 离其他代表对象 Oi (i  j)最近,则 P 重新分配给 Oi 。 ➢ 第二种情况:P 当前隶属于代表对象 Oj 。如果 Oj 被 Orandom 所取代作为代表对象, 并且 P 离其他代表对象 Orandom 最近,则 P 重新分配给 Orandom。 ➢ 第三种情况:P 当前隶属于代表对象 Oi ,(i  j)。如果 Oj 被 Orandom 所取代作为代表 对象,并且 P 离其他代表对象 Oi 最近,则对象的隶属不发生变化。 ➢ 第四种情况:P 当前隶属于代表对象 Oi ,(i  j)。如果 Oj 被 Orandom 所取代作为代表 对象,并且 P 离其他代表对象 Orandom 最近,则 P 重新分配给 Orandom。 下面是我们这次实现这个 k 中心点算法的具体描述 输入:结果簇的个数 k 和包含 n 个对象的数据集合 输出:k个簇的集合,使得所有对象与其最近中心点的相异度总和最小 方法: (1) 从 n 个对象的集合中随意选取 k 个对象作为初始化的中心点; (2) repeat;
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有