正在加载图片...
K均值(K-means)算法 一、假如对于训练样本集{X,x2,…,七n},有K个聚类{4,h,…,},计算 每个样本和聚类中心的距离: lx-4l 找出离x,最近的k,计C,=j。 二、对于聚类中心,找出其对应的所有x,将它们的中心坐标求出,成为新的 4 三、误差函数:使得各个数据点距离聚类中心的距离 总和最小,也就是图中所有红线和蓝线加起来的总长 度最小。 xi-ucK均值(K-means)算法 一、假如对于训练样本集 { x1 , x2 , … , xn } ,有 K 个聚类{ 1 , 2 , … , K },计算 每个样本和聚类中心的距离: || xi - j || 找出离xi最近的K,计Ci = j。 二、对于聚类中心j,找出其对应的所有xi,将它们的中心坐标求出,成为新的 j: 三、误差函数: 使得各个数据点距离聚类中心的距离 总和最小,也就是图中所有红线和蓝线加起来的总长 度最小。 𝐿 = 1 𝑛 ෍ 𝑖=1 𝑛 𝒙𝑖 − 𝝁𝐶𝑖 𝝁𝑗 = 1 𝑁𝑗 ෍ 𝑖∈𝜇𝑗 𝑁𝑗 xi
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有