本文将使用 K-Means 聚类算法将以下 5 个样本点聚类为两类,距离度量使用曼哈顿距离。

样本集合:

(0,2), (0,0), (1,0), (5,0), (-1,-1)

K-Means 聚类算法步骤

  1. 选择初始聚类中心: 随机选择 (0,2) 和 (5,0) 作为初始聚类中心。

  2. 迭代过程

    • 第一轮迭代

      • 计算每个样本点到两个聚类中心的曼哈顿距离。
      • 将每个样本点分配到距离更近的聚类中心所在的类别。

      | 样本点 | 到 (0,2) 距离 | 到 (5,0) 距离 | 所属类别 | | -------- | -------- | -------- | -------- | | (0,2) | 0 | 5 | 第二类 | | (0,0) | 2 | 5 | 第一类 | | (1,0) | 1 | 4 | 第一类 | | (5,0) | 5 | 0 | 第二类 | | (-1,-1) | 3 | 7 | 第一类 |

      • 更新聚类中心:第一类中心为 (0.33, 0),第二类中心为 (1.33, 1)。
    • 第二轮迭代

      • 重新计算每个样本点到两个聚类中心的曼哈顿距离。
      • 将每个样本点分配到距离更近的聚类中心所在的类别。

      | 样本点 | 到 (0.33, 0) 距离 | 到 (1.33, 1) 距离 | 所属类别 | | -------- | -------- | -------- | -------- | | (0,2) | 2.33 | 2.33 | 第一类 | | (0,0) | 0.33 | 1.33 | 第一类 | | (1,0) | 0.67 | 0.67 | 第一类 | | (5,0) | 4.67 | 4.67 | 第二类 | | (-1,-1) | 2.33 | 2.33 | 第一类 |

      • 更新聚类中心:第一类中心为 (0.33, 0),第二类中心为 (1.33, 0.33)。
    • 第三轮迭代

      • 每个样本点到聚类中心的距离已经不再改变,聚类已经收敛。
  3. 最终聚类结果

    • 第一类:(0,0), (1,0), (-1,-1)
    • 第二类:(0,2), (5,0)

注意事项

由于 K-Means 聚类算法的迭代过程受到初始聚类中心的影响,不同初始聚类中心可能会得到不同的聚类结果。

K-Means 聚类算法实例:将 5 个样本聚类为两类

原文地址: https://www.cveoy.top/t/topic/ogHD 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录