K-Means 聚类算法实例：将 5 个样本聚类为两类

本文将使用 K-Means 聚类算法将以下 5 个样本点聚类为两类，距离度量使用曼哈顿距离。

样本集合：

(0,2), (0,0), (1,0), (5,0), (-1,-1)

选择初始聚类中心：随机选择 (0,2) 和 (5,0) 作为初始聚类中心。
迭代过程：
- 第一轮迭代：
  - 计算每个样本点到两个聚类中心的曼哈顿距离。
  - 将每个样本点分配到距离更近的聚类中心所在的类别。
  | 样本点 | 到 (0,2) 距离 | 到 (5,0) 距离 | 所属类别 | | -------- | -------- | -------- | -------- | | (0,2) | 0 | 5 | 第二类 | | (0,0) | 2 | 5 | 第一类 | | (1,0) | 1 | 4 | 第一类 | | (5,0) | 5 | 0 | 第二类 | | (-1,-1) | 3 | 7 | 第一类 |
  - 更新聚类中心：第一类中心为 (0.33, 0)，第二类中心为 (1.33, 1)。
- 第二轮迭代：
  - 重新计算每个样本点到两个聚类中心的曼哈顿距离。
  - 将每个样本点分配到距离更近的聚类中心所在的类别。
  | 样本点 | 到 (0.33, 0) 距离 | 到 (1.33, 1) 距离 | 所属类别 | | -------- | -------- | -------- | -------- | | (0,2) | 2.33 | 2.33 | 第一类 | | (0,0) | 0.33 | 1.33 | 第一类 | | (1,0) | 0.67 | 0.67 | 第一类 | | (5,0) | 4.67 | 4.67 | 第二类 | | (-1,-1) | 2.33 | 2.33 | 第一类 |
  - 更新聚类中心：第一类中心为 (0.33, 0)，第二类中心为 (1.33, 0.33)。
- 第三轮迭代：
  - 每个样本点到聚类中心的距离已经不再改变，聚类已经收敛。
最终聚类结果
- 第一类：(0,0), (1,0), (-1,-1)
- 第二类：(0,2), (5,0)

由于 K-Means 聚类算法的迭代过程受到初始聚类中心的影响，不同初始聚类中心可能会得到不同的聚类结果。