K-Means 聚类算法实例:将 5 个样本聚类为两类
本文将使用 K-Means 聚类算法将以下 5 个样本点聚类为两类,距离度量使用曼哈顿距离。
样本集合:
(0,2), (0,0), (1,0), (5,0), (-1,-1)
K-Means 聚类算法步骤
-
选择初始聚类中心: 随机选择 (0,2) 和 (5,0) 作为初始聚类中心。
-
迭代过程:
-
第一轮迭代:
- 计算每个样本点到两个聚类中心的曼哈顿距离。
- 将每个样本点分配到距离更近的聚类中心所在的类别。
| 样本点 | 到 (0,2) 距离 | 到 (5,0) 距离 | 所属类别 | | -------- | -------- | -------- | -------- | | (0,2) | 0 | 5 | 第二类 | | (0,0) | 2 | 5 | 第一类 | | (1,0) | 1 | 4 | 第一类 | | (5,0) | 5 | 0 | 第二类 | | (-1,-1) | 3 | 7 | 第一类 |
- 更新聚类中心:第一类中心为 (0.33, 0),第二类中心为 (1.33, 1)。
-
第二轮迭代:
- 重新计算每个样本点到两个聚类中心的曼哈顿距离。
- 将每个样本点分配到距离更近的聚类中心所在的类别。
| 样本点 | 到 (0.33, 0) 距离 | 到 (1.33, 1) 距离 | 所属类别 | | -------- | -------- | -------- | -------- | | (0,2) | 2.33 | 2.33 | 第一类 | | (0,0) | 0.33 | 1.33 | 第一类 | | (1,0) | 0.67 | 0.67 | 第一类 | | (5,0) | 4.67 | 4.67 | 第二类 | | (-1,-1) | 2.33 | 2.33 | 第一类 |
- 更新聚类中心:第一类中心为 (0.33, 0),第二类中心为 (1.33, 0.33)。
-
第三轮迭代:
- 每个样本点到聚类中心的距离已经不再改变,聚类已经收敛。
-
-
最终聚类结果
- 第一类:(0,0), (1,0), (-1,-1)
- 第二类:(0,2), (5,0)
注意事项
由于 K-Means 聚类算法的迭代过程受到初始聚类中心的影响,不同初始聚类中心可能会得到不同的聚类结果。
原文地址: https://www.cveoy.top/t/topic/ogHD 著作权归作者所有。请勿转载和采集!