给定含有5个样本的集合02001050-1-1请用k均值聚类算法将样本聚为两类距离度量为曼哈顿距离。初始聚类中心选择02和00
首先计算每个样本到两个初始聚类中心的曼哈顿距离:
样本 | 到(0,2)的距离 | 到(0,0)的距离 | 所属类别 ---|---|---|--- (0,2) | 0 | 2 | 1 (0,0) | 2 | 0 | 2 (1,0) | 1 | 1 | 1 (5,0) | 5 | 5 | 1 (-1,-1) | 3 | 1 | 2
根据距离划分样本为两个类别,重新计算每个类别的中心点:
类别1:{(0,2),(1,0),(5,0)},中心点为(2, 2/3)
类别2:{(0,0),(-1,-1)},中心点为(-0.5, -0.5)
再次计算每个样本到新的聚类中心的曼哈顿距离:
样本 | 到(2, 2/3)的距离 | 到(-0.5, -0.5)的距离 | 所属类别 ---|---|---|--- (0,2) | 2 2/3 | 2 1/2 | 2 (0,0) | 2 2/3 | 0.5 | 2 (1,0) | 1 2/3 | 0.5 | 2 (5,0) | 3 1/3 | 5.5 | 2 (-1,-1) | 3 1/3 | 0 | 2
可以发现,样本(0,2)从类别1转移到了类别2,而其它样本的类别没有改变。因此,重新计算每个类别的中心点:
类别1:{(1,0),(5,0)},中心点为(3,0)
类别2:{(0,2),(0,0),(-1,-1)},中心点为(-1/3, 1/3)
再次计算每个样本到新的聚类中心的曼哈顿距离:
样本 | 到(3,0)的距离 | 到(-1/3, 1/3)的距离 | 所属类别 ---|---|---|--- (0,2) | 3 | 2 2/3 | 2 (0,0) | 3 | 2/3 | 2 (1,0) | 2 | 2/3 | 2 (5,0) | 2 | 8/3 | 1 (-1,-1) | 4 | 2/3 | 2
可以发现,样本(5,0)从类别2转移到了类别1,而其它样本的类别没有改变。因此,重新计算每个类别的中心点:
类别1:{(1,0),(5,0)},中心点为(3,0)
类别2:{(0,2),(0,0),(-1,-1)},中心点为(-1/3, 1/3)
此时,每个样本的类别不再改变,聚类结果为:
类别1:{(1,0),(5,0)}
类别2:{(0,2),(0,0),(-1,-1)}
因此,将样本聚为两类的结果为:
类别1:{(1,0),(5,0)}
类别2:{(0,2),(0,0),(-1,-1)
原文地址: https://www.cveoy.top/t/topic/fsgs 著作权归作者所有。请勿转载和采集!