给定含有5个样本的集合02001050-1-1请用k均值聚类算法将样本聚为两类距离度量为曼哈顿距离
首先选择两个初始聚类中心,可以随机选择样本(0,2)和(5,0)作为初始聚类中心。
第一轮迭代:
计算每个样本到两个聚类中心的曼哈顿距离,将每个样本分配给距离更近的聚类中心所在的类别。
(0,2)到(0,2)的距离为0,到(5,0)的距离为5,分配给距离更近的聚类中心所在的类别,即第二类。
(0,0)到(0,2)的距离为2,到(5,0)的距离为5,分配给距离更近的聚类中心所在的类别,即第一类。
(1,0)到(0,2)的距离为1,到(5,0)的距离为4,分配给距离更近的聚类中心所在的类别,即第一类。
(5,0)到(0,2)的距离为5,到(5,0)的距离为0,分配给距离更近的聚类中心所在的类别,即第二类。
(-1,-1)到(0,2)的距离为3,到(5,0)的距离为7,分配给距离更近的聚类中心所在的类别,即第一类。
第一轮迭代后,两个聚类的中心分别为(0.33,0)和(1.33,1).
第二轮迭代:
重新计算每个样本到两个聚类中心的曼哈顿距离,将每个样本分配给距离更近的聚类中心所在的类别。
(0,2)到(0.33,0)的距离为2.33,到(1.33,1)的距离为2.33,分配给距离更近的聚类中心所在的类别,即第一类。
(0,0)到(0.33,0)的距离为0.33,到(1.33,1)的距离为1.33,分配给距离更近的聚类中心所在的类别,即第一类。
(1,0)到(0.33,0)的距离为0.67,到(1.33,1)的距离为0.67,分配给距离更近的聚类中心所在的类别,即第一类。
(5,0)到(0.33,0)的距离为4.67,到(1.33,1)的距离为4.67,分配给距离更近的聚类中心所在的类别,即第二类。
(-1,-1)到(0.33,0)的距离为2.33,到(1.33,1)的距离为2.33,分配给距离更近的聚类中心所在的类别,即第一类。
第二轮迭代后,两个聚类的中心分别为(0.33,0)和(1.33,0.33)。
第三轮迭代:
每个样本到聚类中心的距离已经不再改变,聚类已经收敛。最终的聚类结果为:
第一类:(0,0),(1,0),(-1,-1)
第二类:(0,2),(5,0)
注:由于k均值聚类算法的迭代过程受到初始聚类中心的影响,不同初始聚类中心可能会得到不同的聚类结果
原文地址: https://www.cveoy.top/t/topic/fsh8 著作权归作者所有。请勿转载和采集!