给定含有5个样本的集合02001050-1-1请用k均值聚类算法将样本聚为两类选择第一、第二个样本点作为类的中心距离度量为曼哈顿距离。
首先,我们需要计算出每个样本点到两个中心点的距离。
对于第一个中心点(0,2),每个样本点到该中心点的距离分别为:
(0,2)到自身的距离为0 (0,0)到中心点的距离为2 (1,0)到中心点的距离为2 (5,0)到中心点的距离为5 (-1,-1)到中心点的距离为4
对于第二个中心点(0,0),每个样本点到该中心点的距离分别为:
(0,2)到中心点的距离为2 (0,0)到自身的距离为0 (1,0)到中心点的距离为1 (5,0)到中心点的距离为5 (-1,-1)到中心点的距离为2
根据距离,我们可以将每个样本点分配到离其最近的中心点的类中。根据两个中心点的距离,我们可以将第二个样本点和第三个样本点分配到第二类中,将剩余的三个样本点分配到第一类中。
现在,我们需要重新计算两个类的中心点坐标。对于第一类,其包含的样本点坐标为(0,2),(0,0),(5,0),(-1,-1),所以其中心点坐标为(1,0.25)。对于第二类,其包含的样本点坐标为(1,0),(0,0),所以其中心点坐标为(0.5,0)。
现在,我们再次计算每个样本点到两个中心点的距离,然后重新分配样本点到类中。对于第一个中心点(1,0.25),每个样本点到该中心点的距离分别为:
(0,2)到中心点的距离为2.75 (0,0)到中心点的距离为0.25 (1,0)到自身的距离为0 (5,0)到中心点的距离为4.75 (-1,-1)到中心点的距离为3.5
对于第二个中心点(0.5,0),每个样本点到该中心点的距离分别为:
(0,2)到中心点的距离为2 (0,0)到中心点的距离为0.5 (1,0)到中心点的距离为0.5 (5,0)到中心点的距离为4.5 (-1,-1)到中心点的距离为1.5
根据距离,我们可以将每个样本点分配到离其最近的中心点的类中。根据两个中心点的距离,我们可以将第二个样本点和第三个样本点分配到第二类中,将剩余的三个样本点分配到第一类中。
现在,两个类的中心点坐标为(1.5,-0.25)和(0.333,0),再次计算每个样本点到两个中心点的距离,重新分配样本点到类中。经过一次迭代后,聚类算法收敛。最终的聚类结果为:
第一类:(0,2),(0,0),(5,0) 第二类:(1,0),(-1,-1
原文地址: https://www.cveoy.top/t/topic/fsgO 著作权归作者所有。请勿转载和采集!