K-Medoids 算法:原理、步骤及优缺点
K-Medoids 算法是一种基于贪心策略的聚类算法,它是 K-Means 算法的一种变体,主要用于处理离散或非欧几里德距离空间中的数据。K-Medoids 算法的核心思想是将数据集中的每个点分配到最近的中心点,并且通过交换中心点来优化聚类效果。
具体地说,K-Medoids 算法的步骤如下:
- 随机选择 k 个点作为初始的中心点 (medoids)。
- 对于每个数据点,计算它与每个中心点的距离,并将它分配到距离最近的中心点所在的簇中。
- 对于每个簇,选择一个代表性的中心点,使得它与该簇中所有点的平均距离最小。
- 对于每个中心点,计算将它与其他非中心点交换后的聚类效果,选择使得聚类效果最优的交换方案。
- 重复第 2-4 步,直到中心点的位置不再发生变化或达到预定的迭代次数。
K-Medoids 算法的优点是它的中心点可以是任意数据点,而不仅仅限于样本的均值或中心。因此,它对于离散或非欧几里德距离空间中的数据具有较好的适应性。缺点是它的时间复杂度较高,并且它对于噪声和异常点的鲁棒性较差。
原文地址: https://www.cveoy.top/t/topic/okya 著作权归作者所有。请勿转载和采集!