聚类算法详解：概念、K-Means 代码示例

聚类是一种无监督学习方法，通过将数据集中的样本按照某种相似度度量方法划分为不同的类别，使得同一类别内的数据点相似度尽可能高，不同类别之间的相似度尽可能低。

以下是一个简单的 K-Means 聚类示例代码：

import numpy as np
from sklearn.cluster import KMeans

# 生成样本数据
X = np.random.rand(100,2)

# 设置聚类数量
kmeans = KMeans(n_clusters=3)

# 训练模型
kmeans.fit(X)

# 预测数据所属类别
y_pred = kmeans.predict(X)

# 打印聚类结果
print(y_pred)

在上述代码中，我们使用 Numpy 库生成了 100 个二维随机数据点作为样本数据，然后使用 sklearn 库中的 KMeans 类进行聚类操作。在这个例子中，我们将聚类数量设置为 3，然后训练模型并预测数据所属的类别。最后，我们打印聚类结果，即每个数据点所属的类别。