聚类算法详解:概念、K-Means 代码示例
聚类是一种无监督学习方法,通过将数据集中的样本按照某种相似度度量方法划分为不同的类别,使得同一类别内的数据点相似度尽可能高,不同类别之间的相似度尽可能低。
以下是一个简单的 K-Means 聚类示例代码:
import numpy as np
from sklearn.cluster import KMeans
# 生成样本数据
X = np.random.rand(100,2)
# 设置聚类数量
kmeans = KMeans(n_clusters=3)
# 训练模型
kmeans.fit(X)
# 预测数据所属类别
y_pred = kmeans.predict(X)
# 打印聚类结果
print(y_pred)
在上述代码中,我们使用 Numpy 库生成了 100 个二维随机数据点作为样本数据,然后使用 sklearn 库中的 KMeans 类进行聚类操作。在这个例子中,我们将聚类数量设置为 3,然后训练模型并预测数据所属的类别。最后,我们打印聚类结果,即每个数据点所属的类别。
原文地址: https://www.cveoy.top/t/topic/otDG 著作权归作者所有。请勿转载和采集!