如何使用Scikit-learn查找聚类质心

时间:2018-05-14 14:27:57

标签: python machine-learning scikit-learn centroid

我有一个带有(标记)群集的数据集。我试图找到每个簇的质心(一个向量,它的距离是簇中所有数据点中最小的)。

我找到了许多解决方案来执行聚类,然后才找到质心,但我还没有找到现有的质心。

Python schikit-learn是首选。感谢。

1 个答案:

答案 0 :(得分:1)

直接来自docs

from sklearn.neighbors.nearest_centroid import NearestCentroid
import numpy as np
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
y = np.array([1, 1, 1, 2, 2, 2])
clf = NearestCentroid()
clf.fit(X, y)

print(clf.centroids_)
# [[-2.         -1.33333333]
#  [ 2.          1.33333333]]