在KMeans算法中获取每个群集中的值数

时间:2019-07-15 12:04:38

标签: python pandas scikit-learn cluster-analysis k-means

如何在熊猫的KMeans算法中获取每个群集中的值总数?

我尝试了以下操作:

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()

,但是它不起作用。

我的预期输出是:

Clusters   Number_of_values
cluster_0  932
cluster_1  931
cluster_2  930

有什么想法可以在Pandas中实现吗?

我也尝试过这个,它有效。如果我有其他选择的话会更好。

from collections import Counter
print(Counter(kmeans_model.labels_))

谢谢。

1 个答案:

答案 0 :(得分:3)

你可以做到

将群集编号列添加到数据框

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)

dataframe['kmean'] = kmeans_model.labels_

然后数数他们

dataframe['kmean'].value_counts()