如何在熊猫的KMeans算法中获取每个群集中的值总数?
我尝试了以下操作:
kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()
,但是它不起作用。
我的预期输出是:
Clusters Number_of_values
cluster_0 932
cluster_1 931
cluster_2 930
有什么想法可以在Pandas中实现吗?
我也尝试过这个,它有效。如果我有其他选择的话会更好。
from collections import Counter
print(Counter(kmeans_model.labels_))
谢谢。
答案 0 :(得分:3)
你可以做到
将群集编号列添加到数据框
kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)
dataframe['kmean'] = kmeans_model.labels_
然后数数他们
dataframe['kmean'].value_counts()