Kmeans没有产生肘部

时间:2016-08-17 02:58:18

标签: python scikit-learn cluster-computing k-means

我有一个大约300,000个唯一产品名称的数据框,我正在尝试使用k方法将相似的名称聚集在一起。我使用了sklearn的tfidfvectorizer来对名称进行矢量化并转换为tf-idf矩阵。

接下来,我在tf-idf矩阵上运行k表示,簇的数量范围从5到25.然后我绘制了每个簇的惯性。

基于情节我是否接近问题?如果没有明显的肘部,可以从中得到什么?

enter image description here

1 个答案:

答案 0 :(得分:0)

最有可能因为k-means w = TF-IDF对诸如产品名称之类的短文本不起作用。

没有看到肘部表明结果并不好。