如何应对低的Silhouette得分和无肘点的无监督学习?

时间:2019-07-30 22:49:06

标签: python cluster-analysis data-visualization k-means unsupervised-learning

数据集:200,000个样本。 毫不奇怪,我使用K-means进行了基本探索。 累积的解释方差比不是理想的。对于PC1和PC2之和,甚至小于20%。然后,WCSS图没有显示明显的弯头。 如下所示,数据点本身像一个簇一样被压缩!下面最后一张图片中的Silhouette得分也存在同样的问题。 DBSCAN方法也可能会受到质疑,因为数据是如此彼此接近。你们有类似的经验来应对吗?

干杯。

pca plot

accumulated explained variance elbow Silhouette

0 个答案:

没有答案