标签: python cluster-analysis data-visualization k-means unsupervised-learning
数据集:200,000个样本。 毫不奇怪,我使用K-means进行了基本探索。 累积的解释方差比不是理想的。对于PC1和PC2之和,甚至小于20%。然后,WCSS图没有显示明显的弯头。 如下所示,数据点本身像一个簇一样被压缩!下面最后一张图片中的Silhouette得分也存在同样的问题。 DBSCAN方法也可能会受到质疑,因为数据是如此彼此接近。你们有类似的经验来应对吗?
干杯。