在spark.ml中使用PCA时,BiPlots是否有支持?

时间:2018-09-10 15:45:15

标签: apache-spark k-means pca apache-spark-ml dimensionality-reduction

我曾经使用kmeans和PCA试图以二维方式可视化高维k-means聚类,但是却失去了2D聚类的含义。

是否有将要素投影到2D图上以返回一些可解释性的方法?

1 个答案:

答案 0 :(得分:0)

任何non-linear dimensionality reduction方法都可能效果更好(也称为“流形学习”,例如,参见sklearn's suite)。 t-sne方法通常对此非常流行。

但是,这些不会考虑您的群集标签。如果您想这样做(尽管通常不要),则可以对流形学习技术(例如,迫使同一个簇的点靠得很近)加重惩罚。