应用错误收集

在spark.ml中使用PCA时，BiPlots是否有支持？

时间：2018-09-10 15:45:15

标签： apache-spark k-means pca apache-spark-ml dimensionality-reduction

我曾经使用kmeans和PCA试图以二维方式可视化高维k-means聚类，但是却失去了2D聚类的含义。

是否有将要素投影到2D图上以返回一些可解释性的方法？

1 个答案:

答案 0 :(得分：0)

任何non-linear dimensionality reduction方法都可能效果更好（也称为“流形学习”，例如，参见sklearn's suite）。 t-sne方法通常对此非常流行。

但是，这些不会考虑您的群集标签。如果您想这样做（尽管通常不要），则可以对流形学习技术（例如，迫使同一个簇的点靠得很近）加重惩罚。