标签: python pyspark cluster-analysis k-means hierarchical-clustering
我正在使用PySpark 2.4的ml软件包对某些数据进行聚类。我能够为k个聚类实现平分k均值,但是我不知道如何获得所有步骤的预测(即知道具有2个聚类的第一步的预测,然后了解4个聚类的预测,等等)。
是否有一种方法可以获取这些预测,而不必像常规k均值那样多次运行算法来增加k?