如何使用PySpark二等分k均值获得所有聚类层次结构?

时间:2019-03-07 10:35:09

标签: python pyspark cluster-analysis k-means hierarchical-clustering

我正在使用PySpark 2.4的ml软件包对某些数据进行聚类。我能够为k个聚类实现平分k均值,但是我不知道如何获得所有步骤的预测(即知道具有2个聚类的第一步的预测,然后了解4个聚类的预测,等等)。

是否有一种方法可以获取这些预测,而不必像常规k均值那样多次运行算法来增加k?

0 个答案:

没有答案