标签: pyspark k-means apache-spark-ml
我正在使用来自sklearn和pyspark.ml的kmeans。 火花版本要快得多。但是,它似乎没有我需要的选项。使用sklearn kmeans,我可以为集群中心指定初始值:KMeans(init = centers,...)。 我没有看到pyspark这样的选项。我错过了,还是我运气不好而且它不存在?
谢谢