标签: apache-spark pyspark k-means
我正在尝试使用Python在Spark上实现k-means聚类,我想指定初始质心,而不是采用“ random”或“ k-means ++”。我想传递包含质心列表的RDD。我应该如何在Pyspark中做到这一点。