标签: apache-spark cluster-analysis k-means
我需要使用Spark K-means训练几个模型,现在我可以执行以下操作
for(JavaRDD<Vector> parsedData : data){ KMeansModel clusters = KMeans.train(parsedData.rdd(), numClusters, numIterations); }
但这太慢了, 你有什么想法? 谢谢。