应用错误收集

我正在使用Streaming k-means使用

中的示例聚类一些二维流数据

http://spark.apache.org/docs/latest/mllib-clustering.html#streaming-k-means。

代码：

model = StreamingKMeans(k=5, decayFactor=0.7).setRandomCenters(2, 1.0, 0)
model.trainOn(trainingData)
clust=model.predictOnValues(testData.map(lambda lp: (lp.label, lp.features)))

它运行良好，没有错误。现在，我需要在每个批次或每个滑动批次中查找并打印集群中心。考虑到质心是用衰减因子0.7制作的，我怎样才能找到/计算聚类中心？

Spark Streaming中的Cluster Center k-means聚类

0 个答案: