我正在使用Streaming k-means使用
中的示例聚类一些二维流数据http://spark.apache.org/docs/latest/mllib-clustering.html#streaming-k-means。
代码:
model = StreamingKMeans(k=5, decayFactor=0.7).setRandomCenters(2, 1.0, 0)
model.trainOn(trainingData)
clust=model.predictOnValues(testData.map(lambda lp: (lp.label, lp.features)))
它运行良好,没有错误。现在,我需要在每个批次或每个滑动批次中查找并打印集群中心。考虑到质心是用衰减因子0.7制作的,我怎样才能找到/计算聚类中心?