Spark Streaming中的Cluster Center k-means聚类

时间:2015-12-27 23:54:00

标签: apache-spark k-means spark-streaming apache-spark-mllib

我正在使用Streaming k-means使用

中的示例聚类一些二维流数据

http://spark.apache.org/docs/latest/mllib-clustering.html#streaming-k-means

代码:

model = StreamingKMeans(k=5, decayFactor=0.7).setRandomCenters(2, 1.0, 0)
model.trainOn(trainingData)
clust=model.predictOnValues(testData.map(lambda lp: (lp.label, lp.features)))

它运行良好,没有错误。现在,我需要在每个批次或每个滑动批次中查找并打印集群中心。考虑到质心是用衰减因子0.7制作的,我怎样才能找到/计算聚类中心?

0 个答案:

没有答案