如何使用Spark MLlib中的Power Iteration聚类生成的谱聚类模型来预测新点的聚类成员资格?

时间:2018-03-27 05:15:04

标签: scala apache-spark cluster-analysis apache-spark-mllib

我正在使用Spark MLlib的Power Iteration Clustering功能来聚类无向图。当节点数量和亲和度矩阵的大小非常大时,该模型的计算成本很高。在这种情况下,重新估计新数据的集群将成为一个非常昂贵的过程。

问题:

  1. 有没有办法从Spark MLlib生成的 PowerIterationClusteringModel 对象预测新点的集群成员资格?
  2. 如何从模型对象访问模型估计的中间结果,例如估计的eignevectors和特征值&在eignevectors跨越的空间中投影数据点?目前,只有群集分配通过API
  3. 公开
  4. 我从this问题中发现了一些用于谱聚类的增量/在线学习方法。 Spark上有这样的方法可用吗?

0 个答案:

没有答案