用于确定Mahout上的簇数的弯头方法

时间:2014-10-28 16:54:36

标签: hadoop cluster-analysis mahout

我正在使用Mahout进行群集,我已经使用elbow方法来确定群集的数量,因此我不必指定它。

我在一台机器上试过这个,但现在我对计算机集群有疑问。

我计划使用Oozie来模拟循环(每次将簇数增加一个时运行聚类算法)。我读到Oozie用于DAG,但我认为没有其他方法可以做到这一点。

问题是,这看起来像一个合理的方法吗?如果没有,任何替代方案?

0 个答案:

没有答案