标签: hadoop cluster-analysis mahout
我正在使用Mahout进行群集,我已经使用elbow方法来确定群集的数量,因此我不必指定它。
我在一台机器上试过这个,但现在我对计算机集群有疑问。
我计划使用Oozie来模拟循环(每次将簇数增加一个时运行聚类算法)。我读到Oozie用于DAG,但我认为没有其他方法可以做到这一点。
问题是,这看起来像一个合理的方法吗?如果没有,任何替代方案?