使用一个暗淡的K-means进行Mahout聚类

时间:2014-04-12 16:26:32

标签: hadoop cluster-analysis data-mining mahout k-means

我可以使用mahout K-means算法将数据与一个变量而不是很多(我已经测试过)聚类在一起吗?如果是的话(我希望如此:))你能给我一个聚类实例并思考

1 个答案:

答案 0 :(得分:1)

您的数据有多大?如果它不是exabytes,没有Mahout你会更好。

如果是exabytes,请使用sampling,然后在一台计算机上处​​理它。

另见:

还有更多。

Mahout不是您进行数据分析的常用地点。只有 才能获得Google比例数据。否则,开销太大。