标签: hadoop cluster-analysis data-mining mahout k-means
我可以使用mahout K-means算法将数据与一个变量而不是很多(我已经测试过)聚类在一起吗?如果是的话(我希望如此:))你能给我一个聚类实例并思考
答案 0 :(得分:1)
您的数据有多大?如果它不是exabytes,没有Mahout你会更好。
如果是exabytes,请使用sampling,然后在一台计算机上处理它。
另见:
还有更多。
Mahout不是您进行数据分析的常用地点。只有 才能获得Google比例数据。否则,开销太大。