我特别想知道Map是否像Mahout一样拥有K Means聚类?
答案 0 :(得分:5)
据我所知,MapR只是一个“更快”的Hadoop。没有包含算法。
所以你的工作应该兼容。
但实施自己的协议是什么? K-means非常简单。看我的博文: http://codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html
然而,我已经实现了一个带有BSP(批量同步并行)和Apache Hama的k-means集群,如果将它与本书中的Mahout基准测试结果进行比较,快几十倍:http://www.manning.com/ingersoll/(链接jira: https://issues.apache.org/jira/browse/MAHOUT-588) 以下是Apache Hama的k-means基准:http://wiki.apache.org/hama/Benchmarks