R分布式群集包

时间:2012-06-01 14:20:20

标签: r

是否存在利用RHadoop或RHIPE在分布式hadoop集群上运行的现有R集群包(kmeans,层次结构)?

由于

1 个答案:

答案 0 :(得分:1)

RevolutionAnalytics / RHadoop RHadoop项目包的实现通过rhdfs,rhbase和rmr连接Hadoop和R.

我知道实现K-means聚类算法是“标准”方式(使用Python,Pig和Java,如幻灯片8-10所示)与仅使用R(使用rmr包,如幻灯片14-15所示) ):它需要更少的代码,并且可以用单一语言实现

在同一文档中有一个comparison implementation of K-means in Python, Java and R,它显示了使用R是多么容易。

如果您在Hadoop集群上运行此程序包,您肯定可以在Hadoop上编写K-means集群。

如果R不是您的选择,那么H-is和Mahout上就可以使用K-means集群(使用MapReduce构建),因此您确定可以在Hadoop集群上执行此操作。