RStudio连接到远程Hadoop服务器

时间:2014-05-23 11:59:04

标签: r hadoop rstudio

我有一个带有Rstudio的Ubuntu桌面,我还有一个在Centos下运行的远程hadoop集群,我希望从RStudio连接,据我所知,这是一个可行的方法但有人可以确认吗?

1 个答案:

答案 0 :(得分:1)

Rstudio不允许您连接到hadoop,但您可以使用hadoop流API来提交您的hadoop作业。

有一些软件包可以帮助您入门。我已经使用rmr在带有流API的hadoop集群上运行map / reduce作业。这些都可以在这里找到。

https://github.com/RevolutionAnalytics/RHadoop/wiki

还有一个rhipe包,它允许你与R脚本中的hdfs文件系统进行通信。

http://www.datadr.org/doc/functions.html