我有一个带有Rstudio的Ubuntu桌面,我还有一个在Centos下运行的远程hadoop集群,我希望从RStudio连接,据我所知,这是一个可行的方法但有人可以确认吗?
答案 0 :(得分:1)
Rstudio不允许您连接到hadoop,但您可以使用hadoop流API来提交您的hadoop作业。
有一些软件包可以帮助您入门。我已经使用rmr在带有流API的hadoop集群上运行map / reduce作业。这些都可以在这里找到。
https://github.com/RevolutionAnalytics/RHadoop/wiki
还有一个rhipe包,它允许你与R脚本中的hdfs文件系统进行通信。