实际上我正在努力与R集成,但我得到了这个错误。
包'rmr','rJava','RJSONIO','rhdfs','rhbase','plyrmr'不可用(对于R版本3.1.3)
将Hadoop与R集成的步骤:
在ubuntu中安装了R和Hadoop。
在〜/ .bashrc文件中添加这三行。
*导出HADOOP_PREFIX = / Users / hadoop / hadoop-1.1.2
导出HADOOP_CMD = / Users / hadoop / hadoop-1.1.2 / bin / hadoop
导出HADOOP_STREAMING = / Users / hadoop / hadoop-1.1.2 / contrib / streaming / hadoop-streaming-1.1.2.jar *
使用此命令安装R软件包
install.packages(c("rJava", "RJSONIO", "rmr", "rhdfs", "rhbase", "plyrmr").
但我犯了上述错误。如何集成R和Hadoop的主要问题是什么? 我已按照此link to integrate。
答案 0 :(得分:9)
从https://github.com/RevolutionAnalytics/RHadoop/wiki下载rhdfs,rhbase,rmr2和plyrmr软件包并安装如下:
install.packages("<path>/rhdfs_1.0.8.tar.gz", repos=NULL, type="source")
install.packages("<path>/rmr2_2.2.2.tar.gz", repos=NULL, type="source")
install.packages("<path>plyrmr_0.2.0.tar.gz", repos=NULL, type="source")
install.packages("<path>/rhbase_1.2.0.tar.gz", repos=NULL, type="source")
答案 1 :(得分:3)
使用devtools
,您可以直接从Github安装:
install.packages('devtools')
devtools::install_github(c('RevolutionAnalytics/rmr2/pkg', 'RevolutionAnalytics/plyrmr/pkg'))
答案 2 :(得分:1)
您可以通过指定存储库来尝试安装这些软件包:
install.packages(c("rJava", "RJSONIO", "rmr", "rhdfs", "rhbase", "plyrmr"), repos="http://cran.r-project.org/")
答案 3 :(得分:1)
您可以从CRAN的网站下载软件包并安装它们,而无需连接到存储库。
例如,要下载'rJava'包,您可以访问此链接: http://cran.r-project.org/web/packages/rJava/index.html
从那里下载'Package source',然后手动安装它们:
install.packages('path to downloads/rJava_0.9-6.tar.gz',repos=NULL)
您可以按照与其他提到的包相同的模式。 rhdfs,rhbase和rmr包位于https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads