安装Apache SparkR包时出错

时间:2015-04-21 10:18:42

标签: r apache-spark r-package

安装apache sparkr包时出现以下错误:

install_github("amplab-extras/SparkR-pkg", subdir="pkg")
Downloading github repo amplab-extras/SparkR-pkg@master
Installing SparkR
Error in isNamespaceLoaded(pkg) : 
 attempt to use zero-length variable name

2 个答案:

答案 0 :(得分:4)

我可以通过执行以下操作在R / RStudio中加载SparkR库:

下载并设置SparkR
1.下载spark-1.4.0并解压缩/解压缩 2.安装spark,然后转到你的目录/spark01.4.0/R
3.在终端中,运行./install-dev.sh。这将在您的目录中创建一个名为“lib”的文件夹

将SparkR添加到R .libPaths()
4.在终端:

    cat >> $HOME/.Rprofile <<EOT
    lib_path <- .libPaths()
    lib_path <- c(lib_path,"/MyDirectory/spark-1.4.0/R/lib")
    .libPaths(lib_path)
    rm(lib_path)
    EOT
  1. 加载R,然后使用库(SparkR)。

答案 1 :(得分:1)

我对pander软件包遇到了同样的问题并管理了一个冗长的工作。我从Github安装\library\pander到早期版本的R(3.1.2为我工作)。然后我将包从sparkr复制到我的新R v3.2.0安装中。到目前为止它似乎工作正常。

我已经为 { A:ABC, B:DEF } 软件包执行了此操作,但遗憾的是它需要更新的R版本。您可能会发现R v3.1.3可以正常运行,但是我可以使用它。我无法在我的机器上测试它。