使用install_github安装SparkR包时出错

时间:2015-06-02 15:16:12

标签: r apache-spark rstudio sparkr

我正在尝试使用R中的SparkR包。我有所有依赖包,例如devtoolsRtools.exe等。

当我尝试以下命令时:

install_github("amplab-extras/SparkR-pkg",subdir="pkg")

我收到以下错误:

Downloading github repo amplab-extras/SparkR-pkg@master
Error in function (type, msg, asError = TRUE ) :
  Received HTTP code 403 from proxy after CONNECT

为了解决这个问题,我已经设置了一个有效的http_proxy,https_proxy,但是它无法正常工作并抛出错误。请指导,因为我是R / RStudio的新手。

2 个答案:

答案 0 :(得分:1)

我在Windows 7上安装了SparkR,在R-3.2.x上安装了64位,并安装了Spark 1.4。

**如果您需要了解在Windows上安装Spark,请查看Spark的官方文档或列出的逐步过程here.

  • 转到maven的bin文件夹

    <form method="post" action="/foo" novalidate>...</form>

  • 打开记事本并粘贴文本

    C:\Program Files\apache-maven-3.3.3\bin

  • 将记事本保存在bin文件夹中为mvn.bat,如下所示

    "%~dp0\mvn.cmd" %*

  • 重新启动Rstudio并执行

    C:\Program Files\apache-maven-3.3.3\bin\mvn.bat

答案 1 :(得分:0)

由于SparkR从2015年6月的1.4版本开始合并到Spark Core项目中,所以现在SparkR构建指令与Spark构建指令相同。确保为SparkR添加maven标志-Psparkr。

例如,您可以使用SparkR构建Spark版本,如下所示:

build/mvn -Psparkr -DskipTests clean package

有关详细信息,请参阅:http://spark.apache.org/docs/latest/building-spark.html