由于旧库,我无法在hdinsights中使用dplyrXdf

时间:2017-12-14 00:05:31

标签: r apache-spark dplyr hdinsight revoscaler

我使用RevoScaleR和dplyrXdf编写了一个脚本,令我惊讶的是,当使用HDInsights(Microsoft Azure托管的Spark集群服务)时,我得到了R 3.3.3的安装,我无法安装dplyrXdf,包中也没有存储库也不能使用devtools从git安装,我设法安装它一旦更新它的各自github存储库的每一个依赖,但这是疯狂,花了我几个小时...... 最大的问题似乎是dplyr 0.5,这是该服务的最新可用包(目前的CRAN包为0.7.4) 难道我做错了什么?也许是配置中的东西(比如选择错误类型的集群)? 我无法相信MS会在R中投入那么多工作并且不更新它的集群服务,我必须在这里遗漏一些东西。

1 个答案:

答案 0 :(得分:0)

你可以很快安装所有依赖项 - 我花了大约20分钟。只需查看错误消息并安装所述的软件包即可。我只需要这些

enter image description here