我使用RevoScaleR和dplyrXdf编写了一个脚本,令我惊讶的是,当使用HDInsights(Microsoft Azure托管的Spark集群服务)时,我得到了R 3.3.3的安装,我无法安装dplyrXdf,包中也没有存储库也不能使用devtools从git安装,我设法安装它一旦更新它的各自github存储库的每一个依赖,但这是疯狂,花了我几个小时...... 最大的问题似乎是dplyr 0.5,这是该服务的最新可用包(目前的CRAN包为0.7.4) 难道我做错了什么?也许是配置中的东西(比如选择错误类型的集群)? 我无法相信MS会在R中投入那么多工作并且不更新它的集群服务,我必须在这里遗漏一些东西。