如何使用R连接到客户端的spark集群

时间:2018-05-31 06:20:37

标签: r apache-spark sparkr

我有一个运行Cloudera CDH的集群。我需要将我的R程序(在我的笔记本电脑上运行)连接到集群中运行的Spark。

但是如果我尝试通过Sparklyr连接本地R,它会给出错误。因为它在笔记本电脑上搜索Spark家庭意味着我必须在我的笔记本电脑上安装spark,但我无法做到。

我用谷歌搜索,发现我们可以安装SparkR并使用R和Spark。但是,对于使用sparkR我必须做的事情:

  1. 在群集的所有节点上安装SparkR?
  2. 如何配置使用SparkR?

0 个答案:

没有答案