我在本地笔记本电脑上使用RStudio并尝试连接到现有的远程HDInsight Spark Cluster。
几个问题:
1)我是否需要在HDInsight Spark Cluster上安装RStudio?
2)如何将本地RStudio连接到远程Spark Cluster?我一直在查看SparkR文档here,但它似乎没有提供连接示例(即URL,凭据等)?
答案 0 :(得分:2)
HDInsight包含一个集成到HDInsight群集中的R Server选项。此选项允许R脚本使用Spark和MapReduce来运行分布式计算。
有关详细信息,请参阅“this SO question”。