应用错误收集

在hadoop集群上安装spark集群

时间：2016-06-12 00:07:26

标签： scala hadoop apache-spark

我正在尝试在hadoop集群上安装apache spark集群。

我正在寻找这方面的最佳实践。我假设spark master需要安装在hadoop namenode和hadoop datanode上的spark slave的同一台机器上。另外，我需要安装scala吗？请指教。

1 个答案:

答案 0 :(得分：0)

如果您的Hadoop群集正在运行YARN，请使用纱线模式提交您的应用程序。这将是最简单的方法，除了简单地将Apache Spark发行版下载到客户端计算机之外，不需要安装任何东西。您可以做的另一件事是将Spark程序集部署到HDFS，以便在调用spark-submit时可以使用spark.yarn.jar配置，以便在节点上缓存JAR。

请点击此处查看所有详细信息：http://spark.apache.org/docs/latest/running-on-yarn.html

在EC2集群上安装Hbase / Hadoop
安装Spark Cluster，Hive存在问题
在Pyspark-Cluster模式下在工作节点上安装外部库
在集群Hadoop上安装mahout
在Hadoop集群上安装RHadoop
在hadoop集群上安装spark集群
在Ambari集群上安装Hue
在HDP群集上安装Snappy
在hadoop集群中安装python依赖项
在Hadoop集群配置上运行Spark

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？