使用EMR进行pentaho数据集成spark-submit

时间:2017-02-20 23:33:09

标签: apache-spark pentaho emr pentaho-data-integration spark-submit

我一直在阅读文档以配置pentaho DI上的spark-submit条目,这些示例主要用于CDH和HDP,但它如何用于EMR?我的具体问题与EMR集群的“临时”性质有关。从红色开始,您需要将* -site.xml文件从群集复制到PDI服务器,但每个新群集的主机名都会更改,也许* -site.xml文件也会更改,因此每个自动运行或你的工作,你需要找到你的集群主机名,然后将* -site.xml文件scp到PDI,我是对的吗?是否有人在EMI中使用EMR配置了spark-submit条目?

0 个答案:

没有答案