在Google dataproc中运行超过火花流媒体作业

时间:2017-09-18 10:58:06

标签: apache-spark apache-spark-sql google-cloud-dataproc spark-structured-streaming

如何在数据中心群集中运行多个火花流工作?我使用capacity-scheduler.xml创建了多个队列,但是现在我需要12个队列,如果我想运行12个不同的流 - 聚合应用程序。任何的想法?

1 个答案:

答案 0 :(得分:0)

Dataproc 1.2图像在容量调度程序中启用了公平模式,它可以在没有队列开销的情况下执行您想要的操作[1] [2]。

[1] https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.3.4/bk_yarn_resource_mgt/content/flexible_scheduling_policies.html

[2] https://community.hortonworks.com/questions/19342/yarn-fair-sharing-ordering-policy-for-capacity-sch.html

相关问题