我正在实施Fair Scheduler来管理集群中的pyspark作业。但是,我不明白如何在Fair Scheduler中将作业分配给池。
例如,在我当前的集群中,我有队列1..10,队列1、2、3、4中有正在运行的作业,而其他队列为空。现在,如果我启动要在“空闲队列”中运行的作业(例如10),则由于队列空闲,我希望它处于运行模式。但是它处于等待模式。
所有池都具有公平的调度策略,并且fairSharePreemptionTimeout设置为30秒。这是fair-scheduler.xml中的条目
`<fairSharePreemptionTimeout>30</fairSharePreemptionTimeout>`
我应该在fair-scheduler.xml中添加任何addl条目,以使队列快速完成任务。