在Hadoop YARN群集中使用Apache Spark 1.6.2。
某些(简单)查询会占用大量资源,我看到我们的开发人员针对1To文件运行SELECT * FROM DB
!因此,它需要很长时间,并且"阻止"所有YARN资源片刻(并在几个小时后大部分时间崩溃......)。
我想知道是否可以限制Spark在YARN群集中运行所消耗的时间/资源:
(不确定"断路器"是一个好词,我是从弹性搜索中获取的)
答案 0 :(得分:0)
这个问题非常广泛,但总的来说: