任何人都可以澄清能否或不能抢占Spark驱动程序因为应用程序占用的资源多于其队列所允许的资源?
这个问题源自prod集群的情景:
ERROR | SIGTERM handler | org.apache.spark.executor.CoarseGrainedExecutorBackend | RECEIVED SIGNAL TERM
)ERROR | SIGTERM handler | org.apache.spark.deploy.yarn.ApplicationMaster | RECEIVED SIGNAL TERM
。 NM日志只是说驱动程序容器被杀死了Stopping container with container Id: app1_driver_containerId
。 我无法在文档中找到RM可以杀死应用程序主机的任何证据。文件说,它礼貌地要求大师释放资源,而且他们没有被释放,然后强行杀死容器。可以杀死AM吗?