运行Spark并使用Spark UI,一切正常。 在主服务器运行一两天后,我们开始注意到已完成的工作日志开始仅变成文本,不再是用于查看应用程序和驱动程序日志的URL。
每个工作人员的暂存驱动器为250GB,因此我们没有空间用完的问题。日志目录也是250GB。两者都有大量的可用空间。
是否需要在默认配置文件中设置保留值,以使这些保留时间更长?
例如,我们有4个工作人员,其中3个工作人员的URL不再可用。仅适用于与主机共享的主机。如果我们重新启动母版,或启动新作业,我们将在“完成的作业”部分中看到“工作者URL”。这些工作大多数在凌晨4点运行,似乎在下午2点左右开始消失,这意味着工作人员URL变成了文本,并且链接不再可用。检查目录,应用程序目录stdout仍然存在,但驱动程序目录存在,但stdout不存在。就像看门人进程在一段时间后删除了stdout一样。
我们正在检查文档,并发现一些看起来可能与此相关的参数。
spark.history.retainedApplications=50
spark.executor.logs.rolling.*
spark.deploy.retainedApplications=200
spark.deploy.retainedDrivers=200
谁会知道是什么原因造成的,或者我们如何增加时间或总数? 谢谢。