Linux上的文件系统中的空间问题 让我们称之为FILESYSTEM1 通常,FILESYSTEM1中的空间仅使用约40-50%
并且客户端运行一些报告或运行一些查询,这些报告会生成大小为4-5GB的大量文件,这会立即填满FILESYSTEM1。
我们有一些清理脚本,但它们永远不会捕获它,因为它发生在几分钟内,清理脚本通常会清理超过5-7天的数据。
另一组脚本也已就位,当文件系统中的可用空间小于某个阈值时会报告这些脚本
我们想到了可能的解决方案来主动检测和采取行动。
增加FILESYSTEM1文件系统的大小。
将此文件系统的警报脚本中的阈值设置为在50%已满时发出警报。
这有望让我们有足够的时间来抓住这个并在客户报告由于FILESYSTEM1已满而导致问题之前采取行动。
尽管此解决方案有效,但似乎并不是处理这种情况的最佳方法。
欢迎任何建议/意见/解决方案。
感谢
答案 0 :(得分:0)
听起来你发现简单的基于阈值的监控对你正在处理的使用模式不起作用。我建议将高频采样(比方说,每分钟一次)与监控工具结合起来,监控工具可以对数据进行某种回归,以预测空间何时耗尽。
除了知道你的空间已经用完之外,你还需要知道你是否即将耗尽空间。有几个工具可以做到这一点,或者你可以编写自己的工具。一个现有工具是Zabbix,它具有predictive trigger functions,可用于在文件系统使用率似乎可能在特定时间段内超过阈值时发出警报。这可能有助于对未经检查的快速更改做出反应,从而填充文件系统。