Bash脚本通过删除最后访问的文件来限制目录大小

时间:2012-07-23 18:17:52

标签: bash shell for-loop

我之前使用过一个简单的find命令来删除过去x天内未访问的tar文件(在本例中为3天):

find /PATH/TO/FILES -type f -name "*.tar" -atime +3 -exec rm {} \;

我现在需要通过按访问日期的顺序删除来改进这个脚本,我的bash写作技巧有点生疏。这就是我需要做的事情:

  1. 检查目录/ PATH / TO / FILES
  2. 的大小
  3. 如果1)中的大小大于X大小,请按访问日期获取文件列表
  4. 按顺序删除文件,直到大小小于X
  5. 这里的好处是缓存和备份目录,我只会删除我需要的内容以使其保持在一个限制内,而如果某一天特别大,则简化方法可能会超出大小限制。我猜我需要使用stat和bash for loop?

3 个答案:

答案 0 :(得分:7)

我改进了brunner314的例子并修复了问题。

这是我正在使用的工作脚本:

#!/bin/bash
DELETEDIR="$1"
MAXSIZE="$2"
if [[ -z "$DELETEDIR" || -z "$MAXSIZE" || "$MAXSIZE" -lt 1 ]]; then
    echo "usage: $0 [directory] [maxsize in megabytes]" >&2
    exit 1
fi
find "$DELETEDIR" -type f -printf "%T@::%p::%s\n" \
| sort -rn \
| awk -v maxbytes="$((1024 * 1024 * $MAXSIZE))" -F "::" '
  BEGIN { curSize=0; }
  { 
  curSize += $3;
  if (curSize > maxbytes) { print $2; }
  }
  ' \
  | tac | awk '{printf "%s\0",$0}' | xargs -0 -r rm
# delete empty directories
find "$DELETEDIR" -mindepth 1 -depth -type d -empty -exec rmdir "{}" \;

答案 1 :(得分:4)

这是一个简单,易于阅读和理解的方法,我想出来这样做:

DIRSIZE=$(du -s /PATH/TO/FILES | awk '{print $1}')
if [ "$DIRSIZE" -gt "$SOMELIMIT" ]
  then
    for f in `ls -rt --time=atime /PATH/TO/FILES/*.tar`; do
    FILESIZE=`stat -c "%s" $f`
    FILESIZE=$(($FILESIZE/1024))

    DIRSIZE=$(($DIRSIZE - $FILESIZE))
    if [ "$DIRSIZE" -lt "$LIMITSIZE" ]; then
        break
    fi
done
fi

答案 2 :(得分:1)

我不需要使用循环,只需要仔细应用stat和awk。下面的详细信息和说明,首先是代码:

find /PATH/TO/FILES -name '*.tar' -type f \
| sed 's/ /\\ /g' \
| xargs stat -f "%a::%z::%N" \
| sort -r \
| awk '
  BEGIN{curSize=0; FS="::"}
  {curSize += $2}
  curSize > $X_SIZE{print $3}
  '
| sed 's/ /\\ /g' \
| xargs rm

请注意,这是一个逻辑命令行,但为了理智,我将其拆分。

它以基于上述命令的find命令开始,没有将其限制为超过3天的文件的部分。它管道sed,以逃避文件名中的任何空格查找返回,然后使用xargs在所有结果上运行stat。 -f“%a ::%z ::%N”告诉stat要使用的格式,第一个字段中的上次访问时间,第二个字段中文件的大小以及文件中的文件名。第三。我使用'::'来分隔字段,因为这样更容易处理文件名中的空格。排序然后在第一个字段上对它们进行排序,使用-r反转排序。

现在我们列出了我们感兴趣的所有文件,从最新访问到最早访问。然后awk脚本在列表中添加所有大小,并在它超过$ X_SIZE时开始输出它们。不以这种方式输出的文件将是保存的文件,其他文件名再次转到sed以逃避任何空格,然后转到xargs,它运行rm它们。