我之前使用过一个简单的find命令来删除过去x天内未访问的tar文件(在本例中为3天):
find /PATH/TO/FILES -type f -name "*.tar" -atime +3 -exec rm {} \;
我现在需要通过按访问日期的顺序删除来改进这个脚本,我的bash写作技巧有点生疏。这就是我需要做的事情:
这里的好处是缓存和备份目录,我只会删除我需要的内容以使其保持在一个限制内,而如果某一天特别大,则简化方法可能会超出大小限制。我猜我需要使用stat和bash for loop?
答案 0 :(得分:7)
我改进了brunner314的例子并修复了问题。
这是我正在使用的工作脚本:
#!/bin/bash
DELETEDIR="$1"
MAXSIZE="$2"
if [[ -z "$DELETEDIR" || -z "$MAXSIZE" || "$MAXSIZE" -lt 1 ]]; then
echo "usage: $0 [directory] [maxsize in megabytes]" >&2
exit 1
fi
find "$DELETEDIR" -type f -printf "%T@::%p::%s\n" \
| sort -rn \
| awk -v maxbytes="$((1024 * 1024 * $MAXSIZE))" -F "::" '
BEGIN { curSize=0; }
{
curSize += $3;
if (curSize > maxbytes) { print $2; }
}
' \
| tac | awk '{printf "%s\0",$0}' | xargs -0 -r rm
# delete empty directories
find "$DELETEDIR" -mindepth 1 -depth -type d -empty -exec rmdir "{}" \;
答案 1 :(得分:4)
这是一个简单,易于阅读和理解的方法,我想出来这样做:
DIRSIZE=$(du -s /PATH/TO/FILES | awk '{print $1}')
if [ "$DIRSIZE" -gt "$SOMELIMIT" ]
then
for f in `ls -rt --time=atime /PATH/TO/FILES/*.tar`; do
FILESIZE=`stat -c "%s" $f`
FILESIZE=$(($FILESIZE/1024))
DIRSIZE=$(($DIRSIZE - $FILESIZE))
if [ "$DIRSIZE" -lt "$LIMITSIZE" ]; then
break
fi
done
fi
答案 2 :(得分:1)
我不需要使用循环,只需要仔细应用stat和awk。下面的详细信息和说明,首先是代码:
find /PATH/TO/FILES -name '*.tar' -type f \
| sed 's/ /\\ /g' \
| xargs stat -f "%a::%z::%N" \
| sort -r \
| awk '
BEGIN{curSize=0; FS="::"}
{curSize += $2}
curSize > $X_SIZE{print $3}
'
| sed 's/ /\\ /g' \
| xargs rm
请注意,这是一个逻辑命令行,但为了理智,我将其拆分。
它以基于上述命令的find命令开始,没有将其限制为超过3天的文件的部分。它管道sed,以逃避文件名中的任何空格查找返回,然后使用xargs在所有结果上运行stat。 -f“%a ::%z ::%N”告诉stat要使用的格式,第一个字段中的上次访问时间,第二个字段中文件的大小以及文件中的文件名。第三。我使用'::'来分隔字段,因为这样更容易处理文件名中的空格。排序然后在第一个字段上对它们进行排序,使用-r反转排序。
现在我们列出了我们感兴趣的所有文件,从最新访问到最早访问。然后awk脚本在列表中添加所有大小,并在它超过$ X_SIZE时开始输出它们。不以这种方式输出的文件将是保存的文件,其他文件名再次转到sed以逃避任何空格,然后转到xargs,它运行rm它们。