如何通过linux脚本识别文件是否仍在写入或完成

时间:2021-01-23 06:32:14

标签: linux shell sh lsof

我们有一个正在生成文件的系统,我想通过脚本检查许多文件中的哪些文件是完整的,并且在过去两分钟内没有被修改,最后重命名这些文件。

这是我尝试过的,但结果不正确。有人可以帮忙吗?

for file in /home/test/*abc_YYYYMMDDhhmmss*
do
    f1=`basename $file`
    if [ lsof | grep "$f1" = "" ];then
        if  [ `stat --format=%Y $file` -le $(( `date +%s` - 300 )) ]; then
        mv "$f1" "${f1}_Complete"
    else
       echo "no files to collect"
    fi
done

2 个答案:

答案 0 :(得分:2)

您犯了一个常见的错误,认为 [if 命令语法的一部分;但它不是:[ 只是另一个命令。 if 语句的语法是

if commands; then
    : what to do if the exit code from commands was 0
else
    : what to do if not
fi

其中 commands 可以是任意复杂的命令序列,序列中最后一个命令的退出代码决定采用哪个分支; else 分支是可选的。

作为最小的修复,更改为

    # use modern $(command substitution) syntax
    # instead of obsolescent `command substitution`;
    # always quote variables with file names
    f1=$(basename "$file")
    # Remove [ and switch to grep -q;
    # add -F to grep flags for literal matching
    if ! lsof | grep -Fq "$f1"; then

无论如何,这样的东西呢?

find $(lsof |
    awk 'NR==FNR { if ($9 ~ /^\/home\/test\//) a[$9]++; next }
    FNR == 1 {
        if (! (FILENAME in a)) print FILENAME;
        next }' - /home/test/*abc_YYYYMMDDhhmmss*) \
    -type f -mmin +2 -exec sh -c '
        for file; do
            mv "$file" "${file}_Complete"
        done' _ {} +

这很复杂,但这里有一个概要。

  • lsof | awk ... 打印出通配符匹配中未打开的文件。
    • 这假定文件是常规文本文件 - 一些 awk 变体在二进制输入文件方面存在问题。如果它是有问题的,那么重构它以避免这种约束可能不会太难。
    • 更详细地说,Awk 的第一个参数是 -,即标准输入,它从 lsof 读取管道。第一个输入文件的条件 NR==FNR 为真;我们只是将打开的文件收集到关联数组 a 中。然后第二个条件打印当前输入文件的名称,如果它不在数组中;这是对剩余的输入文件执行的,即那些匹配通配符的文件。
  • 这作为 find 要检查的路径传递;它将查找在过去两分钟内修改的任何文件,并将结果传递给 -exec 中的命令。
  • -exec 中的简单 shell 脚本应该易于理解。 find 将找到的文件作为命令行参数传递,但 sh -c$0 填充它们,因此我们传入一个虚拟的 _ 以将文件名推送到 {{1} }, $1 等等,如果你不给它一个参数列表,这就是 $2 循环的内容。

如果您的文件名包含换行符,这可能不起作用;那么你仍然需要一些更复杂的东西。

在 Bourne 系列 shell 中循环任意文件名令人失望地复杂,并且在 shell 脚本中查找列表中不是的元素总是有点麻烦。 Ksh 和 Bash 提供了一些缓解,因为它们有数组,但这不能移植到 POSIX for / sh / ash

答案 1 :(得分:0)

这种方式怎么样?

#!/bin/bash
find /home/test/* -type f -mmin +2 -print0 |
    while IFS= read -r -d '' line; do
            echo $line
            fuser -s "$line"
            mv "$line" "${line}_Completed"
    done

-mmin +2 表示最近 2 分钟内未修改的文件。

编辑:根据要求,我已将其更改为 check if the file is currently openfuser -s "$line" 行将退出当前打开的文件,否则它将继续移动文件。我还将变量用引号括起来,感谢提醒