遍历目录中的每个文件-bash

时间:2020-09-30 20:09:05

标签: bash loops for-loop grep

我正在尝试对目录中的每个文件执行某些操作,但是执行顺序有问题。一次应该做一个文件。在没有脚本的情况下,长行(解压缩,grepping,zipping)可以在单个文件上正常工作,因此循环存在问题。有什么想法吗?

脚本应grep浏览每个压缩文件并查找word1或word2。如果其中至少有一个存在,则:

  1. 解压缩文件
  2. grep word1和word2并将其保存到file_done
  3. 删除解压缩的文件
  4. 使用原始名称将zip file_done压缩到/ donefiles /
  5. 从原始目录中删除file_done
    #!/bin/bash
    for file in *.gz; do
    counter=$(zgrep -c 'word1\|word2' $file)
    if [[  $counter -gt 0 ]]; then
    echo $counter
    for file in *.gz; do
    filenoext=${file::-3}
    filedone=${filenoext}_done
    echo $file
    echo $filenoext
    echo $filedone
    gunzip  $file | grep 'word1\|word2'  $filenoext > $filedone | rm -f $filenoext |  gzip -f  -c  $filedone > /donefiles/$file | rm -f $filedone
    done
    else
    echo "nothing to do here"
    fi
    done

2 个答案:

答案 0 :(得分:1)

您提供的代码片段有一些问题,例如不必要的嵌套循环和错误的管道 (整行gunzip $file | grep 'word1\|word2' $filenoext > $filedone | rm -f $filenoext | gzip...)。

请注意,仅当* .gz文件的名称中没有空格(或特殊字符)时,您的代码才能正常工作。 此外,zgrep -c 'word1\|word2'也将匹配line_starts_withword1_orword2_之类的字符串。

这是脚本的工作版本:

#!/bin/bash
for file in *.gz; do
        counter=$(zgrep -c -E 'word1|word2' $file) # now counter is the number of word1/word2 occurences in $file
        if [[ $counter -gt 0 ]]; then
                name=$(basename $file .gz)
                zcat $file | grep -E 'word1|word2' > ${name}_done
                gzip -f -c ${name}_done > /donefiles/$file
                rm -f ${name}_done
        else
                echo 'nothing to do here'
        fi
done

我们在这里可以改善的是:

  • 由于我们无论如何都将文件解压缩以检查word1 | word2是否存在,因此我们可以对临时文件执行此操作,并避免两次解压缩
  • 我们不需要计算文件中有多少个word1或word2,我们可以检查它们的存在
  • $ {name} _done可以是自动清除的临时文件
  • 我们可以使用while循环来处理带空格的文件名
#!/bin/bash
tmp=`mktemp /tmp/gzip_demo.XXXXXX` # create temp file for us
trap "rm -f \"$tmp\"" EXIT INT TERM QUIT HUP # clean $tmp upon exit or termination
find . -maxdepth 1 -mindepth 1 -type f -name '*.gz' | while read f; do
        # quotes around $f are now required in case of spaces in it
        s=$(basename "$f") # short name w/o dir
        gunzip -f -c "$f" | grep -P '\b(word1|word2)\b' > "$tmp"
        [ -s "$tmp" ] && gzip -f -c "$tmp" > "/donefiles/$s" # create archive if anything is found
done

答案 1 :(得分:0)

似乎您在外部的内部有一个内部循环:

#!/bin/bash
for file in *.gz; do
    counter=$(zgrep -c 'word1\|word2' $file)
    if [[  $counter -gt 0 ]]; then
        echo $counter
        for file in *.gz; do #<<< HERE
            filenoext=${file::-3}
            filedone=${filenoext}_done
            echo $file
            echo $filenoext
            echo $filedone
            gunzip  $file | grep 'word1\|word2'  $filenoext > $filedone | rm -f $filenoext |  gzip -f  -c  $filedone > /donefiles/$file | rm -f $filedone
        done
    else
        echo "nothing to do here"
    fi
done

如果其中一个文件包含file1或file2,则内部循环遍历目录中的所有文件。您可能想要这个:

#!/bin/bash
for file in *.gz; do
    counter=$(zgrep -c 'word1\|word2' $file)
    if [[  $counter -gt 0 ]]; then
        echo $counter
        filenoext=${file::-3}
        filedone=${filenoext}_done
        echo $file
        echo $filenoext
        echo $filedone
        gunzip  $file | grep 'word1\|word2'  $filenoext > $filedone | rm -f $filenoext |  gzip -f  -c  $filedone > /donefiles/$file | rm -f $filedone
    else
        echo "nothing to do here"
    fi
done