如何在多个ZIP文件中搜索和替换字符串?

时间:2014-02-21 05:31:52

标签: bash shell unix sed grep

我在查找正确的命令时遇到问题,在Unix上查找包含XML文件的多个ZIP文件中的字符串。

我能够在多个ZIP文件中找到一个搜索字符串,但是在替换查找并替换该字符串时却没有成功。

不幸的是,这不太合适。一旦找到解压缩文件的字符串(到临时位置),我正在尝试使用grep和sed命令。但我可能不正确地认为我可以编辑到临时?

oldAddress='<ns1:line1/>'
newAddress='<ns1:line1>somestring</ns1:line1>'

for file in *.zip; do
    unzip -c "$file" | grep -q "<ns1:line1/>" | xargs -l {} sed -i 's/$oldAddress/$newAddress/g'
done

提前致谢。

1 个答案:

答案 0 :(得分:0)

关于循环结构的一些注意事项:

首先,尽管使用全局变量很有诱惑力,但bash还支持以下循环样式:

 while read line ; do   echo $line; done < <(find . -iname 'file*zip')

其次,您可以使用zipgrep搜索文件,然后仅解压缩真正需要解压缩的文件。这将导致文件的两次时间缩小。一次用于greping,一次用于解压缩真正需要解压缩的人。但是,这将使我们无需将冗余文件压缩回来。

第三,你正在搜索2次,对于大文件或许多文件,这将慢两倍:

 grep -q "<ns1:line1/>" | xargs -l {} sed -i 's/$oldAddress/$newAddress/g'

相反,您只能解压缩那些匹配的文件,并且只使用sed一步完成搜索和替换。

建议的解决方案

# From within a (bash) script you need to use double quotes instead of singel qoutes to expand the variable
newAddress="<ns1:line1>somestring</ns1:line1>"
oldAddress="<ns1:line1/>"

for fname in *.zip
do
  zipgrep -q $oldAddress $fname;    
  if [ $? -eq 0 ]; then
     filename="${fname%.*}" 
     unzip -qp $fname | sed -e 's#'$oldAddress'#'$newAddress'#g' > $filename
     zip $filename.zip $filename
  fi
done

测试数据

这是一个用于创建测试数据的for循环:

for i in {1..4} ; do touch file$i; done
while read line ; do   
  echo '<ns1:line1/>' > $line;   
  zip $line.zip $line
  rm $line
done < <(find . -iname 'file*')