我在查找正确的命令时遇到问题,在Unix上查找包含XML文件的多个ZIP文件中的字符串。
我能够在多个ZIP文件中找到一个搜索字符串,但是在替换查找并替换该字符串时却没有成功。
不幸的是,这不太合适。一旦找到解压缩文件的字符串(到临时位置),我正在尝试使用grep和sed命令。但我可能不正确地认为我可以编辑到临时?
oldAddress='<ns1:line1/>'
newAddress='<ns1:line1>somestring</ns1:line1>'
for file in *.zip; do
unzip -c "$file" | grep -q "<ns1:line1/>" | xargs -l {} sed -i 's/$oldAddress/$newAddress/g'
done
提前致谢。
答案 0 :(得分:0)
首先,尽管使用全局变量很有诱惑力,但bash还支持以下循环样式:
while read line ; do echo $line; done < <(find . -iname 'file*zip')
其次,您可以使用zipgrep
搜索文件,然后仅解压缩真正需要解压缩的文件。这将导致文件的两次时间缩小。一次用于greping,一次用于解压缩真正需要解压缩的人。但是,这将使我们无需将冗余文件压缩回来。
第三,你正在搜索2次,对于大文件或许多文件,这将慢两倍:
grep -q "<ns1:line1/>" | xargs -l {} sed -i 's/$oldAddress/$newAddress/g'
相反,您只能解压缩那些匹配的文件,并且只使用sed一步完成搜索和替换。
# From within a (bash) script you need to use double quotes instead of singel qoutes to expand the variable
newAddress="<ns1:line1>somestring</ns1:line1>"
oldAddress="<ns1:line1/>"
for fname in *.zip
do
zipgrep -q $oldAddress $fname;
if [ $? -eq 0 ]; then
filename="${fname%.*}"
unzip -qp $fname | sed -e 's#'$oldAddress'#'$newAddress'#g' > $filename
zip $filename.zip $filename
fi
done
这是一个用于创建测试数据的for循环:
for i in {1..4} ; do touch file$i; done
while read line ; do
echo '<ns1:line1/>' > $line;
zip $line.zip $line
rm $line
done < <(find . -iname 'file*')