我有一些word文档,我想从中删除一些元素。我想做的是:
\[.*\]
替换为“”并将\(.*\)
替换为“”赞赏的想法和方向。就目前而言,我不知道如何以编程方式执行任何这些操作。我正在手动执行此操作。
如果重要,我正在使用Ubuntu 11.04
答案 0 :(得分:2)
由于您可以使用纯文本,因此对您的算法进行了一些改进:
antiword
自动从doc转换为tx sed
进行就地正则结构修改:sed -i -e's/bad/good/' file.txt
更新(回应评论):
正则表达式很好,但我完全不了解目标:
如果您想要替换[foo]&的出现次数(foo)用“”使用:
sed -i -e's/\[.*\]/""/g' file.txt; sed -i -e's/\(.*\)/""/g' file.txt
如果你想替换出现次数[foo]& (foo)每次使用“foo”:
sed -i -e's/\[\(.*\)\]/"\1"/g' file.txt; sed -i -e's/(\(.*\))/"\1"/g' file.txt