在ubuntu终端中逐个删除文件

时间:2015-01-15 12:58:51

标签: html ubuntu terminal grep

我使用wget实用程序下载了一些网站页面,但是html页面包含太多不需要的信息。我希望文件之前只包含文本 </article>标记。我怀疑用grep命令可以做到这一点,但我需要哪些参数?以及如何将这样的命令应用于目录中的所有文件?

1 个答案:

答案 0 :(得分:0)

这里是剧本

for i in *.htm; do (cat $i | grep -i "</article>" -B 9999) > $i; done;