需要一种简单的方法来删除HTML代码

时间:2014-07-16 16:37:30

标签: html bash

这是一个问题。我有一项艰巨的任务,即手动删除超过1400个代码条目。

这就是我所拥有的。必须删除<!-- Begin Description -->之前的所有内容,并且还必须删除<!-- End Description -->之后的所有内容。我需要一个脚本或者可以为我做这件事的东西。有人可以帮忙吗?

1 个答案:

答案 0 :(得分:3)

使用awk:

awk '/<!-- Begin Description -->/,/<!-- End Description -->/' file.html > new_file.html

示例:

$ cat file
some code 
foo
<!-- Begin Description -->
some description
to keep
bar
<!-- End Description -->
some stuff
to remove
baz

$ awk '/<!-- Begin Description -->/,/<!-- End Description -->/' file
<!-- Begin Description -->
some description
to keep
bar
<!-- End Description -->

如果您有1400个文件,则可以在shell中进行循环:

for file in *.html; do
    awk '/<!-- Begin Description -->/,/<!-- End Description -->/' $file > ${file%.html}_new.html
done