Bash:从页面删除html标签

时间:2019-06-19 05:43:01

标签: html bash sed

我有一些html代码

<div><img src="..." /></div>

,我想从中删除img标签以获取:

<div></div>

我用与emacs中相同的命令编写了一个bash脚本:

cat "$1"|sed 's/</\n</g'|sed 's/>/>\n/g'|sed 's/^<img.+//g' > "$2"

但是没有用。 sed似乎在换行符中不起作用。有什么建议吗?

我也尝试过:

sed 's/<img.+>//g'

但这会删除过多的代码。

谢谢。

1 个答案:

答案 0 :(得分:0)

sed 's/<img[^>]*>//g'模式似乎很适合我的需求。