可能重复:
Regex to match all HTML tags and tag content except <p> and </p>
RegEx match open tags except XHTML self-contained tags
我有一个文本编辑器,它包含所有HTML属性,如span,div,字体颜色,字体名称,大小。所以我想删除所有HTML标记,只保留段落标记和中断标记。
答案 0 :(得分:0)
正则表达式中的否定这是一件非常棘手的事情。有办法否定一个群体:(?!somepattern)
,但并不是所有语言都支持它,如果支持,你应该小心。
我建议您只需匹配所有代码:<.*?>
。然后,使用您正在编程的语言(此案例为C#)迭代结果并删除与<p>
或</p>
不匹配的结果。
并非总是正则表达式是解决问题的最佳方法。