正则表达式匹配除C#中的<p>和</p>之外的所有HTML标记

时间:2011-12-14 11:23:50

标签: c# regex

  

可能重复:
  Regex to match all HTML tags and tag content except <p> and </p>
  RegEx match open tags except XHTML self-contained tags

我有一个文本编辑器,它包含所有HTML属性,如span,div,字体颜色,字体名称,大小。所以我想删除所有HTML标记,只保留段落标记和中断标记。

1 个答案:

答案 0 :(得分:0)

正则表达式中的否定这是一件非常棘手的事情。有办法否定一个群体:(?!somepattern),但并不是所有语言都支持它,如果支持,你应该小心。

我建议您只需匹配所有代码:<.*?>。然后,使用您正在编程的语言(此案例为C#)迭代结果并删除与<p></p>不匹配的结果。

并非总是正则表达式是解决问题的最佳方法。