正则表达式删除HTML标签但不删除HTML注释标签

时间:2014-06-16 18:02:03

标签: c# html regex

下面我有以下Regex Expression,用于从字符串对象中删除HTML标记:

(?:<style.+?>.+?</style>|<script.+?>.+?</script>|<(?:!|/?[a-zA-Z]+).*?/?>)

这个表达效果很好......有点太好了。我想要排除HTML注释标记,如:

  • <!--/ nav -->
  • <!--end nav-->
  • <!-- subnavup -->
  • <!--/ subnavup -->

不是这些示例,而是所有 HTML注释标记。为了实现这个目标,我需要对我的正则表达式进行哪些更改?

1 个答案:

答案 0 :(得分:-1)

尝试:

(<!--[\S\s]+?-->)

我没有测试它,但我确信它有效。