如何使用正则表达式解析HTML文件并删除所有已注释掉的文本<! - - >?

时间:2012-05-17 18:25:12

标签: c# .net regex html

我需要解析HTML文件并删除<!-- HTML评论中注释掉的所有行,该文件可能包含<!---->的多个部分。

有人知道如何使用正则表达式删除HTML文件中<!---->之间的注释吗?该文件有多行。

我要处理大约1000个文件,我需要使用C#。

1 个答案:

答案 0 :(得分:4)

替换

<!--.*?-->

使用空字符串

并设置选项,使点也匹配换行符。

在C#中,这变为

resultString = Regex.Replace(subjectString, "<!--.*?-->", "", RegexOptions.Singleline);