我需要解析HTML文件并删除<!--
HTML评论中注释掉的所有行,该文件可能包含<!--
和-->
的多个部分。
有人知道如何使用正则表达式删除HTML文件中<!--
和-->
之间的注释吗?该文件有多行。
我要处理大约1000个文件,我需要使用C#。
答案 0 :(得分:4)
替换
<!--.*?-->
使用空字符串
并设置选项,使点也匹配换行符。
在C#中,这变为
resultString = Regex.Replace(subjectString, "<!--.*?-->", "", RegexOptions.Singleline);