正则表达式替换模式,无法找到它的作用

时间:2015-01-27 20:30:41

标签: c# regex

无法弄清楚这个正则表达式模式的作用。谷歌中的搜索只返回通用正则表达式使用。请帮助!!!

const string HTML_TAG_PATTERN = "<.*?>";
return Regex.Replace(inputString, HTML_TAG_PATTERN, string.Empty);

2 个答案:

答案 0 :(得分:3)

上面用空格替换所有HTML样式标记。它符合如下:

< - Match the < character literally
.*? - Match any single character that is not a line break character 
      between zero and unlimited times, as few times as possible, expanding as needed
> - Match the > character literally

替换号码说:用HTML_TAG_PATTERN替换inputStringstring.Empty的所有匹配。

答案 1 :(得分:1)

尝试通过正则表达式测试程序运行它(可以通过搜索找到其中的任意一个)

  • 视尖括号(<>)不是典型的正则表达式 语法,这些符号完全匹配。
  • .表示“除换行符之外的任何字符”
  • *表示“前面元素中的零个或多个”
  • ?表示“前一个元素中的零个或一个”(编辑:也尽可能少“,因为如果可以,它将避免匹配此元素)

总之,这将匹配尖括号中的任何文本 - 它可能正在寻找HTML / XML标记。