正则表达式删除HTML标记

时间:2011-08-10 04:06:16

标签: c# html

我有以下表达式来从检索到的数据中去除HTML标记。我怎么编辑它来过滤掉特殊字符? (例如,@ amp; etc)

目前只过滤掉<&gt ;.

@ Page.xaml.cs:

//使用Regex从字符串中删除HTML。

  public static string StripTagsRegex(string source)
    {
        return Regex.Replace(source, "<.*?>", string.Empty);
    }

1 个答案:

答案 0 :(得分:2)

别。使用HTML解析器,一旦你将HTML输入其中,然后获取它的InnerText(而不是html)。这样你只能得到html的内容。