我想要一个正则表达式从字符串中删除html标签和& nbsp,& quot等。我的正则表达式是删除html标签,但不删除其他提到的标签。我正在使用.Net 4
由于
CODE:
String result = Regex.Replace(blogText, @"<[^>]*>", String.Empty);
答案 0 :(得分:1)
请勿使用正则表达式,请使用HTML Agility包:
答案 1 :(得分:0)
如果您希望以已创建的内容为基础,可以将其更改为以下内容:
String result = Regex.Replace(blogText, @"<[^>]*>|&\w+", String.Empty);
这意味着......
&
后跟至少一个字符 \w
- 尽可能多。这两种情况都不适用于所有令人讨厌的情况,但通常都是如此。