查找不包含html标签的字符串

时间:2010-02-20 05:54:24

标签: c# .net winforms webbrowser-control

我可以获取没有将在webbrowser控件上显示的html标签的字符串吗?

就像我有String str =“html hello html”那么我想找到像hello这样的字符串。

我该怎么做?

2 个答案:

答案 0 :(得分:2)

正则表达式不适合HTML。正则表达式适用于常规文本,而不是HTML。

使用HTML解析器库,例如免费的开源HTML Agility Pack。它捆绑了一个HTML-to-Text converter sample

答案 1 :(得分:1)

您可以使用正则表达式去除html标记,例如:

string html = "Your html string";
string x = Regex.Replace(html,@"<(.|\n)*?>", string.Empty);
相关问题