我可以获取没有将在webbrowser控件上显示的html标签的字符串吗?
就像我有String str =“html hello html”那么我想找到像hello这样的字符串。
我该怎么做?
答案 0 :(得分:2)
正则表达式不适合HTML。正则表达式适用于常规文本,而不是HTML。
使用HTML解析器库,例如免费的开源HTML Agility Pack。它捆绑了一个HTML-to-Text converter sample。
答案 1 :(得分:1)
您可以使用正则表达式去除html标记,例如:
string html = "Your html string";
string x = Regex.Replace(html,@"<(.|\n)*?>", string.Empty);