我想在body标签中获取纯文本。
标记:
**simple text 1**
<div>------</div>
<font>-------</font>
**simple text 2**
代码:
foreach (HtmlElement elm in webBrowser1.Document.Body.All)
{
//get simple text
}
答案 0 :(得分:1)
简单地:
string plainText = webBrowser1.Document.Body.InnerText;
答案 1 :(得分:0)
我找到了这个简单的方法:
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.LoadHtml(webBrowser1.Document.Body.InnerHtml);
foreach (var elm in htmlDoc.DocumentNode.Descendants())
{
if (elm.NodeType == HtmlNodeType.Text)
{
//simple text is #text
var innerText=elm.InnerText;
}
}
玩得开心。
答案 2 :(得分:0)
请尝试以下方式:您可以使用以下技术获取浏览器预览中显示的所有文字。
string plainText= StripHTML(webBrowser1);// call this way-----
public string StripHTML(WebBrowser webp)
{
try
{
Clipboard.Clear();
webp.Document.ExecCommand("SelectAll", true, null);
webp.Document.ExecCommand("Copy", false, null);
}
catch (Exception ep)
{
MessageBox.Show(ep.Message);
}
return Clipboard.GetText();
}