将页面加载到webBrowser并抓取HTML

时间:2012-05-14 19:03:21

标签: c# browser html-parsing web-scraping

我需要将页面加载到webBrowser中,等待加载此页面(包括ajax),然后抓取该页面的HTML。

我试过这个,但似乎没有按预期工作。任何帮助都会很棒!

WebBrowser webBrowser = new WebBrowser();
webBrowser.Navigate("http://www.mysite.com");
String htmldoc = webBrowser.DocumentText;

1 个答案:

答案 0 :(得分:2)

订阅DocumentCompleted ...

private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
    string htmldoc = webBrowser.Document.Body.InnerHtml;
}

这应该可以解决问题。