如何在C#中解析动态更新的网页

时间:2016-02-01 09:57:23

标签: c# html parsing webbrowser-control

我正在尝试解析此页面中显示的数字:

https://www.edf.org/embed/methane-counters

我尝试过WebBrowser,WebClient等等,但没有取得好成绩。每当我尝试新的东西时,在返回的HTML中我都会得到这个(显示数字的HTML区域):

<strong id=\"methane\"></strong>

...如您所见,'strong'标签之间没有数字。为了以防万一,这是我尝试过的最新代码,但仍然无效:

using (WebBrowser myWebBrowser = new WebBrowser()) {
    myWebBrowser.ScriptErrorsSuppressed = true;
    myWebBrowser.Navigate(myURL);

    while ((myWebBrowser.ReadyState != WebBrowserReadyState.Complete)) 
        Application.DoEvents();

    myContent = myWebBrowser.Document.Body.InnerHtml;
    myContent = myWebBrowser.DocumentText;
}

...最后两个调用都没有返回带有数字的HTML。

有关如何获取此页面的正确内容的任何想法?

0 个答案:

没有答案