在Javascript等之后获取最终呈现的HTML代码

时间:2014-12-02 08:09:32

标签: c# html visual-studio-2010

我正在使用C#,而且我已经挣扎了几天,从URL中抓取最终呈现的HTML。

我尝试过使用多个浏览器引擎,Awesomium,W​​ebBrowser等,但没有一个返回页面的实际呈现HTML,就像我右键单击chrome并选择"检查元素&# 34 ;.

1 个答案:

答案 0 :(得分:1)

我所做的大致如下(使用WebBrowser WinForms control):

public static string GetDomSource(WebBrowser wb)
{
    var dd = wb.Document.DomDocument as IHTMLDocument2;
    return dd.body.parentElement.outerHTML;
}

(虽然我不知道你是否已经尝试过这个或者你是否正在使用WinForms)。

为了介绍IHTMLDocument2接口,我添加了对“Microsoft.mshtml”程序集的引用。