我正在使用C#,而且我已经挣扎了几天,从URL中抓取最终呈现的HTML。
我尝试过使用多个浏览器引擎,Awesomium,WebBrowser等,但没有一个返回页面的实际呈现HTML,就像我右键单击chrome并选择"检查元素&# 34 ;.
答案 0 :(得分:1)
我所做的大致如下(使用WebBrowser
WinForms control):
public static string GetDomSource(WebBrowser wb)
{
var dd = wb.Document.DomDocument as IHTMLDocument2;
return dd.body.parentElement.outerHTML;
}
(虽然我不知道你是否已经尝试过这个或者你是否正在使用WinForms)。
为了介绍IHTMLDocument2
接口,我添加了对“Microsoft.mshtml”程序集的引用。