我正在使用以下内容来获得一个工作正常的网页
public static HtmlDocument GetWebPageFromUrl(string url)
{
var hw = new HtmlWeb();
return hw.Load(url);
}
但是如何将HTML的全部内容从HtmlDocument吐出到字符串中呢?
我试过HtmlDocument.ToString()但是这不会给我文档中的所有HTML?有什么想法吗?
答案 0 :(得分:42)
DocumentNode.OuterHtml
包含完整的html:
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load("sample.html");
string html = doc.DocumentNode.OuterHtml;
在你的例子中:
public static string GetWebPageHtmlFromUrl(string url)
{
var hw = new HtmlWeb();
HtmlDocument doc = hw.Load(url);
return doc.DocumentNode.OuterHtml;
}