HTML Agility Pack HtmlDocument显示所有HTML?

时间:2011-04-08 18:03:03

标签: c# asp.net html-agility-pack

我正在使用以下内容来获得一个工作正常的网页

    public static HtmlDocument GetWebPageFromUrl(string url)
    {
        var hw = new HtmlWeb();
        return hw.Load(url);
    }

但是如何将HTML的全部内容从HtmlDocument吐出到字符串中呢?

我试过HtmlDocument.ToString()但是这不会给我文档中的所有HTML?有什么想法吗?

1 个答案:

答案 0 :(得分:42)

DocumentNode.OuterHtml包含完整的html:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load("sample.html");
string html = doc.DocumentNode.OuterHtml;

在你的例子中:

public static string GetWebPageHtmlFromUrl(string url)
{
    var hw = new HtmlWeb();
    HtmlDocument doc = hw.Load(url);
    return doc.DocumentNode.OuterHtml;
}