从HtmlAgilityPack打印网页源代码

时间:2012-03-17 14:35:08

标签: c# python html beautifulsoup html-agility-pack

我是来自python背景的C#的新手。我很难搞清楚这一点。在python中我可以使用beautifulsoup来做到这一点:

from bs4 import BeautifulSoup
import requests
r = requests.get('http://stackoverflow.com').content
soup = BeautifulSoup(r).prettify
print soup

这将获取stackoverflow.com的源内容,并将其打印到控制台。 我无法弄清楚如何在C#中执行此操作。

        var webGet = new HtmlWeb();
        var document = webGet.Load("http://stackoverflow.com");
        Console.WriteLine(document);

这不起作用,它只打印var文档的类型。有谁知道如何做到这一点?非常感谢 - 我正在尝试通过转换我的一个python程序来学习C#,只是fyi。

1 个答案:

答案 0 :(得分:4)

使用OuterHtml的{​​{1}}属性:

DocumentNode