我是来自python背景的C#的新手。我很难搞清楚这一点。在python中我可以使用beautifulsoup来做到这一点:
from bs4 import BeautifulSoup
import requests
r = requests.get('http://stackoverflow.com').content
soup = BeautifulSoup(r).prettify
print soup
这将获取stackoverflow.com的源内容,并将其打印到控制台。 我无法弄清楚如何在C#中执行此操作。
var webGet = new HtmlWeb();
var document = webGet.Load("http://stackoverflow.com");
Console.WriteLine(document);
这不起作用,它只打印var文档的类型。有谁知道如何做到这一点?非常感谢 - 我正在尝试通过转换我的一个python程序来学习C#,只是fyi。
答案 0 :(得分:4)
使用OuterHtml
的{{1}}属性:
DocumentNode