C#,如何获取网页内容?

时间:2011-02-10 14:26:11

标签: c# asp.net screen-scraping

我是c#的新手。我需要做一个脚本来获取网页的HTML内容。我可以在哪里获得如何做到这一点的例子?我在这里搜索过但我找不到。

PS:抱歉我的英语。

最诚挚的问候,

1 个答案:

答案 0 :(得分:6)

查看WebClient课程。 DownloadString方法以字符串形式返回页面内容:

var wc = new WebClient();
var html = wc.DownloadString("http://stackoverflow.com");

如果您还想解析下载的HTML,那么您可以查看HTML Agility Pack。它允许您将HTML解析为树状结构(类似于XmlDocument),您可以使用XPath在文档中查找元素等。然后使用正则表达式或自己解析内容是更好的方法。