我是c#的新手。我需要做一个脚本来获取网页的HTML内容。我可以在哪里获得如何做到这一点的例子?我在这里搜索过但我找不到。
PS:抱歉我的英语。
最诚挚的问候,
答案 0 :(得分:6)
查看WebClient
课程。 DownloadString
方法以字符串形式返回页面内容:
var wc = new WebClient();
var html = wc.DownloadString("http://stackoverflow.com");
如果您还想解析下载的HTML,那么您可以查看HTML Agility Pack。它允许您将HTML解析为树状结构(类似于XmlDocument
),您可以使用XPath在文档中查找元素等。然后使用正则表达式或自己解析内容是更好的方法。