下载特定的标记源

时间:2012-11-26 07:31:07

标签: c# webclient-download

我有一些带有很多标签的网页。我想下载标记为Span且其classNameSomething的源页面。

我可能只下载页面的一部分(源代码)而不是整页?

我知道我可以使用webbrowser执行此操作(例如,导航到我的目标网页并搜索特定标记并获取其源代码) 但有了它,我必须首先获得整页,然后获得特定标签。

有任何方法(例如:WebClient类)只下载具有特定ClassName源代码的特定代码?

2 个答案:

答案 0 :(得分:2)

不,HTTP协议没有任何设施可以满足您的需求(唯一可以做的就是获取某个Range,但这需要您确切知道数据的位置,所以看起来似乎没有要帮助),你必须下载整个页面,然后解析你需要的东西。

答案 1 :(得分:1)

我担心您无法下载部分页面而需要先加载整个页面。但是为了使它更容易,您可以用XML解析HTML,然后使用它更容易。