下载完整的网页

时间:2011-05-20 07:51:25

标签: .net html-parsing

是否有任何现有的框架可以下载完整的网页(不是网站):HTML页面,它的样式表,(javascripts)和图像?

如果可能的话,我想避免自己解析HTML和样式表。

2 个答案:

答案 0 :(得分:3)

有一个wget CLI工具。它有一个完整网页的-p选项:

wget -p www.yousite/page.html

答案 1 :(得分:2)

我知道有HTML Agility Pack - 这肯定会做HTML部分。

您将能够轻松查询链接图像,样式表和javascript文件,但无法处理这些文件。

请参阅this有关CSS解析的问题。

除了使用JScript之外,我想不出.NET的任何Javascript解析器。