是否有任何现有的框架可以下载完整的网页(不是网站):HTML页面,它的样式表,(javascripts)和图像?
如果可能的话,我想避免自己解析HTML和样式表。
答案 0 :(得分:3)
有一个wget CLI工具。它有一个完整网页的-p
选项:
wget -p www.yousite/page.html
答案 1 :(得分:2)
我知道有HTML Agility Pack - 这肯定会做HTML部分。
您将能够轻松查询链接图像,样式表和javascript文件,但无法处理这些文件。
请参阅this有关CSS解析的问题。
除了使用JScript之外,我想不出.NET的任何Javascript解析器。