我想保存多个网页及其所有内容,这本身并不难,并且有多个工具可用于此任务。
但页面本身很难处理。
它们在客户端呈现(通过javascript),所以只是抓住服务器上的html内容并不好。
有些工具可以解决这个问题,他们抓取正确处理的html,在html中查找图片网址,然后尝试下载它们。
这是其他问题,图片不能直接下载,只能作为网页内容。在这里,我被困住了。
我尝试在C#中为此任务创建自己的工具,看起来webBrowser
+ ShowSaveAsDialog
工作正常,但无法实现自动化。
有没有办法渲染html并将所有内容保存在"静音模式"?
答案 0 :(得分:0)
如果问题是“保存文件对话框”,您可以无提防地保存:https://stackoverflow.com/a/2976716/1271037
但我建议您看一下这篇文章系列:Webscraping with C#