保存RENDERED网页的内容。 C#或者可能是一些专门的工具/插件

时间:2017-06-23 10:23:08

标签: c#

我想保存多个网页及其所有内容,这本身并不难,并且有多个工具可用于此任务。

但页面本身很难处理。

它们在客户端呈现(通过javascript),所以只是抓住服务器上的html内容并不好。

有些工具可以解决这个问题,他们抓取正确处理的html,在html中查找图片网址,然后尝试下载它们。

这是其他问题,图片不能直接下载,只能作为网页内容。在这里,我被困住了。

我尝试在C#中为此任务创建自己的工具,看起来webBrowser + ShowSaveAsDialog工作正常,但无法实现自动化。

有没有办法渲染html并将所有内容保存在"静音模式"?

1 个答案:

答案 0 :(得分:0)

如果问题是“保存文件对话框”,您可以无提防地保存:https://stackoverflow.com/a/2976716/1271037

但我建议您看一下这篇文章系列:Webscraping with C#